Theo Cointelegraph, việc theo đuổi trí tuệ nhân tạo tổng quát (AGI) vẫn là một thách thức phức tạp, như được nhấn mạnh bởi các nhà nghiên cứu của Apple, những người đã xác định những khó khăn lớn trong lập luận ở các mô hình AI hàng đầu. Mặc dù có những tiến bộ gần đây trong các mô hình ngôn ngữ lớn (LLMs) như ChatGPT của OpenAI và Claude của Anthropic, các khả năng và hạn chế cơ bản của những mô hình này vẫn chưa được hiểu rõ hoàn toàn, như được nêu chi tiết trong một tài liệu tháng 6 có tiêu đề "Sự Ảo Tưởng của Suy Nghĩ." Các nhà nghiên cứu nhấn mạnh rằng các đánh giá hiện tại tập trung nặng nề vào các tiêu chuẩn toán học và mã hóa, ưu tiên độ chính xác của câu trả lời cuối cùng mà không đánh giá đầy đủ khả năng lập luận của các mô hình AI.

Nghiên cứu của Apple trái ngược với niềm tin phổ biến rằng AGI sắp xảy ra. Để khám phá khả năng lập luận của AI, các nhà nghiên cứu đã thiết kế nhiều trò chơi đố để kiểm tra cả phiên bản "suy nghĩ" và "không suy nghĩ" của các mô hình như Claude Sonnet, o3-mini và o1 của OpenAI, và các chatbot DeepSeek-R1 và V3. Các phát hiện của họ cho thấy các mô hình lập luận lớn trên biên giới (LRMs) gặp phải sự giảm sút đáng kể về độ chính xác khi phải đối mặt với các nhiệm vụ phức tạp, không thể tổng quát hóa lập luận một cách hiệu quả. Điều này mâu thuẫn với kỳ vọng về AGI, vì những mô hình này gặp khó khăn với tính toán chính xác, lập luận không nhất quán, và không thể áp dụng các thuật toán rõ ràng qua các câu đố khác nhau.

Nghiên cứu cũng nhấn mạnh rằng các chatbot AI thường biểu hiện sự suy nghĩ quá mức, tạo ra các câu trả lời đúng ban đầu nhưng sau đó lệch hướng vào lập luận sai. Các nhà nghiên cứu kết luận rằng LRMs bắt chước các mẫu lập luận mà không thực sự nội tâm hóa hoặc tổng quát hóa chúng, không đạt được mức lập luận tương đương AGI. Những hiểu biết này thách thức các giả định hiện tại về khả năng của LRM và gợi ý rằng các phương pháp hiện tại có thể đang gặp phải các rào cản căn bản trong việc đạt được lập luận có thể tổng quát.

AGI được coi là mục tiêu tối thượng của sự phát triển AI, đại diện cho một trạng thái mà máy móc có thể suy nghĩ và lập luận ngang hàng với trí thông minh con người. Vào tháng Giêng, Giám đốc điều hành OpenAI Sam Altman bày tỏ sự tự tin vào tiến trình của công ty trong việc xây dựng AGI, tuyên bố rằng họ đang gần hơn bao giờ hết. Tương tự, Giám đốc điều hành Anthropic Dario Amodei dự đoán rằng AGI có thể vượt qua khả năng của con người trong vài năm tới, có thể là vào năm 2026 hoặc 2027. Mặc dù có những dự đoán lạc quan này, các phát hiện từ các nhà nghiên cứu của Apple nhấn mạnh những thách thức tiếp diễn trong cuộc đua phát triển AGI.