Challenges Persist in Developing Artificial General Intelligence, Apple Researchers Reveal

Binance News · 2025-06-09T04:33:40.000Z

According to Cointelegraph, the pursuit of artificial general intelligence (AGI) remains a complex challenge, as highlighted by Apple researchers who have identified significant reasoning difficulties in leading AI models. Despite recent advancements in large language models (LLMs) like OpenAI's ChatGPT and Anthropic's Claude, the fundamental capabilities and limitations of these models are not fully understood, as detailed in a June paper titled "The Illusion of Thinking." The researchers emphasize that current evaluations focus heavily on mathematical and coding benchmarks, prioritizing final answer accuracy without adequately assessing the reasoning abilities of AI models. Apple's research contrasts with the widespread belief that AGI is imminent. To explore the reasoning capabilities of AI, the researchers designed various puzzle games to test both "thinking" and "non-thinking" versions of models such as Claude Sonnet, OpenAI's o3-mini and o1, and DeepSeek-R1 and V3 chatbots. Their findings reveal that frontier large reasoning models (LRMs) experience a significant drop in accuracy when faced with complex tasks, failing to generalize reasoning effectively. This contradicts expectations for AGI, as these models struggle with exact computation, inconsistent reasoning, and an inability to apply explicit algorithms across different puzzles. The study also highlights that AI chatbots often exhibit overthinking, generating correct answers initially but then deviating into incorrect reasoning. The researchers conclude that LRMs mimic reasoning patterns without truly internalizing or generalizing them, falling short of AGI-level reasoning. These insights challenge prevailing assumptions about LRM capabilities and suggest that current approaches may be encountering fundamental barriers to achieving generalizable reasoning. AGI is considered the ultimate goal of AI development, representing a state where machines can think and reason on par with human intelligence. In January, OpenAI CEO Sam Altman expressed confidence in the company's progress toward building AGI, stating that they are closer than ever before. Similarly, Anthropic CEO Dario Amodei predicted that AGI could surpass human capabilities within the next few years, potentially by 2026 or 2027. Despite these optimistic projections, the findings from Apple researchers underscore the ongoing challenges in the race to develop AGI.

Theo Cointelegraph, việc theo đuổi trí tuệ nhân tạo tổng quát (AGI) vẫn là một thách thức phức tạp, như được nhấn mạnh bởi các nhà nghiên cứu của Apple, những người đã xác định những khó khăn lớn trong lập luận ở các mô hình AI hàng đầu. Mặc dù có những tiến bộ gần đây trong các mô hình ngôn ngữ lớn (LLMs) như ChatGPT của OpenAI và Claude của Anthropic, các khả năng và hạn chế cơ bản của những mô hình này vẫn chưa được hiểu rõ hoàn toàn, như được nêu chi tiết trong một tài liệu tháng 6 có tiêu đề "Sự Ảo Tưởng của Suy Nghĩ." Các nhà nghiên cứu nhấn mạnh rằng các đánh giá hiện tại tập trung nặng nề vào các tiêu chuẩn toán học và mã hóa, ưu tiên độ chính xác của câu trả lời cuối cùng mà không đánh giá đầy đủ khả năng lập luận của các mô hình AI.
Nghiên cứu của Apple trái ngược với niềm tin phổ biến rằng AGI sắp xảy ra. Để khám phá khả năng lập luận của AI, các nhà nghiên cứu đã thiết kế nhiều trò chơi đố để kiểm tra cả phiên bản "suy nghĩ" và "không suy nghĩ" của các mô hình như Claude Sonnet, o3-mini và o1 của OpenAI, và các chatbot DeepSeek-R1 và V3. Các phát hiện của họ cho thấy các mô hình lập luận lớn trên biên giới (LRMs) gặp phải sự giảm sút đáng kể về độ chính xác khi phải đối mặt với các nhiệm vụ phức tạp, không thể tổng quát hóa lập luận một cách hiệu quả. Điều này mâu thuẫn với kỳ vọng về AGI, vì những mô hình này gặp khó khăn với tính toán chính xác, lập luận không nhất quán, và không thể áp dụng các thuật toán rõ ràng qua các câu đố khác nhau.
Nghiên cứu cũng nhấn mạnh rằng các chatbot AI thường biểu hiện sự suy nghĩ quá mức, tạo ra các câu trả lời đúng ban đầu nhưng sau đó lệch hướng vào lập luận sai. Các nhà nghiên cứu kết luận rằng LRMs bắt chước các mẫu lập luận mà không thực sự nội tâm hóa hoặc tổng quát hóa chúng, không đạt được mức lập luận tương đương AGI. Những hiểu biết này thách thức các giả định hiện tại về khả năng của LRM và gợi ý rằng các phương pháp hiện tại có thể đang gặp phải các rào cản căn bản trong việc đạt được lập luận có thể tổng quát.
AGI được coi là mục tiêu tối thượng của sự phát triển AI, đại diện cho một trạng thái mà máy móc có thể suy nghĩ và lập luận ngang hàng với trí thông minh con người. Vào tháng Giêng, Giám đốc điều hành OpenAI Sam Altman bày tỏ sự tự tin vào tiến trình của công ty trong việc xây dựng AGI, tuyên bố rằng họ đang gần hơn bao giờ hết. Tương tự, Giám đốc điều hành Anthropic Dario Amodei dự đoán rằng AGI có thể vượt qua khả năng của con người trong vài năm tới, có thể là vào năm 2026 hoặc 2027. Mặc dù có những dự đoán lạc quan này, các phát hiện từ các nhà nghiên cứu của Apple nhấn mạnh những thách thức tiếp diễn trong cuộc đua phát triển AGI.

Những Thách Thức Vẫn Tồn Tại Trong Việc Phát Triển Trí Tuệ Nhân Tạo Tổng Quát, Các Nhà Nghiên Cứu Của Apple Tiết Lộ

Tin tức mới nhất

Những Thách Thức Vẫn Tồn Tại Trong Việc Phát Triển Trí Tuệ Nhân Tạo Tổng Quát, Các Nhà Nghiên Cứu Của Apple Tiết Lộ

Tin tức mới nhất

Bài viết thịnh hành