Challenges Persist in Developing Artificial General Intelligence, Apple Researchers Reveal

Binance News · 2025-06-09T04:33:40.000Z

According to Cointelegraph, the pursuit of artificial general intelligence (AGI) remains a complex challenge, as highlighted by Apple researchers who have identified significant reasoning difficulties in leading AI models. Despite recent advancements in large language models (LLMs) like OpenAI's ChatGPT and Anthropic's Claude, the fundamental capabilities and limitations of these models are not fully understood, as detailed in a June paper titled "The Illusion of Thinking." The researchers emphasize that current evaluations focus heavily on mathematical and coding benchmarks, prioritizing final answer accuracy without adequately assessing the reasoning abilities of AI models. Apple's research contrasts with the widespread belief that AGI is imminent. To explore the reasoning capabilities of AI, the researchers designed various puzzle games to test both "thinking" and "non-thinking" versions of models such as Claude Sonnet, OpenAI's o3-mini and o1, and DeepSeek-R1 and V3 chatbots. Their findings reveal that frontier large reasoning models (LRMs) experience a significant drop in accuracy when faced with complex tasks, failing to generalize reasoning effectively. This contradicts expectations for AGI, as these models struggle with exact computation, inconsistent reasoning, and an inability to apply explicit algorithms across different puzzles. The study also highlights that AI chatbots often exhibit overthinking, generating correct answers initially but then deviating into incorrect reasoning. The researchers conclude that LRMs mimic reasoning patterns without truly internalizing or generalizing them, falling short of AGI-level reasoning. These insights challenge prevailing assumptions about LRM capabilities and suggest that current approaches may be encountering fundamental barriers to achieving generalizable reasoning. AGI is considered the ultimate goal of AI development, representing a state where machines can think and reason on par with human intelligence. In January, OpenAI CEO Sam Altman expressed confidence in the company's progress toward building AGI, stating that they are closer than ever before. Similarly, Anthropic CEO Dario Amodei predicted that AGI could surpass human capabilities within the next few years, potentially by 2026 or 2027. Despite these optimistic projections, the findings from Apple researchers underscore the ongoing challenges in the race to develop AGI.

Menurut Cointelegraph, pencarian kecerdasan umum buatan (AGI) tetap menjadi tantangan kompleks, seperti yang disoroti oleh peneliti Apple yang telah mengidentifikasi kesulitan penalaran signifikan dalam model AI terkemuka. Meskipun kemajuan baru-baru ini dalam model bahasa besar (LLM) seperti ChatGPT dari OpenAI dan Claude dari Anthropic, kemampuan dan batasan dasar dari model-model ini tidak sepenuhnya dipahami, seperti yang dijelaskan dalam makalah bulan Juni berjudul "Ilusi Berpikir." Para peneliti menekankan bahwa evaluasi saat ini sangat fokus pada tolok ukur matematika dan pengkodean, memprioritaskan akurasi jawaban akhir tanpa menilai secara memadai kemampuan penalaran dari model AI.
Penelitian Apple bertentangan dengan keyakinan luas bahwa AGI akan segera terwujud. Untuk mengeksplorasi kemampuan penalaran AI, para peneliti merancang berbagai permainan teka-teki untuk menguji versi "berpikir" dan "non-berpikir" dari model seperti Claude Sonnet, o3-mini dan o1 dari OpenAI, serta chatbot DeepSeek-R1 dan V3. Temuan mereka mengungkapkan bahwa model penalaran besar di garis depan (LRM) mengalami penurunan akurasi yang signifikan ketika dihadapkan pada tugas-tugas kompleks, gagal untuk menggeneralisasi penalaran secara efektif. Ini bertentangan dengan harapan untuk AGI, karena model-model ini kesulitan dalam perhitungan yang tepat, penalaran yang tidak konsisten, dan ketidakmampuan untuk menerapkan algoritma eksplisit di berbagai teka-teki.
Studi ini juga menyoroti bahwa chatbot AI sering menunjukkan berpikir berlebihan, menghasilkan jawaban yang benar pada awalnya tetapi kemudian menyimpang ke penalaran yang salah. Para peneliti menyimpulkan bahwa LRM meniru pola penalaran tanpa benar-benar menginternalisasi atau menggeneralisasikannya, tidak memenuhi standar penalaran setara AGI. Wawasan ini menantang asumsi yang berlaku tentang kemampuan LRM dan menunjukkan bahwa pendekatan saat ini mungkin menghadapi hambatan mendasar untuk mencapai penalaran yang dapat digeneralisasi.
AGI dianggap sebagai tujuan utama pengembangan AI, mewakili keadaan di mana mesin dapat berpikir dan bernalar setara dengan kecerdasan manusia. Pada bulan Januari, CEO OpenAI Sam Altman mengungkapkan keyakinan dalam kemajuan perusahaan menuju pembangunan AGI, menyatakan bahwa mereka lebih dekat dari sebelumnya. Demikian pula, CEO Anthropic Dario Amodei memprediksi bahwa AGI dapat melampaui kemampuan manusia dalam beberapa tahun ke depan, berpotensi pada tahun 2026 atau 2027. Meskipun proyeksi optimis ini, temuan dari peneliti Apple menekankan tantangan yang terus berlanjut dalam perlombaan untuk mengembangkan AGI.

Tantangan Terus Berlanjut dalam Mengembangkan Kecerdasan Umum Buatan, Ungkap Peneliti Apple

Berita Terbaru