Menurut Cointelegraph, pencarian kecerdasan umum buatan (AGI) tetap menjadi tantangan kompleks, seperti yang disoroti oleh peneliti Apple yang telah mengidentifikasi kesulitan penalaran signifikan dalam model AI terkemuka. Meskipun kemajuan baru-baru ini dalam model bahasa besar (LLM) seperti ChatGPT dari OpenAI dan Claude dari Anthropic, kemampuan dan batasan dasar dari model-model ini tidak sepenuhnya dipahami, seperti yang dijelaskan dalam makalah bulan Juni berjudul "Ilusi Berpikir." Para peneliti menekankan bahwa evaluasi saat ini sangat fokus pada tolok ukur matematika dan pengkodean, memprioritaskan akurasi jawaban akhir tanpa menilai secara memadai kemampuan penalaran dari model AI.
Penelitian Apple bertentangan dengan keyakinan luas bahwa AGI akan segera terwujud. Untuk mengeksplorasi kemampuan penalaran AI, para peneliti merancang berbagai permainan teka-teki untuk menguji versi "berpikir" dan "non-berpikir" dari model seperti Claude Sonnet, o3-mini dan o1 dari OpenAI, serta chatbot DeepSeek-R1 dan V3. Temuan mereka mengungkapkan bahwa model penalaran besar di garis depan (LRM) mengalami penurunan akurasi yang signifikan ketika dihadapkan pada tugas-tugas kompleks, gagal untuk menggeneralisasi penalaran secara efektif. Ini bertentangan dengan harapan untuk AGI, karena model-model ini kesulitan dalam perhitungan yang tepat, penalaran yang tidak konsisten, dan ketidakmampuan untuk menerapkan algoritma eksplisit di berbagai teka-teki.
Studi ini juga menyoroti bahwa chatbot AI sering menunjukkan berpikir berlebihan, menghasilkan jawaban yang benar pada awalnya tetapi kemudian menyimpang ke penalaran yang salah. Para peneliti menyimpulkan bahwa LRM meniru pola penalaran tanpa benar-benar menginternalisasi atau menggeneralisasikannya, tidak memenuhi standar penalaran setara AGI. Wawasan ini menantang asumsi yang berlaku tentang kemampuan LRM dan menunjukkan bahwa pendekatan saat ini mungkin menghadapi hambatan mendasar untuk mencapai penalaran yang dapat digeneralisasi.
AGI dianggap sebagai tujuan utama pengembangan AI, mewakili keadaan di mana mesin dapat berpikir dan bernalar setara dengan kecerdasan manusia. Pada bulan Januari, CEO OpenAI Sam Altman mengungkapkan keyakinan dalam kemajuan perusahaan menuju pembangunan AGI, menyatakan bahwa mereka lebih dekat dari sebelumnya. Demikian pula, CEO Anthropic Dario Amodei memprediksi bahwa AGI dapat melampaui kemampuan manusia dalam beberapa tahun ke depan, berpotensi pada tahun 2026 atau 2027. Meskipun proyeksi optimis ini, temuan dari peneliti Apple menekankan tantangan yang terus berlanjut dalam perlombaan untuk mengembangkan AGI.