Згідно з Cointelegraph, прагнення до створення загального штучного інтелекту (ЗШІ) залишається складним завданням, як підкреслюють дослідники Apple, які виявили значні труднощі з міркуваннями у провідних моделях ШІ. Незважаючи на нещодавні досягнення у моделях великих мов програмування (LLM), таких як ChatGPT від OpenAI та Claude від Anthropic, фундаментальні можливості та обмеження цих моделей не до кінця зрозумілі, як детально описано в червневій статті під назвою «Ілюзія мислення». Дослідники наголошують, що поточні оцінки значною мірою зосереджені на математичних та кодуючих орієнтирах, надаючи пріоритет точності остаточної відповіді без належної оцінки здібностей моделей ШІ до міркування.

Дослідження Apple контрастує з поширеною думкою про те, що ОШІ неминучий. Щоб дослідити можливості ШІ до міркування, дослідники розробили різні головоломки для тестування як «мислячих», так і «немислячих» версій моделей, таких як Claude Sonnet, o3-mini та o1 від OpenAI, а також чат-боти DeepSeek-R1 та V3. Їхні результати показують, що моделі великих міркувань на межі (LRM) зазнають значного зниження точності, коли стикаються зі складними завданнями, не в змозі ефективно узагальнювати міркування. Це суперечить очікуванням щодо ОШІ, оскільки ці моделі мають проблеми з точними обчисленнями, непослідовними міркуваннями та нездатністю застосовувати явні алгоритми до різних головоломок.

У дослідженні також підкреслюється, що чат-боти зі штучним інтелектом часто демонструють надмірне мислення, спочатку генеруючи правильні відповіді, але потім відхиляючись до неправильних міркувань. Дослідники роблять висновок, що LRM імітують моделі міркувань, не засвоюючи та не узагальнюючи їх по-справжньому, що не відповідає міркуванню рівня AGI. Ці висновки ставлять під сумнів поширені припущення щодо можливостей LRM та свідчать про те, що сучасні підходи можуть стикатися з фундаментальними перешкодами для досягнення узагальнюючого мислення.

ЗШІ вважається кінцевою метою розвитку штучного інтелекту, що представляє стан, коли машини можуть мислити та міркувати нарівні з людським інтелектом. У січні генеральний директор OpenAI Сем Альтман висловив впевненість у прогресі компанії у створенні ЗШІ, заявивши, що вони ближчі до цього, ніж будь-коли раніше. Аналогічно, генеральний директор Anthropic Даріо Амодей передбачив, що ЗШІ може перевершити людські можливості протягом наступних кількох років, потенційно до 2026 або 2027 року. Незважаючи на ці оптимістичні прогнози, висновки дослідників Apple підкреслюють поточні виклики у гонці за розробку ЗШІ.