Согласно Cointelegraph, стремление к искусственному общему интеллекту (AGI) остается сложной задачей, как подчеркивают исследователи Apple, которые выявили значительные трудности в рассуждении ведущих моделей ИИ. Несмотря на недавние достижения в больших языковых моделях (LLM), таких как ChatGPT от OpenAI и Claude от Anthropic, фундаментальные возможности и ограничения этих моделей не полностью поняты, как подробно изложено в статье за июнь под названием "Иллюзия мышления". Исследователи подчеркивают, что текущие оценки сосредоточены в основном на математических и кодировочных бенчмарках, придавая приоритет точности окончательного ответа, не оценивая адекватно способности к рассуждению моделей ИИ.

Исследование Apple контрастирует с широко распространенным мнением о том, что AGI неизбежен. Чтобы изучить способности рассуждения ИИ, исследователи разработали различные головоломки, чтобы протестировать как "мыслящие", так и "немыслящие" версии моделей, таких как Claude Sonnet, o3-mini и o1 от OpenAI, а также DeepSeek-R1 и V3 чат-ботов. Их выводы показывают, что передовые большие модели рассуждения (LRM) испытывают значительное снижение точности, сталкиваясь со сложными задачами, не в силах эффективно обобщать рассуждения. Это противоречит ожиданиям относительно AGI, поскольку эти модели испытывают трудности с точными вычислениями, несогласованным рассуждением и неспособностью применять явные алгоритмы для различных головоломок.

Исследование также подчеркивает, что ИИ чат-боты часто проявляют избыточное мышление, изначально генерируя правильные ответы, но затем отклоняясь в неверные рассуждения. Исследователи приходят к выводу, что LRM имитируют паттерны рассуждения, не усваивая их на самом деле и не обобщая, что не дотягивает до уровня рассуждений AGI. Эти выводы ставят под сомнение преобладающие предположения о возможностях LRM и предполагают, что текущие подходы могут сталкиваться с фундаментальными барьерами на пути к достижению обобщаемого рассуждения.

AGI считается конечной целью разработки ИИ, представляя собой состояние, когда машины могут мыслить и рассуждать наравне с человеческим интеллектом. В январе генеральный директор OpenAI Сэм Алтман выразил уверенность в прогрессе компании в построении AGI, заявив, что они ближе, чем когда-либо. Аналогично, генеральный директор Anthropic Дарио Амодеи предсказал, что AGI может превзойти человеческие возможности в ближайшие несколько лет, возможно, к 2026 или 2027 году. Несмотря на эти оптимистичные прогнозы, выводы исследователей Apple подчеркивают продолжающиеся проблемы в гонке по разработке AGI.