Challenges Persist in Developing Artificial General Intelligence, Apple Researchers Reveal

Binance News · 2025-06-09T04:33:40.000Z

According to Cointelegraph, the pursuit of artificial general intelligence (AGI) remains a complex challenge, as highlighted by Apple researchers who have identified significant reasoning difficulties in leading AI models. Despite recent advancements in large language models (LLMs) like OpenAI's ChatGPT and Anthropic's Claude, the fundamental capabilities and limitations of these models are not fully understood, as detailed in a June paper titled "The Illusion of Thinking." The researchers emphasize that current evaluations focus heavily on mathematical and coding benchmarks, prioritizing final answer accuracy without adequately assessing the reasoning abilities of AI models. Apple's research contrasts with the widespread belief that AGI is imminent. To explore the reasoning capabilities of AI, the researchers designed various puzzle games to test both "thinking" and "non-thinking" versions of models such as Claude Sonnet, OpenAI's o3-mini and o1, and DeepSeek-R1 and V3 chatbots. Their findings reveal that frontier large reasoning models (LRMs) experience a significant drop in accuracy when faced with complex tasks, failing to generalize reasoning effectively. This contradicts expectations for AGI, as these models struggle with exact computation, inconsistent reasoning, and an inability to apply explicit algorithms across different puzzles. The study also highlights that AI chatbots often exhibit overthinking, generating correct answers initially but then deviating into incorrect reasoning. The researchers conclude that LRMs mimic reasoning patterns without truly internalizing or generalizing them, falling short of AGI-level reasoning. These insights challenge prevailing assumptions about LRM capabilities and suggest that current approaches may be encountering fundamental barriers to achieving generalizable reasoning. AGI is considered the ultimate goal of AI development, representing a state where machines can think and reason on par with human intelligence. In January, OpenAI CEO Sam Altman expressed confidence in the company's progress toward building AGI, stating that they are closer than ever before. Similarly, Anthropic CEO Dario Amodei predicted that AGI could surpass human capabilities within the next few years, potentially by 2026 or 2027. Despite these optimistic projections, the findings from Apple researchers underscore the ongoing challenges in the race to develop AGI.

Согласно Cointelegraph, стремление к искусственному общему интеллекту (AGI) остается сложной задачей, как подчеркивают исследователи Apple, которые выявили значительные трудности в рассуждении ведущих моделей ИИ. Несмотря на недавние достижения в больших языковых моделях (LLM), таких как ChatGPT от OpenAI и Claude от Anthropic, фундаментальные возможности и ограничения этих моделей не полностью поняты, как подробно изложено в статье за июнь под названием "Иллюзия мышления". Исследователи подчеркивают, что текущие оценки сосредоточены в основном на математических и кодировочных бенчмарках, придавая приоритет точности окончательного ответа, не оценивая адекватно способности к рассуждению моделей ИИ.
Исследование Apple контрастирует с широко распространенным мнением о том, что AGI неизбежен. Чтобы изучить способности рассуждения ИИ, исследователи разработали различные головоломки, чтобы протестировать как "мыслящие", так и "немыслящие" версии моделей, таких как Claude Sonnet, o3-mini и o1 от OpenAI, а также DeepSeek-R1 и V3 чат-ботов. Их выводы показывают, что передовые большие модели рассуждения (LRM) испытывают значительное снижение точности, сталкиваясь со сложными задачами, не в силах эффективно обобщать рассуждения. Это противоречит ожиданиям относительно AGI, поскольку эти модели испытывают трудности с точными вычислениями, несогласованным рассуждением и неспособностью применять явные алгоритмы для различных головоломок.
Исследование также подчеркивает, что ИИ чат-боты часто проявляют избыточное мышление, изначально генерируя правильные ответы, но затем отклоняясь в неверные рассуждения. Исследователи приходят к выводу, что LRM имитируют паттерны рассуждения, не усваивая их на самом деле и не обобщая, что не дотягивает до уровня рассуждений AGI. Эти выводы ставят под сомнение преобладающие предположения о возможностях LRM и предполагают, что текущие подходы могут сталкиваться с фундаментальными барьерами на пути к достижению обобщаемого рассуждения.
AGI считается конечной целью разработки ИИ, представляя собой состояние, когда машины могут мыслить и рассуждать наравне с человеческим интеллектом. В январе генеральный директор OpenAI Сэм Алтман выразил уверенность в прогрессе компании в построении AGI, заявив, что они ближе, чем когда-либо. Аналогично, генеральный директор Anthropic Дарио Амодеи предсказал, что AGI может превзойти человеческие возможности в ближайшие несколько лет, возможно, к 2026 или 2027 году. Несмотря на эти оптимистичные прогнозы, выводы исследователей Apple подчеркивают продолжающиеся проблемы в гонке по разработке AGI.

Исследователи Apple обнаружили, что в разработке общего искусственного интеллекта по-прежнему существуют проблемы

Последние новости

Исследователи Apple обнаружили, что в разработке общего искусственного интеллекта по-прежнему существуют проблемы

Последние новости

Популярные статьи