Pesquisadores da Apple dizem que a IA de hoje ainda não consegue pensar como os humanos. Ainda estamos longe da AGI (Inteligência Geral Artificial).
-> Novos modelos de IA como ChatGPT e Claude melhoraram, mas ainda enfrentam dificuldades com raciocínio.
-> A maioria dos testes foca apenas em obter a resposta final correta (como em matemática ou programação), não em como a IA pensa.
-> Pesquisadores da Apple criaram jogos de quebra-cabeça para testar o quão bem a IA pode realmente "pensar".
-> Eles testaram IAs populares como Claude Sonnet, o3-mini e o1 da OpenAI, e DeepSeek-R1 e V3.
-> Essas IAs falharam quando os quebra-cabeças se tornaram mais complexos — sua precisão caiu muito.
Elas não conseguiram aplicar lógica bem a problemas mais difíceis.