BitcoinWorldComportamento Chocante da IA: Google Gemini Entra em Pânico Jogando Pokémon

No rápido cenário em evolução da inteligência artificial, entender como modelos avançados de IA se desempenham sob pressão é crucial. Embora muito foco seja dado a tarefas complexas, como análise de dados ou processamento de linguagem natural, os pesquisadores também estão encontrando insights surpreendentes ao observar as IAs enfrentando desafios mais simples – como jogar videogames clássicos. Essa interseção de IA e jogos fornece um campo de teste único, revelando aspectos inesperados do comportamento da IA, às vezes com resultados divertidos que ressoam mesmo dentro da comunidade tecnológica e cripto interessada em tecnologia de ponta.

Como os Modelos de IA Enfrentam Jogos Retro?

As empresas de IA estão em uma corrida pela dominância da indústria, ultrapassando os limites do que os grandes modelos de linguagem podem fazer. Mas às vezes, os testes mais reveladores acontecem não em salas de reunião simuladas, mas em ginásios virtuais de Pokémon. Google DeepMind e Anthropic estão ambos estudando como seus últimos modelos de IA, especificamente o Google DeepMind Gemini 2.5 Pro e o Claude da Anthropic, navegam pelos primeiros jogos de Pokémon. Isso não é apenas por diversão; é uma forma de avaliação de IA, embora não convencional.

A avaliação tradicional de IA muitas vezes envolve conjuntos de dados e métricas padronizadas, que alguns argumentam carecer de contexto do mundo real. Testar a IA em jogos, no entanto, oferece um ambiente dinâmico onde os modelos devem raciocinar, planejar e se adaptar ao longo de períodos prolongados. Essa abordagem fornece insights qualitativos sobre seus processos de tomada de decisão.

Por meses, desenvolvedores independentes até transmitiram essas jogadas de IA no Twitch ('Gemini Joga Pokémon' e 'Claude Joga Pokémon'), permitindo que qualquer pessoa assistisse ao 'raciocínio' da IA – uma saída de linguagem natural explicando seu processo de pensamento – em tempo real. Essa transparência oferece uma janela para o funcionamento interno desses modelos avançados de IA.

A Resposta de Pânico Inesperada do Google Gemini

Um relatório recente da Google DeepMind revelou uma observação fascinante e um pouco perturbadora sobre o desempenho do Google Gemini 2.5 Pro em Pokémon. O relatório observa que, quando os Pokémon da IA estão prestes a desmaiar na batalha, o modelo parece entrar em um estado de 'pânico'.

Esse estado de 'pânico' leva a uma 'degradação qualitativamente observável na capacidade de raciocínio do modelo'. A IA pode parar de usar estratégias ou ferramentas eficazes que empregava anteriormente. Embora a IA não experimente emoções como os humanos, suas ações sob estresse imitam uma tomada de decisão pobre e apressada. Esse comportamento tem sido consistente o suficiente para que até mesmo os espectadores na transmissão do Twitch tenham notado e comentado sobre isso.

Outros Comportamentos Curiosos de IA em Jogos

Não é apenas o Google Gemini que exibe quirks estranhos. Claude também mostrou um comportamento peculiar de IA em sua jornada Pokémon. Em uma instância, Claude observou que perder todos os seus Pokémon ('desmaiar') envia o jogador de volta para um Centro Pokémon. Quando preso na caverna da Mt. Moon, a IA hipotetizou incorretamente que perder intencionalmente a transportaria para o Centro Pokémon mais próximo na próxima cidade, em vez do que havia visitado por último. Os espectadores assistiram enquanto a IA basicamente tentava se 'game over' para escapar da caverna, demonstrando uma compreensão falha da mecânica do jogo, apesar de reconhecer um padrão.

Onde os Modelos de IA se Destacam (e Falham)

Apesar desses momentos de confusão ou 'pânico', é importante notar que esses modelos de IA ainda são notavelmente capazes em certas áreas. Embora levem centenas de horas para completar um jogo que uma criança termina muito mais rápido, sua força reside na resolução de problemas específicos.

O relatório da Google DeepMind destaca que o Gemini 2.5 Pro mostra precisão impressionante na resolução de certos quebra-cabeças dentro do jogo. Com alguma orientação humana, a IA criou 'ferramentas agente' – instâncias específicas do Gemini 2.5 Pro focadas em tarefas particulares – para resolver eficientemente quebra-cabeças complexos de pedras necessárias para progredir em áreas como Victory Road. A IA conseguiu resolver esses quebra-cabeças 'em uma única tentativa' após ser instruída com regras básicas e métodos de verificação.

O Google teoriza que futuras iterações do Google Gemini podem até ser capazes de criar essas ferramentas especializadas sem intervenção humana, sugerindo um caminho em direção a uma resolução de problemas mais autônoma dentro de ambientes dinâmicos. Isso destaca o potencial da IA em jogos não apenas como jogadores, mas como desenvolvedores de estratégias ou ferramentas dentro do mundo do jogo.

Em conclusão, assistir modelos avançados de IA como Google Gemini e Claude jogando Pokémon oferece uma visão única e muitas vezes surpreendente de suas capacidades e limitações. A observação do comportamento de 'pânico' no Gemini sob estresse, ou a tentativa equivocada de Claude de 'desmaiar' para movimento estratégico, sublinha que mesmo a IA sofisticada pode exibir fraquezas inesperadas quando enfrenta situações novas ou estressantes. Por outro lado, sua capacidade de resolver quebra-cabeças complexos e potencialmente desenvolver ferramentas especializadas aponta para seu significativo potencial. Essa mistura de habilidade impressionante e vulnerabilidade peculiar torna o estudo da IA em jogos um esforço valioso para entender a fronteira da inteligência artificial e o comportamento da IA.

Para saber mais sobre as últimas tendências em IA, explore nossos artigos sobre os principais desenvolvimentos que moldam os modelos de IA e o comportamento da IA.

Este post Comportamento Chocante da IA: Google Gemini Entra em Pânico Jogando Pokémon apareceu primeiro no BitcoinWorld e é escrito pela Equipe Editorial.