A OpenAI atualizou o modelo de IA que alimenta o Operador da versão personalizada anterior do GPT-4o para um modelo baseado no o3, um dos mais recentes na série de modelos de 'raciocínio' da OpenAI. O Operador o3 foi ajustado com dados adicionais de segurança para uso em computadores e incluiu conjuntos de dados de segurança projetados para ensinar ao modelo limites de decisão.

A OpenAI atualizou o Operador no ChatGPT com um novo modelo de Agente Usando Computador (CUA) baseado em uma versão do OpenAI o3. Com o novo modelo, o Operador tornou-se mais persistente e mais preciso ao interagir com o navegador, melhorando a taxa de sucesso geral das tarefas. Ele também fornece respostas melhor estruturadas que são mais claras e completas.

De acordo com a OpenAI, o novo modelo CUA mostrou desempenho mais forte em relação ao setor, alcançando SOTA no OSWorld e WebArena. Ele também mostrou desempenho relativo mais forte em comparação com a versão anterior, tanto em benchmarks estabelecidos quanto em avaliações de preferência humana.

A OpenAI substitui o modelo baseado em GPT‑4o por uma versão baseada no o3

A OpenAI sugere uma grande atualização para o Agente Operador ChatGPT pic.twitter.com/iGPQp9butD

— SabatAge (@sabatage) 22 de maio de 2025

A OpenAI substituiu o modelo existente baseado em GPT‑4o para o Operador por uma versão baseada no OpenAI o3, embora a versão da API permaneça baseada no 4o. A empresa de IA também afirmou que o Operador o3 usa a mesma abordagem de segurança em camadas usada para a versão 4o.

No entanto, em comparação com outros modelos da família o3, o Operador o3 foi ajustado com dados adicionais de segurança para uso em computadores, incluindo conjuntos de dados de segurança projetados para ensinar ao modelo limites de decisão sobre confirmações e recusas.

A OpenAI lançou um relatório técnico mostrando o desempenho do Operador o3 em avaliações de segurança específicas. Comparado ao modelo Operador GPT-4o, o Operador o3 tinha menos probabilidade de se recusar a realizar atividades 'ilícitas' e buscar dados pessoais sensíveis e era menos suscetível a uma forma de ataque de IA conhecida como 'injeção de prompt'.

“O Operador o3 usa a mesma abordagem em camadas para segurança que usamos para a versão 4o do Operador… Embora o Operador o3 herde as capacidades de codificação do o3, ele não tem acesso nativo a um ambiente de codificação ou Terminal.”

–OpenAI

A empresa de IA também revelou que o novo modelo baseado em o3 passou por avaliações de segurança padrão, e o Operador continuou disponível como uma prévia de pesquisa para usuários do ChatGPT Pro em todo o mundo. No entanto, esse modelo atualizado estava disponível apenas no Operador no ChatGPT.

Knoop suspeita que rodar o modelo o3 da OpenAI pode ser mais caro do que o esperado

Na semana passada, a Arc Prize Foundation, que mantém e administra a ARC-AGI, atualizou seus custos de computação aproximados para o o3. A organização estimou originalmente que a configuração de melhor desempenho do o3 que testou, o o3 alto, custava cerca de $3K para resolver um único problema da ARC-AGI. No entanto, a Fundação agora acredita que o custo pode ser 10x maior do que o estimado anteriormente, possivelmente cerca de $30K por tarefa.

Além disso, enquanto a OpenAI ainda não precificou o o3 ou o lançou completamente, um dos cofundadores da Arc Prize Foundation, Mike Knoop, acredita que a precificação do modelo o1-pro é um proxy razoável e uma comparação mais próxima do verdadeiro custo do o3. No entanto, ele acrescentou que o o3 continuaria sendo rotulado como uma prévia no placar para refletir a incerteza até que a precificação oficial fosse anunciada.

De acordo com a Arc Prize Foundation, um alto preço para o o3 alto não estaria fora de questão, dada a quantidade de recursos computacionais que o modelo supostamente usa. O o3 alto usou 172x mais computação do que o o3 baixo, a configuração de menor computação do o3, para enfrentar a ARC-AGI.

Rumores circulam desde o início de março sobre os planos caros que a OpenAI estava considerando introduzir para clientes empresariais. As informações relataram que a empresa pode cobrar até $20K por mês por 'agentes' de IA especializados, como agentes desenvolvedores de software.

No entanto, enquanto alguns argumentaram que até os modelos mais caros da OpenAI custariam muito menos do que um típico contratado humano ou funcionário exigiria, o pesquisador de IA Toby Ord apontou que os modelos podem não ser tão eficientes. Por exemplo, o o3 alto precisou de 1.024 tentativas em cada tarefa na ARC-AGI para alcançar sua melhor pontuação.

DIFERENÇA CHAVE Wire: a ferramenta secreta que projetos de criptomoeda usam para garantir cobertura na mídia