A Apple anunciou ontem no WWDC 2025 atualizações futuras em seu modelo de IA para apresentar em toda a suíte de inteligência. O modelo teve um desempenho abaixo do esperado em seu benchmark em comparação com antigos modelos de empresas rivais, como a OpenAI. No entanto, o gigante da tecnologia argumentou que o On-Device e o Apple Server foram melhorados em relação aos seus predecessores e podem entender mais de 15 idiomas.
De acordo com testadores humanos, o mais novo modelo de dispositivo que roda localmente em iPhones e outros dispositivos teve um desempenho semelhante aos antigos modelos da Google e da Alibaba em relação à geração de texto. Testadores humanos classificaram o Apple Server, projetado para rodar nos centros de dados da empresa, atrás do GPT-4o da OpenAI, que tem um ano. Em uma avaliação separada, eles preferiram o Llama 4 da Meta em relação ao Apple Server na capacidade de analisar imagens. As classificações surpreenderam a Apple, já que o Llama 4 Scout teve um desempenho fraco em comparação com laboratórios de IA como Google, Anthropic e OpenAI.
Os desenvolvedores se sentem céticos em relação à promessa de inovação da Apple
Os desenvolvedores se sentem negativamente em relação aos lançamentos do WWDC deste ano, incluindo o pequeno modelo de IA em dispositivo da Apple. Atul Kakkar, diretor de produto do aplicativo de finanças pessoais Origi, revelou que, como desenvolvedor, ele não sentiu a intensidade da empolgação em torno do que a empresa de Tim Cook lançou. Ele acredita que o evento anual do WWDC já foi o mais badalado da tecnologia, mas agora está cercado por ceticismo sobre a capacidade do fabricante do iPhone de acompanhar os gigantes da IA.
A Apple não reporta benchmarks para suas IAs, relatando uma avaliação cara a cara mal documentada
Mas mesmo pelos seus padrões, os modelos mais recentes da Apple em dispositivos são em sua maioria piores do que os abertos Gemma 3-4B da Google ou Qwen 3-4B
E o servidor LLM deles é semelhante ao Llama 4 Scout pic.twitter.com/hwpOG5Lgyp
— Ethan Mollick (@emollick) 10 de junho de 2025
O gigante da tecnologia está sob pressão para acompanhar, atualizando continuamente suas ferramentas de IA para desenvolvedores e construindo uma experiência empolgante para o consumidor dentro da suíte de Inteligência da Apple. Grant McDonald, CEO e cofundador do aplicativo de aconselhamento parental Bobo, disse que a empresa de Tim Cook está fazendo coisas interessantes, mas isso não é suficiente para se destacar no barulho.
McDonald acredita que permitir que os desenvolvedores construam aplicativos com IA usando seus pequenos modelos de IA em dispositivo pode ser o valor que a empresa espera entregar. Pequenos modelos de IA são treinados em pequenos conjuntos de dados e usam menos poder computacional, o que significa que podem ser executados em um iPhone em vez de grandes servidores na nuvem. Ele disse que executar modelos em um dispositivo é praticamente mais barato do que os baseados em nuvem, como o GPT e o Gemini.
Os desenvolvedores duvidaram que os modelos em dispositivo possam ter um bom desempenho em comparação com os baseados em nuvem. Um desenvolvedor disse que eles não conseguirão ajustá-los em um conjunto de dados proprietário. McDonald disse que os modelos em dispositivo serão bons o suficiente para alguns aplicativos, mas não para o Bobo. O aplicativo de parentalidade personalizou seu modelo de IA com dados proprietários de consultores de sono, consultores de lactação, patologistas da fala e outros especialistas em parentalidade.
A divisão de pesquisa em IA da Apple luta para alcançar os concorrentes
O gigante da tecnologia prometeu uma atualização da Siri para apresentar conteúdo mais personalizado, mas essa atualização foi adiada. Alguns clientes processaram a empresa por comercializar produtos que ainda não foram entregues. Pesquisadores disseram que, enquanto os modelos de IA têm um desempenho muito bom em matemática e ciências, problemas complexos fornecem apenas a ilusão de pensar.
O gigante da tecnologia atrasou o desenvolvimento de grandes modelos de linguagem e a implementação de IA em seus dispositivos para ficar fora da conversa. No WWDC, a empresa apresentou a Apple Intelligence para recursos de IA, que a comunidade considerou decepcionantes.
Pesquisadores descobriram que os LRMs começam a falhar após um certo ponto. Isso mostra que todos os modelos de raciocínio exibem um padrão semelhante em que a precisão diminui progressivamente à medida que a complexidade do problema aumenta até a precisão zero. De acordo com os pesquisadores, os modelos de raciocínio inicialmente aplicam mais tokens de pensamento, mas à medida que a complexidade aumenta, eles desistem e, contraintuitivamente, seu esforço de raciocínio começa a diminuir apesar do aumento da dificuldade do problema.
De acordo com Dipanjan Chatterjee, analista da Forrester Research, o silêncio em torno da Siri era ensurdecedor. Ele revelou que nenhuma quantidade de correção de texto ou emojis fofos pode preencher a esperada experiência interativa de IA que ele sabe que a Siri seria capaz de oferecer. Ele acredita que o fim da Siri está próximo se a empresa não agir rapidamente. A empresa não forneceu um cronograma preciso para a atualização da Siri. No entanto, indicou que isso não acontecerá até o próximo ano, no mínimo, de acordo com Craig Federighi, um dos principais executivos de software da empresa.
Suas notícias sobre criptomoedas merecem atenção - a KEY Difference Wire coloca você em mais de 250 sites principais