De acordo com o Foresight News, a OpenAI lançou o HealthBench, um novo benchmark para avaliar o desempenho da IA em ambientes médicos. Desenvolvido colaborativamente por mais de 250 médicos em todo o mundo, o HealthBench inclui 5.000 diálogos reais sobre saúde. O benchmark tem como objetivo avaliar as capacidades de grandes modelos de linguagem em cenários de saúde e agora está disponível como código aberto no GitHub.