Según Foresight News, OpenAI ha lanzado HealthBench, un nuevo estándar para evaluar el rendimiento de la IA en entornos médicos. Desarrollado de manera colaborativa por más de 250 médicos en todo el mundo, HealthBench incluye 5,000 diálogos de salud reales. El estándar tiene como objetivo evaluar las capacidades de los modelos de lenguaje grande en escenarios de atención médica y ahora está disponible como código abierto en GitHub.