Según Foresight News, OpenAI ha lanzado HealthBench, un nuevo punto de referencia para evaluar el rendimiento de la IA en entornos médicos. Desarrollado en colaboración con más de 250 médicos de todo el mundo, HealthBench incluye 5000 diálogos de salud reales. El punto de referencia busca evaluar las capacidades de los grandes modelos lingüísticos en entornos sanitarios y ya está disponible como código abierto en GitHub.