Potrivit Foresight News, OpenAI a lansat HealthBench, un nou standard pentru evaluarea performanței AI în medii medicale. Dezvoltat colaborativ de peste 250 de medici din întreaga lume, HealthBench include 5.000 de dialoguri reale despre sănătate. Standardul își propune să evalueze capacitățile modelelor mari de limbaj în scenarii de îngrijire a sănătății și este acum disponibil ca open-source pe GitHub.