Согласно Foresight News, OpenAI запустила HealthBench, новый стандарт для оценки производительности ИИ в медицинских условиях. Разработанный совместно более чем 250 врачами со всего мира, HealthBench включает 5000 реальных медицинских диалогов. Стандарт направлен на оценку возможностей больших языковых моделей в сценариях здравоохранения и теперь доступен как с открытым исходным кодом на GitHub.