Згідно з Foresight News, OpenAI запустила HealthBench, новий еталон для оцінки продуктивності ШІ в медичних умовах. Розроблений спільно понад 250 лікарями з усього світу, HealthBench містить 5,000 реальних медичних діалогів. Еталон має на меті оцінити можливості великих мовних моделей у сценаріях охорони здоров'я і тепер доступний як відкритий код на GitHub.