Według Foresight News, OpenAI uruchomiło HealthBench, nowy standard oceny wydajności AI w medycynie. Opracowany wspólnie przez ponad 250 lekarzy na całym świecie, HealthBench zawiera 5 000 rzeczywistych dialogów zdrowotnych. Standard ma na celu ocenę możliwości dużych modeli językowych w scenariuszach opieki zdrowotnej i jest teraz dostępny jako open-source na GitHub.