Theo Foresight News, OpenAI đã ra mắt HealthBench, một tiêu chuẩn mới để đánh giá hiệu suất AI trong các cài đặt y tế. Được phát triển hợp tác bởi hơn 250 bác sĩ trên toàn thế giới, HealthBench bao gồm 5.000 cuộc đối thoại sức khỏe thực tế. Tiêu chuẩn này nhằm đánh giá khả năng của các mô hình ngôn ngữ lớn trong các tình huống chăm sóc sức khỏe và hiện đã có sẵn dưới dạng mã nguồn mở trên GitHub.