據 PANews 報道,OpenAI 宣佈推出 HealthBench 評估基準,由262位來自60國的醫生設計,涵蓋5000條模擬對話。HealthBench 檢驗模型響應的準確性、完整性與臨牀實用性。

此外,OpenAI 稱所有 Plus、Team 與 Pro 用戶可將深度研究報告導出爲格式良好的 PDF 文件,Enterprise 與 Edu 版本用戶將稍後上線。