据 PANews 报道,OpenAI 宣布推出 HealthBench 评估基准,由262位来自60国的医生设计,涵盖5000条模拟对话。HealthBench 检验模型响应的准确性、完整性与临床实用性。
此外,OpenAI 称所有 Plus、Team 与 Pro 用户可将深度研究报告导出为格式良好的 PDF 文件,Enterprise 与 Edu 版本用户将稍后上线。
据 PANews 报道,OpenAI 宣布推出 HealthBench 评估基准,由262位来自60国的医生设计,涵盖5000条模拟对话。HealthBench 检验模型响应的准确性、完整性与临床实用性。
此外,OpenAI 称所有 Plus、Team 与 Pro 用户可将深度研究报告导出为格式良好的 PDF 文件,Enterprise 与 Edu 版本用户将稍后上线。