Согласно PANews, OpenAI объявила о запуске 'Центра оценки безопасности', чтобы улучшить безопасность и прозрачность своих моделей. Эта инициатива направлена на предоставление регулярных обновлений о безопасной работе моделей OpenAI в отношении вредоносного контента, атак на jailbreak, генерации галлюцинаций и приоритизации инструкций. В отличие от системных карточек, которые раскрывают данные только один раз во время выпуска модели, центр будет предлагать периодические обновления, согласованные с обновлениями моделей, что позволит проводить сравнения между моделями. Цель состоит в том, чтобы повысить понимание сообществом безопасности ИИ и регулирующей прозрачности. В настоящее время GPT-4.5 и GPT-4o отмечены своим выдающимся поведением в сопротивлении атакам на jailbreak и поддержании фактической точности.