Według PANews, OpenAI ogłosiło uruchomienie 'Centrum Oceny Bezpieczeństwa', aby poprawić bezpieczeństwo i przejrzystość swoich modeli. Inicjatywa ta ma na celu dostarczanie bieżących aktualizacji dotyczących wydajności bezpieczeństwa modeli OpenAI w kontekście szkodliwych treści, ataków jailbreak, generowania halucynacji oraz priorytetyzacji instrukcji. W przeciwieństwie do kart systemowych, które ujawniają dane tylko raz podczas wydania modelu, centrum będzie oferować okresowe aktualizacje zgodne z aktualizacjami modelu, umożliwiając porównania między modelami. Celem jest zwiększenie zrozumienia społeczności w zakresie bezpieczeństwa AI i przejrzystości regulacyjnej. Aktualnie, GPT-4.5 i GPT-4o wyróżniają się doskonałą wydajnością w opieraniu się atakom jailbreak i utrzymywaniu dokładności faktów.