Conform PANews, OpenAI a anunțat lansarea 'Centrului de Evaluări de Siguranță' pentru a îmbunătăți securitatea și transparența modelor sale. Această inițiativă își propune să ofere actualizări continue cu privire la performanța de siguranță a modelor OpenAI în ceea ce privește conținutul dăunător, atacurile jailbreak, generarea de halucinații și prioritizarea instrucțiunilor. Spre deosebire de cărțile de sistem care divulgă date doar o dată în timpul lansării modelului, centrul va oferi actualizări periodice aliniate cu actualizările modelului, permițând comparații între modele. Scopul este de a îmbunătăți înțelegerea comunității cu privire la siguranța IA și transparența reglementărilor. În prezent, GPT-4.5 și GPT-4o sunt remarcate pentru performanța lor excepțională în rezistența la atacurile jailbreak și menținerea acurateței factuale.