OpenAI Lanza el Centro de Evaluaciones de Seguridad para Mejorar la Transparencia en Modelos de IA

Binance News · 2025-05-14T16:13:44.000Z

According to PANews, OpenAI has announced the launch of the 'Safety Evaluations Hub' to improve the security and transparency of its models. This initiative aims to provide ongoing updates on the safety performance of OpenAI's models concerning harmful content, jailbreak attacks, hallucination generation, and instruction prioritization. Unlike system cards that disclose data only once during model release, the hub will offer periodic updates aligned with model updates, allowing for cross-model comparisons. The goal is to enhance community understanding of AI safety and regulatory transparency. Currently, GPT-4.5 and GPT-4o are noted for their outstanding performance in resisting jailbreak attacks and maintaining factual accuracy.

Binance News

--・Cuenta oficial de Binance verificada

Resumen de IA

El lanzamiento de un nuevo centro para actualizaciones continuas de seguridad de IA demuestra un compromiso con la transparencia y la mejora de las medidas de seguridad. Es probable que esta iniciativa fomente una mayor confianza y comprensión entre los usuarios respecto al rendimiento de los modelos de IA.

Según PANews, OpenAI ha anunciado el lanzamiento del 'Centro de Evaluaciones de Seguridad' para mejorar la seguridad y transparencia de sus modelos. Esta iniciativa tiene como objetivo proporcionar actualizaciones continuas sobre el rendimiento de seguridad de los modelos de OpenAI en relación con contenido dañino, ataques de jailbreak, generación de alucinaciones y priorización de instrucciones. A diferencia de las tarjetas del sistema que divulgan datos solo una vez durante la publicación del modelo, el centro ofrecerá actualizaciones periódicas alineadas con las actualizaciones del modelo, lo que permitirá comparaciones entre modelos. El objetivo es mejorar la comprensión de la comunidad sobre la seguridad de la IA y la transparencia regulatoria. Actualmente, se destaca que GPT-4.5 y GPT-4o tienen un rendimiento excepcional en la resistencia a ataques de jailbreak y en el mantenimiento de la precisión fáctica.

Aviso legal: Se incluyen opiniones de terceros. Esto no representa una asesoría financiera. Puede haber contenido patrocinado. Lee los TyC.

Noticias relacionadas

La Fundación Ethereum lanza una iniciativa de seguridad de un billón de dólares

OpenAI lanza HealthBench para evaluar la IA en la atención médica

Los desarrolladores de Ethereum se centran en la actualización de Fusaka para una mayor escalabilidad

Prime Intellect para un modelo de aprendizaje de refuerzo distribuido de código abierto

OpenAI Lanza el Centro de Evaluaciones de Seguridad para Mejorar la Transparencia en Modelos de IA

Lo más reciente