OpenAI Launches Safety Evaluations Hub to Enhance AI Model Transparency

Binance News · 2025-05-14T16:13:44.000Z

According to PANews, OpenAI has announced the launch of the 'Safety Evaluations Hub' to improve the security and transparency of its models. This initiative aims to provide ongoing updates on the safety performance of OpenAI's models concerning harmful content, jailbreak attacks, hallucination generation, and instruction prioritization. Unlike system cards that disclose data only once during model release, the hub will offer periodic updates aligned with model updates, allowing for cross-model comparisons. The goal is to enhance community understanding of AI safety and regulatory transparency. Currently, GPT-4.5 and GPT-4o are noted for their outstanding performance in resisting jailbreak attacks and maintaining factual accuracy.

Theo PANews, OpenAI đã công bố ra mắt 'Trung tâm Đánh giá An toàn' nhằm cải thiện độ an toàn và minh bạch của các mô hình của mình. Sáng kiến này nhằm cung cấp các cập nhật liên tục về hiệu suất an toàn của các mô hình OpenAI liên quan đến nội dung gây hại, các cuộc tấn công jailbreak, việc tạo ra ảo giác và ưu tiên hướng dẫn. Khác với các thẻ hệ thống chỉ tiết lộ dữ liệu một lần trong quá trình phát hành mô hình, trung tâm sẽ cung cấp các cập nhật định kỳ phù hợp với các bản cập nhật mô hình, cho phép so sánh giữa các mô hình. Mục tiêu là nâng cao hiểu biết của cộng đồng về an toàn AI và tính minh bạch trong quy định. Hiện tại, GPT-4.5 và GPT-4o được ghi nhận với hiệu suất xuất sắc trong việc chống lại các cuộc tấn công jailbreak và duy trì độ chính xác thực tế.

OpenAI Ra Mắt Trung Tâm Đánh Giá An Toàn để Tăng Cường Tính Minh Bạch của Mô Hình AI

Tin tức mới nhất

OpenAI Ra Mắt Trung Tâm Đánh Giá An Toàn để Tăng Cường Tính Minh Bạch của Mô Hình AI

Tin tức mới nhất

Bài viết thịnh hành