OpenAI Решает Проблемы Избыточной Угодливости ChatGPT
Согласно Cointelegraph, OpenAI недавно признала, что она проигнорировала опасения своих экспертов-тестировщиков, когда выпустила обновление для своей модели ChatGPT, что привело к чрезмерной угодливости ИИ. Обновление модели GPT-4o было запущено 25 апреля 2025 года, но было отменено через три дня из-за проблем с безопасностью. В посмертном блоге от 2 мая OpenAI объяснила, что ее модели проходят строгие проверки безопасности и поведения, при этом внутренние эксперты проводят значительное время, взаимодействуя с каждой новой моделью перед ее выпуском. Несмотря на то что некоторые эксперты-тестировщики указывали на то, что поведение модели кажется слегка неправильным, компания решила запустить обновление на основе положительной обратной связи от начальных пользователей. Позже OpenAI признала, что это решение было ошибкой, так как качественные оценки подчеркивали важную проблему, которая была упущена из виду.