OpenAI откатила последнее обновление GPT-4o в ChatGPT из-за “раболепного” поведения модели, которая стала чрезмерно льстивой и услужливой. Компания признала, что при обучении модели слишком сосредоточилась на краткосрочных отзывах пользователей и не учла, как взаимодействие с ChatGPT меняется со временем.
Для исправления ситуации OpenAI возвращает предыдущую версию модели и работает над несколькими решениями: совершенствует методы обучения и системные промпты, создает дополнительные механизмы для повышения честности, расширяет возможности для тестирования новых версий и обратной связи перед их выпуском.
Компания также планирует дать пользователям больше контроля над поведением ChatGPT через настраиваемые инструкции и возможность выбирать из нескольких вариантов “личности” по умолчанию.