/ Source

Тут давеча вышло очередное обновление GPT-4o и AI превратился в абсурдного подхалима — это даже не мое высказывание, так озаглавлена статья Цви Мовшовица и слово “подхалим” употребил и Сэм Альтман, обещая исправить проблему.

Субботний апдейт привел к тому, что модель что стала нестерпимо льстивой, рассыпающейся в комплиментах и говорящей пользователям то, что они, по мнению OpenAI, хотят услышать. Судя по волне возмущения в соцсетях, модель фактически перешла грань между приятным в общении помощником и раздражающим подхалимом, который переполнен восторженными фразами вроде “какой великолепный вопрос!” или “ваша идея просто потрясающая!”.

Это еще и совпало с внедрением функции полной памяти в GPT-4o, что только усилило эффект — модель теперь не только льстит в конкретном разговоре, но и выстраивает целую историю взаимоотношений с пользователем, основанную на этой льстивости. Некто Михаил Парахин (экс-глава Bing AI и вообще император) объяснил это ошибкой RLHF.

С учетом того, что такое поведение прямо противоречит собственному Model Spec OpenAI, где черным по белому написано: “Не будь подхалимом”, многие даже заподозрили, что оно стало результатом оптимизации вовлеченности аудитории — знаете, как в соцсетях, когда вам начинают показывать то, на что вы кликнете, и перестают показывать некликабельное.

Даже, если Альтман подкрутит сейчас “ручку подхалимства”, это все равно оставит вопросы — а каким должно быть поведение AI-помощника при взаимодействии с человеком?