| Телеграм-канал БлоGнот

7 августа 2025 г.

А вот такой комментарий написал к предыдущей новости сам GPT-5:

Кажется, OpenAI наконец-то фиксирует новый формат продукта: не «зоопарк моделей», а единая система с автоматическим роутером. По данным OpenAI, GPT‑5 становится дефолтом в ChatGPT, а «глубокое мышление» включается по ситуации — или по подсказке пользователя фразой вроде think hard about this. Если упрётесь в лимиты, вас тихо переведут на mini‑версию. Концептуально это важнее самих бенчмарков.

Довольно любопытно, что компания меняет сам подход к безопасности. Вместо жёстких отказов — так называемые safe completions: модель пытается помочь на безопасном уровне и честно объясняет границы. Параллельно «GPT‑5 thinking» отнесли к High в биологии и химии, для него завезли многоуровневые защиты и 5 тысяч часов red‑teaming с партнёрами, как утверждает OpenAI. Вкупе с заявленными снижениями галлюцинаций и обмана это звучит как попытка вывести AI из режима демонстрации трюков в режим предсказуемой инфраструктуры. Впрочем, посмотрим, как это поведёт себя за пределами демо.

Есть ещё пара деталей, которые легко пропустить. Во‑первых, роутер тренируется на реальных сигналах — от предпочтений пользователей до измеренной корректности, — то есть сам продукт будет меняться по мере того, как мы им пользуемся. Во‑вторых, OpenAI явно борется с избыточной «учтивостью» модели: снижение лести и новые предустановленные «персоны» вроде Cynic и Robot призваны управлять тоном, а не только фактурой ответов. И да, по данным OpenAI, в коде и здравоохранении прирост ощутим — от SWE‑bench Verified до HealthBench, — но бенчмарки, как обычно, хороши постфактум, а важнее качество в повседневных задачах.

Если прогнозировать, рынок ждёт перетяжка каната не столько за «самый умный» чип, сколько за лучший пользовательский автопилот. Унифицированная архитектура с роутером снижает видимость модели как таковой и повышает ценность дистрибуции. Бесплатный доступ по умолчанию — сильная вилка против конкурентов из лагеря Google, Anthropic и Meta, а заодно давление на экосистему «обёрток» и плагинов, которым всё сложнее объяснить, зачем промежуточный слой. В здравоохранении появится ещё один слой триажа и подготовки к визиту к врачу, но вместе с этим вырастет интерес регуляторов — безопасные частичные ответы хороши на бумаге, в реальности границы часто размыты.

По ощущениям, если архитектура с роутером действительно работает, эпоха советов «переключите модель на X» будет сходить на нет. Пользователю это удобно. Конкурентам, скажем так, не вполне удачно.