Еще одна новость от OpenAI: представлена GPT-5-Codex — версия GPT-5, оптимизированная для “агентного программирования”.

Как понятно из названия, она предназначена для работы в Codex — причем, как в веб-версии, так и cli. OpenAI подчеркивает, что модель адаптирует объем размышлений под задачу и может потратить несколько часов на сложный рефакторинг. При этом она заточена под code review.

Судя по результатам тестов, модель солидно выигрывает у дефолтной GPT-5, которая до этого использовалась в codex cli.

Как на грех, у меня как раз закончились кодерские задачи, даже не на чем попробовать пока.

OpenAI опубликовали исследование на основе анализа 1.5 млн чатов с ChatGPT.

Самое интересное — люди используют ChatGPT совсем не так, как предполагали технооптимисты. Программирование, которое все считают чуть ли не главной способностью GPT, остается нишевой активностью. Зато половина всех запросов — это “Asking”, когда пользователи просят совета, а не генерации контента. ChatGPT стал не инструментом автоматизации, а цифровым советником. Причем 70% использования вообще не связано с работой — люди решают повседневные задачи, ищут информацию, пишут личные тексты.

Про личные тексты не знаю, а вот у меня он полностью заменил поиск в информационных запросах. Более того, он же прекрасно заменяет даже shopping-поиски — сначала объясняет, что именно надо для решения задачи, а потом выясняется, что это продаётся в Эпицентре в нескольких километрах от дома.

География тоже выглядит необычно. Рост в странах с низкими доходами в четыре раза превышает показатели богатых стран. Похоже на историю со смартфонами и мобильной связью, когда в большом количестве развивающихся стран их освоение произошло без использования проводного интернета и десктопных интернетов.

Гендерный разрыв практически исчез — женщины составляют уже 52% пользователей против 37% год назад.

Правда, за пределами исследования осталось корпоративное использование — то есть чаты корпоративных пользователей. Там определенно всё иначе — может, программирование и лидирует. Впрочем, необязательно.

Penske Media первым из крупных американских медиахолдингов подал антимонопольный иск против Google из-за AI Overviews. Претензии стандартные: Google использует контент изданий без компенсации и перехватывает трафик.

По данным Penske, примерно 20% результатов поиска, содержащих хотя бы одну ссылку на сайты холдинга (а в их число входят Rolling Stone и Hollywood Reporter) сопровождаются теперь AI Overviews. При этом доход от партнерских ссылок на сайтах холдинга упали больше чем на треть с конца 2024 года.

Google в ответ заявил, что AI Overviews улучшает качество поиска для пользователей, а те, кто переходят на сайты по ссылкам оттуда, проводят на сайтах больше времени. В общем, стандартные ответы.

Этой дилемме уже лет 20 и решения не предвидится — люди строят бизнесы, серьезно зависящие от источников трафика, в частности, от поисковиков, и уверены, что имеют право на стабильность этого бизнеса. С другой стороны, как правило, они склонны переоценивать уникальность и полезность своего контента.

OpenAI и другие AI компании ходят и фактически покупают доступ к такому контенту — правда, эти деньги не способны заместить выбывающие доходы. Но, предположим, можно закрыть доступ для ChatGPT — а что будет делать тот же самый Penske Media, пропав из поиска вообще?

Мира Мурати наконец показала, над чем работает её Thinking Machines Lab с двумя миллиардами seed-финансирования. На этой неделе компания запустила собственный блог и выложила первую статью в нем. Статья посвящена попытке сделать ответы LLM детерминированными — воспроизводимыми при одинаковых запросах.

Исследователь Хорас Хе пишет о проблеме недетерминированности в LLM — когда даже при установке температуры в 0, API языковых моделей выдают разные результаты при одинаковых запросах. Многие считают, что причина недетерминированности - это комбинация параллельных вычислений и неассоциативности операций с плавающей точкой на GPU. Хорас показывает, что это не полная картина.

Главная причина недетерминированности - отсутствие batch-инвариантности в ядрах GPU. Когда размер батча (количество одновременно обрабатываемых запросов) меняется, результаты для отдельных элементов могут отличаться из-за разного порядка суммирования чисел с плавающей точкой. В статье предлагается создать batch-инвариантные версии ключевых операций. По результатам тестирования на модели Qwen3-235B удалось добиться полной идентичности ответов — правда, ценой снижения производительности в 1,6 раза.

Это, конечно, еще не полное оправдания полученного финансирования, но хорошая иллюстрация его полезности, как мне кажется.

Хорошему новостному агрегатору Techmeme вчера исполнилось 20 лет. Честно скажу, я сам много лет использую его для мониторинга новостной картины и даже наличие большого количества подписок на ведущие СМИ не отменяет его полезности. Правда, проект остается небольшим, но, как они сами написали, absurdly constistent. И это хорошо — учитывая, сколько нишевых СМИ с многолетней историей закрываются сейчас, хочется надеяться, что последовательность им поможет.

Apple, скорее всего, отложит запуск iPhone Air в Китае — устройство толщиной 5.6мм требует eSIM, а китайские регуляторы пока не готовы дать одобрение. При этом обычные iPhone 17, Pro и Pro Max выйдут по графику 19 сентября.

Пекин традиционно настороженно относится к технологии, которая позволяет менять оператора без физического посещения салона связи. China Mobile в среду даже написал в Weibo, что “включил поддержку eSIM для мобильных телефонов”, но тут же добавил — дата запуска будет объявлена отдельно.

По данным Apple, все три государственных оператора — China Unicom, China Mobile и China Telecom — готовы предоставить поддержку eSIM. Но “конкретные сроки зависят от регуляторного одобрения”. Поскольку слот для физической карты в Air разместить негде, покупателям придется подождать.

OpenAI и Microsoft подписали необязывающий меморандум о взаимопонимании для пересмотра партнерства. Документ должен расчистить путь для реструктуризации создателя ChatGPT из некоммерческой организации в public benefit corporation — формат, позволяющий совету директоров учитывать не только интересы акционеров.

Детали не раскрываются, но источники говорят о взаимных уступках.

Будем надеяться, что не договорились договариваться, а то сейчас это у американцев модно.

FTC затребовала у семи крупнейших AI-компаний информацию о влиянии чатботов на детей и подростков. В списке OpenAI, Google, Meta с Instagram, Snap, xAI Маска и Character Technologies. Агентство использует полномочия 6(b) для “исследования рынка” — процесс может занять годы, но любая найденная информация пойдет в официальные расследования.

Это, на самом деле, достаточно выраженный тренд — есть несколько исков к OpenAI и Character.AI по поводу возможного влияния их чатботов на случаи самоубийства подростков. Политики, вплоть до сенаторов, достаточно регулярно высказываются о возможном вреде AI для детей. В итоге полностью республиканская FTC единогласно проголосовала за расследование, хотя обычно республиканцы против регулирования big tech.

В общем, мы должны помочь этим детям и мы им поможем — сказали себе политики. Если что, помогали детям и дело с концом.

Apple блокирует Live Translation для AirPods в Европе — функция недоступна пользователям, которые одновременно находятся в ЕС и имеют европейский Apple Account. Двойная проверка намекает на серьезность юридических опасений компании.

Ирония в том, что функция поддерживает все основные языки ЕС — английский, французский, немецкий, испанский, португальский. До конца года добавят еще итальянский.

В общем, не удивительно — это не первая функция с использованием AI, которая не запускается в странах Евросоюза благодаря местному регулированию в области технологий. В такой конфигурации функция Live Translation становится, в основном, функцией для американских пользователей во время турпоездок по Европе. По крайней мере, до того, как состоится запланированный до конца года запуск китайского, корейского и японского языков.

Bending Spoons покупает Vimeo за $1.38 млрд наличными — премия в 91% к средневзвешенной цене акций за последние 60 дней. При рыночной капитализации в $797 млн до объявления сделки, это скорее спасательная операция для платформы, потерявшей 90% стоимости за последние четыре года.

Миланская Bending Spoons специализируется на покупке и реанимации цифровых активов, которые потеряли путь. В частности, именно они купили в свое время Evernote, когда тот казался безнадежно устаревшим на фоне Notion. В их портфеле также StreamYard, Meetup и другие интересные продукты.

При этом оценка самой Bending Spoons составляет $2.6 млрд после последнего раунда, то есть они тратят больше половины своей стоимости на Vimeo.

Сделка полностью за наличные — да, я знаю, как криво переводится выражение cash, но, как уже комментировал, адекватного перевода особо и нет. Что будет делать новый владелец, примерно понятно — оптимизировать расходы и выстраивать монетизацию. Насколько я вижу, особой синергии между разными активами в портфеле компании не наблюдается, впрочем, что компания вкладывает внутри продуктов, снаружи можно и не заметить. Vimeo терять особо нечего — попытки конкурировать с YouTube и TikTok у них явно не удались, так что у нового владельца руки развязаны.

---