Сэм Альтман опубликовал эссе со взглядом на будущее искусственного интеллекта, его экономику и его влияние на общество. Компания видит AGI (искусственный общий интеллект) как следующий этап в эволюции человеческих инструментов — после электричества, транзистора, компьютера и интернета.

Ключевые наблюдения об экономике AI впечатляют: интеллект модели растет пропорционально логарифму затраченных ресурсов, стоимость использования падает примерно в 10 раз каждые 12 месяцев (закон Мура, напомню, трактует об удвоении количества транзисторов каждые 24 месяца), а социально-экономическая ценность линейного роста интеллекта имеет суперэкспоненциальный характер.

OpenAI ожидает, что AI-агенты станут виртуальными коллегами — например, в разработке ПО они смогут работать на уровне инженера с несколькими годами опыта. И хотя они не будут генерировать прорывные идеи и потребуют человеческого контроля, масштаб их применения может быть огромным.

Интересно, что Альтман сравнивает AI с транзистором — научным открытием, которое хорошо масштабируется и проникает во все уголки экономики. При этом Сэм признает риски, особенно в области распределения благ между трудом и капиталом, и предлагает необычные идеи вроде предоставления всем людям “вычислительного бюджета” для использования AI.

Сноску обязательно прочитайте — мол, мы используем термин AGI для ясности, но это никак не влияет на наши отношения с Microsoft. И дальше — “эта сноска кажется глупой, но мы знаем, что некоторые журналисты попытаются получить клики, написав что-то глупое, поэтому мы упреждаем глупость…”

Раз уж я упомянул рекламу T-Mobile, нельзя не упомянуть рекламу ChatGPT на том же Superbowl. Минутный ролик в самом дорогом слоте в американской рекламе обошелся OpenAI в 8 млн долларов и по сюжету показывает развитие человечества от (видимо) Большого взрыва до ChatGPT. Симпатичная идея, легко считываемая и понятная.

T-Mobile запускает бета-тестирование спутниковой связи Starlink, начиная с функции отправки SMS для абонентов, находящихся вне зоны покрытия наземных сетей. До июля сервис будет бесплатным не только для клиентов T-Mobile, но и для абонентов AT&T и Verizon — довольно неожиданное решение, принятое в ответ на рекламу Verizon со знаменитым астронавтом Баззом Олдрином. Кстати, сам T-Mobile ответил на это рекламой на SuperBowl.

После июля сервис будет включен в самый дорогой тариф T-Mobile Go5G Next или доступен как опция за $15 в месяц (ранние пользователи смогут получить скидку до $10). Для абонентов AT&T и Verizon цена составит $20 в месяц, при этом им не придется менять оператора — достаточно иметь разблокированное устройство с поддержкой eSIM.

T-Mobile и SpaceX уже имеют более 450 спутников на орбите, обеспечивающих покрытие 500 тысяч квадратных миль территории, недоступной для наземных сетей. Компании также использовали эту технологию во время стихийных бедствий — ураганов Милтон и Элен, а также недавних пожаров в Лос-Анджелесе.

В этом году планируется добавить поддержку передачи данных, а в будущем и голосовой связи. Существующие встроенные решения в iPhone и моделях на Android обеспечивают только экстренные сообщения через спутник.

В Internet Archive в Сан-Франциско установили мраморный бюст Аарона Шварца — программиста, активиста и символа борьбы за свободный доступ к информации. Церемония собрала около 300 человек, большинство из которых никогда не встречали Шварца лично, но считают его идеи актуальными.

312-фунтовый бюст, вырезанный из каррарского мрамора, был создан с использованием как роботизированной обработки на основе ИИ, так и традиционной ручной резьбы. Пабло Пениче, инициатор проекта, вложил $10 000 собственных средств, остальные $53 500 были собраны от доноров, включая CEO Intercom и Mana.

“Я рад, что он стал символом, он бы это одобрил”, — поделился Эмметт Шир, бывший CEO Twitch, один из немногих, кто знал Шварца лично. Бюст будет установлен в вестибюле Internet Archive, пока Пениче не получит разрешение на размещение его в местном парке.

Илья Суцкевер, похоже, лучше всех монетизирует свою репутацию. Его стартап Safe Superintelligence (SSI), основанный всего восемь месяцев назад, может получить оценку в $20 млрд, хотя пока не заработал ни цента.

За этими космическими цифрами, конечно, стоит не только имя Суцкевера, считающегося крестным отцом масштабирования в ИИ (того самого подхода, который привел к ChatGPT). Команда усилена Даниэлем Гроссом, руководившим AI-инициативами в Apple, и Даниэлем Леви из OpenAI. А инвесторы, похоже, верят в их способность “покорить новую гору”, как загадочно выразился Суцкевер.

На фоне других AI-компаний $20 млрд не выглядят чем-то из ряда вон. OpenAI ведет переговоры об оценке в $300 млрд, а Anthropic может получить $60 млрд. Даже появление китайского DeepSeek с его “бюджетными” моделями, пошатнувшее акции Nvidia на $600 млрд, не охладило пыл инвесторов.

Есть только один вопрос — у SSI нет ни только ни цента выручки, но и даже приблизительного описания, в чем заключается продукт компании. Этим она, конечно, сильно отличается от других игроков.

Mistral выпустила обновление своего ассистента Le Chat, включая мобильное приложение для iOS и Android и новый веб-интерфейс.

Le Chat теперь получил поддержку веб-поиска с цитированием, генерацию изображений и работу с текстом/кодом в отдельном окне.

Вместе с мобильным приложением компания запускает Pro-подписку за $14.99 в месяц с доступом к самой производительной модели и возможностью отказаться от sharing данных. Mistral утверждает, что Le Chat работает на “самых быстрых inference-движках в мире” и может выдавать до 1000 слов в секунду — это было достигнуто благодаря партнерству с Cerebras.

Впрочем, основное преимущество Mistral — возможность развертывания Le Chat в собственной инфраструктуре с кастомными моделями и интерфейсом. Это критично для компаний в сфере обороны или банкинга, где невозможно использовать не on-premise сервисы.

Теперь посмотрим, сможет ли мобильное приложение Mistral привлечь пользователей — сейчас ChatGPT, DeepSeek и Google Gemini занимают 2-е, 3-е и 6-е места среди самых скачиваемых приложений для iPhone в США.

Конгрессмены США готовят законопроект о запрете приложения DeepSeek на правительственных устройствах из-за опасений, что оно может передавать данные пользователей китайскому правительству. Инициатива исходит от республиканца Дарина Лахуда и демократа Джоша Готхаймера, и очень напоминает историю с TikTok, который сначала запретили на госустройствах, а потом начали процесс полного запрета в США.

По данным анализа Feroot Security, чат-бот DeepSeek, ставший самым скачиваемым приложением в США, содержит скрытый код для передачи данных авторизации China Mobile — государственной телекоммуникационной компании, которой запрещено работать в США.

Некоторые федеральные агентства, включая ВМС США и NASA, уже заблокировали приложение. Австралия, Южная Корея и Италия также запретили DeepSeek в правительственных системах. Техас стал первым штатом США, запретившим приложение на государственных устройствах.

Да, а с TikTok пока всё хорошо — Трамп продлил дедлайн на 75 дней и обещает решить вопрос в течение месяца. Только не уточнил, это тот же месяц, в течение которого за 24 часа он закончит войну России против Украины, или какой-то другой. В общем, дадим ему 100 дней, а то за четыре года всё успеть невозможно.

Если вы уже забыли, то еще полтора года назад к компаниям, разрабатывающим AI-модели, было подано несколько групповых исков от имени ряда авторов книг про незаконное использование их произведений для обучения LLM моделей. Теперь в иске к Meta появился неожиданный поворот — компания не просто скачивала контент из “теневых библиотек”, но и активно пыталась скрыть свои действия. Внутренние документы и переписка показывают, что компания прекрасно понимала сомнительность своих действий.

Исследователи Meta работали в “стелс-режиме”, намеренно избегая использования корпоративных серверов, чтобы скрыть следы скачивания. Майкл Кларк, один из руководителей проекта, признал в показаниях, что они специально минимизировали “сидирование” — раздачу файлов другим участникам торрент-сети.

Особенно пикантно выглядят новые данные на фоне предыдущих показаний Марка Закерберга, утверждавшего, что не имел отношения к решению использовать LibGen для обучения AI. Внутренняя переписка показывает, что решение было принято после “предварительной эскалации к MZ”.

Meta продолжает настаивать, что использование книг подпадает под доктрину “добросовестного использования”. Однако попытки скрыть источник данных и минимизировать цифровые следы заставляют усомниться, что компания сама верила в законность своих действий.

Помните прошлогоднюю серию уходов из OpenAI, когда даже говорили о том, что Альтман вычищает всех, кто был в руководстве компании на момент его увольнения? Не все так однозначно и возможна и вторая производная — Джон Шульман, ушедший в Anthropic в августе прошлого года, теперь присоединяется к стартапу бывшей CTO OpenAI Миры Мурати.

Уходя из OpenAI в Anthropic, Шульман подчеркивал, что хочет сосредоточиться на “выравнивании AI” (alignment) и вернуться к практической технической работе. Чем он планирует заняться теперь, неясно, поскольку о проекте пока мало что известно, кроме того, что Мурати ведет переговоры о привлечении более $100 млн финансирования.

Стартап активно переманивает сотрудников из OpenAI, Character AI и Google DeepMind. В прошлом месяце к нему присоединились Джонатан Лахман (бывший руководитель специальных проектов OpenAI), Кристиан Гибсон из команды суперкомпьютеров OpenAI и IT-менеджер Марио Салтарелли.

Вот вам еще одна разработка исследователей — на этот раз из MIT и Гарварда, — на тему обучения моделей рассуждениям. В этом случае исследователи, чтобы обойтись без дорогостоящего обучения с участием большой модели, применением RLHF и SFT, разработали метод “Chain-of-Action-Thought” (COAT), когда сначала для модели генерируется небольшой обучающий набор рассуждений, а затем модель по нему обучается в процессе генерации промежуточных звеньев в цепочке останавливаться, оценивать решение, искать альтернативный подход и двигаться дальше.

Ключевая особенность подхода Satori в том, что модель учится рассуждать без внешнего руководства, она сама оценивает промежуточные результаты и сама ищет альтернативные решения. При этом навыки рассуждения, полученные на математических задачах, успешно переносятся на другие области — логику, программирование и так далее.

Обученная на базе Qwen-7B модель обошла по тестам своих одноклассников и даже большие (Llama 70B) модели, а в других областях продемонстрировала результаты на уровне лидеров, при том, что она не обучалась на материале этих тем.

Но еще одну ссылку я дам на свой блог — поскольку обсуждая статью с LLM, у нас родилась идея, что аналогичный подход можно реализовать с помощью few shot на топовой LLM и оказалось, что действительно можно и результаты получаются заметно лучше, чем даже с традиционными примерами “вопрос-ответ”. Правда, промпт получается немаленький, но… читайте в блоге, я там описал подробности.

---