Илья Суцкевер, похоже, лучше всех монетизирует свою репутацию. Его стартап Safe Superintelligence (SSI), основанный всего восемь месяцев назад, может получить оценку в $20 млрд, хотя пока не заработал ни цента.

За этими космическими цифрами, конечно, стоит не только имя Суцкевера, считающегося крестным отцом масштабирования в ИИ (того самого подхода, который привел к ChatGPT). Команда усилена Даниэлем Гроссом, руководившим AI-инициативами в Apple, и Даниэлем Леви из OpenAI. А инвесторы, похоже, верят в их способность “покорить новую гору”, как загадочно выразился Суцкевер.

На фоне других AI-компаний $20 млрд не выглядят чем-то из ряда вон. OpenAI ведет переговоры об оценке в $300 млрд, а Anthropic может получить $60 млрд. Даже появление китайского DeepSeek с его “бюджетными” моделями, пошатнувшее акции Nvidia на $600 млрд, не охладило пыл инвесторов.

Есть только один вопрос — у SSI нет ни только ни цента выручки, но и даже приблизительного описания, в чем заключается продукт компании. Этим она, конечно, сильно отличается от других игроков.

Mistral выпустила обновление своего ассистента Le Chat, включая мобильное приложение для iOS и Android и новый веб-интерфейс.

Le Chat теперь получил поддержку веб-поиска с цитированием, генерацию изображений и работу с текстом/кодом в отдельном окне.

Вместе с мобильным приложением компания запускает Pro-подписку за $14.99 в месяц с доступом к самой производительной модели и возможностью отказаться от sharing данных. Mistral утверждает, что Le Chat работает на “самых быстрых inference-движках в мире” и может выдавать до 1000 слов в секунду — это было достигнуто благодаря партнерству с Cerebras.

Впрочем, основное преимущество Mistral — возможность развертывания Le Chat в собственной инфраструктуре с кастомными моделями и интерфейсом. Это критично для компаний в сфере обороны или банкинга, где невозможно использовать не on-premise сервисы.

Теперь посмотрим, сможет ли мобильное приложение Mistral привлечь пользователей — сейчас ChatGPT, DeepSeek и Google Gemini занимают 2-е, 3-е и 6-е места среди самых скачиваемых приложений для iPhone в США.

Конгрессмены США готовят законопроект о запрете приложения DeepSeek на правительственных устройствах из-за опасений, что оно может передавать данные пользователей китайскому правительству. Инициатива исходит от республиканца Дарина Лахуда и демократа Джоша Готхаймера, и очень напоминает историю с TikTok, который сначала запретили на госустройствах, а потом начали процесс полного запрета в США.

По данным анализа Feroot Security, чат-бот DeepSeek, ставший самым скачиваемым приложением в США, содержит скрытый код для передачи данных авторизации China Mobile — государственной телекоммуникационной компании, которой запрещено работать в США.

Некоторые федеральные агентства, включая ВМС США и NASA, уже заблокировали приложение. Австралия, Южная Корея и Италия также запретили DeepSeek в правительственных системах. Техас стал первым штатом США, запретившим приложение на государственных устройствах.

Да, а с TikTok пока всё хорошо — Трамп продлил дедлайн на 75 дней и обещает решить вопрос в течение месяца. Только не уточнил, это тот же месяц, в течение которого за 24 часа он закончит войну России против Украины, или какой-то другой. В общем, дадим ему 100 дней, а то за четыре года всё успеть невозможно.

Если вы уже забыли, то еще полтора года назад к компаниям, разрабатывающим AI-модели, было подано несколько групповых исков от имени ряда авторов книг про незаконное использование их произведений для обучения LLM моделей. Теперь в иске к Meta появился неожиданный поворот — компания не просто скачивала контент из “теневых библиотек”, но и активно пыталась скрыть свои действия. Внутренние документы и переписка показывают, что компания прекрасно понимала сомнительность своих действий.

Исследователи Meta работали в “стелс-режиме”, намеренно избегая использования корпоративных серверов, чтобы скрыть следы скачивания. Майкл Кларк, один из руководителей проекта, признал в показаниях, что они специально минимизировали “сидирование” — раздачу файлов другим участникам торрент-сети.

Особенно пикантно выглядят новые данные на фоне предыдущих показаний Марка Закерберга, утверждавшего, что не имел отношения к решению использовать LibGen для обучения AI. Внутренняя переписка показывает, что решение было принято после “предварительной эскалации к MZ”.

Meta продолжает настаивать, что использование книг подпадает под доктрину “добросовестного использования”. Однако попытки скрыть источник данных и минимизировать цифровые следы заставляют усомниться, что компания сама верила в законность своих действий.

Помните прошлогоднюю серию уходов из OpenAI, когда даже говорили о том, что Альтман вычищает всех, кто был в руководстве компании на момент его увольнения? Не все так однозначно и возможна и вторая производная — Джон Шульман, ушедший в Anthropic в августе прошлого года, теперь присоединяется к стартапу бывшей CTO OpenAI Миры Мурати.

Уходя из OpenAI в Anthropic, Шульман подчеркивал, что хочет сосредоточиться на “выравнивании AI” (alignment) и вернуться к практической технической работе. Чем он планирует заняться теперь, неясно, поскольку о проекте пока мало что известно, кроме того, что Мурати ведет переговоры о привлечении более $100 млн финансирования.

Стартап активно переманивает сотрудников из OpenAI, Character AI и Google DeepMind. В прошлом месяце к нему присоединились Джонатан Лахман (бывший руководитель специальных проектов OpenAI), Кристиан Гибсон из команды суперкомпьютеров OpenAI и IT-менеджер Марио Салтарелли.

Вот вам еще одна разработка исследователей — на этот раз из MIT и Гарварда, — на тему обучения моделей рассуждениям. В этом случае исследователи, чтобы обойтись без дорогостоящего обучения с участием большой модели, применением RLHF и SFT, разработали метод “Chain-of-Action-Thought” (COAT), когда сначала для модели генерируется небольшой обучающий набор рассуждений, а затем модель по нему обучается в процессе генерации промежуточных звеньев в цепочке останавливаться, оценивать решение, искать альтернативный подход и двигаться дальше.

Ключевая особенность подхода Satori в том, что модель учится рассуждать без внешнего руководства, она сама оценивает промежуточные результаты и сама ищет альтернативные решения. При этом навыки рассуждения, полученные на математических задачах, успешно переносятся на другие области — логику, программирование и так далее.

Обученная на базе Qwen-7B модель обошла по тестам своих одноклассников и даже большие (Llama 70B) модели, а в других областях продемонстрировала результаты на уровне лидеров, при том, что она не обучалась на материале этих тем.

Но еще одну ссылку я дам на свой блог — поскольку обсуждая статью с LLM, у нас родилась идея, что аналогичный подход можно реализовать с помощью few shot на топовой LLM и оказалось, что действительно можно и результаты получаются заметно лучше, чем даже с традиционными примерами “вопрос-ответ”. Правда, промпт получается немаленький, но… читайте в блоге, я там описал подробности.

Пятьдесят долларов облачных кредитов — именно столько потребовалось исследователям из Стэнфорда и Университета Вашингтона, чтобы создать AI-модель, способную соревноваться с продуктами технологических гигантов. Это как если бы кто-то собрал Ferrari в гараже из запчастей от Toyota, причем машина поехала почти так же быстро, как оригинал.

Секрет успеха кроется в методе дистилляции — своеобразном AI-репетиторстве, когда маленькая модель учится у большой, перенимая её способности к рассуждению. Исследователи использовали всего 1000 тщательно подобранных вопросов и ответов от Google Gemini, потратили полчаса на 16 GPU — и получили модель s1, показывающую впечатляющие результаты в тестах на математику и программирование.

В то время как Meta, Google и Microsoft планируют вложить сотни миллиардов долларов в AI-инфраструктуру в 2025 году, этот эксперимент ставит неудобный вопрос: а нужны ли такие гигантские инвестиции? Конечно, дистилляция не создает принципиально новых возможностей, но она может сделать существующие технологии доступными для более широкого круга разработчиков и даже бизнес-пользователей.

Впрочем, я бы еще задумался о тестах — за последние полгода мы уже видели много моделей, “показывающих впечатляющие результаты в тестах”, но только R1 вроде удовлетворяет пользователей за пределами тестов.

Wall Street преподнес Илону Маску неожиданный подарок — банки продали долг X на $5.5 млрд по цене 97 центов за доллар, что существенно выше первоначальных планов. Те же самые банки, которые списывали миллиарды на этих кредитах после покупки Twitter в 2022 году, теперь радуются возможности улучшить свои балансы.

Что изменилось? Формально — финансовые показатели. X сообщил о выручке $2.7 млрд и EBITDA $1.25 млрд за 2024 год. Это все еще существенно ниже результатов Twitter за 2021 год ($5 млрд и $682 млн соответственно), но уже не выглядит катастрофой. Возвращение крупных рекламодателей вроде Amazon внушает оптимизм, хотя компания все еще балансирует на грани безубыточности.

Но главные причины энтузиазма инвесторов лежат за пределами финансовой отчетности. Во-первых, это растущая синергия с xAI — X получил 10% долю в компании, оцененную в $5 млрд, а искусственный интеллект Маска тренируется на данных соцсети. Во-вторых, и это, понятно, ключевой фактор — политическое влияние Маска после возвращения Трампа в Белый дом.

Впрочем, даже самые оптимистичные инвесторы признают, что при процентных платежах более $1 млрд в год компании придется непросто. А банкам еще предстоит продать оставшиеся $6 млрд долга X, причем более рискованного. Но пока Wall Street готов делать ставку на “Маск Inc.” — конгломерат компаний, чья стоимость все больше зависит от политического капитала их владельца.

Почтовая служба США быстро отыграла назад решение о приостановке приема посылок из Китая и Гонконга. Всего через 12 часов после объявления о временной заморозке отправлений USPS сообщила, что продолжит принимать “всю входящую международную почту и посылки”.

Замешательство возникло на фоне отмены правила “de minimis” для Китая, которое ранее позволяло беспошлинно ввозить в США небольшие посылки стоимостью до $800. Это исключение, которым активно пользовались китайские e-commerce компании, было отменено в рамках введения новой 10% пошлины на товары из Китая и Гонконга.

Теперь USPS и Таможенная служба работают над механизмом эффективного сбора новых пошлин с минимальными нарушениями в доставке посылок.

В общем, это скорее демонстрирует консистентность менеджмента. Как где-то уже написали, “Илон Маск приносит хаос из Twitter в федеральное правительство”, но, как мы видим на этой неделе, пример заразителен и скорость распространения хаоса и в международную политику и даже на госкомпании впечатляет.

В Украине запустился Revolut. Информация о начале бета-тестирования была еще в конце прошлого года, но вот сейчас мне пришло уведомление, что можно зарегистрировать аккаунт. Юридически это аккаунт в европейском сервисе — напомню, что формально Revolut имеет банковскую лицензию в Литве, распространяющуюся на весь Евросоюз. Дефолтная валюта счета — евро, можно открыть дополнительно еще в 30 валютах, но гривны среди них нет. Компания объясняет это регуляторными ограничениями в Украине.

При этом у компании есть дочка в Украине — ТОВ “РЕВОЛЮТ ТЕХНОЛОДЖИС ЮКРЕЙН”, но она используется, видимо, лишь для технического взаимодействия — например, верификация пользователя происходит через Дію, впрочем, отдельно запускается процесс верификации через Onfido.

Пока непонятно, будут ли доступны в Украине бизнес-услуги Revolut — доступ к системе платежей и Pro-аккаунты, — пока мне сообщило, что недоступно, но у меня и аккаунт еще не прошел верификацию. С другой стороны, Paypal так и не сделал доступными бизнес-аккаунты, несмотря на то, что персональные аккаунты в нем доступны украинцам уже три года.

В общем, давайте присматриваться — деньги от новых сервисов сами не возникают, но лишним Revolut вряд ли будет.

---