T-Mobile запускает бета-тестирование спутниковой связи Starlink, начиная с функции отправки SMS для абонентов, находящихся вне зоны покрытия наземных сетей. До июля сервис будет бесплатным не только для клиентов T-Mobile, но и для абонентов AT&T и Verizon — довольно неожиданное решение, принятое в ответ на рекламу Verizon со знаменитым астронавтом Баззом Олдрином. Кстати, сам T-Mobile ответил на это рекламой на SuperBowl.

После июля сервис будет включен в самый дорогой тариф T-Mobile Go5G Next или доступен как опция за $15 в месяц (ранние пользователи смогут получить скидку до $10). Для абонентов AT&T и Verizon цена составит $20 в месяц, при этом им не придется менять оператора — достаточно иметь разблокированное устройство с поддержкой eSIM.

T-Mobile и SpaceX уже имеют более 450 спутников на орбите, обеспечивающих покрытие 500 тысяч квадратных миль территории, недоступной для наземных сетей. Компании также использовали эту технологию во время стихийных бедствий — ураганов Милтон и Элен, а также недавних пожаров в Лос-Анджелесе.

В этом году планируется добавить поддержку передачи данных, а в будущем и голосовой связи. Существующие встроенные решения в iPhone и моделях на Android обеспечивают только экстренные сообщения через спутник.

В Internet Archive в Сан-Франциско установили мраморный бюст Аарона Шварца — программиста, активиста и символа борьбы за свободный доступ к информации. Церемония собрала около 300 человек, большинство из которых никогда не встречали Шварца лично, но считают его идеи актуальными.

312-фунтовый бюст, вырезанный из каррарского мрамора, был создан с использованием как роботизированной обработки на основе ИИ, так и традиционной ручной резьбы. Пабло Пениче, инициатор проекта, вложил $10 000 собственных средств, остальные $53 500 были собраны от доноров, включая CEO Intercom и Mana.

“Я рад, что он стал символом, он бы это одобрил”, — поделился Эмметт Шир, бывший CEO Twitch, один из немногих, кто знал Шварца лично. Бюст будет установлен в вестибюле Internet Archive, пока Пениче не получит разрешение на размещение его в местном парке.

Илья Суцкевер, похоже, лучше всех монетизирует свою репутацию. Его стартап Safe Superintelligence (SSI), основанный всего восемь месяцев назад, может получить оценку в $20 млрд, хотя пока не заработал ни цента.

За этими космическими цифрами, конечно, стоит не только имя Суцкевера, считающегося крестным отцом масштабирования в ИИ (того самого подхода, который привел к ChatGPT). Команда усилена Даниэлем Гроссом, руководившим AI-инициативами в Apple, и Даниэлем Леви из OpenAI. А инвесторы, похоже, верят в их способность “покорить новую гору”, как загадочно выразился Суцкевер.

На фоне других AI-компаний $20 млрд не выглядят чем-то из ряда вон. OpenAI ведет переговоры об оценке в $300 млрд, а Anthropic может получить $60 млрд. Даже появление китайского DeepSeek с его “бюджетными” моделями, пошатнувшее акции Nvidia на $600 млрд, не охладило пыл инвесторов.

Есть только один вопрос — у SSI нет ни только ни цента выручки, но и даже приблизительного описания, в чем заключается продукт компании. Этим она, конечно, сильно отличается от других игроков.

Mistral выпустила обновление своего ассистента Le Chat, включая мобильное приложение для iOS и Android и новый веб-интерфейс.

Le Chat теперь получил поддержку веб-поиска с цитированием, генерацию изображений и работу с текстом/кодом в отдельном окне.

Вместе с мобильным приложением компания запускает Pro-подписку за $14.99 в месяц с доступом к самой производительной модели и возможностью отказаться от sharing данных. Mistral утверждает, что Le Chat работает на “самых быстрых inference-движках в мире” и может выдавать до 1000 слов в секунду — это было достигнуто благодаря партнерству с Cerebras.

Впрочем, основное преимущество Mistral — возможность развертывания Le Chat в собственной инфраструктуре с кастомными моделями и интерфейсом. Это критично для компаний в сфере обороны или банкинга, где невозможно использовать не on-premise сервисы.

Теперь посмотрим, сможет ли мобильное приложение Mistral привлечь пользователей — сейчас ChatGPT, DeepSeek и Google Gemini занимают 2-е, 3-е и 6-е места среди самых скачиваемых приложений для iPhone в США.

Конгрессмены США готовят законопроект о запрете приложения DeepSeek на правительственных устройствах из-за опасений, что оно может передавать данные пользователей китайскому правительству. Инициатива исходит от республиканца Дарина Лахуда и демократа Джоша Готхаймера, и очень напоминает историю с TikTok, который сначала запретили на госустройствах, а потом начали процесс полного запрета в США.

По данным анализа Feroot Security, чат-бот DeepSeek, ставший самым скачиваемым приложением в США, содержит скрытый код для передачи данных авторизации China Mobile — государственной телекоммуникационной компании, которой запрещено работать в США.

Некоторые федеральные агентства, включая ВМС США и NASA, уже заблокировали приложение. Австралия, Южная Корея и Италия также запретили DeepSeek в правительственных системах. Техас стал первым штатом США, запретившим приложение на государственных устройствах.

Да, а с TikTok пока всё хорошо — Трамп продлил дедлайн на 75 дней и обещает решить вопрос в течение месяца. Только не уточнил, это тот же месяц, в течение которого за 24 часа он закончит войну России против Украины, или какой-то другой. В общем, дадим ему 100 дней, а то за четыре года всё успеть невозможно.

Если вы уже забыли, то еще полтора года назад к компаниям, разрабатывающим AI-модели, было подано несколько групповых исков от имени ряда авторов книг про незаконное использование их произведений для обучения LLM моделей. Теперь в иске к Meta появился неожиданный поворот — компания не просто скачивала контент из “теневых библиотек”, но и активно пыталась скрыть свои действия. Внутренние документы и переписка показывают, что компания прекрасно понимала сомнительность своих действий.

Исследователи Meta работали в “стелс-режиме”, намеренно избегая использования корпоративных серверов, чтобы скрыть следы скачивания. Майкл Кларк, один из руководителей проекта, признал в показаниях, что они специально минимизировали “сидирование” — раздачу файлов другим участникам торрент-сети.

Особенно пикантно выглядят новые данные на фоне предыдущих показаний Марка Закерберга, утверждавшего, что не имел отношения к решению использовать LibGen для обучения AI. Внутренняя переписка показывает, что решение было принято после “предварительной эскалации к MZ”.

Meta продолжает настаивать, что использование книг подпадает под доктрину “добросовестного использования”. Однако попытки скрыть источник данных и минимизировать цифровые следы заставляют усомниться, что компания сама верила в законность своих действий.

Помните прошлогоднюю серию уходов из OpenAI, когда даже говорили о том, что Альтман вычищает всех, кто был в руководстве компании на момент его увольнения? Не все так однозначно и возможна и вторая производная — Джон Шульман, ушедший в Anthropic в августе прошлого года, теперь присоединяется к стартапу бывшей CTO OpenAI Миры Мурати.

Уходя из OpenAI в Anthropic, Шульман подчеркивал, что хочет сосредоточиться на “выравнивании AI” (alignment) и вернуться к практической технической работе. Чем он планирует заняться теперь, неясно, поскольку о проекте пока мало что известно, кроме того, что Мурати ведет переговоры о привлечении более $100 млн финансирования.

Стартап активно переманивает сотрудников из OpenAI, Character AI и Google DeepMind. В прошлом месяце к нему присоединились Джонатан Лахман (бывший руководитель специальных проектов OpenAI), Кристиан Гибсон из команды суперкомпьютеров OpenAI и IT-менеджер Марио Салтарелли.

Вот вам еще одна разработка исследователей — на этот раз из MIT и Гарварда, — на тему обучения моделей рассуждениям. В этом случае исследователи, чтобы обойтись без дорогостоящего обучения с участием большой модели, применением RLHF и SFT, разработали метод “Chain-of-Action-Thought” (COAT), когда сначала для модели генерируется небольшой обучающий набор рассуждений, а затем модель по нему обучается в процессе генерации промежуточных звеньев в цепочке останавливаться, оценивать решение, искать альтернативный подход и двигаться дальше.

Ключевая особенность подхода Satori в том, что модель учится рассуждать без внешнего руководства, она сама оценивает промежуточные результаты и сама ищет альтернативные решения. При этом навыки рассуждения, полученные на математических задачах, успешно переносятся на другие области — логику, программирование и так далее.

Обученная на базе Qwen-7B модель обошла по тестам своих одноклассников и даже большие (Llama 70B) модели, а в других областях продемонстрировала результаты на уровне лидеров, при том, что она не обучалась на материале этих тем.

Но еще одну ссылку я дам на свой блог — поскольку обсуждая статью с LLM, у нас родилась идея, что аналогичный подход можно реализовать с помощью few shot на топовой LLM и оказалось, что действительно можно и результаты получаются заметно лучше, чем даже с традиционными примерами “вопрос-ответ”. Правда, промпт получается немаленький, но… читайте в блоге, я там описал подробности.

Пятьдесят долларов облачных кредитов — именно столько потребовалось исследователям из Стэнфорда и Университета Вашингтона, чтобы создать AI-модель, способную соревноваться с продуктами технологических гигантов. Это как если бы кто-то собрал Ferrari в гараже из запчастей от Toyota, причем машина поехала почти так же быстро, как оригинал.

Секрет успеха кроется в методе дистилляции — своеобразном AI-репетиторстве, когда маленькая модель учится у большой, перенимая её способности к рассуждению. Исследователи использовали всего 1000 тщательно подобранных вопросов и ответов от Google Gemini, потратили полчаса на 16 GPU — и получили модель s1, показывающую впечатляющие результаты в тестах на математику и программирование.

В то время как Meta, Google и Microsoft планируют вложить сотни миллиардов долларов в AI-инфраструктуру в 2025 году, этот эксперимент ставит неудобный вопрос: а нужны ли такие гигантские инвестиции? Конечно, дистилляция не создает принципиально новых возможностей, но она может сделать существующие технологии доступными для более широкого круга разработчиков и даже бизнес-пользователей.

Впрочем, я бы еще задумался о тестах — за последние полгода мы уже видели много моделей, “показывающих впечатляющие результаты в тестах”, но только R1 вроде удовлетворяет пользователей за пределами тестов.

Wall Street преподнес Илону Маску неожиданный подарок — банки продали долг X на $5.5 млрд по цене 97 центов за доллар, что существенно выше первоначальных планов. Те же самые банки, которые списывали миллиарды на этих кредитах после покупки Twitter в 2022 году, теперь радуются возможности улучшить свои балансы.

Что изменилось? Формально — финансовые показатели. X сообщил о выручке $2.7 млрд и EBITDA $1.25 млрд за 2024 год. Это все еще существенно ниже результатов Twitter за 2021 год ($5 млрд и $682 млн соответственно), но уже не выглядит катастрофой. Возвращение крупных рекламодателей вроде Amazon внушает оптимизм, хотя компания все еще балансирует на грани безубыточности.

Но главные причины энтузиазма инвесторов лежат за пределами финансовой отчетности. Во-первых, это растущая синергия с xAI — X получил 10% долю в компании, оцененную в $5 млрд, а искусственный интеллект Маска тренируется на данных соцсети. Во-вторых, и это, понятно, ключевой фактор — политическое влияние Маска после возвращения Трампа в Белый дом.

Впрочем, даже самые оптимистичные инвесторы признают, что при процентных платежах более $1 млрд в год компании придется непросто. А банкам еще предстоит продать оставшиеся $6 млрд долга X, причем более рискованного. Но пока Wall Street готов делать ставку на “Маск Inc.” — конгломерат компаний, чья стоимость все больше зависит от политического капитала их владельца.

---