Google объявил о выпуске Gemini 2.0 — новой версии своей языковой модели, которая теперь умеет не только понимать мультимодальный ввод (текст, изображения, видео, аудио), но и генерировать изображения и речь. Кроме того, модель получила встроенную возможность использовать инструменты вроде Google Search и выполнять код.

Самое интересное — Google начал активно экспериментировать с “агентным” подходом, то есть с системами, которые могут самостоятельно выполнять задачи от имени пользователя. Показали несколько прототипов:

  • Project Astra — универсальный ассистент для смартфонов (и, возможно, очков)
  • Project Mariner — агент для браузера, который может выполнять задачи в web-интерфейсах
  • Jules — помощник для разработчиков, интегрированный с GitHub.

Пока всё это доступно только разработчикам и доверенным тестировщикам, широкий релиз планируется в начале следующего года. Интересно, что Google специально подчеркивает внимание к безопасности — например, браузерный агент может работать только в активной вкладке и требует подтверждения для важных действий вроде покупок.

Gemini 2.0 Flash уже доступна в интерфейсе пользователей с предупреждением, что это экспериментальная модель. Более того, она уже добралась до третьего места в ChatBot Arena, где на первом уже несколько дней находится экспериментальная Gemini Exp 1206. Я при этом как-то не могу распробовать эти модели — какого-то суперпрогресса по сравнению с исправно кодящим Claude 3.5 Sonnet не ощущается. Говорят, правда, что можно соптимизировать модель так, чтобы она зажгла в сравнении на Chatbot Arena, но вряд ли Google будет таким заниматься.

Я всегда говорю, что абсолютная статистика в исполнении любого счетчика или аналитического сервиса доверия не заслуживает, но вот динамика её изменения вполне может что-то показать. Интересная статистика по исходу пользователей из X (бывший Twitter) — за два месяца площадка потеряла 2.7 миллиона активных пользователей в США. И практически ровно столько же — 2.5 миллиона — приобрела Bluesky, одна из альтернативных платформ.

Причины в общем-то понятны — Маск активно использует сеть для пропаганды и даже начал использовать аккаунт @america для продвижения своего политического комитета в поддержку Трампа, что спровоцировало уход с платформы множества известных людей. Среди них режиссеры Гильермо дель Торо и Майк Флэнаган, актеры Квинта Брансон и Марк Хэмилл. Другие, как политик Александра Окасио-Кортес, сохранили аккаунты в X, но стали активнее постить в Bluesky.

Даже немецкие футбольные клубы стали покидать X — сначала St. Pauli назвал платформу “машиной ненависти”, а потом и Werder Bremen ушел, пожертвовав 600 тысячами подписчиков ради 9 тысяч в Bluesky. По словам директора по коммуникациям клуба, “место, где нет регулирования языка ненависти — не место для нас”.

Вопрос, конечно, в том, достаточно ли в итоге будет энергии ушедших для поддержания развития платформы — по моему опыту, проекты, рассчитывающие на развитие “назло оригиналу”, живут так себе в смысле длительности и качества.

GM закрывает проект беспилотного такси Cruise, в который за последние годы было вложено более 9 миллиардов долларов. По словам CEO компании Мэри Барры, развитие сервиса роботакси требует слишком больших затрат и не является основным бизнесом GM.

Cruise был одним из двух лидеров рынка беспилотных такси наряду с Waymo от Alphabet, но после октябрьского инцидента с наездом на пешехода компания попала под пристальное внимание регуляторов, лишилась лицензии в Калифорнии и была вынуждена приостановить работу по всей стране. После этого ушел основатель компании, были уволены 9 топ-менеджеров и сокращено 25% сотрудников.

GM планирует использовать наработки Cruise для развития систем помощи водителю SuperCruise и в перспективе — для создания полностью автономных автомобилей для розничных покупателей. Фактически Cruise будет полностью поглощен GM, при этом сотрудники узнали об этом примерно одновременно с журналистами и были удивлены, вместе с руководством. Тем более, что некоторые подразделения возобновляли тестирование поездок в нескольких городах и планировали запускать работу сервиса в Хьюстоне. Вероятно, эти планы будут свернуты, а сотрудники сокращены.

Интересно, что это происходит на фоне планов Tesla запустить свой сервис роботакси в 2026 году и расширения географии работы Waymo.

Рынок позитивно отреагировал на новость — акции GM выросли на 2.7% после закрытия торгов. Еще бы, экономия более миллиарда долларов в год это бесценно.

Почему-то пошли новости про регуляции. Теперь вот Google решил вмешаться в отношения Microsoft и OpenAI, попросив FTC (Федеральную торговую комиссию) разорвать эксклюзивное соглашение между компаниями. По нему OpenAI может размещать свои сервисы только в облаке Microsoft Azure, а Microsoft получает 20% выручки OpenAI.

Google и Amazon хотели бы тоже размещать модели OpenAI в своих облаках, чтобы их клиентам не приходилось дополнительно использовать Microsoft Azure. Некоторые компании, например Snap и Intuit, уже были вынуждены начать использовать Azure именно из-за того, что хотели работать с технологиями OpenAI.

FTC проводит широкое расследование деятельности Microsoft, включая отношения с OpenAI, но пока неясно, приведет ли оно к каким-то конкретным действиям. Руководство FTC почти наверняка сменится в начале будущего года, для Microsoft это не первое расследование — так что процесс будет небыстрым. Правда, мы же помним, что есть еще и Илон Маск, который явно не прочь расстроить отношения конкурентов своего xAI, используя позицию близкого советника Трампа. Так что ничего определенного, конечно, сказать нельзя.

Вот вы не следите за сериалом “Мэтт Мюлленвег против WPEngine”, а зря — кажется, перед нами финал первого сезона с обязательным клиффхенгером для поддержания интереса публики.

Спустя несколько месяцев конфликта между WordPress (Automattic) и хостинг-провайдером WP Engine суд встал на сторону последнего — WordPress должен восстановить доступ WP Engine к ресурсам wordpress.org и прекратить вмешиваться в работу плагинов компании. Кроме того, Automattic должен удалить список компаний, отказавшихся от услуг WP Engine, и убрать чекбокс, требующий от пользователей подтверждать отсутствие связи с WP Engine при входе в систему.

Судья не согласилась с аргументом WordPress о том, что WP Engine сами виноваты, построив бизнес на сайте, к которому у них нет контрактных прав, — по мнению суда, целенаправленные действия WordPress против WP Engine (и только против них, а не против других конкурентов) нельзя игнорировать.

При этом за прошедшие несколько месяцев Мюлленвег успел отличиться по-разному — и блокировкой доступа для WPEngine, и форком (вместе с аудиторией) плагина ACF, разработанного WPEngine, и последующей публикацией платной версией ACF Pro, и чистками чатов, показательными расставаниями как с сотрудниками Automattic, так и с независимыми разработчиками (им отключали доступ к wordpress.org). В общем, я в него верю, он обеспечит интригу сериала еще надолго.

Китайские регуляторы начали антимонопольное расследование в отношении Nvidia, касающееся сделки четырехлетней давности по покупке израильской компании Mellanox за $7 млрд. Регулятор утверждает, что Nvidia нарушила условия, на которых эта сделка была одобрена в 2020 году.

Условия были довольно простыми — не продавать GPU в комплекте с оборудованием Mellanox в Китае, не дискриминировать китайских клиентов и обеспечивать совместимость продуктов обеих компаний с оборудованием третьих сторон.

Интересно, что расследование начато в момент, когда Nvidia и так не может продавать свои самые современные GPU в Китае из-за американских экспортных ограничений. При этом в США ряд китайских компаний находятся под санкциями — так что, возможно, что таким образом китайские власти готовятся к грядущей торговой войне, обещанной Дональдом Трампом.

Bluesky готовится запустить платную подписку Bluesky+. В GitHub компании появились макеты интерфейса с предполагаемыми функциями, среди которых загрузка видео более высокого качества, кастомизация профиля, собственные иконки приложения, значок верификации, встроенный перевод постов, аналитика и папки для закладок.

Цена подписки указана как $8 в месяц или $72 в год, хотя представители компании подчеркивают, что это пока только черновой вариант, и финальный набор функций может отличаться. Интересно, что Bluesky рассматривает и другие способы монетизации, включая продажу доменных имен, маркетплейс алгоритмов и даже возможную рекламу.

Это важный шаг для платформы, которая уже насчитывает 24.7 миллиона пользователей и пытается найти устойчивую бизнес-модель. Но честно скажу, что пока что платить туда смысла не вижу.

TikTok продолжает борьбу с американским законом, требующим продажи или запрета приложения. Компания подала ходатайство о приостановке действия закона до рассмотрения дела Верховным судом США. В качестве аргументов приводится необходимость дать время новой администрации Трампа определить свою позицию, а также потенциальный ущерб для 170 миллионов американских пользователей и малого бизнеса (предполагаемые потери более $1 млрд только за месяц запрета).

Интересно, что Трамп, который в свой первый президентский срок активно добивался продажи TikTok (и добился в итоге крупного контракта для Oracle по размещению инфраструктуры соцсети, Ларри Эллисон, основатель Oracle, — крупный донор республиканской партии), теперь выступает против запрета и вообще вел весьма активную деятельность в TiTok, ориентируясь на молодых избирателей. Закон должен вступить в силу 19 января, за день до инаугурации Трампа. TikTok привлек серьезную юридическую команду, включая бывшего генерального солиситора из первой администрации Трампа, но аналитики считают, что шансы на успех невелики после недавнего решения апелляционного суда не в пользу компании.

OpenAI выпустила в публичный доступ свой генератор видео Sora, который был анонсирован в феврале. Доступ получат пользователи ChatGPT Plus и Pro (кроме пользователей из Европы, Британии и Швейцарии — гм, опять неуважение к желающим регулировать прогресс, кажется).

Новая версия, Sora Turbo, работает значительно быстрее февральского прототипа. Можно генерировать видео длиной до 20 секунд в разрешении до 1080p, в разных форматах (вертикальный, горизонтальный, квадратный). Для Plus-подписчиков доступно 50 видео в месяц в 480p, Pro-пользователи получат в 10 раз больше квоты и более высокие разрешения.

Все сгенерированные видео будут содержать метаданные C2PA и водяные знаки для идентификации контента. Загрузка изображений людей пока ограничена из-за рисков deepfakes. OpenAI подчеркивает, что технология все еще имеет ограничения — особенно в том, что касается физики объектов и сложных действий.

Google объявил о создании нового квантового процессора Willow со 100+ кубитами, который достиг важного технологического рубежа — преодоления порога квантовой коррекции ошибок. Это означает, что при увеличении числа кубитов частота ошибок не растет, а снижается, что критически важно для создания практически полезных квантовых компьютеров.

На новом чипе также провели тестовое вычисление, которое, по заявлению Google, заняло бы у недавнего рекордсмена среди классических суперкомпьютеров Frontier около 10 септиллионов лет (это 10^24 лет). Для сравнения, в 2019 году Google заявляла о достижении квантового превосходства с задачей, которая заняла бы у классического компьютера “всего” 10000 лет.

Компания также поделилась планами по развитию технологии — к концу десятилетия они планируют создать полноценный отказоустойчивый квантовый компьютер. Google уже имеет команду из 300 специалистов и собственное производство квантовых чипов. В перспективе планируется предоставлять квантовые вычисления через облако и даже разворачивать системы на территории клиентов.

---