Google разыгрывает свой главный козырь в гонке AI-ассистентов: компания выкатывает Personal Intelligence для Gemini. Это функция, которая подключает к Gemini все остальные персональные сервисы — Gmail, YouTube, Photos и так далее, позволяя пользователю оперировать этим всем, как контекстом.

В общем, как-то так мы и представляем себе крутого агента. Правда, хороший пример, когда у Gemini можно спросить, какие тебе колеса нужны для машины, а AI отыщет фото машины, определит тип шин и посоветует, что купить, в моем воображении перебивается другим — такой умный AI, если я его попрошу заказать мне стейк, найдет сканы моих анализов и я рискую получить вегетарианский салат.

Пока, впрочем, для нас это будущее — выкатка начинается с платных подписчиков в США. Так что подождем.

Британское правительство отказалось от планов обязательного digital ID для подтверждения права на работу. Правда, это уже третий случай отказа правительства от своих планов и сторонники правящей партии не в восторге от таких шараханий.

Лорд Бланкетт, сам когда-то продвигавший ID-карты, комментирует в том духе, что правительство не объяснило ни зачем это нужно, ни как будет работать.

При этом технически мало что меняется. Gov.uk One Login уже используют 12 миллионов человек. Цифровые проверки для британцев с биометрическими паспортами работают с 2022 года. Gov.uk Wallet готовится к запуску. Обязательные проверки права на работу никуда не денутся — просто будут называться иначе. То есть по сути, инфраструктура (кто сказал “ангсоц”?) и так развивается, просто её использование не всегда обязательно.

Будем надеяться, пока.

Интересные события развиваются вокруг поставок чипов H200 в Китай.

С одной стороны, США долго запрещали поставки мощных чипов. И до сих пор многие уверены, что так и надо продолжать и эти меры работают и тормозят развитие AI в Китае.

Но теперь власти официально одобрили экспорт чипов H200 в Китай. Однако разрешение сопровождается жесткими ограничениями: объем поставок китайским клиентам не должен превышать 50% от объема продаж в США, а каждая партия подлежит проверке третьей стороной для подтверждения технических характеристик.

С другой стороны, власти Китая не злопамятны, но память у них хорошая и фразу американского чиновника про то, что надо держать Китай на поводке, не давая им мощных технологий, они запомнили. Сначала китайским компаниям было настоятельно рекомендовано покупать китайские GPU, а от покупок у Nvidia отказаться. Это не очень просто сделать — я писал, что чипы Huawei недостаточно мощны для полноценного обучения LLM, хотя для инференса уже подходят. Власти допускают исключения для закупок — но только для университетских исследований и R&D-центров.

И вот по данным Reuters, китайские таможенные органы получили прямое указание блокировать ввоз чипов H200.

Nvidia в итоге оказывается в центре шторма, близкого к идеальному — китайский рынок огромен, запреты и ограничения уже привели к развитию национальных версий GPU, при этом контрабанда чипов начинает напоминать романы киберпанка. Компания теперь требует от китайских клиентов 100% предоплаты наличными без права на возврат средств или отмену заказа, даже если товар будет остановлен на границе.

Несмотря на это, спрос со стороны китайских компаний, включая Alibaba и ByteDance, превышает 2 миллиона чипов, что значительно больше текущих складских запасов Nvidia.

Мне почему-то вспомнилась заключительная (не совсем последняя, правда) фраза Джима Моррисона из фильма The Doors — Let’s get some tacos. Не знаете, почему?

Очень интересное исследование влияния прогресса LLM на профессиональную эффективность. В нем участвовали более 500 специалистов (консультанты, аналитики данных, менеджеры), которые выполняли профильные задачи с использованием одной из 13 моделей различной мощности.

Вот что, вкратце, обнаружилось.

Экономический эффект прямо зависит от технических параметров моделей. Каждый год развития фронтир-моделей сокращает время выполнения задач в среднем на 8%. Десятикратное увеличение объема вычислений (при изоляции влияния других факторов) при обучении приводит к сокращению времени выполнения задачи на 6.3%. При этом прогресс обеспечивается как увеличением мощностей (на 56%), так и качественным образом, изменением алгоритмов и данных.

В процессе эксперимента участники получали вознаграждение, которое увеличивалось в зависимости от оценки качества выполнения заданий. Оказалось, что использование любой модели повышает базовый заработок в минуту на 81.3%, а с учетом бонусов за качество — на 146%.

При этом задачи, не связанные с использованием агентов — то есть, условно, одноходовые задачи, — показали прирост заработка на $1.58/мин. Аналогичный показатель для agentic-задач заметно скромнее — лишь $0.34/мин.

Но самое удивительное, что людям лучше не вмешиваться. Качество ответов моделей линейно растет с увеличением вычислительной мощности. Топовые модели демонстрируют оценки выше 6.0 из 7 (сверхчеловеческий уровень). А участие человека в выполнении задачи, хотя и улучшает результаты слабых моделей, но мощные модели в среднем получают среднюю оценку (4.3 балла). В общем, AI от людей тупеет.

Авторы исследований намеренно рандомизируют модели (и даже их не упоминают), чтобы исключить влияние конкретных LLM и сделать общие выводы. Но они и так интересны.

Microsoft анонсировал инициативу «community first» — набор обязательств по полной оплате электроэнергии для AI-датацентров, отказу от местных налоговых льгот и восполнению воды. Трамп успел слить новость накануне через Truth Social, назвав Microsoft «первым» из tech-компаний, готовых взять обязательства перед американцами.

Брэд Смит, президент Microsoft, описывает, как за год изменились разговоры в его родном Висконсине. В 2024-м местные хотели обсуждать рабочие места. К октябрю — только тарифы и расход воды. В штатах с крупными кластерами датацентров — Вирджинии, Иллинойсе, Огайо — цены на электричество для жителей выросли на 12-16% за год. Впрочем, если кто слушал один из недавних выпусков Радио-Т, то в курсе, как в городе Напервиль местные выступают против строительства датацентра, хотя компания гарантирует модернизацию энергосети, прямо сейчас находящейся не в блестящем состоянии.

Любопытно, что Смит поддержал федеральную помощь с разрешениями и доступом к земле, но прямо отверг субсидии на электроэнергию. OpenAI, обсуждая Stargate, от льгот не отказывается.

Мне регулярно случается сталкиваться с объяснениями, что личное присутствие в офисе не нужно, всё можно заменить видеозвонками, да еще и камеру не включать. Если вам кажется так же, то вот научные факты.

Исследователи Корнельского университета изучили статистику и даже провели эксперименты. Выяснилось, что почти идеальная видеосвязь хуже, чем её отсутствие — небольшие глюки психологически переносятся на собеседника, снижая его оценку.

Самый удивительный факт следует из статистики слушаний по условному освобождению в судах с января по апрель 2021 года. Глюки обнаружились в 32.6% случаев. Там, где связь работала нормально, положительное решение получали 60% заключенных. Наличие глюков снижало процент положительных решений до 48%. Проверка на характеристики преступления и самих заключенных ничего не изменила.

Из других проявлений — кандидаты на собеседованиях, где связь барахлила, получали оценки ниже и реже нанимались на работу. Рекомендации врача в случае с телемедициной воспринимались с меньшим доверием.

Ученые назвали это эффектом “жутковатой долины” и признались, что не смогли выработать рекомендации по минимизации этого явления.

Правда, сами авторы встретились вживую только через четыре года после того, как в пандемию начали работу над исследованием. Как видим, им это не помешало.

В общем, мы про это и так знали, но теперь официально — Apple будет использовать Gemini и облачную инфраструктуру Google для своих базовых AI-моделей. Сумму в год мы тоже знали — примерно 1 млрд долларов в год.

Сотрудничество с OpenAI тоже не прекращается.

Акции Google продолжили расти — компания официально перевалила за 4 триллиона долларов капитализации. Рынок наконец признал, что Google справился с вызовами AI.

Meta сокращает около 10% сотрудников Reality Labs — это примерно 1500 человек из 15 тысяч. По данным New York Times, удар придётся на тех, кто строил метавселенную: VR-гарнитуры, виртуальные социальные сети. Деньги перенаправляются понятно куда — на AI-исследования и подразделение носимых устройств.

При этом увеличивается бюджет TBD Lab — внутреннего подразделения Meta, которое занимается созданием “суперинтеллекта”.

Подразделение дополненной реальности — очки, браслеты, голосовое управление — сокращения почти не затронут. Фактически Meta делает ставку на AR вместо VR, хотя публично от метавселенной не отказывается. Просто концепция поменялась, как объяснял герой не очень старого анекдота.

Anthropic выпустила Cowork — по сути, Claude Code для тех, кто не пишет код. Можно это даже назвать упаковкой для разнообразных функций, связанных с обработкой файлов и документов.

Главное отличие от обычного чата — агентность. Claude получает доступ к выбранной папке, сам планирует выполнение задачи, работает параллельно с несколькими запросами.

Пока только macOS и только для подписчиков Claude Max. Windows и кросс-платформенная синхронизация обещаны позже.

На самом деле, я довольно часто именно так и использую Claude Code, который встроен в десктопное приложение. Достаточно выбрать режим Local и указать папку, после чего приложение делает всё, что попросите — правда, несколько напрягает разрешать ему почти каждую первую операцию, а посмотреть, как это разрешить радикально, пока не догадался.

Впрочем, еще одну похожую задачу я выполняю прямо из терминального Claude Code — команда monthly-report проверяет все изменения в папке проекта, читает всю историю изменений, коммитов и сессий, сверяется с предыдущими отчетами и составляет очередной, с расчетом рабочего времени, реализованных функций. Всё вот думаю — справится ли с созданием акта выполненных работ, причем так, чтобы не напугать бухгалтерию страшными словами?

Если вы уже видели новости про то, что Andreessen Horowitz привлекла $15 млрд в новые фонды, то вот прекрасный обзор на эту тему.

Главный тезис: a16z — это не венчурный фонд в классическом понимании. Это “культ технологий”. Фонд привлёк $15 млрд за 3 месяца в худший для VC год, управляет $90+ млрд активов, среди которых 10 из 15 крупнейших частных компаний мира.

Три принципа, которые отличают a16z:

  1. Никогда не инвестировать во “второго” Лучше пропустить категорию, чем выбрать не того основателя. Если нашёл лидера — дай ему в 50 раз больше, чем он просил. Databricks просили $200K, получили $10M — Андреесен довольно алогично верил, что Spark имеет шансы наравне с Hadoop. При этом компании остаются частными дольше.

  2. Компании стоят дороже, чем все думают. В 2016 году WSJ писала, что a16z отстаёт от элиты. Видимо, теперь напишут, что обгоняют.

  3. Масштаб — это преимущество, а не проблема. Когда конкуренты говорили “слишком много денег”, Marc Andreessen показывал неприличный жест и отвечал: “Мы охотимся на слонов” — defense tech, ядерная энергетика, биотех, космос.

Обзор неслучайно назван Power Brokers — a16z строит инфраструктуру власти: рекрутинг топ-менеджеров, продажи в enterprise, Government Affairs, медиа-команда. Фактически фонд становятся полноценной корпорацией, важной услугой которой является лоббизм (Regulation as a Service). А если вы вспомните эссе Андреесена “Time to build”, то поймете, что это очень долгосрочная стратегия.

---