Anthropic рассказала о новом инструменте для Claude - функции “think” (думать), которая значительно улучшает способности модели решать сложные задачи. В отличие от функции “extended thinking” (которая работает до начала генерации ответа), инструмент “think” позволяет Claude добавить отдельный этап размышления уже в процессе формирования ответа.

Этот простой, но эффективный подход показал впечатляющие результаты в тестах τ-Bench, особенно в сложных сценариях обслуживания клиентов авиакомпаний. Наилучшие результаты были достигнуты при сочетании инструмента “think” с оптимизированными примерами использования в промпте - улучшение на 54% по сравнению с базовым уровнем.

Функция особенно полезна в трех сценариях: при анализе результатов других инструментов, в среде с множеством политик и правил, а также при последовательном принятии решений, где каждое действие опирается на предыдущие.

Интересно, что для более простых задач в сфере ритейла даже базовое использование “think” без дополнительных инструкций дало улучшение. В тестах SWE-Bench (программирование) этот инструмент также способствовал достижению рекордного результата 0.623, улучшив производительность на 1.6%.

Команда рекомендует использовать “think” с конкретными примерами для вашей предметной области и размещать сложные инструкции в системном промпте, а не в описании инструмента.

Я уже почти перестал удивляться, что с современными LLM всё эффективнее работают простые приемы, которые используются в процессе мышления человеком — “посиди, подумай”, как пример. Но все сильнее ощущение, что в итоге это и закончится новой разумной жизнью.

Cloudflare представила интересное решение против ботов и AI-краулеров — “AI Labyrinth”. Вместо простой блокировки несанкционированных ботов, которые игнорируют директивы “no crawl”, система создает AI-генерируемые страницы-ловушки, чтобы замедлить, запутать и истощить ресурсы этих ботов.

Суть в том, что когда AI-краулер пытается собирать данные с сайта, Cloudflare незаметно добавляет скрытые ссылки на AI-сгенерированные страницы. Боты следуют по этим ссылкам и попадают в “лабиринт” связанных между собой страниц с правдоподобным, но бесполезным контентом. Реальные пользователи эти ссылки не видят и не кликают на них.

Это дает двойную выгоду: во-первых, боты тратят вычислительные ресурсы на обработку бесполезной информации вместо настоящего контента сайта, а во-вторых, это служит “приманкой” для идентификации ботов — если кто-то перешел на четвертую страницу AI-генерированной бессмыслицы, это почти наверняка бот, а не человек.

По данным Cloudflare, AI-краулеры генерируют более 50 миллиардов запросов к их сети ежедневно, что составляет почти 1% всего трафика. AI Labyrinth доступен для всех клиентов Cloudflare, включая бесплатный тариф, и активируется одним переключателем на панели управления.

Выглядит устрашающе, если задуматься — как скоро этим роботам в интернете начнут мешать люди?

Anthropic добавили в Claude возможность веб-поиска — теперь LLM может искать информацию в интернете, чтобы предоставлять более актуальные и релевантные ответы. Найденную информацию Claude оформляет как цитату, указывая ссылку на источник — собственно, как это делают все остальные.

Функция веб-поиска уже доступна в предварительной версии для всех платных пользователей Claude в США. Поддержка для бесплатных пользователей и других стран появится в ближайшее время. Чтобы начать использование, нужно включить веб-поиск в настройках профиля и начать разговор с Claude 3.7 Sonnet.

В связи с резким падениям курса акций Tesla оживились комментаторы на тему, как сейчас у Маска не хватит денег, причем некоторые доходят до высказываний, что буквально сегодня-завтра у Маска за долги отберут Twitter (и вернут народу, видимо).

Давайте разберемся, о чем вообще речь.

Когда говорят, что состояние того или иного человека составляет сколько-то миллиардов, далеко не все в этот момент понимают, что речь не идет о деньгах на счету, пачках наличных в сейфе или золотых монетах под паркетом. Состояние большинства миллиардеров — это акции компаний, которые им принадлежат, и Маск не исключение. Если его текущее состояние составляет около 300 млрд, то порядка 90 млрд — это акции Tesla, 150 млрд — доля в SpaceX, ну, и по “мелочи” — Twitter, xAI и другое. При этом живых денег там немного — вы же помните, как акционеры через суд зарубили идею заплатить ему бонус, как главе Tesla, в размере 55 млрд долларов.

Чтобы живые деньги были, миллиардеры обычно берут кредиты, а в качестве залога предлагают банкам пакеты акций, которые им принадлежат. Как понятно, стоимость пакета акций должна как-то соответствовать сумме кредита.

Что же происходит теперь? С начала года акции Tesla, достигшие в декабре рекордного уровня в истории компании, упали на 45 процентов. То есть, если Маск в декабре где-то заложил акции и получил кредит, теперь его залог стоит на 45% меньше и срабатывает margin call — то есть банк вправе потребовать либо погашения кредита, либо увеличения залога. Правда, если сравнивать с октябрём 2024-го, до выборов, то колебание курса не очень значительное, пока что акции просто потеряли всё, что набрали сразу после избрания Трампа.

Twitter занимает в этих новостях центральное место, поскольку Маск при его покупке использовал смесь собственных кредитов, субординированного займа от группы банков (я недавно писал, что банки наконец конвертировали займ в облигации и продали на вторичном рынке) и так далее. И, скорее всего, для получения кредитов закладывал акции Tesla (а больше заложить нечего, остальные его компании непубличные). Теперь, если в условном кредите на 25 млрд (а Twitter обошелся в 44, из которых 13 дали банки, 1 точно дал Ларри Эллисон из Oracle, наверное, сколько-то Маск собрал еще с кого-то) обеспечение упадет до определенного уровня, банки могут потребовать возврата кредита или погашения его части или увеличения покрытия. При этом Маску принадлежит почти 13% акций Tesla и, если он их начнет продавать, то это будет значительное движение и курс может упасть еще ниже. По имеющимся данным, в залоге находится больше половины от всего пакета акций Маска, так что совсем много он и не может продать.

Но это всё пока что теоретические упражнения. Чтобы банки заволновались, Tesla должна упасть еще процентов на 40, и даже тогда у специального советника новоизбранного президента США имеется масса вариантов по выходу из ситуации — вплоть до продажи части долей в непубличных компаниях, типа SpaceX, где у него в любом случае полный контроль, хотя доля в капитале составляет около 42%. А Twitter он, конечно, не потеряет.

Брюссель продолжает регуляторные действия против Apple и Google в рамках Digital Markets Act (DMA), несмотря на растущую напряженность с администрацией Трампа. Еврокомиссия в среду предъявила официальные обвинения Alphabet в нарушении DMA, указав, что поисковик Google отдает предпочтение собственным сервисам и затрудняет конкуренцию в своем магазине приложений.

За нарушение DMA предусмотрены штрафы до 10% глобальной выручки, а для повторных нарушителей — до 20%. Google заявила, что решение комиссии “навредит европейскому бизнесу и потребителям, затруднит инновации, ослабит безопасность и снизит качество продуктов”.

Комиссия также обязала Apple открыть свои операционные системы для подключаемых устройств других производителей, таких как смарт-часы или наушники. Apple заявила, что это решение “опутывает компанию красной лентой, замедляет способность Apple внедрять инновации для пользователей в Европе и заставляет бесплатно отдавать новые функции компаниям, которые не обязаны играть по тем же правилам”.

Тереза Рибера, комиссар ЕС по конкуренции, подчеркнула: “Компании, работающие в ЕС, независимо от места их регистрации, должны соблюдать правила ЕС, включая Закон о цифровых рынках”.

Это, если кто-то подумал, что новый состав Еврокомиссии, приступивший к выполнению обязанностей осенью прошлого года, как-то иначе подойдет к применению законодательства ЕС, — так нет.

Верховный гражданский суд Германии отклонил апелляцию Apple, подтвердив решение антимонопольного ведомства страны о необходимости более строгого регулирования деятельности компании. Судьи согласились, что масштабы присутствия Apple на различных рынках представляют потенциальный риск для конкуренции.

Суд отметил, что продукты и услуги Apple “высоко вертикально интегрированы, тесно взаимосвязаны и в основном доступны только пользователям устройств Apple”, что создает замкнутую экосистему. Особое внимание уделено зависимости сторонних разработчиков от Apple для доступа к её многочисленным пользователям.

Apple выразила несогласие с решением, заявив, что “сталкивается с жесткой конкуренцией” в Германии и что суд “пренебрегает ценностью бизнес-модели, ориентированной на конфиденциальность и безопасность пользователей”.

Глава антимонопольного ведомства Андреас Мундт приветствовал решение, отметив, что новые правила уже улучшили ситуацию на цифровых рынках. Теперь у регулятора есть прочная основа для продолжения проверки правил отслеживания Apple для сторонних приложений.

Это уже второй случай, когда суд поддерживает применение новых правил к технологическим гигантам — ранее с подобной апелляцией проиграл Amazon. Аналогичный надзор распространяется на Facebook, Google и Microsoft.

Google добавил в Gemini функцию Canvas, аналогичную одноименному инструменту от OpenAI и Artifacts от Anthropic. Это интерактивное пространство, где пользователи могут создавать, редактировать и делиться текстовыми и кодовыми проектами.

Canvas позволяет составлять длинные тексты с помощью Gemini, а затем редактировать их по частям — например, можно выделить абзац и попросить сделать его более лаконичным или формальным. Также можно экспортировать результат в Google Docs одним кликом.

Для программистов Canvas предлагает возможность генерировать и предварительно просматривать HTML, React-код и другие веб-прототипы в реальном времени. Можно просить Gemini вносить изменения, и Canvas будет обновлять превью.

Помимо Canvas, Google также добавил в Gemini функцию Audio Overview, ранее доступную в NotebookLM. Она создает реалистичные аудиорезюме документов, веб-страниц и других источников в формате, напоминающем подкаст.

В общем, Google сохраняет неплохой темп, набранный еще в конце прошлого года, в части развития AI. Правда, несмотря на лидерство в ChatBot Arena, модели компании отстают от лидеров в виде OpenAI и Anthropic, и не помогает даже гигантское окно контекста в 1 и 2 миллиона токенов для моделей 2.0 Flash и 2.0 соответственно. Хотя и это хорошо — у меня попадались задачи, когда модели с огромным контекстом можно простить тупизну.

Фанаты Pebble, ваш час настал!

Основатель компании анонсировал сразу две модели, возрождающие прежний бренд: Core 2 Duo за $149 (начнут доставлять в июле) и Core Time 2 за $225 (доставка с декабря).

Core 2 Duo практически идентичны Pebble 2, но с современными компонентами — черно-белый e-paper дисплей, защита по стандарту IPX8, длительность работы на одном заряде до 30 дней (вместо 7 у оригинальных Pebble). Добавлены динамик, барометр и компас.

Core Time 2 — мечта каждого фаната Pebble. По сути, это то, чем должен был стать Pebble Time 2, который так и не вышел. Цветной 64-цветный дисплей 1.5 дюйма, металлический корпус, сенсорный экран, мониторинг сердечного ритма и также до 30 дней автономной работы.

Самое приятное — обе модели поддерживают более 10 000 существующих приложений и циферблатов для Pebble. Всё будет с открытым исходным кодом, что позволит энтузиастам дорабатывать систему.

Предзаказ уже доступен, интересно будет посмотреть на спрос.

Nvidia представила две новые серии чипов на своей ежегодной конференции GTC: Blackwell Ultra, который начнет поставляться во второй половине этого года, и Vera Rubin — следующее поколение графических процессоров.

Vera Rubin — это первый пользовательский CPU-дизайн Nvidia, получивший название Olympus. Ранее компания использовала готовые дизайны от Arm. По заявлению Nvidia, новый CPU будет вдвое быстрее того, что используется в прошлогодних чипах Grace Blackwell. В паре с Vera чип Rubin сможет обеспечить 50 петафлопс при выполнении inference (вдвое больше, чем у текущих чипов Blackwell).

Blackwell Ultra сможет производить больше токенов в секунду, что позволит облачным провайдерам предлагать премиальные услуги ИИ для критичных ко времени приложений. Nvidia утверждает, что эти чипы могут приносить до 50 раз больше выручки, чем поколение Hopper, вышедшее в 2023 году.

Дженсен Хуанг подчеркнул, что для “агентного AI” и моделей с рассуждениями необходимо на порядки больше вычислительной мощности — “примерно в 100 раз больше, чем мы думали ранее”. Это отвечает на вопрос, действительно ли гиперскейлерам нужно продолжать тратить огромные средства на инфраструктуру Nvidia.

Параллельно компания представила Dynamo — программную платформу с открытым исходным кодом, которая оптимизирует процесс рассуждений ИИ, разделяя его на этапы и распределяя нагрузку. При использовании модели DeepSeek-R1 на крупном кластере GB200 NVL72, Dynamo увеличивает количество токенов в 30 раз на один GPU.

Компания также представила дорожную карту на ближайшие годы: чипы Vera Rubin появятся во второй половине 2026 года, а Rubin Ultra — во второй половине 2027. Отмечено, что Nvidia сохраняет годовой цикл обновлений, меняя внутреннюю архитектуру, но сохраняя совместимость оборудования.

По сути, Nvidia хочет убедить рынок, что даже эффективные модели вроде DeepSeek всё равно требуют её интегрированного стека оборудования и ПО для построения “AI-фабрик”.

В Белом Доме появился интернет от Starlink. Администрация заверила, что сервис получен в подарок от компании и всё было проверено с точки зрения этики, поскольку владелец компании является бесплатным советником президента.

Правда, зачем это было сделано — непонятно. Сам сервис предназначен для обеспечения доступа к интернету в удаленных местах, к которым Белый Дом явно не относится. Кроме того, входные каналы от Starlink-овских антенн ведут не в Белый Дом, а в специальный датацентр, который обслуживает резиденцию президента США и находится в нескольких милях от неё, а между ними лежит несколько оптических линий.

Я много раз сталкивался в бизнесе с ситуацией, когда ты знакомишься с потенциальным партнером и вроде договариваешься о конкретных вещах, а он тебе в нагрузку начинает рассказывать, что и вот это у тебя фигня, и тут твои сотрудники всё не так делают, а вот у меня-то есть то, что вам надо и работает неплохо (ломаясь раза в три чаще, чем существующее решение), и стоит недорого (раза в два дороже того, что есть, причем оплата только налом в другой валюте). Казалось бы, где одесские бизнесмены средней руки, а где Маск, а поди ж ты…

---