OpenAI представила новое семейство моделей GPT-4.1, включающее варианты GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Все они специализируются на программировании и следовании инструкциям, имеют контекстное окно в 1 миллион токенов (около 750 000 слов для английского), окно вывода в 32к токенов (вдвое больше GPT-4o) и доступны только через API компании, но не в ChatGPT.

OpenAI заявляет, что оптимизировала GPT-4.1 для реальных задач, улучшив фронтенд-кодирование, следование форматам и использование инструментов. Флагманская модель GPT-4.1 превосходит GPT-4o и GPT-4o mini по кодированию, а варианты mini и nano жертвуют точностью ради скорости и эффективности.

Цены варьируются от $2 за миллион входных токенов и $8 за миллион выходных для полной версии до $0,10 и $0,40 соответственно для nano-версии. Это на 25% дешевле, чем GPT-4o.

При этом результаты GPT-4.1 на бенчмарке SWE-bench Verified (52-54,6%) немного отстают от Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%). Также OpenAI признает, что надежность модели снижается при обработке большого количества токенов — с 84% при 8000 токенов до 50% при миллионе. Но зато нет доплаты при использовании длинного контекста, как это сделал Google.

Заодно в стриме презентации предупредили, что в обозримом будущем (несколько месяцев) в API пропадет доступ к GPT-4.5 — кажется, её поддержание обходится дорого, несмотря на запретительную цену. И позвали основателя Windsurf, который пообещал, что доступ к GPT-4.1 будет бесплатным следующие 7 дней, а затем будет заметно дешевле.

Последняя приятная деталь — знания модели актуальны на 1 июня 2024 года, то есть примерно на уровне с Gemini 2.5 Pro и на несколько месяцев раньше Claude 3.7 Sonnet. Что хорошо, поскольку до сих пор все модели OpenAI выглядели застрявшими в 1 октября 2023 года.

В окружном суде Вашингтона сегодня начались слушания иска FTC против Meta, в котором комиссия обвиняет Meta в создании монополии посредством приобретения стартапов Instagram и WhatsApp. FTC утверждает, что Meta использовала стратегию «купить или уничтожить», приобретая потенциальных конкурентов на ранних стадиях их развития, чтобы избежать конкуренции.

Если суд поддержит позицию FTC, Meta может столкнуться с требованием продать Instagram и WhatsApp, что существенно изменит структуру рынка социальных сетей и подход Кремниевой долины к поглощениям молодых компаний.

Однако эксперты считают, что FTC будет непросто доказать свою позицию. Для этого необходимо убедительно показать, что без покупки стартапов успех Meta был бы невозможен, а также обосновать, почему сделки, одобренные много лет назад, должны быть отменены.

Meta, со своей стороны, утверждает, что действовала в рамках закона и приобретения стартапов были частью естественного развития компании. В свою защиту юристы Meta приводят аргумент, что компания постоянно сталкивается с конкуренцией со стороны таких платформ, как TikTok, LinkedIn и YouTube.

Пока стороны только обменялись заявлениями и все с нетерпением ждут возможного появления Марка Закерберга на свидетельском месте — думаю, мы это увидим.

Исследователи выявили новый класс атак на цепочку поставок под названием “slopsquatting”, связанный с использованием генеративного ИИ для написания кода. Проблема возникает из-за склонности AI-моделей “галлюцинировать” несуществующие имена пакетов.

В отличие от традиционного typosquatting, где злоумышленники используют опечатки в названиях популярных библиотек, slopsquatting основан на создании вредоносных пакетов с названиями, которые AI регулярно придумывает в своих кодовых примерах.

Недавнее исследование показало, что примерно в 20% случаев (из 576 000 проанализированных примеров кода на Python и JavaScript) рекомендованные ИИ пакеты на самом деле не существуют. Проблема особенно заметна в открытых моделях типа CodeLlama и DeepSeek, но даже коммерческие инструменты вроде GPT-4 ошибаются примерно в 5% случаев.

58% “галлюцинированных” имен пакетов повторялись более одного раза в десяти запусках, что делает их предсказуемыми целями для атак. При этом 38% названий были вдохновлены реальными пакетами, 13% были результатом опечаток, а 51% — полностью выдуманными.

Хотя пока нет признаков активного использования этой уязвимости злоумышленниками, исследователи из компании Socket предупреждают, что семантически правдоподобные и повторяющиеся имена пакетов создают предсказуемые возможности для атак.

Для защиты рекомендуется всегда вручную проверять имена пакетов, использовать сканеры зависимостей, файлы блокировки и верификацию хешей. Также помогает снижение параметра “температуры” в настройках AI и тестирование сгенерированного кода в изолированной среде перед его использованием в продакшене.

Сэм Альтман сходил на TED, где у него взяли интервью про OpenAI и будущее. Видео идет 47 минут, поэтому вот вам основные пункты.

  • Рост: ChatGPT имеет около 500 млн еженедельных пользователей с быстрым ростом.
  • Открытый код: OpenAI планирует выпустить мощную модель с открытым исходным кодом.
  • Творчество: Разрабатываются модели распределения доходов с художниками, давшими согласие на использование их стиля.
  • Наука: Наиболее перспективно применение AI в научных открытиях и медицине.
  • Угрозы: Признает “большие риски” - биотерроризм, кибербезопасность, самосовершенствующиеся модели.
  • Агентный AI: Представляет самый серьезный вызов безопасности; хороший продукт должен быть безопасным.
  • AGI: Нет четкого определения AGI; модели продолжат становиться умнее по экспоненциальной кривой.
  • Будущее: Альтман считает, что его ребенок будет жить в мире, где люди “никогда не будут умнее AI”, с “невероятным материальным изобилием”.

Жесткий переговорщик, умеющий заключать сделки, отменил беспрецедентно высокие пошлины в адрес Китая в части смартфонов, компьютеров, чипов, мониторов, жестких дисков и другой электроники — причем эти товары не будут облагаться не только 125% пошлины, но и базовой 10%. Снятие ограничений касается других стран, поставляющих в США эту продукцию — так что пресловутая Framework сможет возобновить поставки своих начальных моделей лэптопов с Тайваня.

От пошлин освобождены также поставки оборудования для производства чипов.

В общем, я практически уверен, что Трамп почти не врал, рассказывая на этой неделе про страны и задницу. Определенно, какие-то действия с задницей были. Но я сильно сомневаюсь, что дело было в поцелуях.

Илья Суцкевер, сооснователь OpenAI, привлек $2 млрд для своего стартапа Safe Superintelligence (SSI), что оценивает компанию в $32 млрд — несмотря на отсутствие готового продукта. Илья, покинувший OpenAI в прошлом году, основал SSI в июне вместе с Даниэлем Гроссом, бывшим руководителем направления AI в Apple, и исследователем Даниэлем Леви.

В раунде финансирования приняли участие ведущие венчурные фонды, включая Greenoaks (возглавивший раунд с $500 млн), Lightspeed Venture Partners и Andreessen Horowitz. До этого SSI уже привлекал $1 млрд при оценке в $5 млрд в сентябре.

Мира Мурати, бывшая CTO OpenAI, которая тоже покинула компанию в прошлом году, также запустила компанию — Thinking Machines Lab в феврале. Причем тоже привлекает раунды — на этой неделе ходили слухи о привлечении 2 млрд долларов в качестве seed-раунда, если это окажется правдой, то это будет один из крупнейших раундов на этой стадии. Компания без продукта и продолжающая формировать команду, по слухам, оценивается в 10 млрд.

Еще одна волна сокращений в Google — на этот раз компания увольняет сотни сотрудников подразделения платформ и устройств, занимающегося Android, Pixel и браузером Chrome. Это последовательный шаг после предложения уйти добровольно, которое было сделано в январе этого года.

В прошлом году Google объединил Android и Chrome под руководством Рика Остерло, который отвечает за Pixel и другие устройства. До предложения об уходе в этом объединенном подразделении работало более 20 000 человек.

OpenAI запускает функцию “памяти” в ChatGPT, которая позволит боту адаптировать ответы на основе предыдущих разговоров с пользователем. Это нововведение должно сделать общение более персонализированным — пользователям больше не придется повторять уже сообщенную ранее информацию.

Функция сначала появится для подписчиков ChatGPT Pro и Plus, за исключением пользователей из Великобритании, ЕС и некоторых других европейских стран, где требуются дополнительные проверки на соответствие местным нормам. О запуске для бесплатных пользователей информации пока нет.

Кстати, эту функцию для Claude можно реализовать самостоятельно, с помощью MCP сервера. Правда, в этом случае придется ему напоминать, что надо вспомнить.

Хьюго Барра возвращается — он присоединяется к совету директоров Sonos в довольно непростое для компании время.

Если кто не помнит, то Барра имеет впечатляющее резюме — он руководил развитием Android в Google, потом ушел в Xiaomi и затем возглавлял подразделение виртуальной реальности Meta (Oculus).

Сейчас он является кофаундером /dev/agents, компании, разрабатывающей “операционную систему нового поколения для AI-агентов”. Председатель совета директоров Sonos Джулиус Геначовски отметил, что Барра “обладает доказанной способностью превращать передовые инновации в отличные продукты”, а его опыт в области AI особенно ценен.

При этом, как сообщают инсайдеры Sonos, моральный климат в компании явно улучшился после ухода предыдущего CEO вместе с CPO, пока компанией руководит временный глава Том Конрад.

Google представил Agent2Agent (A2A) — открытый протокол совместимости для обеспечения беспрепятственного взаимодействия между AI-агентами разных производителей и фреймворков. Протокол нацелен на корпоративный сегмент и призван решить проблему разрозненности систем путем стандартизации коммуникации между агентами, автоматизации сложных рабочих процессов и повышения продуктивности.

Заявляется, что инициативу поддержали более 50 технологических партнеров, включая Salesforce, SAP, ServiceNow и MongoDB, поддержали инициативу. A2A обеспечивает универсальный фреймворк для безопасного обмена информацией между AI-агентами, координации действий и интеграции корпоративных платформ.

Протокол работает на нескольких ключевых принципах: обнаружение возможностей, управление задачами, сотрудничество и согласование пользовательского опыта. Например, агенты могут публиковать свои возможности через “Agent Cards” в формате JSON, что позволяет клиентским агентам определять наиболее подходящего удаленного агента для конкретной задачи. Протокол также обеспечивает управление жизненным циклом задач, позволяя синхронизировать агентов в реальном времени.

Google выпустила A2A с открытым исходным кодом, приглашая сообщество вносить вклад в доработку и расширение его функциональности. Протокол дополняет Model Context Protocol (MCP) от Anthropic и позиционируется как абстракция более высокого уровня для коммуникации агентов.

Инициатива интересная и, в целом, обычно Google достаточно успешен в области подобных инициатив. Так что посмотрим на то, как этим будут пользоваться.

---