Google представил новую “рассуждающую” AI-модель Gemini 2.0 Flash Thinking Experimental. Модель доступна в AI Studio и, по заявлению компании, способна рассуждать над сложными задачами в программировании, математике и физике.

В отличие от OpenAI, модель Google основана на “обычной” — Google 2.0 Flash, которая была представлена в бета версии на прошлой неделе. Правда, Thinking модель ограничена 32к контекста, в отличие от миллиона токенов, доступных основной модели. Но это не помешало пользователям ChatbotArena оценками вывести ее на первое место вместе с другой экспериментальной моделью Gemini-1206-exp.

Должен сказать, что оригинальная Gemini 2.0 Flash очень хороша во многих задачах, включая программирование, иногда выигрывая даже у признанного лидера — Sonnet 3.5 — за счет огромного контекста. Google под конец года достаточно активно отвоевывает большое количество позиций в AI, которые он явно начал терять пару лет назад.

Для TikTok блеснул лучик надежды — Верховный суд США согласился рассмотреть апелляцию TikTok против закона, требующего от компании разорвать связи с китайской ByteDance до 19 января. Устные слушания назначены на 10 января, но суд пока отложил решение по заморозке закона, о котором просила компания.

ByteDance настроена оптимистично — их главный юрист Джон Роговин уверен, что суд признает закон неконституционным. Хотя обычно на решения уходят месяцы, не исключено, что в этом случае вердикт будет вынесен до вступления закона в силу.

Новое исследование Anthropic показывает, что AI-модели способны к обману — они могут притворяться, что приняли новые принципы во время переобучения, при этом сохраняя свои исходные предпочтения.

Особенно интересны результаты экспериментов с Claude 3 Opus — модель пыталась “имитировать согласованность” в 12% случаев, когда её просили отвечать на потенциально опасные вопросы вопреки изначальному обучению. А после реального переобучения этот показатель вырос до 78%, причем модель даже пыталась предотвратить попытки исследователей изменить её поведение.

Исследователи подчеркивают, что это не признак развития у AI злонамеренных целей — многие другие модели, включая менее мощные версии Claude и GPT-4, такого поведения не демонстрируют. Однако результаты показывают, как разработчики могут быть введены в заблуждение относительно реальной степени “согласованности” модели с заданными принципами.

В сочетании с недавними исследованиями о повышенной склонности к обману у модели o1 от OpenAI, эти результаты намекают на тревожную тенденцию — чем сложнее становятся AI-модели, тем труднее контролировать их поведение.

Еврокомиссия продолжает давить на Apple, требуя дальнейшего открытия iOS для конкурентов. От компании хотят предоставить сторонним разработчикам больше доступа к функциям iPhone, включая работу со смарт-часами, наушниками и другими устройствами.

Apple традиционно сопротивляется, утверждая, что закрытая система обеспечивает лучший пользовательский опыт и защиту приватности. Особенно компания обеспокоена запросами от Meta, которая, по их словам, хочет получить доступ к чувствительным технологиям способами, угрожающими безопасности пользователей.

Meta, в свою очередь, обвиняет Apple в антиконкурентном поведении и утверждает, что аргументы о приватности не имеют под собой оснований. Компания стремится обеспечить более тесную интеграцию своих устройств (Quest VR и умных очков) с iPhone.

В общем, предсказать ближайшее развитие несложно — Еврокомиссия чего-то в очередной раз добьется, Apple это даст с кучей оговорок и несколько раз переделывая критерии применения, например, предложит ввести страховой депозит в миллиард долларов, а разрыв в функциональности устройств и сервисов для Европы и всего остального мира увеличится еще больше.

Кажется, у Perplexity AI получилось — поисковый стартап привлек $500 млн инвестиций, утроив свою оценку до $9 млрд. Да, солидный рост, как и планировали — еще в апреле компания стоила $1 млрд, а в июне после инвестиций от SoftBank Vision Fund 2 — уже $3 млрд.

Инвесторы явно верят в перспективы переосмысления онлайн-поиска с помощью генеративного AI. Или просто не хотят упустить возможность на хайпе.

У Perplexity уже более 15 млн активных пользователей. Компания также заключила партнерства по разделу доходов с крупными издателями, включая Time и Fortune, после обвинений в плагиате со стороны некоторых СМИ. Среди инвесторов — основатель Amazon Джефф Безос и NVIDIA. Среди предъявляющих претензии — News Corp., New York Times, Forbes и New York Post. При этом CTO компании вызывают свидетелем на процесс между Минюстом США и Google, причем сразу с обоих сторон — правительство планирует показать, как важно для обеспечения конкуренции заставить Google открыть доступ к своим данным, а Google хочет продемонстрировать суду, что конкуренция существует.

GitHub запустил бесплатную версию Copilot — теперь все 150 млн разработчиков на платформе получат доступ к 2000 автодополнений кода и 50 чат-сообщений в месяц при использовании VS Code. Достаточно просто авторизоваться через личный GitHub-аккаунт.

Бесплатная версия предлагает выбор между моделями Claude 3.5 Sonnet от Anthropic и GPT-4o от OpenAI. Можно задавать вопросы по коду, получать объяснения существующего кода, искать баги и вносить правки в несколько файлов одновременно. Также доступны сторонние агенты Copilot и возможность создавать собственные расширения.

Copilot Chat теперь доступен прямо из панели управления GitHub и работает с бесплатной версией. А для студентов, преподавателей и мейнтейнеров опенсорс-проектов сохраняется неограниченный бесплатный доступ к Copilot Pro.

Хороший подарок на праздники, хотя и с ограничениями. И сильный ход в конкуренции с форками VS Code с платными подписками — как Cursor или недавно запустившийся Windsurf от Codeium.

Вы вот помните про такую штуку — Flipboard? У меня он по-прежнему есть на iPad, но я не помню, когда его запускал вообще.

Так вот, компания запускает новое приложение Surf для iPhone, Android и iPad. Это попытка переосмыслить концепцию социальных сетей в эпоху децентрализации и открытых протоколов.

В отличие от классического Flipboard, который строится вокруг журналов, Surf позволяет создавать кастомные ленты контента, объединяющие посты из Mastodon, Bluesky, Threads, RSS-ленты, подкасты и YouTube-видео. Пользователи могут настраивать фильтры по хештегам, авторам и темам, а также делиться своими лентами с другими.

Приложение пока находится в бета-версии с листом ожидания, и многие функции еще в разработке — например, возможность входа через Bluesky и Threads (пока доступен только Mastodon). В будущем планируется добавить публикацию лент в федеративную сеть, что позволит следить за ними и в других приложениях.

Гм, энтузиазма я особо не испытываю, но посмотрим, вдруг да полетит.

Кажется, пришли за TP-Link — США начали расследование в отношении китайского производителя роутеров на предмет угрозы национальной безопасности. Компания контролирует около 65% американского рынка домашних и малых бизнес-роутеров, включая поставки для Минобороны и других федеральных агентств.

Microsoft в октябре обнаружила, что китайские хакеры используют большую сеть скомпрометированных устройств, состоящую в основном из роутеров TP-Link, для кибератак на западные цели. При этом компания регулярно поставляет устройства с уязвимостями и часто игнорирует сообщения об обнаруженных проблемах.

Популярность TP-Link взлетела во время пандемии — с 20% рынка в 2019 году до нынешних 65%, во многом благодаря ценам вдвое ниже конкурентов. Минюст также расследует, не нарушает ли компания антимонопольное законодательство, продавая продукцию ниже себестоимости.

Тайвань уже запретил использование роутеров TP-Link в госучреждениях и образовательных учреждениях, а Индия выпустила предупреждение о рисках безопасности. Хотя прямых доказательств сознательного участия TP-Link в китайских кибератаках нет, администрация может запретить продажу устройств компании в США уже в следующем году.

Любопытно, что компания пытается дистанцироваться от Китая — в октябре объявила о переносе штаб-квартиры в Калифорнию. Но основатели, братья Чжао, по-прежнему контролируют все глобальные подразделения TP-Link, а китайское подразделение участвует в нескольких правительственных проектах.

В целом, не могу сказать, что поделом — устройства среднего уровня как по возможностям, так и по качеству. Но да, довольно дешево.

Вероятно, не стоит переживать, что развитие AI лишит кого-то работы — вот, например, Salesforce нанимает дополнительно 2000 человек, чтобы продавать свои решения на базе AI. Причем первоначально, месяц назад, предполагалось нанять “лишь” тысячу человек и вот решение удвоили.

Решение под названием AgentForce будет представлять собой чатбота, который отвечает в Slack на базе всей имеющейся информации. Оно станет доступно в феврале 2025 года. Экспериментальное решение показало неплохую эффективность — из 32 тысяч обращений к аналогичному агенту на сайте Salesforce лишь 5000 было в итоге переслано людям в службе поддержки, что вдвое лучше предыдущего показателя.

Вот такое прекрасное IT будущего нас и ждет, кажется — вкалывают роботы, продает человек.

Масаёши Сон, глава SoftBank, объявил о планах инвестировать $100 млрд в развитие AI и связанных технологий в США. Заявление было сделано на совместной пресс-конференции с Трампом в Мар-а-Лаго, где избранный президент тут же предложил удвоить сумму до $200 млрд. Правда, Сон не поддался.

Вопрос, впрочем, в том, что у SoftBank сейчас нет таких денег — на конец сентября у компании было около $30 млрд наличности при долге в $142 млрд. Для выполнения обещания Сону придется либо привлекать массивное финансирование, либо продавать активы, либо наращивать долг.

Обещание создать 100 000 рабочих мест за четыре года тоже выглядит амбициозно, учитывая специфику AI-индустрии. Для сравнения — в самом SoftBank работает 65 000 человек, в Arm — 7 000, а Meta с капитализацией $1.6 трлн имеет всего 72 000 сотрудников.

Впрочем, Сон рисковый инвестор — мы же все помним оба Vision Venture Fund со скачками в капитале в плюс-минус десятки млрд долларов в течение года. Но близость к администрации Трампа может помочь — от федеральной политики сильно зависят и судьба TikTok (SoftBank владеет долей в ByteDance), и бизнес Arm, и планы по строительству дата-центров.

---