Google опубликовал свои предложения по мерам, которые должен предпринять суд по иску о поисковой монополии компании. Компания, впрочем, отмечает, что планирует подать апелляцию на решение суда, однако это не дает права уклониться от соблюдения процедуры.

Google критикует предложения Минюста (которые, как мы помним, даже содержат пункт о разделении компании и продаже Chrome) как чрезмерно широкие и выходящие за рамки сути дела, которое касалось только соглашений о дистрибуции поиска. По мнению компании, требования регулятора могут навредить американским потребителям и подорвать технологическое лидерство США.

В своем предложении Google фокусируется на двух основных моментах:

  • Браузерные соглашения: компании вроде Apple и Mozilla смогут свободно выбирать поисковик по умолчанию, менять его каждые 12 месяцев и устанавливать разные поисковики для разных платформ
  • Android-контракты: производители устройств получат больше свободы в предустановке нескольких поисковиков и приложений Google независимо друг от друга

Google признает, что эти изменения создадут определенные сложности для партнеров, но считает их адекватным ответом на решение суда, который не угрожает приватности пользователей и технологическому лидерству США. Ну и компания напоминает, что с момента окончания судебного разбирательства год назад ситуация сильно изменилась из-за развития AI.

OpenAI завершила свой 12-дневный марафон анонсов презентацией o3 — нового семейства “рассуждающих” моделей, преемника o1. Интересно, что компания пропустила название o2 из-за возможного конфликта с британским телекоммуникационным провайдером O2. Впрочем, символики тут все равно достаточно — вместо кислорода мы имеем озон, который до сих пор ассоциируется со свежестью.

Модели пока доступны только для исследователей безопасности. Компания планирует выпустить модели в публичный доступ довольно скоро — o3-mini к концу января 2025 года, а o3 вскоре после этого.

Главная особенность o3 — способность к “самопроверке” через “внутреннюю цепочку рассуждений”. Модель может планировать действия и объяснять свои решения, хотя это увеличивает время отклика. Новинкой стала возможность регулировать время на “размышления” — чем больше времени, тем точнее результат.

По многим бенчмаркам o3 значительно превосходит предшественника: 87.5% на тесте ARC-AGI (против 25-32% у o1), 96.7% на AIME 2024, 87.7% на GPQA Diamond. Впрочем, эти результаты пока основаны только на внутреннем тестировании OpenAI.

Я, впрочем, немного разочарован — никогда еще моя покупка не устаревала так быстро, поскольку ровно сутки назад мы нас уговорили и подписались на ChatGPT Pro, с доступом к o1 pro. Придется выжимать из этого месяца максимум.

Разработчик AI-помощника для программистов Cursor привлек $100 млн в раунде Series B при оценке в $2,6 млрд. Раунд возглавил прежний инвестор Thrive Capital, также участвовал a16z. Примечательно, что это произошло всего через 4 месяца после Series A на $60 млн при оценке $400 млн — рост в 6,5 раз за такой короткий срок.

Компания демонстрирует впечатляющий рост выручки — с $4 млн годовой подписки в апреле до $4 млн ежемесячной в октябре. То есть годовая выручка достигла $48 млн, а значит компанию оценили примерно в 50 раз выше текущей выручки. Что становится уже привычным в условиях AI-бума, хотя до сих пор мультипликатор х20 считался чем-то сродни ставки в казино.

К слову, я уже больше месяца использую Cursor как основной редактор кода и почти им доволен. С точностью до того, что большинство альтернативных вариантов не лучше, как минимум. Кстати, небольшой лайфхак — в свежей версии 0.44 появилась поддержка o1 через API и, кажется, проводится какой-то аттракцион невиданной щедрости — запросы к этой модели никак не учитываются и по опыту пары часов работы — даже не ограничиваются. Может, раунд празднуют?

Google представил новую “рассуждающую” AI-модель Gemini 2.0 Flash Thinking Experimental. Модель доступна в AI Studio и, по заявлению компании, способна рассуждать над сложными задачами в программировании, математике и физике.

В отличие от OpenAI, модель Google основана на “обычной” — Google 2.0 Flash, которая была представлена в бета версии на прошлой неделе. Правда, Thinking модель ограничена 32к контекста, в отличие от миллиона токенов, доступных основной модели. Но это не помешало пользователям ChatbotArena оценками вывести ее на первое место вместе с другой экспериментальной моделью Gemini-1206-exp.

Должен сказать, что оригинальная Gemini 2.0 Flash очень хороша во многих задачах, включая программирование, иногда выигрывая даже у признанного лидера — Sonnet 3.5 — за счет огромного контекста. Google под конец года достаточно активно отвоевывает большое количество позиций в AI, которые он явно начал терять пару лет назад.

Для TikTok блеснул лучик надежды — Верховный суд США согласился рассмотреть апелляцию TikTok против закона, требующего от компании разорвать связи с китайской ByteDance до 19 января. Устные слушания назначены на 10 января, но суд пока отложил решение по заморозке закона, о котором просила компания.

ByteDance настроена оптимистично — их главный юрист Джон Роговин уверен, что суд признает закон неконституционным. Хотя обычно на решения уходят месяцы, не исключено, что в этом случае вердикт будет вынесен до вступления закона в силу.

Новое исследование Anthropic показывает, что AI-модели способны к обману — они могут притворяться, что приняли новые принципы во время переобучения, при этом сохраняя свои исходные предпочтения.

Особенно интересны результаты экспериментов с Claude 3 Opus — модель пыталась “имитировать согласованность” в 12% случаев, когда её просили отвечать на потенциально опасные вопросы вопреки изначальному обучению. А после реального переобучения этот показатель вырос до 78%, причем модель даже пыталась предотвратить попытки исследователей изменить её поведение.

Исследователи подчеркивают, что это не признак развития у AI злонамеренных целей — многие другие модели, включая менее мощные версии Claude и GPT-4, такого поведения не демонстрируют. Однако результаты показывают, как разработчики могут быть введены в заблуждение относительно реальной степени “согласованности” модели с заданными принципами.

В сочетании с недавними исследованиями о повышенной склонности к обману у модели o1 от OpenAI, эти результаты намекают на тревожную тенденцию — чем сложнее становятся AI-модели, тем труднее контролировать их поведение.

Еврокомиссия продолжает давить на Apple, требуя дальнейшего открытия iOS для конкурентов. От компании хотят предоставить сторонним разработчикам больше доступа к функциям iPhone, включая работу со смарт-часами, наушниками и другими устройствами.

Apple традиционно сопротивляется, утверждая, что закрытая система обеспечивает лучший пользовательский опыт и защиту приватности. Особенно компания обеспокоена запросами от Meta, которая, по их словам, хочет получить доступ к чувствительным технологиям способами, угрожающими безопасности пользователей.

Meta, в свою очередь, обвиняет Apple в антиконкурентном поведении и утверждает, что аргументы о приватности не имеют под собой оснований. Компания стремится обеспечить более тесную интеграцию своих устройств (Quest VR и умных очков) с iPhone.

В общем, предсказать ближайшее развитие несложно — Еврокомиссия чего-то в очередной раз добьется, Apple это даст с кучей оговорок и несколько раз переделывая критерии применения, например, предложит ввести страховой депозит в миллиард долларов, а разрыв в функциональности устройств и сервисов для Европы и всего остального мира увеличится еще больше.

Кажется, у Perplexity AI получилось — поисковый стартап привлек $500 млн инвестиций, утроив свою оценку до $9 млрд. Да, солидный рост, как и планировали — еще в апреле компания стоила $1 млрд, а в июне после инвестиций от SoftBank Vision Fund 2 — уже $3 млрд.

Инвесторы явно верят в перспективы переосмысления онлайн-поиска с помощью генеративного AI. Или просто не хотят упустить возможность на хайпе.

У Perplexity уже более 15 млн активных пользователей. Компания также заключила партнерства по разделу доходов с крупными издателями, включая Time и Fortune, после обвинений в плагиате со стороны некоторых СМИ. Среди инвесторов — основатель Amazon Джефф Безос и NVIDIA. Среди предъявляющих претензии — News Corp., New York Times, Forbes и New York Post. При этом CTO компании вызывают свидетелем на процесс между Минюстом США и Google, причем сразу с обоих сторон — правительство планирует показать, как важно для обеспечения конкуренции заставить Google открыть доступ к своим данным, а Google хочет продемонстрировать суду, что конкуренция существует.

GitHub запустил бесплатную версию Copilot — теперь все 150 млн разработчиков на платформе получат доступ к 2000 автодополнений кода и 50 чат-сообщений в месяц при использовании VS Code. Достаточно просто авторизоваться через личный GitHub-аккаунт.

Бесплатная версия предлагает выбор между моделями Claude 3.5 Sonnet от Anthropic и GPT-4o от OpenAI. Можно задавать вопросы по коду, получать объяснения существующего кода, искать баги и вносить правки в несколько файлов одновременно. Также доступны сторонние агенты Copilot и возможность создавать собственные расширения.

Copilot Chat теперь доступен прямо из панели управления GitHub и работает с бесплатной версией. А для студентов, преподавателей и мейнтейнеров опенсорс-проектов сохраняется неограниченный бесплатный доступ к Copilot Pro.

Хороший подарок на праздники, хотя и с ограничениями. И сильный ход в конкуренции с форками VS Code с платными подписками — как Cursor или недавно запустившийся Windsurf от Codeium.

Вы вот помните про такую штуку — Flipboard? У меня он по-прежнему есть на iPad, но я не помню, когда его запускал вообще.

Так вот, компания запускает новое приложение Surf для iPhone, Android и iPad. Это попытка переосмыслить концепцию социальных сетей в эпоху децентрализации и открытых протоколов.

В отличие от классического Flipboard, который строится вокруг журналов, Surf позволяет создавать кастомные ленты контента, объединяющие посты из Mastodon, Bluesky, Threads, RSS-ленты, подкасты и YouTube-видео. Пользователи могут настраивать фильтры по хештегам, авторам и темам, а также делиться своими лентами с другими.

Приложение пока находится в бета-версии с листом ожидания, и многие функции еще в разработке — например, возможность входа через Bluesky и Threads (пока доступен только Mastodon). В будущем планируется добавить публикацию лент в федеративную сеть, что позволит следить за ними и в других приложениях.

Гм, энтузиазма я особо не испытываю, но посмотрим, вдруг да полетит.

---