Anthropic представила модели Claude Opus 4 и Claude Sonnet 4.
Claude Opus 4 позиционируется как “лучшая в мире модель для программирования”, способная поддерживать высокую производительность на сложных длительных задачах. Если вы помните, добиться стабильной работы Opus 3.5 у компании не вышло и они отложили релиз. Интересно посмотреть, что получилось в итоге.
Sonnet 4 значительно превосходит своего предшественника, Sonnet 3.7, с улучшенными возможностями кодинга и рассуждения.
Обе модели получили расширенные возможности мышления с использованием инструментов (включая веб-поиск), могут выполнять параллельные задачи и лучше следуют инструкциям. При доступе к локальным файлам они демонстрируют улучшенные возможности памяти, извлекая и сохраняя ключевые факты.
Помимо новых моделей, Anthropic объявляет о выходе Claude Code в общий доступ с поддержкой фоновых задач через GitHub Actions и интеграцией с VS Code и JetBrains. В API добавлены четыре новые возможности, включая инструмент выполнения кода и API для работы с файлами.
Opus 4 и Sonnet 4 — это гибридные модели с двумя режимами: мгновенные ответы и расширенное мышление для глубоких рассуждений. Модели доступны через Anthropic API, Amazon Bedrock и Google Cloud Vertex AI. Цены остаются на прежнем уровне: Opus 4 — $15/$75 за миллион токенов (ввод/вывод), Sonnet 4 — $3/$15.
По результатам бенчмарков, Claude Opus 4 лидирует на SWE-bench (72,5%) и Terminal-bench (43,2%), значительно опережая конкурентов в сложных задачах программирования, требующих длительной фокусировки и тысяч шагов.