Еще один сегодняшний запуск в области моделей — Google представил Gemini 2.5 Pro (экспериментальная версия) для подписчиков Advanced и разработчиков. Главное отличие новой модели — встроенные возможности “мышления”, позволяющие рассуждать перед ответом, что улучшает точность и производительность. Теперь это не отдельная функция “Thinking”, а базовая возможность всех моделей семейства 2.5.
Gemini 2.5 Pro уже возглавляет рейтинг LMArena, который измеряет предпочтения пользователей, и лидирует в математических и научных бенчмарках. Он также достиг рекордных 18,8% в тесте Humanity’s Last Exam, созданном экспертами для оценки современных границ знаний и рассуждений.
Особое внимание уделено продвинутому программированию — модель создает визуально привлекательные веб-приложения, агентный код и отлично справляется с трансформацией кода. На SWE-Bench Verified, стандартном тесте для оценки агентного кода, Gemini 2.5 Pro набирает 63,8%.
Модель обладает контекстным окном в 1 млн токенов (скоро увеличится до 2 млн) и может обрабатывать сложные задачи с использованием различных источников информации — текст, аудио, изображения, видео и даже целые репозитории кода.
Надо пробовать, конечно, вдруг оно перекодит наш любимый Claude 3.7 Sonnet…