Anthropic представил Claude Opus 4.5, заявив ее как лучшую модель для кодинга и сложных задач. Компания утверждает, что на их внутреннем сложном тесте для приема на работу инженеров модель показала результат выше, чем любой когда-либо проходивший его человек.
А мы уже ждали, что опять будем полгода с Sonnet жить.
Технологически важным новшеством стал параметр effort — теперь через API можно управлять тем, насколько глубоко модель должна «задумываться» над задачей, балансируя между стоимостью токенов и качеством решения. В принципе, и раньше можно было указать бюджет токенов на размышления, но сейчас параметр работает иначе. Кстати, по умолчанию он выставлен в high.
Утверждается, что Opus теперь более экономно расходует токены, превосходя Sonnet в качестве решения.
В общем, пошли тестировать и сравнивать с Gemini 3 Pro. Тем более, что гугловцы наконец определились и сломали доступ к лучшей модели в CLI опять.