OpenAI представила новое семейство моделей GPT-4.1, включающее варианты GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Все они специализируются на программировании и следовании инструкциям, имеют контекстное окно в 1 миллион токенов (около 750 000 слов для английского), окно вывода в 32к токенов (вдвое больше GPT-4o) и доступны только через API компании, но не в ChatGPT.
OpenAI заявляет, что оптимизировала GPT-4.1 для реальных задач, улучшив фронтенд-кодирование, следование форматам и использование инструментов. Флагманская модель GPT-4.1 превосходит GPT-4o и GPT-4o mini по кодированию, а варианты mini и nano жертвуют точностью ради скорости и эффективности.
Цены варьируются от $2 за миллион входных токенов и $8 за миллион выходных для полной версии до $0,10 и $0,40 соответственно для nano-версии. Это на 25% дешевле, чем GPT-4o.
При этом результаты GPT-4.1 на бенчмарке SWE-bench Verified (52-54,6%) немного отстают от Gemini 2.5 Pro (63,8%) и Claude 3.7 Sonnet (62,3%). Также OpenAI признает, что надежность модели снижается при обработке большого количества токенов — с 84% при 8000 токенов до 50% при миллионе. Но зато нет доплаты при использовании длинного контекста, как это сделал Google.
Заодно в стриме презентации предупредили, что в обозримом будущем (несколько месяцев) в API пропадет доступ к GPT-4.5 — кажется, её поддержание обходится дорого, несмотря на запретительную цену. И позвали основателя Windsurf, который пообещал, что доступ к GPT-4.1 будет бесплатным следующие 7 дней, а затем будет заметно дешевле.
Последняя приятная деталь — знания модели актуальны на 1 июня 2024 года, то есть примерно на уровне с Gemini 2.5 Pro и на несколько месяцев раньше Claude 3.7 Sonnet. Что хорошо, поскольку до сих пор все модели OpenAI выглядели застрявшими в 1 октября 2023 года.