Если вы смотрите на небольшие модели, да еще и с возможностью работать с ней локально, то вот, — Microsoft представила новую модель Phi-4. При всего 14 миллиардах параметров она показывает результаты лучше, чем у гораздо более крупных моделей вроде Gemini Pro 1.5 от Google, особенно в области решения математических задач.
По тестам AMC (это материалы американских математических олимпиад для студентов) модель обходит как Gemini Flash и Pro 1.5, так и gpt-4o, Claude 3.5 Sonnet, не говоря уже о только что выпущенной Llama-3.3-70B (впрочем, та, кажется, совсем не готова к этим тестам).
Microsoft делает акцент на безопасности и контролируемом внедрении — модель будет доступна через Azure AI Foundry по исследовательской лицензии, позже планируется релиз на Hugging Face и, видимо, на Ollama.