/ Source

Я давно говорил, что многие LLM-модели просто оптимизируют под LMArena и не надо туда смотреть. Теперь вот Meta поймали — модель, отвечаюшая на LM Arena, отличается от той, что можно скачать на сайте. Версия на LM Arena активно использует эмодзи и дает чрезмерно длинные ответы.

Компания признала в своем объявлении, что на LM Arena представлена “экспериментальная чат-версия”, а на официальном сайте Llama указано, что тестирование проводилось с использованием “Llama 4 Maverick, оптимизированной для разговорности”.

Первый принцип LM Optimization — смайликов побольше, зумерам нужны смайлики!