| Телеграм-канал БлоGнот

29 июля 2025 г. / Source

Z.ai, больше известные как Zhipu, представили GLM-4.5 — модель уже присутствовала на рынке, но нынешний релиз выглядит серьезной заявкой. По тестам модель с 355 миллиардами параметров (активных 32) заняла третье место в общем рейтинге после o3 и Grok 4, обойдя Opus 4.

Модель по решению похожа на Claude — у нее есть обычный режим и thinking. На практике это означает, что на математике (MATH 500) модель показывает 98.2%, почти как o3, а на агентных бенчмарках — на уровне Claude 4 Sonnet.

В блоге разработчики описывают интересную деталь — они изменили пропорции архитектуры модели. Сделали модель глубже, но уже, в отличие от того же DeepSeek-V3. И увеличили количество attention heads в 2.5 раза. По их словам, это не улучшает training loss, зато почему-то помогает на reasoning бенчмарках.

Модель открытая (как и предыдущие версии), поэтому желающие могут скачать веса и воспроизвести результат. Если видеокарты хватит.