/ Source

Nvidia представила две новые серии чипов на своей ежегодной конференции GTC: Blackwell Ultra, который начнет поставляться во второй половине этого года, и Vera Rubin — следующее поколение графических процессоров.

Vera Rubin — это первый пользовательский CPU-дизайн Nvidia, получивший название Olympus. Ранее компания использовала готовые дизайны от Arm. По заявлению Nvidia, новый CPU будет вдвое быстрее того, что используется в прошлогодних чипах Grace Blackwell. В паре с Vera чип Rubin сможет обеспечить 50 петафлопс при выполнении inference (вдвое больше, чем у текущих чипов Blackwell).

Blackwell Ultra сможет производить больше токенов в секунду, что позволит облачным провайдерам предлагать премиальные услуги ИИ для критичных ко времени приложений. Nvidia утверждает, что эти чипы могут приносить до 50 раз больше выручки, чем поколение Hopper, вышедшее в 2023 году.

Дженсен Хуанг подчеркнул, что для “агентного AI” и моделей с рассуждениями необходимо на порядки больше вычислительной мощности — “примерно в 100 раз больше, чем мы думали ранее”. Это отвечает на вопрос, действительно ли гиперскейлерам нужно продолжать тратить огромные средства на инфраструктуру Nvidia.

Параллельно компания представила Dynamo — программную платформу с открытым исходным кодом, которая оптимизирует процесс рассуждений ИИ, разделяя его на этапы и распределяя нагрузку. При использовании модели DeepSeek-R1 на крупном кластере GB200 NVL72, Dynamo увеличивает количество токенов в 30 раз на один GPU.

Компания также представила дорожную карту на ближайшие годы: чипы Vera Rubin появятся во второй половине 2026 года, а Rubin Ultra — во второй половине 2027. Отмечено, что Nvidia сохраняет годовой цикл обновлений, меняя внутреннюю архитектуру, но сохраняя совместимость оборудования.

По сути, Nvidia хочет убедить рынок, что даже эффективные модели вроде DeepSeek всё равно требуют её интегрированного стека оборудования и ПО для построения “AI-фабрик”.