| Телеграм-канал БлоGнот

27 января 2025 г. / Source

Китайский DeepSeek серьезно встряхнул технологический сектор — его новая модель R1, способная работать на менее мощных чипах, вызвала обвал акций Nvidia на 10% и общее падение технологического сектора. Nasdaq 100 и европейские компании (в первую очередь, ASML) могут потерять около $1 трлн капитализации.

За выходные ажиотаж достиг, пожалуй, максимума, а приложение быстро возглавило рейтинги App Store. Кроме того, оно совершенно бесплатно, в отличие от o1/o1 pro от OpenAI.

Немного странно, что страдают акции Nvidia — ведь именно на них обучены новые модели DeepSeek, а тот факт, что DeepSeek смогли обойтись меньшим количеством карт, скорее намекает на возможности для тех, кто не так ограничен в их использовании. При этом DeepSeek дозированно сообщают какие-то данные по стоимости обучения и оборудования так, что у всех слова “обучение одной нашей модели обошлось в 5,6 млн долларов” однозначно понимаются как “Полное обучение R1 обошлось в 5 млн”, что, мягко говоря, не так.

Восторги восторгами — особенно всех радует наличие дистиллированных моделей, — однако дистиллированные модели работают заметно хуже, а качество ответов большой R1 может сильно зависеть от языка, на котором к ней обращаются. Так что тестируйте.