| Телеграм-канал БлоGнот

21 февраля 2025 г. / Source

DeepSeek объявил, что на следующей неделе откроет исходный код пяти своих репозиториев. Хотя пока неизвестно, что именно будут содержать эти репозитории, все надеются, что речь идет об коде и данных, которые используются лучшими моделями компании — V3 и R1.

Это необычный шаг — многие компании, включая Meta, делают свои модели доступными для использования в дальнейшей разработке, но полное раскрытие данных и кода пока никто не практикует.

Такое решение потенциально обостряет гонку между США и Китаем в развитии AI. При этом DeepSeek, выросший из AI-лаборатории хедж-фонда High-Flyer, пока не раскрывает внешних инвесторов и, возможно, испытывает меньше давления в плане монетизации, чем американские конкуренты вроде Anthropic или xAI, в которые вложены десятки миллиардов долларов.

Впрочем, даже открытие всех данных не даст возможности “в каждом гараже” повторить разработку R1, вы же понимаете. Скорее будет интересно посмотреть на различные оптимизации и хаки, которые упростили и удешевили разработку и тренировку модели.