/ Source

Если вы уже забыли, то еще полтора года назад к компаниям, разрабатывающим AI-модели, было подано несколько групповых исков от имени ряда авторов книг про незаконное использование их произведений для обучения LLM моделей. Теперь в иске к Meta появился неожиданный поворот — компания не просто скачивала контент из “теневых библиотек”, но и активно пыталась скрыть свои действия. Внутренние документы и переписка показывают, что компания прекрасно понимала сомнительность своих действий.

Исследователи Meta работали в “стелс-режиме”, намеренно избегая использования корпоративных серверов, чтобы скрыть следы скачивания. Майкл Кларк, один из руководителей проекта, признал в показаниях, что они специально минимизировали “сидирование” — раздачу файлов другим участникам торрент-сети.

Особенно пикантно выглядят новые данные на фоне предыдущих показаний Марка Закерберга, утверждавшего, что не имел отношения к решению использовать LibGen для обучения AI. Внутренняя переписка показывает, что решение было принято после “предварительной эскалации к MZ”.

Meta продолжает настаивать, что использование книг подпадает под доктрину “добросовестного использования”. Однако попытки скрыть источник данных и минимизировать цифровые следы заставляют усомниться, что компания сама верила в законность своих действий.