Open Source Initiative выпустили определение, что такое Open AI system. Открытой AI системой считается модель, соответствующая трем параметрам: — имеется открытый доступ к обучающим данным, чтобы другие разработчики могли воспроизвести модель, — доступен полный код программного обеспечения, которое использовалось для построения и обучения модели, — доступны все параметры и веса по обучающим данным.
Судя по всему, этому определению не соответствуют модели Llama — хотя Meta выкладывает модели в открытый доступ вместе с весами, но она не раскрывает обучающую выборку и накладывает ограничения на коммерческое использование. Meta уже заявила, что не согласна с таким определением и продолжают считать свои модели открытыми.
На стороне OSI 25 лет истории, на протяжении которых подход к определению open-source, сформулированный организацией, был принят и поддержан мировым сообществом разработчиков.
Некоторые не очень добрые языки утверждают, что полное раскрытие информации по обучающим данным угрожает многочисленными исками в адрес компаний за несанкционированное использование материалов, являющихся объектами авторского права. Сейчас, как в иске New York Times против OpenAI, компаниям приходится долго и не совсем обычно исследовать результат работы модели, чтобы по косвенным данным показать такое использование.