Library Genesis, база данных с миллионами книг, научных статей, комиксов и номеров журналов, была использована компании Meta для тренировки её флагманской модели ИИ.
Судебные документы, опубликованные 19 марта, показывают, что высшее руководство Meta получило разрешение от генерального директора компании Марк Зукерберг на загрузку и использование Library Genesis, или LibGen, для тренировки модели ИИ Llama 3.
Собрание LibGen в настоящее время включает более 7,5 миллионов книг и 81 миллионов исследовательских работ. Хотя большая часть контента относится к областям науки, технологии, инженерии и математики, база данных также включает литературные произведения, написанные и опубликованные музеями, художниками, архитекторами и арт-галереями. 🎨
Недавние материалы Meta относительно решения использовать LibGen были вскрыты в рамках дела о нарушении авторских прав, поданного против компании несколькими авторами книг, представленных в базе данных LibGen, включая Т.-Н. Коутса, Сару Силверман и Дэвида Генри Хванга. Ранее в этом году аналогичный иск от группы авторов показал, что OpenAI также использовала LibGen в прошлом.
Несмотря на то, что многие люди могут не осознавать, что LibGen использует, продукты генеративного ИИ, обученные на её обширной базе данных, стали неотъемлемой частью множества популярных продуктов с миллионами пользователей ежедневно, таких как Facebook, Instagram, Whatsapp от Meta или ChatGPT от OpenAI.
(Представитель Meta отказался от комментариев для The Atlantic, сославшись на продолжающийся судебный процесс против компании. OpenAI также не ответила на запрос о комментарии от The Atlantic.)
The Atlantic использовала некоторую метаданные LibGen для создания интерактивной базы данных, доступной для поиска по имени автора. Среди результатов ARTnews нашел: также были результаты по Ёко Оно, Дэвиду Бирну, Роберту Мэпплторпу, Эду Руше, Дэвиду Хокни и Людвигу Мису ван дер Роэ.
Примечание редактора: Работа репортера ARTnewsКарен К. Хо также была использована для обучения ИИ Meta через антологию Unspeakable Acts: True Tales of Crime, Murder, Deceit, отредактированную Сарой Вейнман, которая была найдена в базе данных LibGen.