![Мета-листи розкривають торрент-завантаження піратських книг для тренування AI](https://uk.wizcase.com/wp-content/uploads/2025/02/Screenshot-2025-02-10-at-17.11.58.webp)
Image by Nokia621, from Wiki Commons
Мета-листи розкривають торрент-завантаження піратських книг для тренування AI
Нещодавно розсекречені електронні листи виявилися тим, що автори книг називають “найбільш обвинувачувальними доказами” проти Meta у триваючому судовому позові про порушення авторських прав, як спочатку повідомило Ars Technica.
Поспішаєте? Ось вам основні факти!
- Мета завантажила 81,7 терабайтів піратських книг з тіньових бібліотек, таких як LibGen та Z-Library.
- Внутрішня кореспонденція показує, що працівники Мети висловлювали правові занепокоєння щодо завантаження та поширення авторського матеріалу.
- Як стверджується, Мета приховувала процес завантаження, уникаючи серверів Facebook та мінімізуючи діяльність поширення.
Ars Technica повідомляє, що автори звинувачують Meta в тому, що вона незаконно навчала свої моделі AI на піратських книгах, а електронні листи виявляють внутрішні стурбованість щодо законності торентів та поширення авторських матеріалів.
Минулого місяця, Meta визнала, що використовувала торрент для завантаження суперечливого набору даних званого LibGen, який містить десятки мільйонів піратських книжок.
Однак, деталі залишалися неясними, поки не були опубліковані незачеркнені електронні листи.
Згідно з судовим позовом авторів, Meta завантажила через торрент “принаймні 81,7 терабайтів даних з декількох тіньових бібліотек через сайт Архів Анни, включаючи принаймні 35,7 терабайтів даних з Z-Library та LibGen”. Крім того, “Meta раніше завантажувала через торрент 80,6 терабайтів даних з LibGen.”
“Розмір незаконної схеми завантаження Meta через торрент просто шокує”, – зазначено у позові авторів, відзначаючи, що навіть “набагато менші акти піратства даних – лише .008 відсотків від кількості авторських творів, які Meta завантажила через піратство – призводили до того, що судді направляли справу на кримінальне розслідування до офісу прокурорів США.”
Ars Technica зазначає, що ці листи також виявляють внутрішній непокій серед працівників Meta. У квітні 2023 року інженер-дослідник Микола Башлюков написав: “Завантаження через торенти з корпоративного ноутбука якось не відчувається правильним”, додавши смайл.
Він висловив стурбованість щодо використання IP-адрес Meta “для завантаження піратського контенту через торенти”. У вересні 2023 року Башлюков втратив гумор, звернувшись до юридичної команди Meta і попередивши, що “використання торентів передбачало б «посів» файлів, тобто розповсюдження контенту поза межами, це могло бути юридично неприпустимо”.
Незважаючи на ці попередження, автори заявляють, що Meta продовжувала здійснювати торент-потік та сідінг піратського контенту, навіть намагаючись приховати свою активність.
Ars Technica повідомляє, що внутрішні повідомлення свідчать про те, що Meta уникла використання серверів Facebook для завантаження набору даних, щоб “уникнути” “ризику” того, що хтось “відслідкує сідера/завантажувача”, як це описав дослідник Франк Чжан.
Майкл Кларк, виконавчий директор Meta, також визнав у депозиції, що налаштування були змінені “таким чином, щоб можливе було якомога менше посіву.”
Автори тепер стверджують, що працівників Meta, які були причетні до рішення про торренти, повинні знову дати депозицію, оскільки нові докази, за їхніми словами, “суперечать попереднім свідченням в депозиції.”
Наприклад, генеральний директор Марк Цукерберг заперечував свою участь у використанні LibGen для тренування AI, проте невидалені повідомлення свідчать, що “рішення використовувати LibGen було прийнято” після “попереднього ескалаційного звернення до MZ”.
Ars Technica повідомляє, що Meta стверджує, що її тренування AI на LibGen являє собою “справедливе використання” та відкидає будь-яке незаконне поширення творів авторів. Однак, відкриття щодо торрентів ускладнило її захист, дозволивши авторам розширити свої вимоги щодо прямого порушення авторських прав.
У міру розгляду справи, Meta стикається зі зростаючим контролем у зв’язку з її поводженням з авторськими правами, а автори впевнені у необхідності притягнути до відповідальності технологічного гіганта за те, що вони описують як “масштабну незаконну схему торрентів”.
Лишити коментар
Скасувати