„The New York Times“ ir „Daily News“ teisininkai, kurie kreipiasi į teismą su OpenAI dėl tariamo jų darbų, skirtų dirbtinio intelekto modelių mokymui be leidimo, teigia, kad „OpenAI“ inžinieriai netyčia ištrynė su byla galinčius būti susijusius duomenis.
Anksčiau šį rudenį „OpenAI“ sutiko pateikti dvi virtualias mašinas, kad „The Times“ ir „Daily News“ konsultantai galėtų ieškoti jų autorių teisių saugomo turinio savo AI mokymo rinkiniuose. (Virtualios mašinos – tai programine įranga pagrįsti kompiuteriai, esantys kito kompiuterio operacinėje sistemoje, dažnai naudojami bandant, kurti atsargines duomenų kopijas ir paleisti programas.) Laiške leidėjų advokatai teigia, kad jie ir jų pasamdyti ekspertai išleido. daugiau nei 150 valandų nuo lapkričio 1 d., ieškant OpenAI mokymo duomenų.
Tačiau lapkričio 14 d. OpenAI inžinieriai ištrynė visus leidėjų paieškos duomenis, saugomus vienoje iš virtualių mašinų, rašoma anksčiau minėtame laiške, kuris vėlai trečiadienį buvo pateiktas JAV pietinio Niujorko apygardos teismui.
OpenAI bandė atkurti duomenis ir dažniausiai buvo sėkmingas. Tačiau, kadangi aplankų struktūra ir failų pavadinimai buvo „negrįžtamai“ prarasti, atkurti duomenys „negali būti naudojami nustatant, kur naujienų ieškovų nukopijuoti straipsniai buvo panaudoti kuriant („OpenAI“) modelius“, – teigiama laiške.
„Naujienų ieškovai buvo priversti atkurti savo darbą nuo nulio, naudodami daug darbo valandų ir kompiuterio apdorojimo laiką“, – rašė „The Times“ ir „Daily News“ advokatas. „Naujienų ieškovai tik vakar sužinojo, kad atkurti duomenys yra netinkami naudoti ir kad visos savaitės ekspertų ir teisininkų darbas turi būti atliktas iš naujo, todėl šiandien pateikiamas šis papildomas raštas.
Ieškovų advokatas paaiškina, kad jie neturi pagrindo manyti, kad ištrynimas buvo tyčinis. Tačiau jie sako, kad incidentas pabrėžia, kad „OpenAI“ „yra geriausia galimybė ieškoti savo duomenų rinkiniuose“ dėl potencialiai pažeidžiančio turinio, naudodama savo įrankius.
OpenAI atstovas atsisakė pateikti pareiškimą.
Tačiau vėlai penktadienį, lapkričio 22 d., OpenAI advokatas pateikė atsakymą į trečiadienį „The Times“ ir „Daily News“ teisininkų išsiųstą laišką. Savo atsakyme OpenAI advokatai vienareikšmiškai neigė, kad OpenAI ištrynė bet kokius įrodymus, o vietoj to teigė, kad ieškovai yra kalti dėl netinkamos sistemos konfigūracijos, dėl kurios kilo techninė problema.
„Ieškovai paprašė pakeisti konfigūraciją viename iš kelių įrenginių, kuriuos OpenAI suteikė mokymo duomenų rinkiniams ieškoti“, – rašė OpenAI advokatas. „Tačiau įgyvendinus ieškovų prašomą pakeitimą buvo pašalinta aplankų struktūra ir kai kurie failų pavadinimai viename standžiajame diske – diske, kuris turėjo būti naudojamas kaip laikina talpykla… Bet kuriuo atveju nėra pagrindo manyti, kad failai iš tikrųjų buvo prarasti“.
Šiuo ir kitais atvejais „OpenAI“ teigė, kad mokymo modeliai naudojant viešai prieinamus duomenis, įskaitant „The Times“ ir „Daily News“ straipsnius, yra sąžiningas naudojimas. Kitaip tariant, kurdama modelius, tokius kaip GPT-4o, kurie „mokosi“ iš milijardų el. knygų, esė ir kitų pavyzdžių, kad sukurtų žmonėms skambantį tekstą, OpenAI mano, kad nereikia licencijuoti ar kitaip mokėti už. pavyzdžiai – net jei iš tų modelių uždirbama pinigų.
Nepaisant to, „OpenAI“ sudarė licencijavimo sutartis su vis daugiau naujų leidėjų, įskaitant „Associated Press“, „Business Insider“ savininką Axelį Springerį, „Financial Times“, „People“ patronuojančią bendrovę „Dotdash Meredith“ ir „News Corp.“ OpenAI atsisakė laikytis šių sąlygų. sandoriai yra vieši, tačiau vienam turinio partneriui „Dotdash“ per metus mokama mažiausiai 16 mln.
„OpenAI“ nei patvirtino, nei paneigė, kad be leidimo apmokė savo AI sistemas dėl kokių nors konkrečių autorių teisių saugomų darbų.
Atnaujinimas: pridėtas OpenAI atsakymas į kaltinimus.