AI společnost může trénovat na legálních knihách, pirátství je zakázáno rozhodl soud v USA
Americký federální soud v Kalifornii vydal důležité rozhodnutí v případu spisovatelů Andrea Bartz, Charles Graeber a Kirk Wallace Johnson proti společnosti Anthropic. Soudce rozhodl, že trénování umělé inteligence na legálně zakoupených knihách spadá pod koncept poctivého užití (fair use), ale zároveň odmítl jakoukoli obranu pro miliony pirátských kopií v digitální knihovně společnosti.
Spektakulárně transformativní použití
Soudce označil AI trénink za "spektakulárně" transformativní proces. Podle rozhodnutí je možné přirovnat jazykový model Claude k začínajícím spisovatelům, kteří se učí od etablovaných autorů, ale nekopírují je. Toto srovnání bylo klíčové pro rozhodnutí o povoleném použití legálně získaných knih. Autoři v žalobě nedokázali prokázat, že by Claude byl schopen generovat výstupy podobné jejich původním dílům. Tento fakt výrazně oslabil jejich hlavní argumenty o konkurenční újmě způsobené AI systémem.
Miliony za legální knihy versus pirátské stahování
Soudní spisy odhalily, že Anthropic legálně utratila "mnoho milionů" za nákup tištěných knih. Tyto knihy byly následně skenovány do digitálních souborů pro použití při trénování umělé inteligence. Tento proces soud považoval za legitimní. Na druhou stranu společnost také stáhla miliony knih z pirátských stránek a trvale je uložila do své centrální knihovny. Cílem bylo vytvořit knihovnu obsahující "všechny knihy světa" a uchovávat je "navždy". Toto jednání soud označil za porušení autorských práv autorů.
Pokračování soudu a důsledky
Anthropic bude čelit soudnímu procesu v prosinci kvůli úmyslnému porušení autorských práv u pirátských děl. Potenciální škody by mohly dosáhnout až 150 000 dolarů za každou knihu, což představuje značné finanční riziko pro společnost.
Toto rozhodnutí poskytuje AI laboratořím zelenou pro trénování na legálně získaných datech. Mohlo by se stát jedním z prvních precedentů pro nespočet případů, které jsou v současnosti vedeny proti technologickým společnostem. Vzhledem k nedostatečné jasnosti ohledně toho, kolik materiálu chráněného autorskými právy se dostává do trénovacích dat, jde pouze o jednu bitvu v tom, co vypadá jako velmi dlouhá právní válka mezi AI společnostmi a držiteli autorských práv.
