Reddit žaluje Anthropic za neoprávněné získávání dat
Společnost Reddit podala žalobu proti umělé inteligenci společnosti Anthropic a obviňuje ji z neoprávněného přístupu ke své platformě více než 100 000krát od července 2024 za účelem získávání uživatelského obsahu pro trénování umělé inteligence. Žaloba byla podána u Nejvyššího soudu v San Franciscu a Reddit tvrdí, že společnost Anthropic pokračovala ve sběru dat navzdory předchozím ujištěním, že jejich boti byli z webu zablokováni.
V čem je problém?
Ben Lee, hlavní právní ředitel Redditu, zdůraznil pro The Verge jedinečnou komerční hodnotu téměř 20letých lidských konverzací na Redditu a argumentoval, že tyto diskuse jsou ústředním prvkem při trénování pokročilých jazykových modelů, jako je Claude od společnosti Anthropic. Lee prohlásil, že úložiště diskusí Redditu by mohlo být v hodnotě "miliard dolarů" a zdůraznil roli platformy při poskytování autentických interakcí mezi lidmi - něčeho, co je v prostředí dominovaném umělou inteligencí stále více vyhledáváno.
Společnost Anthropic se k žalobě doposud veřejně nevyjádřila. Tento právní spor poukazuje na rostoucí napětí mezi platformami sociálních médií a společnostmi vyvíjejícími umělou inteligenci ohledně využívání uživatelského obsahu pro trénování AI modelů. Reddit argumentuje, že jeho obsah představuje cenný zdroj lidské komunikace, který je nenahraditelný pro vývoj pokročilých AI systémů.
Žaloba také odhaluje širší problematiku ochrany dat a práv na duševní vlastnictví v éře umělé inteligence, kdy společnosti čelí otázkám ohledně toho, jak a odkud mohou získávat data pro trénování svých AI modelů. Reddit se snaží chránit svou platformu a uživatelský obsah před neoprávněným využitím, zatímco společnosti jako Anthropic potřebují rozsáhlé datové sady pro zdokonalení svých AI systémů. Hodnota lidských konverzací na platformách jako Reddit se stává stále významnější v kontextu vývoje umělé inteligence. Tyto diskuse poskytují autentické vzorce lidské komunikace, které jsou nezbytné pro vytváření AI modelů schopných přirozeně interagovat s uživateli. Reddit tvrdí, že jeho obsah představuje unikátní zdroj takových dat, který má značnou komerční hodnotu.
Právní precedens, který tento případ může vytvořit, bude mít dalekosáhlé důsledky pro celé odvětví umělé inteligence a sociálních médií. Výsledek sporu mezi Redditem a Anthropic může ovlivnit, jak budou v budoucnosti společnosti přistupovat k získávání dat pro trénování AI a jak budou platformy chránit svůj obsah před neoprávněným využitím.
