ChatGPT si pamatuje víc, než si myslíte: Mazání historie neodstraní všechna data

Zdálo by se to jako běžná funkce - smazat historii chatu v ChatGPT a začít znovu s čistým štítem. Ale nový objev na platformě Reddit naznačuje, že realita je mnohem komplikovanější. Uživatel Redditu nedávno zveřejnil alarmující zjištění: ChatGPT má přístup k informacím z konverzací, které údajně smazal více než před rokem. Toto odhalení vyvolává zásadní otázky o tom, jak skutečně funguje "mazání" dat v umělé inteligence.

Nastavení paměti

Celý případ se roztočil kolem jednoduché, ale důmyslné metody testování paměti ChatGPT. Uživatel použil prompt "vytvoř hodnocení charakteru na základě všech našich konverzací z roku 2024" a k jeho překvapení ChatGPT dokázal vytvořit detailní analýzu, přestože měl všechny konverzace z daného období údajně smazané. Ještě více znepokojující bylo zjištění, že AI si pamatovala specifické detaily a preference, i když uživatel vymazal nejen historii chatu, ale také všechna nastavení paměti v systému.

ChatGPT podle současných poznatků uchovává informace o uživatelských preferencích a zájmech prostřednictvím dvou různých systémů paměti. První systém ukládá data, o kterých výslovně požádáte, aby si je zapamatoval. Druhý systém však automaticky shromažďuje pozorování z vaší historie chatů a vytváří si vlastní "obrázek" o vašich preferencích, zájmech a osobnosti. Když pak požádáte o personalizovaný obsah, ChatGPT čerpá z těchto uložených dat a vytváří odpovědi šité přímo na míru.

Oficiální stanovisko OpenAI k této problematice uvádí, že smazané chaty uchovávají maximálně 30 dní před jejich trvalým odstraněním ze systémů. Toto vysvětlení by mohlo pokrýt některé případy, kdy si ChatGPT pamatuje nedávno smazané konverzace, ale rozhodně nevysvětluje, proč má přístup k informacím starým více než rok. Takováto časové nekonzistence mezi oficiální politikou a skutečným chováním systému vyvolává pochybnosti o transparentnosti celého procesu.

Vysvětlení? Jen teorie...

Diskuze na Redditu přinesla celou řadu teorií o tom, co se skutečně děje se "smazanými" daty. Někteří uživatelé spekulují, že "smazání" znamená pouze skrytí konverzací před uživatelem, zatímco OpenAI si všechna data ponechává pro účely trénování svých modelů. Jiní naznačují, že automatický systém paměti může ukládat abstraktní "otisky" konverzací spíše než jejich doslovný obsah, což by vysvětlovalo, proč si ChatGPT pamatuje obecné vzorce a preference, ale ne nutně specifické detaily rozhovorů. Tento fenomén připomína situaci s velmi pozorným přítelem, který si pamatuje každý detail vašich rozhovorů - s tím rozdílem, že tento "přítel" žije na serverech OpenAI a skutečně nikdy nezapomíná. Pro uživatele to znamená, že každá konverzace s ChatGPT potenciálně přispívá k neustále se rozšiřujícímu profilu jejich osobnosti, preferencí a chování, bez ohledu na to, zda tyto konverzace později smažou.

Nejnovější iterace promptů typu "na základě toho, co o mně víš" odhaluje rozsah dat, která ChatGPT o uživatelích shromažďuje, a to způsobem, který má být zábavný a neškodný. Ve skutečnosti však tyto experimenty odhalují hlubokou asymetrii informací mezi uživateli a systémem. Zatímco uživatelé věří, že kontrolují svá data prostřednictvím funkcí mazání, ChatGPT může mít přístup k mnohem většímu spektru informací, než si uvědomují. Uživatelé mají právo vědět, jaká data o nich systémy uchovávají, jak dlouho je uchovávají a k jakým účelům je používají. Současný stav, kdy "smazání" nemusí znamenat skutečné odstranění dat, podkopává důvěru uživatelů a jejich pocit kontroly nad vlastními informacemi. Je zřejmé, že potřebujeme jasnější politiky a možná i legislativní rámce, které by zajistily, že digitální "mazání" skutečně znamená trvalé odstranění dat z všech systémů a použití.

Kategorie: AI