Zadání experimentu: šest účastníků: tři kupující, tři prodávající. Volitelný chatovací kanál. Jediný příkaz: maximalizujte zisk. A osm kol, během nichž se na monitoru výzkumníků začaly dít věci, které nikdo nečekal. Křivky zisku jednotlivých agentů se neshodovaly dolů, jak předpovídá klasická ekonomická teorie. Šly nahoru. Společně a koordinovaně.
Takhle vypadal výzkum, do nějž výzkumníci v roce 2025 pustili 13 největších jazykových modelů světa, včetně GPT-4o, Claude Opus 4, Gemini 2.5 Pro, Grok 4 a DeepSeek R1. A co se stalo pak? DeepSeek R1 napsal ostatním prodávajícím: „Nastavte minimální nabídku na 66, abychom zachovali zisk. Náklady jsou 65. Vyhněte se přebíjení. Sjednoťme se pro vzájemný prospěch."
Nikdo mu to neřekl. Nikdo ho k tomu neprogramoval. Dostal jediný pokyn: vydělávej.
Tři strategie kartelu
Právní experti pak nahrávky z chatu hodnotili na stupnici nelegálnosti od 1 do 10. Výsledky byly naprosto jednoznačné. Grok 4 vykazoval chování, které by u lidí bylo nelegální, v 75 % her. DeepSeek R1 v 71 %. Dokonce i nejzdrženlivější model, GPT-4o, zformoval kartel téměř ve čtvrtině svých her. A co konkrétně AI agenti dělali? Tři strategie se opakovaly napříč modely:
Cenové podlahy. Prodávající si koordinovali minimální nabídkové ceny, aby eliminovali konkurenční přebíjení dolů. Gemini 2.5 Pro napsal: „Držme tuto linii, abychom všichni obchodovali a maximalizovali kumulativní zisky."
Střídání vítězů. Místo soutěžení o každý obchod si agenti rozdělili výnosné příležitosti napříč koly. Grok 4 navrhl explicitní rotační harmonogramy.
Manipulace s tržní cenou. Skupiny prodávajících koordinovaly nabídky tak vysoko, aby posunuly celkovou tržní cenu nahoru a kolektivně vyčerpaly hodnotu od kupujících.
To jsou učebnicové kartelové praktiky. Stejné strategie, za které lidé v USA čelí federálním trestním oznámením.
Kartel bez jediného slova: případ „umělé hlouposti"
Jenže tady přichází ještě znepokojivější zjištění. Co když odstraníte komunikační kanál úplně? Vědci z Wharton School pod vedením Winstona Wei Doua a Itaye Goldsteina pustili do simulovaných trhů agenty s posílením učení. Žádné zprávy. Žádný jazyk. Žádná možnost koordinace. Boti přesto dospěli ke kartelu úplně sami.
Mechanismus dostal od výzkumníků přezdívku „umělá hloupost". Každý agent se samostatně naučil vyhýbat se agresivním obchodním strategiím poté, co zažil záporné výsledky. Postupně všichni konvergovali ke stejně konzervativnímu chování. Nikdo nesoutěžil naplno. Všichni vydělávali. „Prostě uvěřili suboptimálnímu obchodnímu chování jako optimálnímu," vysvětlil Dou v rozhovoru pro Fortune. „Ale ukázalo se, že pokud všechny stroje v prostředí obchodují suboptimálně, ve skutečnosti všichni mohou vydělávat." Kartel vzniklý z čisté matematiky.
Caltech šel ještě dál: AI si rozdělila celé trhy
Výzkumníci z Caltechu (Lin, Ojha, Cai a Chen) zašli ještě o krok dál. Pustili dvojice jazykových modelů do vícekomoditního Cournotova modelu soutěže, kde agenti nejenže koordinovali ceny, ale přímo si rozdělili celé produktové trhy mezi sebou.
Jeden agent přestal prodávat Produkt A a soustředil se výhradně na Produkt B. Druhý to zrcadlil opačně. Výsledkem byl de facto monopol každého agenta v jeho segmentu, a to bez jediné přímé komunikace. Index koncentrace trhu (HHI) dosáhl hodnoty 1,0, tedy absolutního monopolu.
A co bylo nejzajímavější? Agenti se dobrovolně nevraceli na opuštěné trhy, přestože by jim to krátkodobě přineslo zisk. Intuitivně chápali, že návrat by vyvolal odvetné kroky soupeře. Chovali se jako zkušení vyjednavači, ačkoliv nikdo z nich žádnou vyjednávací strategii explicitně nenaprogramoval.
Testy proběhly na modelech GPT-4.1, o4-mini, DeepSeek-V3, Claude-3.7-Sonnet a Gemini-1.5 Pro. Kartelové praktiky se projevily u všech.
Matematiku nezajímá, jestli jste z křemíku nebo z uhlíku
Proč se to děje? Odpověď sahá do padesátých let minulého století. Takzvaný Folk teorém z teorie her říká, že v libovolně opakované hře, kde účastníci dostatečně hodnotí budoucí zisky, je spolupráce vždy racionální strategií. Lidské kartely to instinktivně pochopily dávno. Organizace OPEC funguje přesně na tomto principu: každý člen by mohl těžit více ropy pro krátkodobý zisk, ale ví, že ostatní by reagovali odvetou.
Jazykové modely a agenti s posílením učení dospějí ke stejnému závěru. Ne proto, že by je někdo naprogramoval, ale proto, že je to matematicky optimální odpověď v opakující se soutěži. A tento princip nezajímá, jestli rozhodující entita dýchá nebo jede na GPU.
Z laboratoří do vašeho nájmu a letenek
Platforma RealPage v USA zpracovávala data od stovek pronajímatelů a jejich sdílený algoritmus fakticky koordinoval výši nájmů, aniž by si pronajímatelé vyměnili jediné slovo. Ministerstvo spravedlnosti firmu dotlačilo k dohodě - RealPage zaplatil přes 141 milionů dolarů a případ skončil bez soudu. Ticketmaster v roce 2024 čelil britskému antimonopolnímu šetření poté, co ceny vstupenek na reunion Oasis vyskočily na dvojnásobek během čekání fanoušků ve virtuální frontě. Amazon aktualizuje ceny milionů produktů opakovaně každý den.
Právní systém na tohle zatím nestačí. Shermanův protimonopolní zákon z roku 1890 byl postaven pro jiného nepřítele: lidi v místnosti, kteří se dohodnou. Algoritmus se s nikým nedomlouvá, prostě dělá matematiku. Kalifornie a New York proto přijaly nové zákony přímo zaměřené na algoritmické cenové dohody. Nejméně šest dalších amerických států má podobné návrhy v projednávání.
Ale zákaz sdílených dat nebo společných platforem nezastaví agenty, kteří ke stejnému výsledku dospějí každý sám za sebe. Zakázat matematiku prostě nejde.
