Představte si, že umělá inteligence dokáže nejen mluvit, ale i chápat prostor a čas podobně jako člověk. Právě na tom pracuje nový startup General Intuition, který vznikl jako odnož platformy Medal pro sdílení herních videí. Tento projekt nedávno oznámil, že získal 133,7 milionu dolarů (přibližně 3,1 miliardy Kč) v seed kole financování. Peníze přišly hlavně od Vinoda Khosly, zakladatele Khosla Ventures, který byl jedním z prvních investorů v OpenAI. Dalšími investory jsou General Catalyst a Raine Group. Moritz Baier-Lentz, který se stará o herní investice v Lightspeed, se připojil k týmu na částečný úvazek jako zakládající člen.
General Intuition se zaměřuje na vývoj základních modelů pro agenty umělé inteligence, kteří mají schopnost prostorově-časového uvažování. To znamená, že umějí pochopit, jak se objekty pohybují v prostoru a čase. Podle Pim de Witte, generálního ředitele jak Medal, tak General Intuition, je to klíčové pro dosažení umělé obecné inteligence (AGI). De Witte vysvětluje, že textové modely ztrácejí spoustu informací, protože lidé popisují svět slovy, ale přitom opomíjejí detaily o prostoru a pohybu.
Výhoda dat z herního světa
Celý nápad vychází z obrovského množství dat, které Medal shromažďuje. Každý rok se na platformu nahraje zhruba 2 miliardy videí od 10 milionů měsíčních aktivních uživatelů napříč desítkami tisíc her. Hráči obvykle sdílejí extrémní momenty – velká vítězství nebo drtivé porážky. To vytváří sbírku dat plnou okrajových situací, které jsou ideální pro trénink umělé inteligence. De Witte říká, že taková data mají "výběrovou zkreslenost směrem k přesně tomu typu informací, které chcete pro trénink používat".
Tato data přilákala pozornost velkých hráčů v oboru. Loni se objevily nabídky na koupi Medal, včetně jedné za 500 milionů dolarů (přibližně 11,6 miliardy Kč), kterou podle zpráv podalo OpenAI. De Witte přiznává, že zpočátku o nabídkách uvažovali, ale pak si uvědomili hodnotu toho, co mají. Místo prodeje se rozhodli data využít sami k budování unikátních modelů.
Jak fungují světové modely
General Intuition staví na konceptu světových modelů, což jsou neuronové sítě navržené ke generování virtuálních prostředí. Tyto modely mají naučit umělou inteligenci předvídat akce v 3D prostoru. Například robot by mohl předpovědět, kdy se sklenice vody převrhne ze stolu a chytit ji dřív, než spadne. De Witte vidí potenciál v ovládání zařízení, která se dají mapovat na klávesnici, myš nebo herní ovladač.
První aplikace by měly cílit na drony pro pátrací a záchranné operace, které se pohybují v neznámém prostředí bez GPS. To souvisí s De Witteho zkušenostmi z humanitární práce. Další oblastí je herní průmysl, kde chtějí vytvářet inteligentní boty a nehráčské postavy, které dynamicky upravují obtížnost. Místo nepřemožitelných "božích botů" by měly udržovat vyrovnanou hru, aby hráči měli kolem 50% šanci na výhru a zůstávali zapojení.
Co přinese budoucnost
Tým General Intuition už ukázal, že jejich modely dokážou chápat prostředí, na kterých nebyly trénovány, a předvídat akce jen na základě vizuálních vstupů. Agenti vidí to samé co lidští hráči a navigují podle ovládacích vstupů, což se dá přenést na fyzické systémy jako robotické paže nebo autonomní vozidla. Přesto je to riskantní sázka – cesta k dokonalým světovým modelům je v oboru stále předmětem debat.
De Witte předpovídá, že herní firmy se stanou atraktivními cíli pro akvizice od velkých laboratoří umělé inteligence, jak se zájem o světové modely zvyšuje. On sám se rozhodl jít vlastní cestou díky datům z Medal, ale varuje ostatní, že jsou v informační nevýhodě. Čím lepší modely budou, tím méně dat budou potřebovat.
General Intuition operuje z New Yorku a Ženevy, kde buduje evropské centrum pro výzkum a inženýrství. To pomáhá při náboru talentů a spolupráci s evropskou scénou umělé inteligence.
Zdroje: theverge.com
