Odyssey právě spustil Odyssey-2, nový interaktivní video model, který vytváří streamované AI video na 20 snímcích za sekundu. Uživatelé mohou formovat a ovládat videa trvající několik minut pomocí textových příkazů, zatímco prozkoumávají scénu. Tento systém se liší od jiných video modelů, které trvají minuty na výrobu krátkých klipů. Odyssey-2 začne streamovat video okamžitě, s novými snímky objevujícími se každých 50 milisekund.
Model generuje video segmenty bez předchozího plánování. Každý nový snímek vychází z toho, co se už stalo, a z toho, co uživatelé zadají v reálném čase. To znamená, že video se vyvíjí dynamicky, bez pevného konce. Například, když model učí fyziku a dynamiku z video dat, dokáže simulovat realistické chování, jako pohyb vln přes vodu nebo změny světla na površích.
Uživatelé řídí vývoj videa přes přirozené jazykové příkazy v chatovacím okně, zatímco video běží. AI se neustále přizpůsobuje každému vstupu, což vytváří pocit živé interakce. Odyssey-2 je založen na kauzálním a autoregresivním přístupu, kde každý snímek vzniká jen na základě předchozích snímků a akcí uživatele, bez znalosti budoucnosti.

Rychlost a technické detaily Odyssey-2
Odyssey-2 dosahuje rychlosti až 30 snímků za sekundu, s každým snímkem vygenerovaným za méně než 50 milisekund. Tato rychlost mění celou zkušenost, protože místo čekání na krátký klip dostanete okamžitý stream, který reaguje na vaše příkazy. Model optimalizovali na úrovni architektury, datového potrubí a inferenčního zásobníku, aby vyvážili rychlost, kvalitu a odezvu.
Systém se učí složité fyzikální jevy z desetiletí video dat. Například při generování vln na oceánu odhaduje sklon povrchu, zakřivení a pole rychlosti z předchozích snímků, pak predikuje další pohyb – hřeben se posune, prohlubně se naplní, pěna se unáší a vlna se ohýbá kolem skály. To vše se děje v reálném čase, což dělá z modelu implicitní simulátor světa.
Odyssey-2 streamuje videa delší než pět minut s udržením koherence prostředí. Používá shluky GPU Nvidia H100 pro výkon, s provozními náklady 1–2 dolary za hodinu uživatele. Sběr dat probíhá pomocí 360stupňové kamery v batohu pro realistické výstupy.
Porovnání s konkurencí
Odyssey-2 se cítí odlišně od jiných AI video platforem, jako Veo nebo Sora. Je to spíš hybridní generátor světa než jen tvůrce klipů. I když kvalita nemusí být tak ohromující jako u jiných modelů, reálný čas a otevřené prozkoumávání nabízejí obrovský potenciál pro nové zážitky s obsahem.
Model se zaměřuje na otevřenou interaktivitu, kde akce v jakémkoli okamžiku mění všechny možné budoucnosti. To umožňuje kontinuální streamování videa, které poslouchá, přizpůsobuje se a reaguje. Odyssey-2 navazuje na Odyssey-1, který se soustředil na navigaci a dlouhodobou paměť, a rozšiřuje to o textové a brzy i audiové příkazy.
Aplikace a budoucnost Odyssey-2
Odyssey-2 otevírá dveře novým aplikacím v hraní, filmu, vzdělávání, sociálních sítích, reklamě, tréninku a simulacích. Představte si procházku starou fotografií a prozkoumávání vzpomínek, nebo vedenou prohlídku starověké civilizace. Model se integruje s nástroji jako Unreal Engine, Blender a Adobe After Effects pro tvůrce.
Tento systém přechází od pevného média k emergentnímu, kde video reaguje na uživatele. Je to raná fáze, ale Odyssey-2 přináší zkušenost podobnou konverzaci s jazykovým modelem – napište a video odpoví okamžitě. Kvalita je zatím surová a někdy nestabilní, ale vývoj pokračuje směrem k vyšší realitě a interaktivitě.
