xAI vypustilo nejnovější verzi svého modelu pro tvorbu videí. Grok Imagine Video 1.5 vezme váš obrázek, vy popíšete, co se v něm má dít, a model z toho vyrobí krátké video s pohybem, zvukem i mluveným slovem. A hlavně rychle. Kde dřív jeho předchůdce potřeboval přes čtyřicet vteřin, zvládne to teď zhruba za pětadvacet.
Rychlost, zvuk a lepší fyzika
Začněme tím, co lidé poznají nejdřív a to je rychlost. Varianta Grok Imagine Video 1.5 Fast skoro zdvojnásobila rychlost generování. Šestivteřinové video v rozlišení 720p vyrobí za nějakých pětadvacet vteřin. Předchozí model na to potřeboval více než čtyřicet vteřin. Proč to vlastně řešíme? Když tvoříte obsah a čekáte na každý klip minutu, práce se vleče. A tady je výrazné zrychlení vaší práce.
Model nevytváří jen obraz, ale i zvuk. Zvukové efekty, okolní ruchy i dialogy vznikají ve stejném průchodu a sedí přesně na to, co se na obrazovce děje. Mluvené slovo je čistší a líp napasované na pohyb rtů. Popíšete scénu, model dodá obraz i odpovídající zvukovou stopu. Odpadá vám tím střih zvuku ve zvláštním programu.
Starší modely pro tvorbu videa mívaly problém s tím, že se postavy a předměty během klipu deformovaly. Grok Imagine Video 1.5 drží pohyb pohromadě po celou délku záběru. Méně podivných zkroucení, věci mají uvěřitelnou váhu a setrvačnost. Když se něco hýbe, vypadá to přirozeněji.
Spolu s modelem přidalo xAI několik věcí, které usnadní samotnou práci. Svoje výtvory si srovnáte do projektů, které najdete v levém panelu. Můžete taky pustit víc úkolů najednou, takže nemusíte čekat, až jedno video doběhne, abyste spustili další. Prostě zadáte několik promptů a necháte je pracovat současně. A když hledáte jeden konkrétní klip, stačí prohledat knihovnu místo nekonečného scrollování.
Jak na to a co potřebujete
Dáte modelu vstupní obrázek, popíšete pohyb a zvolíte rozlišení a délku. xAI ukazuje ukázkový kód, kde stačí zadat prompt, odkaz na obrázek, délku videa v sekundách a rozlišení. Pak už jen čekáte na výsledek.
Model je dostupný přes rozhraní xAI jako grok-imagine-video-1.5 Vyzkoušet ho můžete i přímo na grok.com/imagine nebo v aplikacích pro iOS a Android, kde běží zmíněná rychlá varianta.
Kde model najdete a kolik stojí
Vedle přímého přístupu přes xAI běží Grok Imagine taky na platformě Kie.ai, která sdružuje víc modelů pro tvorbu videa na jednom místě. Tam si můžete vybrat ze čtyř typů vstupu, od obrázku na video přes text na video až po text na obrázek.
Cenu počítá Kie.ai podle vteřin výsledného videa. Výstup v 480p vyjde na 1,6 kreditu za vteřinu, rozlišení 720p stojí 3 kredity za vteřinu. K dispozici jsou různé režimy generování, mezi nimi normální, zábavný i výraznější „Spicy". U videí tvořených z vlastního nahraného obrázku ale Spicy režim nefunguje a automaticky se přepne na normální.
Na výběr máte i poměry stran od svislého 9:16 po širokoúhlé 16:9 a délku klipu si nastavíte podle potřeby.
