Společnost Luma představila Ray3.2, výrazně vylepšenou verzi svého modelu Ray3 pro generování videa umělou inteligencí. Novinka vznikla ve spolupráci s tvůrci ze zábavního průmyslu, reklamy a herního odvětví a míří jasně na profesionály. Hlavní změnou je mnohem lepší kontrola nad výsledkem. Uživatel už jen nezadává textový pokyn a nedoufá, co z modelu vypadne. Může scénu řídit snímek po snímku. Podle platformy Luma je vstupem režie a výstupem filmová kvalita.
Až 16 snímků v jednom záběru
Největší posun oproti předchozí verzi představuje takzvaný multi-keyframe, tedy řízení na úrovni jednotlivých snímků. Tvůrce může do jediného klipu umístit až 16 klíčových snímků a pomocí nich určit, jak se bude pohyb vyvíjet, co se má změnit a co naopak zůstat. Režiséři a produkční týmy tak získávají kontrolu nad tempem, dramatickými zvraty i pohybem kamery. Výsledek pak přesně odpovídá obrazovému scénáři i očekáváním klienta, což agentury pracující podle podrobných zadání ocení nejvíc.
Prodloužila se i délka generovaných záběrů. Ray3.2 zvládne klipy až 20 sekund dlouhé v rozlišení 1080p. To umožňuje stavět souvislé scény, ne jen krátké útržky, na kterých řada konkurenčních nástrojů stále vázne.
Herecký výkon přežije generování
Druhou velkou oblastí vylepšení je zachování hereckého projevu. Vylepšené sledování výkonu nyní pokrývá držení těla i gesta a obličejová mimika se dá přenášet až u osmi tváří současně, snímek po snímku. Studio tak může vzít existující záběr s hercem, proměnit prostředí, kostýmy nebo celý vizuální styl, a jemné odstíny původního výkonu zůstanou zachované.
S tím souvisí i přepracovaná funkce Modify Video. Ta přetváří už natočený materiál: vymění zeď, svět nebo šatník, ale osvětlení drží a herecký projev přežije. I tady platí limit 20 sekund při 1080p.
Výstupy připravené rovnou pro postprodukci
Ray3.2 sází na formáty, které profesionální postprodukce skutečně používá. Model generuje video v HDR s 16bitovou barevnou hloubkou a umí exportovat 16bitové EXR snímky v barevném prostoru ACES2065-1. Právě tyhle formáty potřebují týmy zabývající se vizuálními efekty, kompozicí a barevnými korekcemi. Vygenerovaný záběr tak přestává být jen "AI pokusem" a stává se plnohodnotným podkladem, který zapadne do zaběhnutých pracovních postupů bez ztráty dynamického rozsahu.
Za vyšší kvalitu se ovšem připlácí. HDR výstup stojí dvojnásobek kreditů oproti běžnému SDR, kombinace HDR a EXR pak trojnásobek.
Úprava záběru bez nového natáčení
Zajímavou novinkou je i rozšířený nástroj Reframe. Ten umožňuje upravit záběr až po jeho vygenerování: změnit poměr stran pro různé platformy, rozšířit obraz nebo vyměnit pozadí, a to vše při zachování původního světla ve scéně. Připomínky klienta se tak promění v cílenou úpravu místo drahého přegenerování celé scény od nuly. Pro agentury, které připravují varianty jedné kampaně pro různé trhy a formáty, jde o citelnou úsporu času i peněz.
Poprvé také API pro vývojáře
Ray3.2 je zároveň prvním modelem řady Ray, jehož kompletní ovládání Luma zpřístupnila přes programové rozhraní. Vývojáři tak mohou generování videa zabudovat přímo do studiového softwaru, interních produkčních nástrojů nebo vlastních platforem. Luma rozhraní navrhla tak, aby zapadlo do stávajících technologických sestav, ať jde o renderovací farmy, nebo aplikace třetích stran.
To má v produkčním prostředí velkou váhu. Týmy tam totiž běžně pracují s propojenými softwarovými nástroji, ne s izolovanými aplikacemi. Mediální firmy si díky tomu mohou generativní systém vyzkoušet přímo ve svém prostředí pro správu materiálů, střih a schvalování. Mezi platformy, které s technologií Lumy už pracují, patří mimo jiné Adobe, Freepik, Envato nebo Comfy.
Konkurence tlačí na ovladatelnost
Důraz na přesné řízení odráží širší posun na trhu s AI videem. Dodavatelé se snaží zaujmout filmové, reklamní a herní produkce, které vedle kvality obrazu vyžadují hlavně konzistenci a možnost úprav. Nástroje pro tyto zákazníky se čím dál víc posuzují podle toho, jak dobře zapadnou do zavedených produkčních postupů a jak zvládnou kola revizí, aniž by se scéna musela stavět znovu od začátku.
Soupeření v generativním videu přitom houstne. Zatímco zpočátku přitahovaly pozornost spotřebitelské systémy ovládané jen textovým zadáním, dnes jsou výrobci pod tlakem dokázat, že jejich modely obstojí i v technických a provozních nárocích komerční produkce. Luma na to odpovídá právě kombinací klíčových snímků, zachování hereckého výkonu a profesionálních výstupních formátů. Sama k tomu říká, že budoucnost AI ve filmu nespočívá v nahrazování vize tvůrců, ale v jejím umožnění. Vypravěči vždycky věděli, co chtějí natočit. Teď na to dostávají přesné nástroje.
Zdroj: lumalabs.ai
