Alibaba Wan2.1: Generátor videí, který překoná OpenAI Sora?
Představte si, že napíšete několik vět a během pár vteřin z nich vznikne naprosto realistické video. Tohle není sci-fi. Tohle už je dnes díky umělé inteligenci naprosto běžná realita. S novým generátorem videí Alibaba Wan2.1 však dochází k dalšímu raketovému posunu v této oblasti! Videa mají být nyní naprosto realistická a přesná. Je tomu skutečně tak? A jak si vede nový generátor ve srovnání s OpenAI Sora?
Open-source generátor videí, který je víc než jen rival pro svou konkurenci
Generátor AI videí Wan2.1 vyvinula společnost AIibaba Cloud a okamžitě se z něj stala přímá konkurence pro doposud nejpopulárnější OpenAI Sora. Tento nový model umožňuje generovat vysoce kvalitní a realistická videa, která působí naprosto profesionálně a stírají rozdíly mezi realitou a umělou inteligencí. Důkazem je srovnávací benchmark VBench, ve kterém model Wan2.1 dosáhl 87,4 %. Společnost Alibaba Cloud vypustila tento generátor jako open-source projekt v únoru letošního roku, což už nyní umožňuje komunitě vývojářů tuto AI dále zdokonalovat.

Alibaba Wan2.1: Mistr realistických videí
Nejsilnější zbraní Wan2.1 je, že „rozumí“ fyzikálním zákonům. V praxi to znamená, že videa dokáží nejen simulovat pohyby, ale dokonale kopírovat skutečnost. Generátor ovládá přirozený pohyb, velmi realistickou interakci zobrazených objektů, přechody scén i pohyby kamery. A jaké jsou jeho další přednosti?
- Kvalita videa: Díky technologiím VAE a DiT jsou scény realistické, konzistentní a přirozené s rozlišením 720p.
- Textové a obrazové vstupy: Generátor dokáže vytvořit video na základě textového (varianta Wan 2.1-I2V-14B) i obrazového vstupu (varianta Wan 2.1-T2V-14B). Z jakékoliv fotky tak vytvoří jakousi „oživlou scénu“, což ušetří čas při popisu základního obsahu videa.
- Vícejazyčná podpora: Wan2.1 plně podporuje nejen angličtinu, ale také čínštinu. To z něj dělá velmi univerzální nástroj, který je dostupný pro celý svět.

OpenAI Sora: Uživatelsky přívětivý generátor videí
Uživatelé se shodují, že videa, která Sora vytváří, nejsou příliš přirozené. I když je proto kvalita videí vysoká, OpenAI Sora zaostává za svým přímým konkurentem. A to nejen nepřirozenými pohyby objektů, ale také skutečností, že jeho regionální využití je ve srovnání s Wan2.1 omezené. Přesto je však Sora obdivuhodný a výkonný generátor, který má co nabídnout:
- Uživatelská přívětivost: Sora se snadno ovládá a je součástí prémiových verzí GPT. Díky tomu je součástí uceleného OpenAI ekosystému, který umožňuje další kreativní práci s chatem a dalšími nástroji.
- Vysoké rozlišení: Sora dokáže generovat až 20vteřinová videa v rozlišení 1080p, v závislosti na typu předplatného.
- Funkce Storyboard a Blend: Sora nabízí chytré funkce, které usnadňují tvorbu videí.

Finální verdikt: Kdo je lepší?
Určit absolutního vítěze určitě není jednoduché. Oba generátory jsou totiž velmi výkonné. Čím se ale liší, jsou především oblasti a funkce, ve kterých vynikají. Velkou výhodou Sora je bezesporu jednoduché užívání a propojenost s ekosystémem OpenAI. Kromě specifických funkcí a vysokého rozlišení videí tak otevírá dveře ke kreativní práci všeho druhu.
Wan2.1 na druhou stranu vyniká v kvalitě videa a ve srovnávacích benchmarcích jasně ukazuje, že je technologicky pokročilejší a lépe obstojí v generování realistických videí. V otázce schopností a výkonu tak světu AI videí nyní jednoznačně dominuje. Záleží tedy proto hlavně na samotném uživateli, zda dá přednost jednoduchosti, nebo maximální kvalitě výstupů.
