Seedance 2.0 představuje pokročilý AI model pro generování videa, který vyvinula Čínská společnost ByteDance. Model dokáže vytvářet profesionální videa v rozlišení 1080p až 2K z textových popisů, obrázků, videí i zvukových stop. Jde o multimodální systém, který nabízí bezprecedentní kontrolu nad výsledným obsahem.
Co Seedance 2.0 umí?
Model využívá architekturu dual-branch diffusion transformer, která současně generuje vizuální obsah i nativní zvuk. Uživatelé mohou zadat textový popis nebo nahrát obrázky a během 60 sekund získají video s délkou 4 až 15 sekund. Seedance 2.0 dokáže vytvořit koherentní vícescénové sekvence z jediného promptu, přičemž automaticky analyzuje narativní logiku a udržuje konzistentní zobrazení postav.
Mezi klíčové schopnosti patří pokročilé porozumění sémantice, které umožňuje přesnou kontrolu nad interakcemi více objektů, složitými akcemi a různými pohyby kamery. Model zvládá fyzikálně přesné simulace – objekty padají, srážejí se a interagují podle pravidel reálného světa. Pohyb je plynulý s přirozeným momentem a časováním.
Seedance 2.0 přijímá až 9 obrázků, 3 videa (maximálně 15 sekund celkem), 3 audio soubory MP3 (maximálně 15 sekund celkem) a textové prompty. Celkový limit je 12 souborů na jedno generování. Systém používá @ zmínky pro specifikaci, jak má být každý nahraný soubor použit.
Uživatelé mohou například napsat: "@Image1 jako první snímek, reference @Video1 pro pohyb kamery, použij @Audio1 pro hudbu na pozadí." Model dokáže extrahovat a aplikovat složité choreografie, techniky kamery, editační rytmus nebo speciální pohyby jako Hitchcockův zoom.
Konzistence postav a objektů
Předchozí modely měly problémy s udržením identity napříč snímky. Seedance 2.0 tento problém řeší přímo – tváře postav zůstávají konzistentní, detaily produktů včetně log a textu zůstávají přesné a vizuální styl se během generování nemění. To je zásadní pro tvorbu reklamního obsahu, e-commerce videí nebo příběhů s opakujícími se postavami.
Nativní zvuk a synchronizace
Model generuje videa s nativním zvukem a dokáže synchronizovat obsah s referenčním audiem. Podporuje lip-sync dialogy ve více jazycích včetně češtiny, zvukové efekty odpovídající akcím na obrazovce, hudbu na pozadí sledující vizuální rytmus a hlasové herecké výkony s emočním vyjádřením.
Kontroverzní funkce a její pozastavení
V nedávném testu Pan Tianhong, zakladatel technologického média MediaStorm, objevil, že nahrání osobní fotografie způsobilo, že model vytvořil zvuk téměř identický s jeho skutečným hlasem – bez použití jakýchkoli hlasových vzorků nebo autorizovaných dat. Toto odhalení rychle vyvolalo obavy veřejnosti ohledně padělání identity pomocí AI. Proto provozovatelé platformy Jimeng (čínský název aplikace Seedance 2.0) oznámili: "Pro udržení zdravého a udržitelného kreativního prostředí naléhavě aktualizujeme model a okamžitě pozastavujeme funkci, která umožňuje použití skutečných fotografií nebo videí jako referenčních subjektů."
ByteDance zároveň zavedl krok živého ověření v aplikacích Jimeng a Doubao, který vyžaduje, aby uživatelé před vytvořením digitálního avatara nahráli svůj vlastní obraz a hlas. Společnost zdůraznila, že tyto úpravy jsou navrženy tak, aby udržely odpovědnost při vyvažování inovací s regulačním dodržováním.
Jak se Seedance 2.0 ovládá
Model je dostupný jako webová aplikace fungující v hlavních prohlížečích bez nutnosti stahování. Uživatelé se přihlásí a mohou začít s bezplatnými kredity nebo upgradovat na placené plány. Základní workflow je: zadání promptu, výběr stylu, generování a stažení.
Pro práci s referencemi existují dva režimy: First/Last Frame Mode pro jednoduchou tvorbu se startovním obrázkem a promptem, a Universal Reference Mode pro multimodální kombinace. Uživatelé nahrají soubory a v promptu je odkazují pomocí @ syntaxe.
Cenové plány
Seedance 2.0 funguje na kreditním systému. Každé vytvoření videa v rozlišení 1080p vyžaduje kredity podle délky a rozlišení. Dostupné jsou tři plány: Basic za 247 Kč měsíčně (roční platba) nabízí 800 kreditů měsíčně, což stačí na až 80 videí. Professional za 497 Kč měsíčně poskytuje 2000 kreditů (až 200 videí). Enterprise za 1 247 Kč měsíčně obsahuje 6000 kreditů (až 600 videí) a prioritní podporu.
Praktické využití
Seedance 2.0 nachází uplatnění v reklamě a e-commerce pro tvorbu produktových demonstrací se synchronizovaným komentářem. Umožňuje lokalizaci obsahu – generování vícejazyčných video adaptací s nativním lip-sync. Tvůrci mohou převádět statické storyboardy na animované sekvence nebo vytvářet obsah podle šablon nahráním referenčního videa.
Model zůstává ve fázi interního testování, přičemž ByteDance podniká proaktivní kroky, jako je omezení určitých funkcí a posílení kontroly obsahu pro zmírnění potenciálních rizik. Průmysloví pozorovatelé zůstávají optimističtí ohledně potenciálu Seedance 2.0 v AI krátkých dramatech a animovaných sériích, ale zdůrazňují, že jakékoli nasazení v reálném světě musí být založeno na bezpečnosti, kontrole a odpovědnosti.
Zdroj: technode.com
