Blog /
AI /
Google má nový lepší AI generátor videa. Stačí vám jen text, obrázek, video nebo zvuk

Google má nový lepší AI generátor videa. Stačí vám jen text, obrázek, video nebo zvuk

Ondřej Barták
Ondřej Barták
podnikatel a programátor
21. 5. 2026
3 minut čtení
Poslechněte si článek
Audio verze článku
Google má nový lepší AI generátor videa. Stačí vám jen text, obrázek, video nebo zvuk

    Google DeepMind uvedl nový model s názvem Gemini Omni, který umožňuje vytvářet videa z prakticky libovolného vstupního materiálu. Text, fotka, zvuk nebo existující video záběr. Cokoliv z toho může být výchozím bodem. Výsledkem je vždy video. Model zatím vychází v podobě Gemini Omni Flash a je dostupný v aplikaci Gemini, v nástroji Google Flow a na YouTube Shorts. Google ho nasazuje jako přímého nástupce modelu Veo, který v aplikaci Gemini dosud obstarával generování videí.

     

     

    Editeca pohodlně přes chat z různých vstupů

    Co Gemini Omni odlišuje od předchozích nástrojů? Způsob úprav. Nepracujete jako v klasickém editoru se stopou a vrstvami. Prostě stačí napsat, co chcete změnit. Chcete přenést houslistu do jiného prostředí? Napíšete to. Pak chcete schovat housle? Napíšete to. A pak změníte úhel kamery na záběr přes rameno. Každá úprava navazuje na tu předchozí, scéna zůstává konzistentní, postavy si udržují svůj vzhled. Systém si pamatuje kontext celé sekvence.

    Gemini Omni zvládá úpravy ve více krocích, přičemž zachovává fyzikální logiku obrazu. Tekutiny se chovají jako tekutiny. Mramor se kutálí tak, jak by se kutálel. Google tyto schopnosti popisuje jako intuitivní porozumění silám jako gravitace, kinetická energie nebo dynamika tekutin.

    Jeden z nejzajímavějších momentů, které Google při uvedení modelu předvedl je kombinace různých typů vstupů v jediném výstupu. Uživatel může přiložit video zachycující pohyb, fotografii postavy a hudební stopu. Gemini Omni z toho složí jedno video, kde postava z fotky pohybem odpovídá rytmu hudby a stylem odkazuje na referenční záběr. Vstupy se nekombinují mechanicky, model hledá příběhovou logiku.

    Zatím funguje přímý odkaz na zvuk pouze přes hlasové nahrávky. Ostatní typy zvukových vstupů Google plánuje postupně zpřístupnit.

    Další zajímavou funkcí je náčrtek. Načrtněte rybu, ptáka nebo pampelišku na papír, vyfoťte to, a Gemini Omni z toho udělá realistické video. Pohyb v kresbě slouží jako vodítko pro pohyb ve výsledném záběru. Samotná kresba se ve videu neobjeví. Podobně funguje výměna postav nebo objektů. Přiložíte fotografii postavy a řeknete modelu "přeměň mě v tuto postavu". Výsledná postava převezme pohyb, výraz i dialog z původního záběru.

    Google zdůrazňuje, že model čerpá ze znalostní Gemini, což zahrnuje historii, vědu, matematiku i kulturní kontext. V ukázkách to znamená například video vysvětlující skládání bílkovin, nebo abecední sériál s neobvyklými předměty na každé písmeno, vše automaticky synchronizované s hudbou a titulky. Takže model nejen generuje obraz, ale rozumí tomu, co zobrazuje.

    Gemini Omni Flash je dostupný uživatelům starším 18 let s předplatným Google AI Plus, Pro nebo Ultra. Služba funguje ve všech jazycích a trzích, kde je aplikace Gemini k dispozici. Některé funkce, například úpravy videí nebo avatarů, mohou být v určitých zemích omezeny.

    Videa vytvořená přes Gemini jsou označena neviditelným vodoznakem SynthID a obsahují metadata podle standardu C2PA, který umožňuje ověřit původ obsahu. Ověření bude brzy dostupné přímo v prohlížeči Chrome a ve vyhledávání Google.

    Kategorie: AI

    Komentáře

    0

    Chcete se zapojit do diskuze?

    Buďte ve spojení s komunitou a získejte přístup k exkluzivnímu obsahu.

    Zatím žádné komentáře. Buďte první!

    Líbil se vám tento článek?
    Objevte další zajímavé příspěvky na blogu
    Zpět na blog
    Editee Dashboard

    Tvořte 10x rychleji na pár kliknutí s editee AI

    Umělá inteligence za vás vytvoří kvalitní textový a vizuální obsah pro vaše sociální sítě, blog, reklamy, web a spoustu dalšího během pár sekund!

    Související příspěvky

    SpaceX kupuje AI nástroj Cursor za 60 miliard dolarů SpaceX kupuje AI nástroj Cursor za 60 miliard dolarů
    Elon Musk neztrácí čas. Sotva jeho SpaceX odzvonil na Nasdaqu nejvyšší vstup na burzu v historii, oznámila firma další velký krok. Koupí Anysphere, te...
    4 min čtení
    17. 6. 2026
    Google prohrál soud poté, co si jeho AI Overviews vymyslelo nepravdu o dvou německých vydavatelích Google prohrál soud poté, co si jeho AI Overviews vymyslelo nepravdu o dvou německých vydavatelích
    Dva mnichovští vydavatelé jednoho dne zjistili, že je Google spojuje s podvody a pochybnými obchodními praktikami. Ne v nějaké zapadlé diskusi, ale př...
    4 min čtení
    16. 6. 2026
    Důvod vypnutí nejpokročilejší AI americkou vládou nedává smysl Důvod vypnutí nejpokročilejší AI americkou vládou nedává smysl
    Anthropicu dorazil dopis, který během několika hodin srazil dva nejvýkonnější modely Claude z internetu. Americké ministerstvo obchodu se opřelo o nen...
    6 min čtení
    16. 6. 2026
    Cestování

    USA

    Texas
    Podnikání Podnikání v USA
    Přihlaste se k odběru našeho newsletteru
    Zůstaňte informováni o nejnovějších příspěvcích, exkluzivních nabídkách, a aktualizacích.