Blog /
AI /
Google má nový lepší AI generátor videa. Stačí vám jen text, obrázek, video nebo zvuk

Google má nový lepší AI generátor videa. Stačí vám jen text, obrázek, video nebo zvuk

Ondřej Barták
Ondřej Barták
podnikatel a programátor
21. 5. 2026
3 minut čtení
Poslechněte si článek
Audio verze článku
Google má nový lepší AI generátor videa. Stačí vám jen text, obrázek, video nebo zvuk

    Google DeepMind uvedl nový model s názvem Gemini Omni, který umožňuje vytvářet videa z prakticky libovolného vstupního materiálu. Text, fotka, zvuk nebo existující video záběr. Cokoliv z toho může být výchozím bodem. Výsledkem je vždy video. Model zatím vychází v podobě Gemini Omni Flash a je dostupný v aplikaci Gemini, v nástroji Google Flow a na YouTube Shorts. Google ho nasazuje jako přímého nástupce modelu Veo, který v aplikaci Gemini dosud obstarával generování videí.

     

     

    Editeca pohodlně přes chat z různých vstupů

    Co Gemini Omni odlišuje od předchozích nástrojů? Způsob úprav. Nepracujete jako v klasickém editoru se stopou a vrstvami. Prostě stačí napsat, co chcete změnit. Chcete přenést houslistu do jiného prostředí? Napíšete to. Pak chcete schovat housle? Napíšete to. A pak změníte úhel kamery na záběr přes rameno. Každá úprava navazuje na tu předchozí, scéna zůstává konzistentní, postavy si udržují svůj vzhled. Systém si pamatuje kontext celé sekvence.

    Gemini Omni zvládá úpravy ve více krocích, přičemž zachovává fyzikální logiku obrazu. Tekutiny se chovají jako tekutiny. Mramor se kutálí tak, jak by se kutálel. Google tyto schopnosti popisuje jako intuitivní porozumění silám jako gravitace, kinetická energie nebo dynamika tekutin.

    Jeden z nejzajímavějších momentů, které Google při uvedení modelu předvedl je kombinace různých typů vstupů v jediném výstupu. Uživatel může přiložit video zachycující pohyb, fotografii postavy a hudební stopu. Gemini Omni z toho složí jedno video, kde postava z fotky pohybem odpovídá rytmu hudby a stylem odkazuje na referenční záběr. Vstupy se nekombinují mechanicky, model hledá příběhovou logiku.

    Zatím funguje přímý odkaz na zvuk pouze přes hlasové nahrávky. Ostatní typy zvukových vstupů Google plánuje postupně zpřístupnit.

    Další zajímavou funkcí je náčrtek. Načrtněte rybu, ptáka nebo pampelišku na papír, vyfoťte to, a Gemini Omni z toho udělá realistické video. Pohyb v kresbě slouží jako vodítko pro pohyb ve výsledném záběru. Samotná kresba se ve videu neobjeví. Podobně funguje výměna postav nebo objektů. Přiložíte fotografii postavy a řeknete modelu "přeměň mě v tuto postavu". Výsledná postava převezme pohyb, výraz i dialog z původního záběru.

    Google zdůrazňuje, že model čerpá ze znalostní Gemini, což zahrnuje historii, vědu, matematiku i kulturní kontext. V ukázkách to znamená například video vysvětlující skládání bílkovin, nebo abecední sériál s neobvyklými předměty na každé písmeno, vše automaticky synchronizované s hudbou a titulky. Takže model nejen generuje obraz, ale rozumí tomu, co zobrazuje.

    Gemini Omni Flash je dostupný uživatelům starším 18 let s předplatným Google AI Plus, Pro nebo Ultra. Služba funguje ve všech jazycích a trzích, kde je aplikace Gemini k dispozici. Některé funkce, například úpravy videí nebo avatarů, mohou být v určitých zemích omezeny.

    Videa vytvořená přes Gemini jsou označena neviditelným vodoznakem SynthID a obsahují metadata podle standardu C2PA, který umožňuje ověřit původ obsahu. Ověření bude brzy dostupné přímo v prohlížeči Chrome a ve vyhledávání Google.

    Kategorie: AI

    Komentáře

    0

    Chcete se zapojit do diskuze?

    Buďte ve spojení s komunitou a získejte přístup k exkluzivnímu obsahu.

    Zatím žádné komentáře. Buďte první!

    Líbil se vám tento článek?
    Objevte další zajímavé příspěvky na blogu
    Zpět na blog
    Editee Dashboard

    Tvořte 10x rychleji na pár kliknutí s editee AI

    Umělá inteligence za vás vytvoří kvalitní textový a vizuální obsah pro vaše sociální sítě, blog, reklamy, web a spoustu dalšího během pár sekund!

    Související příspěvky

    Andrej Karpathy přechází do Anthropicu. Spoluzakladatel OpenAI posílí tým Claudu Andrej Karpathy přechází do Anthropicu. Spoluzakladatel OpenAI posílí tým Claudu
    Andrej Karpathy, spoluzakladatel OpenAI a jeden z nejsledovanějších výzkumníků v oboru umělé inteligence, oznámil přestup do Anthropicu. Přestup sám...
    3 min čtení
    21. 5. 2026
    Anthropic poprvé v zisku. Tržby v druhém čtvrtletí přesáhnou 10 miliard dolarů Anthropic poprvé v zisku. Tržby v druhém čtvrtletí přesáhnou 10 miliard dolarů
    Startup ze Silicon Valley, který stojí za umělou inteligencí Claude, se chystá zapsat do historie. Anthropic poprvé očekává provozní zisk a tržby ve...
    4 min čtení
    21. 5. 2026
    Tvůrce OpenClaw utratil za jeden měsíc 1,3 milionu $ provozem stovky kódovacích agentů Tvůrce OpenClaw utratil za jeden měsíc 1,3 milionu $ provozem stovky kódovacích agentů
    Peter Steinberger zveřejnil screenshot ze svého přehledu výdajů na OpenAI API. Na fotce je útrata 1 305 088,81 dolarů za jediný měsíc. Reakce na soc...
    4 min čtení
    20. 5. 2026
    Cestování

    USA

    Texas
    Podnikání Podnikání v USA
    Přihlaste se k odběru našeho newsletteru
    Zůstaňte informováni o nejnovějších příspěvcích, exkluzivních nabídkách, a aktualizacích.