Sora 2 od OpenAI: Připravená porazit Google's Veo 3?
Možná se brzo dočkáme nové ai která nejen vytváří úžasná videa z textu, ale i přidává k nim realistický zvuk – řeč, šumy prostředí a dokonce synchronizaci rtů. Právě o tom se teď mluví v souvislosti s připravovanou verzí Sora 2 od společnosti OpenAI. Podle informací z jejich serverů, které objevili analytici, se chystá velká aktualizace, která má přinést zvuk do videí generovaných textem. To všechno proto, aby Sora mohla konkurovat pokročilému modelu Veo 3 od Google. Pojďme se na to podívat podrobněji, krok za krokem, na základě dostupných detailů z TechRadar a dalších zdrojů.
Co víme o Sora 2 z dostupných informací?
Podle zpráv z TechRadar a serverů OpenAI se Sora 2 objevila v interních zmínkách, což naznačuje, že její vydání je na spadnutí, i když oficiální oznámení zatím chybí. První verze Sora ohromila svou schopností vytvářet videa s vysokou vizuální kvalitou, která zahrnovala realistickou fyziku a delší sekvence – konkrétně klipy delší než 20 sekund. To je velká výhoda oproti konkurentům, kteří často zvládnou jen kratší úseky. Ale Sora 1 byla "tichá" – žádný zvuk, žádné dialogy, jen vizuální obsah. Teď se očekává, že Sora 2 tento nedostatek napraví. Zdroje naznačují integraci zvuku, včetně řeči, okolních šumů a synchronizace rtů, což by mohlo vytvořit plnohodnotný filmový zážitek. Tato aktualizace by mohla být spojená s modelem GPT-5, který by pomohl zlepšit celkovou kvalitu a integraci.
Srovnání s Google's Veo 3: V čem je Sora pozadu?
Veo 3 už teď ukazuje, co znamená pokročilá integrace zvuku. Tento model generuje videa s realistickými zvukovými efekty – od šplouchání kávy po hluk kavárny – a přidává dialogy s přesnou synchronizací rtů. Videa z Veo 3 jsou omezena na osm sekund, ale jejich kvalita je na úrovni 4K s filmovým dojmem. Podle TechRadar musí Sora 2 nejen přidat zvuk, ale udělat to na vysoké úrovni: s přirozenou intonací, harmonií mezi obrazem a hlasem a správnou atmosférou. Pokud OpenAI udrží delší délku videí a přidá tyto prvky, mohla by Sora 2 získat výhodu v kreativních a profesionálních projektech, jako je vzdělávání nebo výzkum. Naopak Veo 3 je integrováno do ekosystému Google, dostupné zdarma pro studenty přes Gemini AI Pro a pro ostatní skrz Vertex AI na Google Cloud.
Očekávané funkce Sora 2
Klíčové vylepšení Sora 2 by mělo zahrnovat plnou integraci zvuku, což znamená nejen řeč, ale i environmentální zvuky a synchronizace rtů. To by umožnilo vytvářet videa, která nejsou jen vizuálně působivá, ale i sluchově realistická. Zdroje jako TechRadar zdůrazňují, že Sora 2 musí "oslnit" diváky, aby překonala Veo 3, které už teď nabízí synchronizovaný audio track. Další aspekt je cena: Veo 3 je součástí předplatného Gemini Advanced za 250 dolarů měsíčně, zatímco Sora 2 by mohla být integrována do placených plánů ChatGPT Plus nebo Pro, což by mohlo být dostupnější. Pokud OpenAI zajistí snadnější přístup, mohlo by to rychle přilákat širokou veřejnost.
S přidáním hlasu a realistických videí přicházejí i rizika. Oba modely – Sora i Veo 3 – mají omezení: zakazují generování obsahu s reálnými lidmi, násilím nebo porušením autorských práv. Přesto přidání hlasů zvyšuje nebezpečí dezinformací, protože videa by mohla vypadat a znít příliš věrohodně. Společnosti jako OpenAI a Google už teď tyto problémy řeší, ale s rostoucí sofistikovaností AI videí se etické otázky stávají ještě naléhavějšími. Například v souvisejících zprávách se mluví o tom, jak Sam Altman uklidňuje hollywoodské filmaře ohledně schopností Sora.
Tento souboj mezi OpenAI a Google by mohl nastavit nové standardy v generativním videu, kde už nejde jen o pixely, ale o celkový filmový efekt. Pokud Sora 2 splní očekávání, čeká nás vzrušující pokrok v AI technologiích. Zůstaňte naladěni na oficiální oznámení!
