Vrátit se na blog

Blog /

AI /

OpenClaw a generování videí, jaké nikdo nečekal

Ondřej Barták

podnikatel a programátor

7. 4. 2026

3 minut čtení

Poslechněte si článek

Audio verze článku

Vygenerovat video z jedné věty? Ještě před rokem to znělo neuvěřitelně pro běžné uživatele. OpenClaw, open-source platforma pro AI agenty to díky své nejnovější verzi 2026.4.5 posouvá na další level.

Co přesně se změnilo? Přibyl vestavěný nástroj video_generate. Agent ho dostane k dispozici automaticky, jakmile nastavíte API klíč libovolného podporovaného poskytovatele. Žádné ruční přidávání do seznamu povolených nástrojů, žádná konfigurace navíc.

Dvanáct poskytovatelů a jeden příkaz

Možná vás překvapí, kolik služeb OpenClaw podporuje. Google Veo, OpenAI Sora, Runway, MiniMax, xAI, fal, Alibaba, BytePlus, Qwen, Together AI, ComfyUI a Vydra. Všechni tito poskytovatelé jsou zapojeni do jednoho jednotného rozhraní. Agent si sám vybere toho správného podle dostupných klíčů a nastavené konfigurace.

Celý výběr probíhá v pořadí: nejdřív parametr přímo v příkazu, pak primární model z konfigurace, pak zálohy, a pokud nic z toho není nastaveno, začne automatická detekce. Selže jeden poskytovatel? Přejde se na dalšího bez nutnosti cokoliv řešit.

Chtějí-li uživatelé pevně nastavit výchozí model, stačí jeden řádek:openclaw config set agents.defaults.videoGenerationModel.primary "google/veo-3.1-fast-generate-preview"

Tři režimy na vše

OpenClaw rozlišuje tři způsoby generování videí a tohle rozlišení je docela důležité. Text na video (generate) funguje bez jakéhokoliv vstupního materiálu. Obrázek na video (imageToVideo) vezme referenční fotku a rozhýbe ji. Video na video (videoToVideo) vezme existující záběr a přetvoří ho.

Každý poskytovatel podporuje jiné kombinaci těchto režimů. Například Runway podporuje všechny tři, ale přechod z videa na video vyžaduje konkrétní model gen4_aleph. Google Veo zvládá text i obrázek, ale sdílené testy videoTransformaci přeskakují, protože tamní vstupní formát zatím nekoresponduje se standardním sdíleným testem. A třeba MiniMax nebo fal pracují jen s textem nebo jedním referenčním obrázkem. Každý si vybere podle toho, co zrovna potřebuje.

Generování videa není okamžitá záležitost. OpenClaw s tím počítá a celý proces zvládá asynchronně. Po odeslání požadavku dostanete okamžitě zpět identifikátor úlohy. Poskytovatel zpracovává video na pozadí, typicky 30 sekund až 5 minut podle poskytovatele a rozlišení. Jakmile je hotovo, OpenClaw probudí původní sezení a video pošle zpátky do konverzace.

Stav úlohy můžete zkontrolovat příkazem: openclaw tasks list openclaw tasks show <taskId>

A pokud by se mezitím agent pokusil spustit generování znovu, OpenClaw ho zastaví a vrátí jen aktuální stav už běžící úlohy. Žádné duplicity, žádné plýtvání API kredity.

Další novinky v aktualizaci

Generování videí je bezpochyby největší novinka, ale vydání 2026.4.5 toho přineslo podstatně víc. Přibylo generování hudby přes nástroj music_generate s podporou Google Lyria a MiniMax. Přidali se noví poskytovatelé jazykových modelů: Qwen, Fireworks AI a StepFun. Opravily se desítky chyb napříč platformami: Telegram, Discord, WhatsApp, Matrix, Slack i MS Teams. Bezpečnostní záplaty zpřísnily správu oprávnění pro pluginy, párování zařízení i SSRF ochranu prohlížeče.

Přes tisíc commitů od vydání poslední verze. A přes devadesát přispěvatelů z celého světa. Tahle platforma rozhodně nezaspí.

Kategorie: AI