Google v úterý představil dva nástroje najednou. Nano Banana 2 Lite umí vytvořit obrázek za čtyři vteřiny a stojí zlomek toho co dřív. Vedle toho firma rozšířila přístup k modelu Gemini Omni Flash, který dělá video a umí ho upravovat na základě běžné konverzace. Obojí míří hlavně na vývojáře a tvůrce, kteří potřebují vyrábět obsah rychle a ve velkých objemech.
Obrázky, výhody a nevýhody
Nano Banana 2 Lite je zatím nejrychlejší a cenově nejúspornější obrazový model z řady Nano Banana. Google u něj snížil takzvanou latenci, tedy dobu, za kterou model odpoví. To se hodí, když si potřebujete rychle naskicovat nápad, protočit jich desítky za sebou a vybrat ten správný. Tisíc obrázků vyjde na 0,034 dolaru. Pro někoho, kdo tvoří návrhy ve velkém a hlídá si náklady, jde o zajímavou nabídku.
Model je vyladěný na rychlost, ne na maximální kvalitu. Přesto si podle Googlu zachovává slušnou věrnost zadání, konzistenci postav napříč obrázky a čitelný text vykreslený přímo v obrázku. Firma ho doporučuje jako přímou náhradu za původní Nano Banana, kterou teď označuje za starší model a radí vývojářům přejít na novinku.
Google má nabídku rozdělenou do několika úrovní. Nano Banana 2 zůstává univerzálním modelem pro běžnou práci, protože nabízí dobrý poměr kvality, rychlosti a ceny. Nad ní stojí výkonnější Nano Banana Pro pro náročné profesionální úlohy, kde je přesnost důležitější než rychlost. Nová Lite verze pak obsazuje spodní příčku, kde jde hlavně o objem a nízkou cenu.
Video, které upravíte příkazem
Druhou novinkou je širší nasazení modelu Gemini Omni Flash. Google ho poprvé ukázal na vývojářské konferenci I/O na začátku roku, teď se dostává k vývojářům přes Gemini API a Google AI Studio. Model tvoří a upravuje video z kombinace textu, obrázků a videa. Cena je 0,10 dolaru za vteřinu výstupu, stejně jako u modelu Veo 3.1 Fast.
Omni Flash zvládá úpravy videa běžnou řečí, propojuje různé vstupy, aby udržel scénu konzistentní, a opírá se o znalosti modelu Gemini z oblastí jako historie nebo biologie. Zvládne taky sladit text a grafiku přímo s děním ve videu.
Model má zatím i svá omezení. Vytváří videa dlouhá deset vteřin, delší mají přijít později. Nahrávání zvukových referencí přes API zatím nefunguje a konzistence postav při změně scény nebo pohybu kamery má své mezery. Google slibuje zlepšení.
Oba modely v jednom
Nejzajímavější věci vznikají, když nástroje spolupracují. Nano Banana 2 Lite rychle vygeneruje obrázek, ten pak poslouží jako předloha pro Gemini Omni Flash, který ho rozpohybuje do videa. Díky takzvanému Interactions API lze v jedné relaci naskládat až tři úpravy za sebou a model si přitom pamatuje kontext.
Google k tomu vydal několik ukázkových aplikací. Jedna z nich, Anywhere, vás z nahrané fotky přenese k desítkám slavných míst a po kliknutí z výsledku udělá krátký animovaný klip. Aplikace Space Lift zase přemění fotku pokoje na návrhy interiéru v různých stylech a jedním klepnutím z nich udělá video. Třetí, Omni Product Studio, mění statické produktové obrázky na e-shopová videa.
Nevýhody rychlé tvorby
Část uživatelů si stěžuje na takzvaný AI slop, tedy zaplavování internetu strojově vyrobeným obsahem nevalné kvality. Technologické firmy přesto do těchto nástrojů dál sypou peníze. Google svoje modely prodává hlavně jako pomocníky při tvorbě reklamy.
Napětí roste i mezi Hollywoodem a technologickými firmami. Google nedávno uzavřel dohodu za 75 milionů dolarů s oblíbeným nezávislým studiem A24. Partnerství schytalo od fanoušků pořádnou dávku kritiky.
Nano Banana 2 Lite se rozjíždí nejen na vývojářských platformách, ale i v běžných produktech Googlu. Najdete ji v režimu AI ve Vyhledávání, v aplikaci Gemini, v NotebookLM, Google Photos, Stitch, Google Flow i v Google Ads. Oba modely značí vytvořený obsah vodoznakem SynthID, který má pomoct rozpoznat, že jde o výtvor umělé inteligence.
Zdroj: techcrunch.com
