Google DeepMind právě představil Nano Banana Pro, což je jejich nový model pro generování a úpravu obrázků. Tento model je postavený na Gemini 3 Pro a přináší spoustu vylepšení, jako lepší zpracování textu, znalosti o světě a pokročilé ovládání. Je dostupný v aplikaci Gemini, v AI Studio, Vertex a dalších službách. Například v Gemini app ho můžete vyzkoušet při výběru možnosti "Vytvořit obrázky" s modelem "Thinking". Pro bezplatné uživatele je tu omezený počet pokusů, pak se přepne na starší verzi Nano Banana. Předplatitelé Google AI Plus, Pro a Ultra mají vyšší limity.
Model Nano Banana Pro pomáhá vizualizovat nápady, vytvářet infografiky nebo převádět ručně psané poznámky na diagramy. Díky pokročilému uvažování Gemini 3 Pro dokáže vytvářet přesné a bohaté vizuály na základě reálných informací. Můžete například vytvořit infografiku o rostlině String of Turtles, kde se objeví detaily o původu, péči a růstu. Další příklad je infografika o přípravě elaichi chai, což je čaj s kardamomem, s podrobnými instrukcemi v krocích.

Jedna z největších výhod je lepší zpracování textu přímo v obrázcích. Nano Banana Pro umí vytvářet čitelný text v různých jazycích, což je ideální pro plakáty, mockupy nebo mezinárodní obsah. Například můžete vygenerovat storyboard pro scénu s astronautem, kde jsou čtyři panely: establishing shot, medium shot, close-up a POV shot. Další ukázka je obrázek ulice v Berlíně, kde fasády domů tvoří slovo "BERLIN" v modré, červené, bílé a černé barvě, přičemž domy stále vypadají jako domy a podobnost s písmeny je jemná.
Model podporuje překlady a lokalizace. Můžete přeložit text na plechovkách z angličtiny do korejštiny, přičemž zbytek obrázku zůstane stejný. Další příklad je fráze "How much wood would a woodchuck chuck if a woodchuck could chuck wood" ztvárněná z dřeva, které seká svišť. Nano Banana Pro umí i komiksový styl pro počasí, kde čerpá reálné data z Google Search, jako je počasí nebo sportovní výsledky.
Pokročilé ovládání a kreativní možnosti
Nano Banana Pro nabízí studiovou kvalitu úprav. Můžete měnit osvětlení, úhel kamery, zaostření nebo barevné ladění. Například změňte denní scénu s liškou na noční, nebo zaostřete na květiny místo na dívku v poli. Model podporuje různé poměry stran, jako 9:16 pro vertikální plakát nebo 21:9 pro široký záběr, a rozlišení až 4K.

Další silnou stránkou je slučování obrázků. Můžete kombinovat až 14 obrázků (počet se liší podle platformy) a udržet konzistenci až pěti postav. Například spojte 14 chlupatých postaviček sedících na gauči před televizí v útulném obývacím pokoji s teplým osvětlením z okna a záři z TV. Další příklad je sloučení obrázků šatů, rostlin a židle do jedné filmové scény v poměru 16:9, kde změníte šaty na figuríně.
Pro značky je skvělé udržování stylu. Můžete vytvořit logo inspirované skicou, jako slovo "WAVE" ve tvaru vlny v retro stylu 60. a 70. let, s měkkými, tekutými písmeny v světle modrém pozadí a tmavě modrém logu. Pak ho aplikujte na 10 mockupů, jako produkty, reklamy, billboardy nebo zastávky autobusů, každý v poměru 16:9.
Tipy pro efektivní používání
Abyste z Nano Banana Pro dostali maximum, pište podrobné prompty. Zahrňte subjekt, jako stoický robot barista s modrými optikami, kompozici jako extrémní přiblížení, akci jako vaření kávy, lokaci jako futuristická kavárna na Marsu a styl jako 3D animace. Pro úpravy buďte přímí, například "změň kravatu muže na zelenou, odstraň auto na pozadí".
Přidejte detaily o kameře a osvětlení, jako "nízký úhel s malou hloubkou ostrosti (f/1.8)" nebo "zlatá hodina s dlouhými stíny". Pro text specifikujte, jako "nadpis 'MĚSTSKÝ PRŮZKUMNÍK' v tučném, bílém, bezpatkovém písmu nahoře". Pokud používáte nahrané obrázky, definujte jejich roli, například "použij obrázek A pro pózu postavy, obrázek B pro umělecký styl a obrázek C pro pozadí".
Pro diagramy zdůrazněte přesnost, například "vědecky přesný průřezový diagram" nebo "zajisti historickou přesnost pro viktoriánskou éru".
Aktuální limity modelu
Nano Banana Pro má ještě oblasti na zlepšení. Malý text, jemné detaily nebo správné pravopisy nemusí být dokonalé. Vždy ověřte fakta v diagramech nebo infografikách. Při překladech se mohou objevit gramatické chyby nebo chybějící kulturní nuance. Složité úpravy, jako slučování nebo změny osvětlení, někdy vytvoří nepřirozené artefakty. Konzistence postav je obvykle spolehlivá, ale může se lišit.
Model je dostupný pro spotřebitele v Gemini app, pro profesionály v Google Ads, Workspace jako Google Slides a Vids, pro vývojáře v Gemini API a Google AI Studio, a pro podniky v Vertex AI. Všechny obrázky mají neviditelný vodoznak SynthID pro identifikaci, že jsou generované AI. V Gemini app můžete nahrát obrázek a zeptat se, jestli ho vytvořilo Google AI.
Naina Raisinghani, produktová manažerka z Google DeepMind, popsala model jako most mezi představivostí a profesionálním provedením. Bea Alessio, skupinová produktová manažerka z Google DeepMind, sdílela tipy pro promptování. Video na YouTube ukazuje, jak model funguje, s hudbou a ukázkami, kde se objevuje text "Nano Banana Pro from Google" a scény s kontrolou barev, zaostření a osvětlení.
