Alibaba představuje výkonný editor s precizní textovou editací - Qwen-Image-Edit
Qwen-Image-Edit představuje nejnovější inovaci od týmu Qwen, která posouvá hranice úpravy obrázků na novou úroveň. Tento model, založený na 20B verzi Qwen-Image, rozšiřuje původní schopnosti o přesnou editaci textu a pokročilé funkce pro semantické i vzhledové úpravy. Byl uveden 19. srpna a vyniká rychlostí – úpravy zpracuje za méně než 3 sekundy, což ho činí skvělým nástrojem pro profesionály i amatéry. Dostupný je přes Qwen Chat v sekci "Image Editing", s podporou integrace do platforem jako Hugging Face nebo ComfyUI.
Hlavní novinky: Semantická a vzhledová editace
Mezi klíčové novinky patří semantická editace, která umožňuje hluboké změny jako rotace objektů, přenos stylu nebo tvorbu originálního obsahu, při zachování celkového smyslu obrázku. Model zvládne otočit předmět o 90 nebo 180 stupňů, což umožní vidět jeho zadní stranu, jako v ukázkách s rotací postav nebo objektů. Tato funkce je perfektní pro generování nových pohledů, kde se mění většina pixelů, ale zůstává konzistence, například při tvorbě IP materiálů s maskotem Capybara.

Další významnou změnou je vzhledová editace, zaměřená na přesné úpravy – přidávání, odebírání nebo modifikaci prvků bez vlivu na zbytek obrázku. Qwen-Image-Edit dokáže vložit ceduli do scény a automaticky přidat její odraz, odstranit jemné detaily jako vlasy nebo změnit barvu konkrétního písmena, například "n" na modrou. Tyto změny jsou mimořádně detailní a udržují nezměněné části obrázku, což představuje velký skok oproti klasickým editorům.

Model využívá dvojitou strukturu: obrázek prochází modulem Qwen2.5-VL pro porozumění vizuálnímu obsahu a VAE Encoder pro kontrolu vzhledu. Díky tomu jsou úpravy nejen rychlé, ale i kontextově přesné. V benchmarkových testech dosahuje špičkových výsledků, což ho řadí mezi nejlepší modely v oblasti editace obrázků.
Přesná editace anglického textu
Jednou z největších předností je precizní editace textu v angličtině. Qwen-Image-Edit umožňuje přidávat, mazat nebo měnit text přímo v obrázcích, přičemž zachovává původní písmo, velikost a styl. V ukázkách model upravuje fráze jako "Hello World" na nové verze, bez ztráty původní estetiky. Tato schopnost vychází z expertizy Qwen-Image v renderování textu a je ideální pro opravy chyb v generovaných obrazech.

Uživatelé mohou označit oblasti rámečky a zadat přirozené příkazy pro krok za krokem úpravy, což vede k dokonalým výsledkům. Tato funkce je obzvláště užitečná pro tvorbu profesionálních materiálů, kde je důležitá přesnost textu.
Praktické ukázky a aplikace
Qwen-Image-Edit exceluje v tvorbě emotikonů na základě MBTI osobnostních typů s maskotem Capybara, což rozšiřuje kreativní možnosti a umožňuje různé výrazy. Další příklad je přenos stylu, kde portrét přemění na estetiku Studio Ghibli, skvělé pro virtuální avatary. Model zvládá i běžné úpravy, jako změna oblečení, pozadí nebo odstranění malých objektů, vše s vysokou kvalitou.
Oproti tradičním nástrojům vyniká rychlostí, jednoduchostí a podporou přirozených příkazů, což snižuje technické překážky. Je snadno integrovatelný přes API a produkuje výsledky na úrovni profesionálních studií, ideální pro obsahovou tvorbu.
Tento model od Qwen Team přináší opravdový pokrok v AI editaci obrázků, inspirovaný potřebami uživatelů a ověřený v testech. Pokud hledáte nástroj spojující přesnost, kreativitu a efektivitu, Qwen-Image-Edit je tou nejlepší volbou. Vyzkoušejte ho na Qwen Chat a uvidíte, jak snadno oživíte své obrázky!
