Alibaba uvádí pokročilý AI model Qwen 3 s unikátním hybridním uvažováním
V dubnu 2025 představila společnost Alibaba svou nejnovější řadu velkých jazykových modelů - Qwen 3. Tento nový krok v oblasti umělé inteligence přináší řadu inovativních funkcí a významně posouvá hranice toho, co mohou open-source AI modely nabídnout.
Hybridní uvažování
Nejvýraznější inovací modelů Qwen 3 je zavedení tzv. "hybridního uvažování". Tato funkce umožňuje modelům dynamicky přepínat mezi dvěma režimy práce podle typu úlohy, kterou řeší. V "thinking mode" (režimu přemýšlení) model provádí důkladné, krok za krokem strukturované uvažování, což je ideální pro složité úlohy jako jsou matematické problémy, programování nebo logické úvahy. Naopak v "non-thinking mode" poskytuje rychlé odpovědi na jednodušší otázky. Co je obzvláště praktické - uživatelé mohou tyto režimy sami ovládat pomocí speciálních tokenů v promptu (/think a /no_think), což jim umožňuje vyvážit přesnost s rychlostí a výpočetními nároky podle aktuální potřeby.
Škálovatelnost pro různé potřeby
Qwen 3 není jen jeden model, ale celá rodina modelů různých velikostí a architektur:
- Tradiční "dense" modely s parametry od 0,6 miliard až po 32 miliard
- Pokročilé Mixture-of-Experts (MoE) modely včetně vlajkové lodi s úctyhodnými 235 miliardami parametrů (Qwen3-235B-A22B)
Menší modely jsou optimalizovány pro nasazení na koncových zařízeních, zatímco ty větší cílí na náročný výzkum a podnikové využití. Všechny modely jsou navíc schopné pracovat s rozsáhlým kontextovým oknem až 131 tisíc tokenů, což umožňuje zpracovávat dlouhé dokumenty nebo konverzace bez problémů s ořezáváním textu.
Multilingvální schopnosti na vysoké úrovni
Qwen 3 byl trénován na impozantním objemu dat - téměř 36 bilionů tokenů zahrnujících učebnice, zdrojové kódy, dialogové páry a další rozmanité zdroje. Díky tomu podporuje ohromujících 119 jazyků, mezi nimiž je zahrnuta i čeština, což jej činí mimořádně všestranným pro globální nasazení. Díky svým silným multilingválním schopnostem by měl Qwen 3 zvládat česky psané texty, odpovídat na otázky v češtině a generovat český obsah. Jazykové modely s takto rozsáhlou jazykovou podporou jsou obvykle schopné pracovat s majoritními evropskými jazyky.
Výkonnost převyšující konkurenci
V řadě benchmarků Qwen 3 překonává i renomované konkurenty:
- V programování předčí Gemini Pro a exceluje v soutěžních programovacích úlohách jako Codeforces.
- V matematice poráží OpenAI o3-mini na AIME matematických testech.
- V obecném uvažování překonává DeepSeek R1 a vyrovnává se nebo předčí OpenAI o1/Gemini ve schopnosti následovat instrukce, generování textu a logickém uvažování.
- Ve schopnosti používat nástroje a fungovat jako agent dosahuje vedoucí pozice mezi open-source LLM.

Hybridní uvažování umožňuje modelu Qwen 3 efektivněji ověřovat vlastní výstupy než mnoho konkurenčních modelů - za cenu zvýšené latence, když je aktivován režim hlubokého přemýšlení.
Otevřená dostupnost
Důležitým aspektem je, že všechny vydané váhy modelů jsou k dispozici pod otevřenou licencí Apache 2.0. Modely lze stáhnout z platforem jako Hugging Face nebo GitHub a lze je spustit na populárních inferenčních enginách jako jsou Transformers a Ollama. Pro praktické vyzkoušení je k dispozici chat.qwen.ai, který nabízí přímý přístup k několika variantám modelů. Qwen 3 je také dostupný prostřednictvím cloudových poskytovatelů jako Fireworks AI.
Postavení ve světě
Alibaba uvádí, že Qwen představuje největší open-source AI ekosystém na světě podle počtu odvozených projektů - překonávající dokonce komunitu Meta's Llama - s více než 100 000 odvozenými modely postavenými na předchozích verzích. Toto vydání dále zesiluje konkurenci s americkými laboratořemi jako OpenAI a zároveň otevírá otázky ohledně budoucího přístupu k čipům vzhledem k probíhajícím exportním omezením zaměřeným na čínské AI firmy. Qwen 3 představuje významný milník v oblasti open-source AI modelů, kde Alibaba dokazuje, že dokáže držet krok - a v některých aspektech i předstihnout - nejlepší uzavřené systémy od Googlu a OpenAI. Kombinace výkonu, všestrannosti a otevřenosti činí z tohoto modelu atraktivní volbu pro vývojáře, výzkumníky i podniky, které chtějí využít pokročilé schopnosti současné generace AI.
