Blog /
AI /
Malé nebo velké AI modely? Které modely dělají nejužitečnější práci?

Malé nebo velké AI modely? Které modely dělají nejužitečnější práci?

Ondřej Barták
Ondřej Barták
podnikatel a programátor
6. 11. 2025
4 minut čtení
Malé nebo velké AI modely? Které modely dělají nejužitečnější práci?

V dnešním světě umělé inteligence se hodně mluví o obřích modelech, které lámou rekordy v testech a slibují revoluci. Jenže v korporátním prostředí, kde se opravdu pracuje, to vypadá jinak. Malé jazykové modely (SLM) jsou ty, které tiše a efektivně řeší každodenní úkoly, snižují náklady a zvyšují produktivitu. Podívejme se, jak to funguje v praxi, na základě zkušeností firem a výzkumů.

Paradox velkých a malých modelů

V článku z Wall Street Journal popisuje paradox: Zatímco velké jazykové modely (LLM) jako ty od OpenAI nebo Anthropicu sbírají titulky za to, že procházejí právnickými zkouškami nebo vyhrávají matematické olympiády, v reálném byznysu je to jinak. Tyto obří modely jsou drahé a pomalé, takže firmy je používají jen na složité plánování. Místo toho se spoléhaní na malé modely, které jsou rychlejší, levnější a specializované. Například Kyle Lo z neziskové organizace Allen Institute for AI říká, že pro většinu operací, které dnes potřebujeme, velké modely vůbec nejsou nutné. Firmy jako Meta používají velké modely jen k přenosu znalostí do menších, které pak běží v produkci, protože ty velké jsou příliš nákladné.

Tento přístup se projevuje v tom, jak firmy budují své AI systémy jako montážní linky. Data jdou dovnitř, procházejí řadou malých modelů, každý dělá svou část práce, a na konci vychází užitečný výstup. To umožňuje zpracovávat velké množství dat rychle a levně, což je klíčové pro konkurenceschopnost.

Jak pracují malé modely

Podívejme se na konkrétní firmy. Aurelian, startup ze Seattlu, používá generativní AI k automatizaci odpovědí na neurgentní volání do center 911. Hark Audio z New Yorku využívá AI k identifikaci a stříhání zajímavých momentů z půl milionu aktivních podcastů. Gong ze San Francisca analyzuje tisíce nahraných prodejních hovorů, aby pomohl firmám jako Google nebo Cisco prodávat víc. A Airbnb řeší značnou část zákaznických požadavků automaticky díky otevřeným modelům z čínské Alibaby, což je rychlejší než práce lidských operátorů.

V Gongu to vypadá takto: Když zákazník položí otázku jako "Proč ztrácím obchody?", systém pošle požadavek nejdřív k pokročilému modelu od Anthropicu nebo OpenAI, který vytvoří obecný plán. Pak data procházejí řadou malých modelů – jeden prohledává tisíce hovorů, další je sumarizuje, jiný analyzuje shrnutí. Nakonec se vše vrátí k velkému modelu, který vytvoří finální report. Eilon Reshef, spoluzakladatel Gongu, vysvětluje, že nejlevnější model slouží k určení relevance konverzace, středně drahý k extrakci informací a nejdražší jen k finálnímu zpracování. To šetří čas i peníze.

Don MacKinnon z Hark Audio dodává, že obří modely jsou sice chytré, ale neumožňují efektivně využít proprietární data firmy. Jeho tým vytvořil knihovnu desítek tisíc klipů vybraných lidmi a použil je k doladění vlastního malého modelu, který teď celý proces automatizuje.

Ekonomické výhody malých modelů

Náklady hrají velkou roli. Podle průmyslového průměru stojí nejmenší model OpenAI, GPT-5 Nano, asi 10 centů za milion tokenů (což je přibližně 2,3 Kč), zatímco plnohodnotný GPT-5 vyjde na 3,44 dolaru za milion tokenů (asi 79 Kč). Velké modely navíc spotřebují tisíckrát víc tokenů kvůli svému internímu "monologu" při uvažování. Malé modely jsou nejen levnější, ale i rychlejší, což je ideální pro reálný čas.

Výzkum od Nvidia a Georgia Institute of Technology, zmíněný v článku, potvrzuje, že malé modely jsou dostatečně silné pro opakující se úkoly v agentních systémech, kde se modely specializují na úzké oblasti. Jsou ekonomičtější, flexibilnější a vhodnější pro nasazení na běžných zařízeních.

Aplikace v různých odvětvích

Malé modely se prosazují i v jiných oblastech. V zákaznickém servisu zpracovávají rutinní dotazy rychleji, což je vidět ve financích, výrobě, pojišťovnictví a maloobchodě. Slouží k analýze sentimentu z recenzí, sociálních sítí nebo průzkumů, což pomáhá v marketingu. V datech parsují dokumenty, extrahují metadata pro soulad s předpisy.

V okrajových aplikacích (edge AI) běží na mobilních zařízeních nebo IoT, kde je důležitá ochrana soukromí – například ve zdravotnictví pro diagnostiku nebo ve financích pro detekci podvodů. V průmyslu pomáhají s optimalizací klinických testů ve farmacii, kontrolou kvality ve výrobě nebo zpracováním pojistných nároků. Firmy jako Nvidia a Meta je nasazují v produktech, kde dosahují srovnatelného výkonu s velkými modely, ale s nižšími náklady a větší flexibilitou.

Limity malých modelů

Přesto mají malé modely své hranice. Nejlépe fungují na úzce definovaných úkolech a nemusí se vyrovnat velkým modelům v obecném porozumění. V rozsáhlých aplikacích s velkou variabilitou dat mohou zaostávat. Přesto jejich rychlost, nízké náklady a snadná přizpůsobitelnost je činí ideálními pro mnoho firemních scénářů, kde není potřeba univerzální inteligence.

Tento trend naznačuje, že budoucnost AI leží v kombinaci – velké modely pro složité myšlení, malé pro každodenní práci. Firmy, které to pochopí, získají výhodu v efektivitě a inovacích.

Kategorie: AI
Líbil se vám tento článek?
Objevte další zajímavé příspěvky na blogu
Zpět na blog
Editee Dashboard

Tvořte 10x rychleji na pár kliknutí s editee AI

Umělá inteligence za vás vytvoří kvalitní textový a vizuální obsah pro vaše sociální sítě, blog, reklamy, web a spoustu dalšího během pár sekund!

Související příspěvky

Muskova SpaceX plánuje měsíční továrnu na výrobu satelitů s AI Muskova SpaceX plánuje měsíční továrnu na výrobu satelitů s AI
Elon Musk představil na interním setkání společnosti xAI ambiciózní plány na výstavbu měsíční základny, která by sloužila k výrobě a vypouštění sateli...
5 min čtení
13. 2. 2026
Auditor Mety zvedl varovný prst před dalším financováním datových center Auditor Mety zvedl varovný prst před dalším financováním datových center
Meta Platforms čelí neobvyklému varování od svého auditora Ernst & Young (EY) ohledně účetního zpracování projektu datového centra v hodnotě 27 miliar...
3 min čtení
13. 2. 2026
Čeká OpneAI s reklamami stejný osud jako Facebook? Čeká OpneAI s reklamami stejný osud jako Facebook?
Zoë Hitzig, ekonomka a členka Harvard Society of Fellows, rezignovala na svou pozici v OpenAI. Svůj odchod oznámila ve středu prostřednictvím článku v...
5 min čtení
13. 2. 2026
Cestování

USA

Texas
Podnikání Podnikání v USA
Přihlaste se k odběru našeho newsletteru
Zůstaňte informováni o nejnovějších příspěvcích, exkluzivních nabídkách, a aktualizacích.