V dnešním světě umělé inteligence se hodně mluví o obřích modelech, které lámou rekordy v testech a slibují revoluci. Jenže v korporátním prostředí, kde se opravdu pracuje, to vypadá jinak. Malé jazykové modely (SLM) jsou ty, které tiše a efektivně řeší každodenní úkoly, snižují náklady a zvyšují produktivitu. Podívejme se, jak to funguje v praxi, na základě zkušeností firem a výzkumů.
Paradox velkých a malých modelů
V článku z Wall Street Journal popisuje paradox: Zatímco velké jazykové modely (LLM) jako ty od OpenAI nebo Anthropicu sbírají titulky za to, že procházejí právnickými zkouškami nebo vyhrávají matematické olympiády, v reálném byznysu je to jinak. Tyto obří modely jsou drahé a pomalé, takže firmy je používají jen na složité plánování. Místo toho se spoléhaní na malé modely, které jsou rychlejší, levnější a specializované. Například Kyle Lo z neziskové organizace Allen Institute for AI říká, že pro většinu operací, které dnes potřebujeme, velké modely vůbec nejsou nutné. Firmy jako Meta používají velké modely jen k přenosu znalostí do menších, které pak běží v produkci, protože ty velké jsou příliš nákladné.
Tento přístup se projevuje v tom, jak firmy budují své AI systémy jako montážní linky. Data jdou dovnitř, procházejí řadou malých modelů, každý dělá svou část práce, a na konci vychází užitečný výstup. To umožňuje zpracovávat velké množství dat rychle a levně, což je klíčové pro konkurenceschopnost.
Jak pracují malé modely
Podívejme se na konkrétní firmy. Aurelian, startup ze Seattlu, používá generativní AI k automatizaci odpovědí na neurgentní volání do center 911. Hark Audio z New Yorku využívá AI k identifikaci a stříhání zajímavých momentů z půl milionu aktivních podcastů. Gong ze San Francisca analyzuje tisíce nahraných prodejních hovorů, aby pomohl firmám jako Google nebo Cisco prodávat víc. A Airbnb řeší značnou část zákaznických požadavků automaticky díky otevřeným modelům z čínské Alibaby, což je rychlejší než práce lidských operátorů.
V Gongu to vypadá takto: Když zákazník položí otázku jako "Proč ztrácím obchody?", systém pošle požadavek nejdřív k pokročilému modelu od Anthropicu nebo OpenAI, který vytvoří obecný plán. Pak data procházejí řadou malých modelů – jeden prohledává tisíce hovorů, další je sumarizuje, jiný analyzuje shrnutí. Nakonec se vše vrátí k velkému modelu, který vytvoří finální report. Eilon Reshef, spoluzakladatel Gongu, vysvětluje, že nejlevnější model slouží k určení relevance konverzace, středně drahý k extrakci informací a nejdražší jen k finálnímu zpracování. To šetří čas i peníze.
Don MacKinnon z Hark Audio dodává, že obří modely jsou sice chytré, ale neumožňují efektivně využít proprietární data firmy. Jeho tým vytvořil knihovnu desítek tisíc klipů vybraných lidmi a použil je k doladění vlastního malého modelu, který teď celý proces automatizuje.
Ekonomické výhody malých modelů
Náklady hrají velkou roli. Podle průmyslového průměru stojí nejmenší model OpenAI, GPT-5 Nano, asi 10 centů za milion tokenů (což je přibližně 2,3 Kč), zatímco plnohodnotný GPT-5 vyjde na 3,44 dolaru za milion tokenů (asi 79 Kč). Velké modely navíc spotřebují tisíckrát víc tokenů kvůli svému internímu "monologu" při uvažování. Malé modely jsou nejen levnější, ale i rychlejší, což je ideální pro reálný čas.
Výzkum od Nvidia a Georgia Institute of Technology, zmíněný v článku, potvrzuje, že malé modely jsou dostatečně silné pro opakující se úkoly v agentních systémech, kde se modely specializují na úzké oblasti. Jsou ekonomičtější, flexibilnější a vhodnější pro nasazení na běžných zařízeních.
Aplikace v různých odvětvích
Malé modely se prosazují i v jiných oblastech. V zákaznickém servisu zpracovávají rutinní dotazy rychleji, což je vidět ve financích, výrobě, pojišťovnictví a maloobchodě. Slouží k analýze sentimentu z recenzí, sociálních sítí nebo průzkumů, což pomáhá v marketingu. V datech parsují dokumenty, extrahují metadata pro soulad s předpisy.
V okrajových aplikacích (edge AI) běží na mobilních zařízeních nebo IoT, kde je důležitá ochrana soukromí – například ve zdravotnictví pro diagnostiku nebo ve financích pro detekci podvodů. V průmyslu pomáhají s optimalizací klinických testů ve farmacii, kontrolou kvality ve výrobě nebo zpracováním pojistných nároků. Firmy jako Nvidia a Meta je nasazují v produktech, kde dosahují srovnatelného výkonu s velkými modely, ale s nižšími náklady a větší flexibilitou.
Limity malých modelů
Přesto mají malé modely své hranice. Nejlépe fungují na úzce definovaných úkolech a nemusí se vyrovnat velkým modelům v obecném porozumění. V rozsáhlých aplikacích s velkou variabilitou dat mohou zaostávat. Přesto jejich rychlost, nízké náklady a snadná přizpůsobitelnost je činí ideálními pro mnoho firemních scénářů, kde není potřeba univerzální inteligence.
Tento trend naznačuje, že budoucnost AI leží v kombinaci – velké modely pro složité myšlení, malé pro každodenní práci. Firmy, které to pochopí, získají výhodu v efektivitě a inovacích.
