Google oficiálně spouští stabilní verze Gemini 2.5 Pro a Flash
Google oficiálně oznámil, že jeho modely Gemini 2.5 Pro a Flash jsou nyní obecně dostupné jako stabilní verze, určené pro produkční nasazení. Tato rodina modelů byla navržena jako hybridní systémy pro uvažování, které poskytují vynikající výkon při zachování optimálního poměru nákladů a rychlosti. Model Gemini 2.5 Pro zůstává beze změn oproti verzi z 6. května, zatímco Gemini 2.5 Flash je identický s verzí z 20. května, která byla představena na konferenci Google I/O. Vývojáři jako Spline a Rooms spolu s organizacemi jako Snap a SmartBear již tyto nejnovější verze několik týdnů používají v produkčním prostředí.
Stabilní verze přináší vývojářům jistotu, že mohou s důvěrou vytvářet produkční aplikace. Gemini 2.5 Pro i Flash jsou nyní dostupné nejen prostřednictvím Google AI Studio a Vertex AI, ale také v aplikaci Gemini. Google navíc implementoval vlastní verze modelů 2.5 Flash-Lite a Flash přímo do svého vyhledávače, což rozšiřuje jejich dostupnost a využití napříč různými platformami Google.
Představení nového modelu Gemini 2.5 Flash-Lite
Nejnovějším přírůstkem do rodiny Gemini 2.5 je model Flash-Lite, který je nyní dostupný ve verzi preview. Tento model představuje nejnákladově efektivnější a nejrychlejší variantu v celé rodině Gemini 2.5. Flash-Lite byl navržen jako nákladově efektivní upgrade předchozích modelů 1.5 a 2.0 Flash a nabízí lepší výkon napříč většinou hodnotících testů při současném dosažení nižší latence první odpovědi a vyšší rychlosti dekódování tokenů.
Model 2.5 Flash-Lite vykazuje všestranně vyšší kvalitu než 2.0 Flash-Lite v oblastech programování, matematiky, vědy, uvažování a multimodálních benchmarků. Zvláště vyniká při objemných úlohách citlivých na latenci, jako je překlad a klasifikace, kde dosahuje nižší latence než 2.0 Flash-Lite a 2.0 Flash na širokém vzorku promptů. Model disponuje stejnými funkcemi, které činí celou rodinu Gemini 2.5 užitečnou, včetně možnosti zapnutí "myšlení" při různých rozpočtech, připojení k nástrojům jako Google Search a spouštění kódu, multimodálního vstupu a kontextové délky jednoho milionu tokenů.

Pokročilé "myslící" modely s dynamickou kontrolou
Všechny modely Gemini 2.5 jsou charakterizovány jako "myslící" modely, které jsou schopné promyslet své úvahy před odpovědí, což vede k lepšímu výkonu a větší přesnosti. Každý model má kontrolu nad rozpočtem na "myšlení", což dává vývojářům možnost vybrat si, kdy a jak moc má model "přemýšlet" před generováním odpovědi. Tato funkce představuje významnou inovaci v oblasti umělé inteligence, protože umožňuje přizpůsobit chování modelu konkrétním potřebám aplikace.
Model Gemini 2.5 Flash-Lite je optimalizován pro náklady a rychlost, takže má funkci "myšlení" ve výchozím nastavení vypnutou, na rozdíl od ostatních modelů. Přesto podporuje dynamickou kontrolu rozpočtu na myšlení prostřednictvím API parametru. Flash-Lite také podporuje všechny nativní nástroje Google, včetně Grounding s Google Search, Code Execution a URL Context, kromě volání funkcí.

Změny v ceníku a cenová struktura
Google provedl významné úpravy v ceníku modelu Gemini 2.5 Flash. Během posledního roku výzkumné týmy společnosti pokračovaly v posouvání hranice Pareto optimality u série modelů Flash. Když byl model 2.5 Flash původně oznámen, Google ještě neměl finalizované schopnosti pro 2.5 Flash-Lite a spustil se s cenou rozlišující "myšlení" a "ne-myšlení", což vedlo k nejasnostem mezi vývojáři.
S uvedením stabilní verze Gemini 2.5 Flash Google aktualizoval ceník na 0,30 dolaru za 1 milion vstupních tokenů (nárůst z 0,15 dolaru) a 2,50 dolaru za 1 milion výstupních tokenů (pokles z 3,50 dolaru). Společnost odstranila rozdíl v ceně mezi režimem "myšlení" a "ne-myšlení" a zachovala jedinou cenovou úroveň bez ohledu na velikost vstupních tokenů. Přestože Google usiluje o udržení konzistentní cenové politiky mezi preview a stabilními verzemi, tato konkrétní úprava odráží výjimečnou hodnotu modelu Flash, který stále nabízí nejlepší poměr ceny a inteligence na trhu.
Pokračující růst a popularity Gemini 2.5 Pro
Růst a poptávka po modelu Gemini 2.5 Pro nadále vykazuje nejstrmější křivku ze všech modelů, které Google kdy vydal. Aby umožnil více zákazníkům vytvářet produkční aplikace na tomto modelu, Google zpřístupňuje verzi z 5. června jako stabilní se stejnou optimální cenovou strukturou jako dříve. Očekává se, že model Pro bude vynikat v případech, kdy je potřeba nejvyšší inteligence a nejvíce schopností, jako je programování a agentní úlohy.
Gemini 2.5 Pro je jádrem mnoha nejoblíbenějších vývojářských nástrojů, včetně Cursor, Bolt, Cline, Cognition, Windsurf, GitHub, Lovable, Replit a Zed Industries. Tyto nástroje využívají pokročilé schopnosti modelu Pro pro poskytování vysoce kvalitních služeb svým uživatelům. Google také sděluje, že v blízké budoucnosti bude sdílet více informací o škálování nad rámec modelu Pro, což naznačuje další vývoj v této oblasti.
Pro uživatele používající starší verze preview modelů Google stanovil jasné termíny migrace. Uživatelé verze 2.5 Pro Preview 05-06 budou mít model k dispozici do 19. června 2025, poté bude vypnut. Uživatelé verze 2.5 Pro Preview 06-05 mohou jednoduše aktualizovat řetězec modelu na "gemini-2.5-pro". Podobně uživatelé Gemini 2.5 Flash Preview 04-17 budou mít existující preview ceny platné do plánovaného ukončení 15. července 2025, kdy bude tento endpoint vypnut.
