Blog /
AI /
Gemini AI přináší přirozené překlady ve sluchátkách do Google Translate

Gemini AI přináší přirozené překlady ve sluchátkách do Google Translate

Ondřej Barták
Ondřej Barták
podnikatel a programátor
18. 12. 2025
2 minut čtení
Gemini AI přináší přirozené překlady ve sluchátkách do Google Translate

Google představil vylepšení modelu Gemini 2.5 Flash Native Audio, který se zaměřuje na lepší zpracování hlasových konverzací. Tento model teď zvládá složité pracovní postupy, lépe chápe pokyny od uživatelů a vede přirozenější dialogy. V aplikacích jako je Google AI Studio nebo Vertex AI dokáže model spolehlivěji volat externí funkce, aby získal aktuální informace během rozhovoru a zapojil je do odpovědi bez přerušení. V testu ComplexFuncBench Audio dosáhl skóre 71,5 %, což je nejlepší výsledek mezi srovnatelnými modely.

Model se teď lépe drží instrukcí, s úspěšností 90 % oproti dřívějším 84 %, a zlepšil se i v udržování kontextu přes více kol konverzace. To znamená, že když mluvíte s Gemini Live nebo Search Live, odpovědi jsou plynulejší a více souvisí s tím, co jste řekli předtím. Například v Search Live teď můžete společně promýšlet nápady v reálném čase, jako byste mluvili s expertem, a model si pamatuje detaily z předchozích otázek.

Flash Native Audio - skóre
Flash Native Audio - skóre, nový model je označem modře.

Živé překlady řeči přímo do sluchátek

Jedna z největších novinek je živý překlad řeči, který Gemini přináší do aplikace Google Translate. Tato funkce umožňuje streamovat překlady v reálném čase přímo do sluchátek, přičemž zachovává intonaci, tempo a výšku hlasu mluvčího. Funguje to ve dvou režimech: kontinuální poslouchání, kde model překládá řeč z více jazyků do jednoho cílového, takže slyšíte svět kolem sebe ve svém jazyce, nebo dvoucestná konverzace, kde se překlad automaticky přepíná podle toho, kdo mluví.

Příklad: Pokud mluvíte anglicky a chcete si popovídat s někým, kdo hovoří hindsky, uslyšíte anglický překlad ve sluchátkách, zatímco váš telefon vysílá hindštinu, když domluvíte. Model podporuje přes 70 jazyků včetně češtiny a 2000 jazykových párů, automaticky detekuje jazyk, filtruje okolní hluk a zvládá smíšené jazyky v jedné relaci bez nutnosti měnit nastavení.

Tato beta verze je zatím v aplikaci Google Translate na Androidu v USA, Mexiku a Indii, s podporou pro iOS a další země v roce 2026. Stačí připojit sluchátka, otevřít appku a klepnout na "Live translate".

Kategorie: AI
Líbil se vám tento článek?
Objevte další zajímavé příspěvky na blogu
Zpět na blog
Editee Dashboard

Tvořte 10x rychleji na pár kliknutí s editee AI

Umělá inteligence za vás vytvoří kvalitní textový a vizuální obsah pro vaše sociální sítě, blog, reklamy, web a spoustu dalšího během pár sekund!

Související příspěvky

Proč by měly firmy jako OpenAI platit evropským tvůrcům? Šéf Mistralu má jasno Proč by měly firmy jako OpenAI platit evropským tvůrcům? Šéf Mistralu má jasno
Arthur Mensch, spoluzakladatel a šéf francouzské společnosti Mistral, hodil do ringu návrh, který v technologickém světě rozhodně nezůstal bez povši...
3 min čtení
30. 3. 2026
Konec robotických hlasů je zde, Google spustil Gemini 3.1 Flash Konec robotických hlasů je zde, Google spustil Gemini 3.1 Flash
Zkuste si vzpomenout na poslední rozhovor s hlasovým asistentem. Bylo to přirozené? Nebo jste čekali, až vás přeruší v půli věty, odpoví s půlvteřin...
4 min čtení
30. 3. 2026
Wikipedia zakázala umělou inteligenci: Dobrovolní editoři odhlasovali zákaz AI poměrem 40:2 Wikipedia zakázala umělou inteligenci: Dobrovolní editoři odhlasovali zákaz AI poměrem 40:2
Bylo to jen otázkou času. Wikipedia, ta obrovská dobrovolnická encyklopedie s více než 7,1 miliony článků v anglické verzi, oficiálně zakázala použí...
3 min čtení
30. 3. 2026
Cestování

USA

Texas
Podnikání Podnikání v USA
Přihlaste se k odběru našeho newsletteru
Zůstaňte informováni o nejnovějších příspěvcích, exkluzivních nabídkách, a aktualizacích.