Google vyvinul umělou inteligenci DolphinGemma pro dekódování delfíní komunikace
V oblasti umělé inteligence a výzkumu mořských savců přichází přelomová novinka. Google představil svůj nejnovější AI model s názvem DolphinGemma, který má za cíl pomoci vědcům rozluštit složitý komunikační systém delfínů. Tento inovativní projekt spojuje pokročilé technologie pro zpracování zvuku s nejmodernějšími AI modely.
Jak DolphinGemma funguje
DolphinGemma využívá takzvaný SoundStream tokenizer k efektivnímu zpracování delfíních zvuků. Tato technologie umožňuje modelu analyzovat složité sekvence pískotin a série pulzů, které jsou typické pro delfíní komunikaci. S přibližně 400 miliony parametrů je DolphinGemma navržena tak, aby byla dostatečně výkonná, ale zároveň úsporná. Jednou z klíčových výhod je možnost provozovat tento AI model přímo na telefonech Pixel, což umožňuje výzkumníkům z organizace Wild Dolphin Project (WDP) používat tuto technologii přímo v terénu. Model byl trénován na rozsáhlém označeném datasetu divokých atlantských skvrnitých delfínů, který WDP shromažďoval po desetiletí. "DolphinGemma funguje jako audio-in, audio-out systém," vysvětluje Google. "Analyzuje přirozené zvukové sekvence, identifikuje vzorce a předpovídá následující zvuky - podobně jako jazykové modely předpovídají slova v lidské řeči."
Vědecký přínos
Pro vědce představuje DolphinGemma významný posun vpřed. Umožňuje:
- Identifikovat opakující se zvukové vzorce a klastry v delfíních vokalizacích.
- Odhalovat skryté struktury, které mohou prozradit význam nebo záměr specifických zvuků.
- Automatizovat rozpoznávání vzorců, což výrazně urychluje výzkum, který dříve vyžadoval značné manuální úsilí.

"Našim konečným cílem není jen pasivní poslouchání, ale aktivní porozumění," uvádí výzkumný tým. "Snažíme se vytvořit sdílenou slovní zásobu mezi lidmi a delfíny pomocí přirozených i syntetických zvuků."
Otevřená věda a spolupráce
V souladu s principy otevřené vědy plánuje Google uvolnit DolphinGemma jako otevřený model během léta 2025. Ačkoli byl původně trénován na atlantských skvrnitých delfínech, může být přizpůsoben i pro jiné druhy kytovců, jako jsou delfíni skákaví nebo delfíni dlouhonosí. "Otevřenost je klíčová pro urychlení výzkumu," zdůrazňuje Google. "Chceme poskytnout mořským biologům po celém světě pokročilé nástroje pro akustickou analýzu různých druhů delfínů a dalších savců."

Součást rodiny modelů Gemma
DolphinGemma vychází přímo z technologie Gemma - rodiny lehkých, špičkových otevřených modelů inspirovaných Gemini (největším multimodálním základním modelem Google). Podobně jako jiné specializované varianty (např. CodeGemma pro generování kódu) adaptuje DolphinGemma základní technologii Gemma specificky pro bioakustický výzkum.
Tato iniciativa ukazuje, jak pokroky v generativní umělé inteligenci překračují hranice textu a pronikají do oblastí jako je výzkum chování zvířat. Zpřístupněním těchto nástrojů prostřednictvím principů otevřené vědy a jejich optimalizací pro nasazení v reálném světě se Google snaží urychlit objevy o nelidské inteligenci a podpořit globální spolupráci mezi výzkumníky. DolphinGemma představuje významný krok směrem k překlenutí komunikačních mezer mezi lidmi a zvířaty s využitím nejmodernější umělé inteligence vycházející z širšího ekosystému Google Gemma.
