Blog /
AI /
Hmyzí mozek učí AI spojovat obraz a zvuk

Hmyzí mozek učí AI spojovat obraz a zvuk

Ondřej Barták
Ondřej Barták
podnikatel a programátor
11. 11. 2025
2 minut čtení
Hmyzí mozek učí AI spojovat obraz a zvuk

Vědci z University of Liverpool vytvořili nový počítačový model, který spojuje zrak a sluch podobně jako lidský mozek. Tento model vychází z biologického mechanismu, který byl poprvé objeven u hmyzu a pomáhá jim detekovat pohyb. Dr. Cesare Parise, starší lektor psychologie na University of Liverpool, upravil tento mechanismus tak, aby zpracovával skutečné audiovizuální signály, jako je video a zvuk, místo abstraktních parametrů, na kterých se spoléhaly starší modely.

Když lidé sledují někoho mluvit, mozek automaticky propojuje to, co vidí, s tím, co slyší. Tato synchronizace vysvětluje iluze jako McGurkův efekt, kdy nesoulad mezi zvuky a pohyby rtů vytváří nové vnímání, nebo ventriloquistickou iluzi, kdy hlas zdánlivě vychází z loutky. Parise zkoumal základní otázku, jak mozek ví, kdy se zvuk a obraz shodují. Starší výpočetní modely to nedokázaly zpracovat přímo. Navzdory desetiletím výzkumu v audiovizuálním vnímání neexistoval model, který by dokázal vzít video jako vstup a říct, zda by zvuk byl vnímán jako synchronizovaný.

Jak model funguje?

Nový systém staví na dřívější práci Parise a Marca Ernsta z University of Bielefeld v Německu. Jejich výzkum představil princip detekce korelace jako možné vysvětlení, jak mozek spojuje smyslové signály. To vedlo k Multisensory Correlation Detector (MCD, multisenzorický detektor korelace), který dokázal napodobit lidské reakce na jednoduché audiovizuální vzory, jako blikání a cvakání.

V této nejnovější studii Parise simuloval mřížku těchto detektorů rozloženou přes vizuální a sluchový prostor. Tento setup umožnil modelu zpracovávat složité signály z reálného světa. Model napodobil výsledky ze 69 známých experimentů zahrnujících lidi, opice a krysy. Jedná se o největší simulaci v oboru. Model odpovídal chování napříč druhy a překonal přední Bayesian Causal Inference model (bayesovský model kauzální inference), přičemž používal stejný počet nastavitelných parametrů.

Model také předpovídal, kam se lidé dívají při sledování audiovizuálních scén, a fungoval jako lehký model saliency (model významnosti). Pracuje přímo na syrových audiovizuálních vstupech, takže ho lze aplikovat na jakýkoli materiál z reálného světa.

Proč je to důležité pro AI?

Parise věří, že jednoduchost modelu ho činí cenným i mimo neurovědu. Evoluce už vyřešila problém sladění zvuku a zraku pomocí jednoduchých výpočtů, které fungují napříč druhy a kontexty. Dnešní systémy umělé inteligence stále bojují se spolehlivým spojováním multimodálních informací. Současné audiovizuální modely závisí na velkých sítích s mnoha parametry, trénovaných na obrovských označených datových sadách, zatímco mřížka MCD je efektivní a nevyžaduje trénink.

To, co začalo jako model hmyzího vnímání pohybu, teď vysvětluje, jak mozky – lidské nebo jiné – integrují zvuk a zrak v řadě souvislostí. Od předpovídání iluzí jako McGurkův a ventriloquistický efekt až po odvozování kauzality a generování dynamických map saliency (map významnosti), nabízí nový plán pro neurovědu i výzkum umělé inteligence. Studie vyšla v časopise eLife.

Další zdroj: interestingengineering.com

Kategorie: AI

Komentáře

0

Chcete se zapojit do diskuze?

Buďte ve spojení s komunitou a získejte přístup k exkluzivnímu obsahu.

Zatím žádné komentáře. Buďte první!

Líbil se vám tento článek?
Objevte další zajímavé příspěvky na blogu
Zpět na blog
Editee Dashboard

Tvořte 10x rychleji na pár kliknutí s editee AI

Umělá inteligence za vás vytvoří kvalitní textový a vizuální obsah pro vaše sociální sítě, blog, reklamy, web a spoustu dalšího během pár sekund!

Související příspěvky

GPT-5.6 je venku, ale na přístup k jeho třem novým verzím si zatím musíme počkat GPT-5.6 je venku, ale na přístup k jeho třem novým verzím si zatím musíme počkat
OpenAI odhalilo novou generaci svých modelů, GPT-5.6. Jde o trojici modelů s názvy Sol, Terra a Luna. Každý míří na jinou kombinaci výkonu a ceny. Má...
5 min čtení
29. 6. 2026
Chyby v Google AI Overviews, kterých jsou miliony a trvají už dva roky Chyby v Google AI Overviews, kterých jsou miliony a trvají už dva roky
V květnu 2024 zapnul Google funkci, která od základu změnila, jak vypadá výsledek vyhledávání. AI Overviews, tedy shrnutí psaná umělou inteligencí, se...
5 min čtení
26. 6. 2026
Dokument Evropa 2031: děsivá vize AI budoucnosti, kterou si v Bruselu předávají z ruky do ruky Dokument Evropa 2031: děsivá vize AI budoucnosti, kterou si v Bruselu předávají z ruky do ruky
Je rok 2031 a Evropa stojí před třemi mizernými možnostmi. Stát se americkým protektorátem. Předat budoucnost Číně. Nebo pomalu vyschnout v izolaci. J...
8 min čtení
26. 6. 2026
Cestování

USA

Texas
Podnikání Podnikání v USA
Přihlaste se k odběru našeho newsletteru
Zůstaňte informováni o nejnovějších příspěvcích, exkluzivních nabídkách, a aktualizacích.