Londýnský startup ElevenLabs, který se specializuje na umělou inteligenci pro generování a přepis řeči, oznámil získání 500 milionů dolarů (přibližně 11,5 miliardy korun) v investičním kole Series D. Toto financování vedené společností Sequoia Capital vyneslo firmě valuaci 11 miliard dolarů (zhruba 253 miliard korun), což představuje více než trojnásobek její hodnoty z ledna 2025, kdy byla oceněna na 3,3 miliardy dolarů.
Technologie, produkty a zákazníci
Investice se zúčastnily také společnosti Andreessen Horowitz, Iconiq, Lightspeed Venture Partners a Evantic Capital. Mezi nové investory patří i Nvidia, která je zároveň jedním z klíčových zákazníků startupu. ElevenLabs, založený v roce 2022 Piotrem Dabkowskim a generálním ředitelem Matim Staniszewskim, generuje více než 330 milionů dolarů (přibližně 7,6 miliardy korun) v ročních příjmech. Mezi jeho zákazníky patří také Meta Platforms.
Nejnovější AI model společnosti, Eleven v3, byl představen v lednu a dokáže generovat syntetickou řeč ve více než 70 jazycích včetně češtiny a simulovat neverbální reakce. Uživatelé s modelem pracují zadáním psaného textu, přičemž mohou využít tzv. audio tagy pro detailní přizpůsobení výstupu. Firma nabízí i další modely. Eleven v2.5 Turbo je rychlejší alternativa k Eleven v3, která dokáže generovat řeč téměř v reálném čase a je určena pro aplikace jako zákaznické asistenty vyžadující rychlou odezvu. Model Scribe v2 je algoritmus pro přepis řeči, který rozumí více než 90 jazykům.
Cloudové služby pro firmy
Modely jsou dostupné prostřednictvím programovacího rozhraní (API), které mohou vývojáři integrovat do svého softwaru. Společnost také provozuje dvě cloudové služby - ElevenAgents a ElevenCreative. ElevenAgents umožňuje firmám vytvářet AI hlasové agenty pro úkoly jako zodpovídání dotazů zákaznické podpory. Knihovna více než 400 konektorů slouží k integraci agenta s firemními systémy. Drag-and-drop rozhraní umožňuje přizpůsobení chování AI - například výrobce elektroniky může specifikovat, kdy má agent přesměrovat požadavky na lidského zástupce.
ElevenCreative je optimalizován pro tvorbu obsahu. Marketéři jej mohou využít k vytváření hudby na pozadí pro reklamy. Integrace s AI modely třetích stran umožňuje zákazníkům generovat obrázky a videa pomocí textových příkazů.
Od kontroverzí k partnerstvím s celebritami
Startup čelil na začátku své existence kritice. Po spuštění softwaru pro generování hlasu v roce 2022 byl žalován hlasovými herci a čelil negativní reakci poté, co byla jeho technologie použita na online fóru 4chan k napodobení herečky Emmy Watson a podcastera Joe Rogana. Žalobu později urovnali.
V poslední době však firma uzavřela partnerství s celebritami jako Michael Caine, který licencoval a naklonoval svůj hlas, a Matthew McConaughey, který používá ElevenLabs k překladu svého hlasu do španělštiny pro svůj newsletter. V srpnu společnost spustila generátor AI hudby a v lednu vydala album "The Eleven Album", vytvořené ve spolupráci s hudebníky.
"Plánujeme rozšířit naši nabídku Creative - pomáhat tvůrcům kombinovat naše špičkové audio s videem a agenty a umožnit firmám budovat agenty, kteří mohou mluvit, psát a jednat," uvedl Mati Staniszewski. Firma hodlá využít získané prostředky k vývoji nových AI modelů a rozšíření své přítomnosti na více než tuctu mezinárodních trhů, kde již působí.
Financování přichází v době, kdy ElevenLabs těží z virální popularity ekosystému OpenClaw, kde uživatelé integrují hlasové modely společnosti k vytváření osobních AI agentů. Staniszewski doufá, že letos zdvojnásobí roční příjmy firmy.
Zdroje: wsj.com a siliconangle.com
