Švýcarský AI model Apertus: Otevřený vícejazyčný model

V září 2025 představily instituce EPFL, ETH Zurich a CSCS nový jazykový model nazvaný Apertus. Tento model představuje první velký otevřený vícejazyčný systém ze Švýcarska, který klade důraz na transparentnost a rozmanitost v generativní umělé inteligenci. Název Apertus pochází z latinského slova pro "otevřený", což přesně vystihuje jeho podstatu – celý proces vývoje, včetně architektury, vah modelu, trénovacích dat a receptur, je plně dostupný a dokumentovaný. Vývojáři a organizace ho mohou využít jako základ pro vlastní aplikace, jako jsou chatboti, překladové systémy nebo vzdělávací nástroje.

Model Apertus vznikl v rámci iniciativy Swiss AI Initiative, kterou vedou EPFL a ETH Zurich. Spolupracovali na něm výzkumníci, inženýři a studenti z celého Švýcarska, společně s infrastrukturou CSCS. Financování zajistila investice přes 10 milionů GPU hodin na superpočítači Alps od CSCS a podpora od ETH Board, která dohlíží na ETH Domain zahrnující ETH Zurich, EPFL, WSL, PSI, Empa a Eawag. K tomu přispěli strategičtí partneři, především Swisscom jako největší švýcarský telekomunikační poskytovatel.

Technické detaily a trénink

Apertus je dostupný ve dvou velikostech: s 8 miliardami parametrů a s 70 miliardami parametrů. Menší verze se hodí spíš pro individuální použití, zatímco větší nabízí robustnější možnosti. Trénink proběhl na 15 bilionech tokenů napříč více než 1000 jazyky, přičemž 40 % dat není v angličtině. Mezi podporovanými jazyky patří švýcarská němčina, románština a mnoho dalších, které byly dosud v podobných modelech opomíjeny.

Vývojáři dbali na soulad se švýcarskými zákony o ochraně dat, autorských právech a transparentnostních povinnostech podle EU AI Act. Trénovací data pocházejí výhradně z veřejně dostupných zdrojů, které byly filtrovány, aby respektovaly požadavky na opt-out z webových stránek, a to i zpětně. Odstraněny byly osobní údaje a nežádoucí obsah ještě před samotným tréninkem. Tento přístup zajišťuje, že model je etický a spolehlivý pro různé aplikace.

Podle výzkumníka Imanola Schläga, technického vedoucího projektu a vědce na ETH Zurich, je Apertus postavený pro veřejné dobro. Je jedním z mála plně otevřených modelů této velikosti, který bere multijazyčnost, transparentnost a soulad s předpisy jako základní principy. Srovnání s modelem Llama 3 od Meta podtrhuje jeho konkurenceschopnost, přestože se zaměřuje spíš na otevřenost než na přímou rivalitu s proprietárními systémy jako ChatGPT nebo Claude.

Dostupnost a použití

Uživatelé mohou Apertus získat přes strategického partnera Swisscom nebo si ho stáhnout z platformy Hugging Face, kde je uvolněn pod permisivní otevřenou licencí. Tato licence umožňuje využití ve vzdělávání, výzkumu i komerčních aplikacích. Pro lidi mimo Švýcarsko je model dostupný i přes Public AI Inference Utility, kterou vede Joshua Tan. Podle něj představuje Apertus přední veřejný AI model, vytvořený veřejnými institucemi pro veřejný zájem, podobně jako infrastruktura typu silnic nebo elektřiny.

Nastavení Apertusu je jednoduché pro profesionály a zkušené uživatele, ale vyžaduje další komponenty jako servery, cloudovou infrastrukturu nebo uživatelská rozhraní. První příležitost k testování nabízejí Swiss {ai} Weeks, série hackathonů a akcí, kde vývojáři mohou experimentovat s modelem a poskytnout zpětnou vazbu. Swisscom nabízí speciální rozhraní pro účastníky a svým firemním zákazníkům umožňuje přístup přes svou švýcarskou AI platformu.

Spolu s modelem byly zveřejněny rozsáhlé zdroje: dokumentace, zdrojový kód tréninkového procesu, datové sady, váhy modelu včetně mezikroků – vše pod otevřenou licencí. Podmínky jsou dostupné na Hugging Face.

Plány do budoucna

Vývojový tým, který zahrnuje specializované inženýry a výzkumníky z CSCS, ETH Zurich a EPFL, plánuje model pravidelně aktualizovat. Podle Martina Jaggiho, profesora strojového učení na EPFL a člena řídícího výboru Swiss AI Initiative, má Apertus sloužit jako vzor pro důvěryhodný, suverénní a inkluzivní AI model. Thomas Schulthess, ředitel CSCS a profesor na ETH Zurich, vidí v Apertusu nástroj pro posílení AI expertizy v výzkumu, společnosti a průmyslu.

Daniel Dobos, výzkumný ředitel Swisscom, zdůrazňuje hrdost na nasazení tohoto modelu na švýcarské AI platformě, což podporuje bezpečný a odpovědný ekosystém. Antoine Bosselut, profesor a vedoucí laboratoře zpracování přirozeného jazyka na EPFL, popisuje uvolnění Apertusu jako začátek cesty k otevřené, důvěryhodné a suverénní AI pro veřejné dobro po celém světě.

Daniel Dobos of Swisscom

Budoucí verze mají rozšířit rodinu modelů, zlepšit efektivitu a přidat specializace pro oblasti jako právo, klima, zdraví nebo vzdělávání, při zachování vysokých standardů transparentnosti. Iniciativa Swiss {ai} Weeks, podporovaná EPFL AI Center, ETH AI Center, Swisscom, Impact Hub Switzerland, Kickstart Innovation, Panter a Wildcard Media, spojuje výzkumníky, vývojáře, podnikatele a občany v úsilí o etické a otevřené AI.

Zdroj: ethz.ch

Kategorie: AI