Apple testuje AI modely soupeřící s ChatGPT

Apple v posledních měsících provedl rozsáhlé interní testování svých nových AI modelů a jejich výsledky poskytují první detailní pohled na to, jak se schopnosti umělé inteligence společnosti ze Silicon Valley poměřují s předními modely od OpenAI, konkrétně s různými verzemi ChatGPT. Tyto benchmarkové testy představují významný milník v rozvoji Apple Intelligence a ukazují, že technologický gigant se začíná seriózně přibližovat konkurenceschopnosti svých největších soupeřů na poli generativní umělé inteligence.

Výsledky benchmarků

Výsledky head-to-head srovnání poskytují fascinující vhled do aktuálního stavu konkurenčního boje v oblasti AI. Cloud-based AI model společnosti Apple prokázal téměř stejnou výkonnost jako ChatGPT 3.5 Turbo, což je údaj, který mnohé experty překvapil svou výrazností. V rámci hodnocení prováděného lidskými testery byly odpovědi od cloudového modelu Applu preferovány přibližně v 50 % případů ve srovnání s GPT-3.5, což představuje impresivní výsledek pro společnost, která vstoupila do závodu o generativní AI relativně pozdě. V dalších 25,3 % případů se modely dokázaly vyrovnat svými výkony, zatímco GPT-3.5 bylo favorizováno pouze ve zbývajících 24,7 % instancí testování.

Když se Apple pustil do srovnání se sofistikovanějším GPT-4 Turbo, výsledky ukazují, že jeho model zůstal konkurenceschopný, ačkoliv GPT-4 Turbo si udrželo určitou převahu v celkovém hodnocení. Model od Applu byl preferován v 28,5 % případů, odpovědi se shodly v kvalitě v 29,8 % testů, což znamená, že GPT-4 Turbo zvítězilo v 41,7 % případů. Tyto výsledky naznačují, že zatímco Apple dosud nedosáhl úrovně nejpokročilejších modelů OpenAI, rozdíl není tak dramatický, jak by se dalo očekávat od společnosti, která se historicky více zaměřovala na hardware než na pokročilé AI služby.

Apple na to jde jinak

Přístup společnosti Apple k umělé inteligenci se výrazně liší od konkurenčních řešení, zejména v oblasti zpracování dat a architektury systémů. Zatímco ChatGPT a podobné služby se typicky spoléhají na cloudové výpočty, Apple klade důraz na spouštění AI modelů přímo na uživatelských zařízeních s cílem zajistit maximální soukromí a efektivitu. Tato filosofie "soukromí v první řadě" představuje jeden z nejdůležitějších diferenciačních faktorů Apple Intelligence. Společnost se snaží zpracovávat co největší množství dat přímo na zařízení uživatele, což kontrastuje s cloud-orientovanými přístupy OpenAI a dalších poskytovatelů AI služeb.

Pro komplexnější úlohy, které vyžadují větší výpočetní sílu, Apple nabízí také cloudový model, ale i v tomto případě klade důraz na minimalizaci přenosu citlivých dat. Tento hybridní přístup umožňuje společnosti kombinovat výhody on-device zpracování s možnostmi cloudových výpočtů tam, kde je to skutečně potřebné. On-device AI model od Applu s 3 miliardami parametrů byl také podroben benchmarkovým testům proti dalším kompaktním modelům jako Microsoft Phi-3-mini, Google Gemma a Mistral 7B, kde prokázal silný výkon v kategorii malých modelů, ačkoliv velké cloudové modely jako GPT-4 Turbo jej stále celkově převyšovaly.

Apple ve vlastním prostředí

Hluboká integrace Apple Intelligence do ekosystému iOS, macOS, Siri a Core ML představuje další významnou výhodu, kterou konkurenční řešení nemají. Zatímco ChatGPT a podobné služby operují primárně prostřednictvím webových rozhraní a API, Apple AI je navržena tak, aby poskytovala personalizované automatizace a vylepšení uživatelského zážitku napříč celým spektrem Apple zařízení a služeb. Tato integrace umožňuje vytváření seamless zkušeností, kde AI asistence může využívat kontextuální informace z různých aplikací a služeb pro poskytování relevantnějších a užitečnějších odpovědí.

Současné srovnání ukazuje, že Apple Intelligence se rychle přibližuje úrovni ChatGPT, zejména ve srovnání s GPT-3.5, a prokázala konkurenceschopnost i proti pokročilejšímu GPT-4 Turbo v určitých scénářích. Tyto výsledky naznačují, že technologická mezera mezi Apple a předními AI společnostmi se rychle zmenšuje, což může mít významné dopady na budoucí vývoj celého odvětví umělé inteligence.

Kategorie: AI