Oracle a AMD se letos rozhodli posunout svou dlouholetou spolupráci na novou úroveň. Tato expanze partnerství umožní Oraclu nasadit 50 000 GPU AMD Instinct MI450 Series v novém datovém centru. Tento plán začne v kalendářním třetím čtvrtletí 2026 a bude se rozšiřovat v roce 2027 i dále. Oracle se tak stane prvním hyperscalerem, který nabídne veřejně dostupný AI supercluster poháněný těmito GPU od AMD. Spolupráce staví na letech společné inovace, kde Oracle Cloud Infrastructure (OCI) již od roku 2024 používá platformy AMD Instinct GPU, včetně MI300X a nyní i MI355X.
Tato iniciativa reaguje na rostoucí poptávku po velkokapacitním AI vybavení. Zákazníci potřebují flexibilní a otevřené řešení pro trénink a provoz pokročilých AI modelů, které překračují limity současných clusterů. Nové AI superclustery OCI budou poháněny designem racku AMD nazvaným „Helios“, který zahrnuje GPU AMD Instinct MI450 Series, procesory AMD EPYC s kódovým jménem „Venice“ a pokročilé síťování AMD Pensando s kódovým jménem „Vulcano“. Tento vertikálně optimalizovaný systém zajišťuje vysoký výkon, škálovatelnost a energetickou efektivitu pro rozsáhlé AI úlohy.
Výhody GPU od AMD
GPU AMD Instinct MI450 Series přinášejí do OCI řadu pokročilých funkcí. Každé GPU nabízí až 432 GB paměti HBM4 a 20 TB/s šířky pásma paměti, což umožňuje zpracovávat modely o 50 % větší než předchozí generace přímo v paměti. To urychluje výsledky a zvládá složitější úlohy bez nutnosti dělení modelů. Design racku „Helios“ podporuje husté, kapalinou chlazené racky se 72 GPU, což optimalizuje výkon, náklady a spotřebu energie.
Hlava clusteru je vybavena procesory AMD EPYC „Venice“, které zvyšují využití clusteru a urychlují orchestraci úloh. Tyto procesory navíc poskytují důvěrné výpočty (confidential computing) a vestavěné bezpečnostní prvky pro ochranu citlivých AI dat. Síťování akcelerované DPU (Data Processing Unit) na bázi AMD Pensando zajišťuje vysokorychlostní ingest dat, zlepšuje výkon a posiluje bezpečnost pro velké AI a cloudové infrastruktury.
Každé GPU může být vybaveno až třemi 800 Gbps AMD Pensando „Vulcano“ AI-NIC, což zajišťuje bezstrátovou, vysokorychlostní konektivitu podporující standardy RoCE a Ultra Ethernet Consortium (UEC). To umožňuje rychlé distribuované trénování a optimalizované kolektivní komunikace.
Software AMD ROCm, který je open-source, umožňuje rychlou inovaci a snadnou migraci AI a HPC (high-performance computing) úloh. Podporuje populární frameworky, knihovny, kompilátory a runtime prostředí. Pokročilé dělení a virtualizace GPU umožňují bezpečné sdílení clusterů, přidělování GPU podle potřeb a robustní multi-tenanci (sdílení mezi více uživateli).
OCI také oznámilo obecnou dostupnost OCI Compute s GPU AMD Instinct MI355X, které lze škálovat až na 131 072 GPU v zettascale OCI Supercluster. Tato GPU nabízejí vynikající hodnotu, flexibilitu v cloudu a kompatibilitu s open-source.
Hlasy z vedení
„Naši zákazníci budují některé z nejamicióznějších AI aplikací na světě, a to vyžaduje robustnou, škálovatelnou a vysoce výkonnou infrastrukturu,“ řekl Mahesh Thiagarajan, výkonný viceprezident Oracle Cloud Infrastructure. „Spojením nejnovějších inovací procesorů AMD s bezpečnou a flexibilní platformou OCI a pokročilým síťováním Oracle Acceleron mohou zákazníci s jistotou posouvat hranice.“
„AMD a Oracle pokračují v nastavování tempa pro AI inovace v cloudu,“ dodal Forrest Norrod, výkonný viceprezident a generální manažer Data Center Solutions Business Group v AMD. „S našimi GPU AMD Instinct, procesory EPYC a pokročilým síťováním AMD Pensando získávají zákazníci Oracle mocné nové možnosti pro trénování, ladění a nasazování příští generace AI.“
Tato dohoda podtrhuje rostoucí roli AMD jako alternativy k Nvidia v oblasti AI čipů. Oracle spolupracuje s AMD již několik let a plánuje nabídnout novou generaci GPU AMD v druhé polovině příštího roku. Konkurence v sektoru AI čipů zahrnuje firmy jako Broadcom a Cerebras, ale toto partnerství posiluje pozici AMD v masivních AI datových centrech.
Zdroje: oracle.com a theinformation.com
