Nvidia představila své nejnovější serverové systémy pro umělou inteligenci (AI) pod názvem Vera Rubin. Tento systém přichází na trh v druhé polovině letošního roku, což je dříve, než se původně očekávalo. Generální ředitel Nvidie Jensen Huang to oznámil na konferenci Consumer Electronics Show v Las Vegas. Podle jeho slov raketově roste potřeba výpočetního výkonu pro AI, protože modely potřebují zpracovávat obrovské množství dat. Firma testovala nový systém s předpokladem, že vývojáři brzy použijí až 10 bilionů datových parametrů pro trénink AI modelů.
Vera Rubin systémy jsou navržené pro zpracování obrovských výpočetních zátěží, které umožňují vytvářet simulace reality pro trénink AI. Například autonomní vozidla mohou zdokonalovat své modely rychleji díky simulacím jízdních situací místo tisíců hodin reálného testování. Nvidia integrovala do systému řadu produktů pro konektivitu a ukládání paměti, což zvyšuje rychlost výpočtů. Firma takto posílila svou pozici jako největší výrobce síťového hardwaru a výpočetních polovodičů.
Rubin GPU: Srdce pro AI výpočty
Rubin GPU (grafický procesor) slouží především k urychlení milionů výpočtů potřebných pro trénink a provoz AI modelů. Tento čip je součástí platformy Vera Rubin NVL72, která obsahuje 72 takových GPU v jednom racku. Rubin GPU je vyrobený s použitím 3-nanometrového procesu od Taiwan Semiconductor Manufacturing Company a využívá nejmodernější technologii vysokorychlostní paměti HBM4 (vysokorychlostní pásmová paměť).
Každý Rubin GPU má 288 GB paměti HBM4 s šířkou pásma 22 TB/s (terabajtů za sekundu) a NVLink šířku pásma 3,6 TB/s. Tyto hodnoty umožňují trénink modelů se směsí expertů (MoE) s použitím jen čtvrtiny počtu GPU oproti předchozí generaci Blackwell.
Rubin GPU je optimalizovaný pro novou generaci AI, včetně agentických modelů, které zpracovávají složité úlohy jako myšlení a rozhodování. Nvidia uvádí, že snižuje náklady na inferenci (odpovědi na uživatelské dotazy) na desetinu oproti Blackwellu, což činí pokročilé AI systémy dostupnějšími.
Vera CPU: Procesor pro data a rozhodování
Vera CPU (centrální procesor) je navržený speciálně pro pohyb dat a podporu agentického uvažování v AI, kde modely simulují myšlenkové procesy. Tento procesor zajišťuje vysokorychlostní, energeticky úsporné výpočty s předvídatelným výkonem. V platformě Vera Rubin NVL72 je 36 takových CPU, každá s 88 jádry typu custom NVIDIA Olympus (kompatibilní s Arm).
Parametry Vera CPU zahrnují: v kombinaci s GPU dosahuje systém 3 168 jader custom NVIDIA Olympus, 54 TB paměti LPDDR5X (nízkoenergetická dvojitá datová rychlost paměť) a NVLink-C2C šířku pásma 65 TB/s. Celkově platforma obsahuje 1 296 čipů NVIDIA plus HBM4. Vera CPU spolupracuje s Rubin GPU pro škálování inteligence v rackovém systému, kde se využívá NVLink 6 switch pro 3,6 TB/s all-to-all komunikace mezi GPU.
Tento procesor urychluje zpracování dat přes úložiště, sítě, kybernetickou bezpečnost a elastické škálování v AI továrnách. Nvidia zdůrazňuje, že Vera CPU přináší masivní zisky v efektivitě, například při tréninku modelů s 10 biliony parametrů lze dosáhnout výsledků za měsíc s menším počtem komponent.
Produkce a partneři
Nvidia potvrdila, že Vera Rubin je v plné produkci a začne dodávat zákazníkům v druhé polovině roku. Mezi prvními partnery jsou Microsoft a CoreWeave, kteří budou nabízet služby na bázi těchto čipů. Microsoft plánuje integrovat tisíce Rubin čipů do svých datových center v Georgii a Wisconsinu. Firma spolupracuje také s Red Hat na produktech pro banky, automobilky a letecké společnosti.
Platforma Vera Rubin NVL72 je postavená na třetí generaci NVIDIA MGX rack designu, což umožňuje snadný přechod z předchozích generací. Obsahuje také ConnectX-9 SuperNIC s 1,6 Tb/s (terabitů za sekundu) šířkou pásma na GPU pro nízkolatenční síťování, BlueField-4 DPU pro akceleraci datového zpracování a Spectrum-X Ethernet s integrovanou křemíkovou fotonikou pro 5x lepší energetickou efektivitu a 10x vyšší odolnost sítě.
