Krátce poté, co šéf Amazonu Andy Jassy oznámil investici 50 miliard dolarů do OpenAI, přišla nečekaná nabídka. AWS (Amazon Web Services) pozvalo novinářku Julie Bort z TechCrunch na soukromou prohlídku chipové laboratoře v texaském Austinu. Té samé, která stojí v centru celého toho obřího obchodu. Odmítl by někdo? Určitě ne.
Laboratoř sídlí v lesklé budově s chromovými okny v austinské čtvrti The Domain, přezdívané místní Silicon Valley. Navenek vypadá jako každá jiná kancelář technologické firmy. Otevřené prostory, kuchyňky, konferenční místnosti. Jenže vzadu, na jednom z horních pater s výhledem na celé město, se skrývá něco jiného.
Za dveřmi AWS
Laboratoř je zhruba velká jako dvě větší konferenční místnosti. Hluk ventilátorů, police plné zařízení, inženýři v džínách. Žádné bílé ochranné obleky. Tady se čipy nevyrábějí, tady se oživují. Trainium3 vyrábí TSMC na 3nanometrovém procesu, tedy na absolutní špičce toho, co dnes výroba čipů umí. Ale zda chip funguje správně, to se zjišťuje právě tady, v Austinu.
Celý rituál se nazývá "bring-up". Ředitel laboratoře Kristopher King to popisuje následně: "Dostaneš chip poprvé do ruky a je to jako velká noční párty. Prostě tu zůstaneš, jako na škole v přírodě." Po 18 měsících práce tým poprvé zapne čip a čeká, jestli bude fungovat. Spoiler: Nikdy to není bez problémů.
U Trainium3 měl prototyp špatné rozměry pro upevnění chladiče. Čip nešlo ani zapnout. Co tým udělal? Popadl brusku a začal brousit kov. Aby nerušili atmosféru párty, odplížili se brousit do vedlejší konferenční místnosti. Takhle to tam prostě chodí.
Milion čipů pro Anthropic a plány pro OpenAI
Celkem je nasazeno přes 1,4 milionu Trainium čipů napříč všemi třemi generacemi. A přes milion z nich pohání Claude od společnosti Anthropic, jeden z nejpopulárnějších AI asistentů světa.
Největší nasazení nese název Project Rainier, jeden z největších AI výpočetních clusterů na světě. Spustil se koncem roku 2025 s půl milionem Trainium2 čipů a běží výhradně pro Anthropic. Jenže teď do hry vstupuje OpenAI. AWS se zavázalo dodat 2 gigawatty výpočetního výkonu na bázi Trainiumu právě pro OpenAI. A to je monumentální závazek, zvlášť když Anthropic a Amazon Bedrock spotřebovávají čipy rychleji, než je Amazon schopen vyrábět.
Dohoda s OpenAI přitom není úplně jednoduchá. Magazín Times informoval, že se Microsoft může cítit poškozen, protože má s OpenAI vlastní dohodu o přístupu ke všem modelům a technologiím. Co z toho nakonec vzejde, se teprve uvidí.
Trainium vs. Nvidia
Tady se dostáváme k tomu, co sledují analytici po celém světě. Nvidia drží téměř monopolní postavení v AI výpočetním hardwaru. Amazonu se ale daří tuto dominanci narušovat a Trainium3 je doposud jejich nejsilnějším argumentem.
Amazon tvrdí, že jeho nové čipy na speciálních serverech Trn3 UltraServer stojí až o 50 procent méně při srovnatelném výkonu oproti klasickým cloudovým serverům. Ředitel inženýringu Mark Carroll za tím vidí kombinaci Trainium3 a nových Neuron přepínačů, které tým rovněž sám navrhl.
"To nám dává něco obrovského," říká Carroll. Přepínače propojují každý čip s každým jiným čipem v síťové mesh konfiguraci, což dramaticky snižuje latenci. Právě proto Trainium3 překonává rekordy, zejména v poměru výkon ku spotřebované energii.
A co switching costs, tedy náklady na přechod z Nvidie? Historicky to byl hlavní argument pro to zůstat u Nvidie. Aplikace psané pro CUDA, proprietární platformu Nvidie, se musely kompletně přepsat. Amazon teď říká, že Trainium podporuje PyTorch a přechod vyžaduje "prakticky jednu změnu v kódu, rekompilaci a spuštění na Trainiumu". Zní to skoro až příliš jednoduše, ale pokud to funguje, mění to celou rovnici.
AWS tento měsíc oznámilo taky partnerství s firmou Cerebras Systems, jejichž specializovaný čip pro inference bude nasazen přímo na serverech s Trainium. Amazon tak staví vícevrstvou sázku na budoucnost AI výpočetního výkonu.
Izraelský startup za 350 milionů dolarů
Celý tento čipový tým existuje díky jedné akvizici. Amazon koupil izraelský Annapurna Labs v lednu 2015 za přibližně 350 milionů dolarů. Deset let nato z tohoto týmu vzešly Graviton, Inferentia a teď Trainium. Logo Annapurna Labs visí v kancelářích dodnes.
Graviton, ARM-based serverový procesor s nízkou spotřebou, byl první velký úspěch. Byl to on, koho Apple v roce 2024 veřejně pochválil na konferenci AWS re:Invent. Apple, firma notoricky tajnůstkářská, tehdy její ředitel AI veřejně popsal, jak Apple používá Graviton i Inferentii. Pro Amazon to bylo potvrzení, že jsou na správné cestě.
Trainium2 dnes obstarává většinu inference provozu na Amazon Bedrock, cloudové službě, přes kterou tisíce firem staví vlastní AI aplikace. "Naše zákaznická základna roste tak rychle, jak jen dokážeme dodat kapacity," říká King. A pak přidá větu, která zaujme: "Bedrock může být jednou tak velký jako EC2." EC2, výpočetní cloud AWS, je přitom jedna z největších a nejziskovějších cloudových služeb na světě.
Laboratoř, kde se svaří i pod mikroskopem
Zpátky do laboratoře. Jedním z nejpůsobivějších momentů prohlídky bylo svařovací pracoviště. Hardwarový inženýr Isaac Guevara tam svařuje miniaturní součástky integrovaných obvodů pod mikroskopem. Práce tak precizní, že Carroll, senior lídr týmu, otevřeně přiznal, že by to nedokázal. Guevara se smál. Inženýři kolem taky.
Hvězdou laboratoře je ale celá stěna "sledů", tedy zásobníků, které nesou čipy Trainium, Graviton a podpůrné komponenty. Každá generace má svůj exponát. Je to trochu jako muzeum, ale funkční. Poskládej sledy na rack, přidej sítové komponenty a máš srdce celého Anthropic Claudu.
Nedaleko od hlavní laboratoře má tým i vlastní soukromé datové centrum pro testování. Vstup přísně střežen. Chladicí systém je tak hlučný, že jsou povinné špunty do uší. Vzduch páchne horkým kovem. Jsou tam řady serverů plné čipů Graviton, Trainium3 a Nitro, vše chlazené kapalinou v uzavřeném okruhu.
Inženýři tu pracují 24 hodin denně, 7 dní v týdnu po dobu tří až čtyř týdnů kolem každého prvního oživení čipu. Tlak je obrovský. Andy Jassy osobně sleduje jejich výsledky a veřejně se o nich vyjadřuje s nadšením. V prosinci prohlásil, že Trainium je pro AWS již multimiliardový byznys a označil ho za jednu z technologií, která ho nejvíc vzrušuje.
Tým teď pracuje na Trainium4. Co přinese, zatím nikdo neřekl.
Zdroj: techcrunch.com
