Kraftfullare, mer effektiv och med minskad latens – AMD Epyc 4 är den i skrivande stund högst presterande processorn för generella datacenter. Datormagazin rapporterar från lanseringen i San Fransisco.
Under den nionde och tionde november 2022 höll AMD:s datacentergrupp, ledd av AMD:s CEO Lisa Su, ett event i San Francisco där fjärde generationens Epyc-processorer, baserade på Zen 4-arkitekturen, lanserades. Processorserien lanseras i 18 olika varianter bestyckade med allt från 16 till 96 kärnor vilka sträcker sig ända upp till 4,4 gigahertz frekvens. Till detta stöder plattformen såväl PCIe Gen 5 som DDR5 samt en delvis ny och förbättrad integrerad säkerhetslösning.
Det som gjorde lanseringen lite extra intressant var att det faktiskt var en av fyra nya arkitekturbaserade AMD-lanseringar under en kort period där AMD, förutom just Zen 4 även lanserat Zen 4C med fokus på molnlösningar, RDNA3 på grafiksidan och XDNA som är nästa generations adaptiva SoC-lösning.
Tydlig serverstrategi
Allt sedan AMD lanserade första generationens Epyc-processor, kallad Naples, i juni 2017 så har företaget haft en tydlig vision gällande sin serverstrategi, ett område som under lång tid varit helt dominerat av Intel. Denna vision består av tre fokusområden:
- Leverera världens bäst presterande processor för generella datacenter
- Ett optimerat silikon (Zen 4) för olika arbetsbelastningar
- Fullstackslösningar samt ett ekosystem och partnerskap som accelererar ”time-to-value” för kunder
För att lyckas med detta lanseras fjärde generationens Epyc-processor i fyra olika huvudmodeller kallade Genoa, Bergamo, Genoa-X och Siena.
Genoa är optimerad för mer generell användning, Bergamo har fokus på Cloud Native-lösningar, Genoa-X är avsedd för mer tekniska plattformar och Siena för Telco- och Edge-lösningar.
För att befästa sin ställning från tredje generationens Epyc (Milan och Milan-X), som den processor med högst beräkningskapacitet, så är det främst fyra områden som AMD lyfter fram:
- Ledarposition gällande prestanda per kärna och socket. Detta genom att använda upp till 96, fem-nanometers, Zen 4-kärnor per processor
- Ledarposition gällande minnesbandbredd och minneskapacitet vilket ska uppnås genom ett stöd för upp till tolv kanalers DDR5.
- Baserat på senaste generationens I/O vilket innebär upp till 160 banor av PCIe Gen 5 och stöd för minnesexpansion via CXL.
- Förbättringar inom konfidentiell datoranvändning genom en förbättring av SEV-SNP guest (Secure Encrypted Virtualization-Secure Nested Paging) vilket bland annat används vid arbete med olika VM-lösningar. Dessutom används minneskryptering för både direkt- och CXL-anslutet minne.
För att kort sätta lite siffror på den förväntade prestanda som Epyc 4 ska erbjuda så har AMD gjort jämförelser med föregående serie. Vid benchmarkmätning av heltalsgenomströmning via SPECrate 2017_int_base, något som är extra intressent för CSP:s, var prestandan för senaste serien 107 procent högre. Går vi vidare till flyttalsgenomströmning, vilket är viktigt för alla typer av HPC-system var prestandaökningen 123 procent och för serverbaserad Javagenomströmning var ökningen 94 procent.
”PrestandaZentrerad” arkitektur
Grunden i denna markanta prestandaökning finner vi i den nya Zen 4-arkitekturen. När denna utvecklades hade AMD tre primära fokusområden jämfört med föregående arkitektur:
- Ökad prestanda via en procentuell tvåsiffrig ökning av IPC (Instructions per clock) – och frekvensprestanda.
- Tack vare en större L2-cache och en allmänt effektivare cachehantering kan den genomsnittliga latensen sänkas.
- Genomströmning/effektivisering: Genom att minska den dynamiska kraften går det att effektivt öka antalet kärnor.
Börjar vi titta på den generella prestandaökningen av IPC så pratar AMD här om en ökning med cirka 14 procent mellan generation tre och fyra. Detta är en ökning som uppnås via flera samverkande faktorer, bland annat den utökade L2-cachen, en optimerad exekveringsmotor, bättre så kallade Branch preditions, effektivare hantering av laddning och lagring samt en optimerad front end.
Går vi lite djupare in på detta så baseras Zen 4 på tidigare Zen 3-mikroarkitektur men där AMD sedan gjort ett antal optimeringar för att få ut det mesta ur plattformen. Detta omfattar bland annat en 22 procentig ökning av LDQ, en Micro-OP cache som utökas från 4K till 6,75K OPS, en dubblerad L2-cache, en ökning av L2 TLB med 50 procent samt en ökning av ROB med 25 procent.
Till detta tillför den nya arkitekturen även nya AVX-512-instruktioner i form av möjlighet till så kallad ”masking” baserad per bana, nya Scatter/Gathter-instruktioner och stöd för BFloat16- och VNNI-instruktioner. Totalt har Zen 4 stöd för tretton så kallade AVX-512 extensions vilka tillsammans ger fjärde generationens arkitektur en 4,2 gångers ökad NLP-, tre gångers högre bildklassificerings- och 3,5 gångers högre objektdetekteringsgenomströmning jämfört med föregående arkitektur.
För att kort beröra den förbättrade säkerheten i Zen 4 får vi fortsatt stöd för SME, SEV-ES och SEV-SNP. Däremot har minneskrypteringen utökats till AES-256-ATS med stöd för 1006 krypterade gäster samt stöd för SMKE. Arkitekturen omfattar även stöd för virtualiserad X2APIC och SMT-skydd för gästprocesser. Dessutom tillhandahåller Zen4 automatisk IBRS.
Ny namnkonvention
Nästa nyhet för Epyc 4, eller 9004-serien som den övergripande kallas, hittar vi i dess sockel som nu kallas för SP5 vilket ska ge bättre strömtillförsel och VR-hantering. Denna kommer med upp till 160 IO-banor av PCIe Gen 5, vid en tvåsockel-lösning, upp till tolv extra PCIe Gen 3-banor, 32 IO-banor för SATA och 64 IO-banor för CLX1.1. Plattformen erbjuder även stöd för tolv kanalers DDR5 i upp till 4 800 megahertz och upp till 256 gigabytes DIMM. Detta ger plattformen en teoretisk maximal bandbredd på 460 gigabyte per sekund och hela sex terabyte per sockels kapacitet.
Vid en två-socket-lösning knyts de båda socklarna ihop med en tre- eller fyrlänks Infinty Fabric för maximal genomströmning mellan processornera, vilken även är energioptimerad för att minimera eventuella förluster.
LÄS OCKSÅ: AMD Epyc 2 – En ny kung på servertronen
När vi sedan kommer till processorernas namn så använder AMD en ny form av namnkonvention där samtliga modeller börjar på en 9:a och slutar på en 4:a. Den första siffran syftar på produktserien och den sista på generationen. Den andra siffran kommer att indikera antalet kärnor där 1 motsvarar 16 och 6 motsvarar 84-96. Den tredje siffran är tänkt att ge en indikation på prestandan sett till antalet kärnor och där ett högre värde motsvarar en högre prestanda.
Baserat på detta har AMD delat upp sina Epyc 4-enheter i tre kategorier:
- Core Performance:
Detta är modeller med hög frekvens och en hög cache per kärna
Enheter:- 9474F – 48 kärnor
- 9374F – 32 kärnor
- 9274F – 24 kärnor
- 9174F – 16 kärnor
- Core Density:
Här finns modellerna med högst antal kärnor och antal trådar.
Enheter:- 9654/p – 96 kärnor
- 9634 – 84 kärnor
- 9554/p – 64 kärnor
- 9534 – 64 kärnor
- 9454/P – 48 kärnor
- Balanced and Optimized:
Detta är modeller som erbjuder bra prestanda med optimal TCO.
Enheter:- 9354/p – 32 kärnor
- 9334 – 32 kärnor
- 9254 – 24 kärnor
- 9224 – 24 kärnor
- 9124 – 16 kärnor
Ökad prestanda – minskat fotavtryck – lägre strömförbrukning
Som nämnts ovan innebär Epyc 4 ett klart lyft jämfört med Epyc 3, men självklart presenterades även ett stort antal jämförelser med Intels Xeon-processorer. Dessa är dock baserade på tredje generationens Intel-modeller då den senaste, fjärde generationen, inte hade lanserats vid tidpunkten för detta event.
Vid samtliga fall, när prestanda per kärna jämfördes, så levererade Epyc 4 mellan 45 och ändå upp till 300 procent högre nivåer jämfört med Intels motsvarande processormodell, se bilder. Men även när det gäller den faktiska prestandan mer eller mindre krossar AMD Intels motsvarighet, vilket gör att företag som väljer att satsa på en serverlösning baserad på Epyc 4 kan minska antalet servrar med så mycket som 66 procent med bibehållen prestanda. I stället för att bygga en serverpark på, låt säga, 15 000 servrar så kan samma nivå alltså uppnås med bara 500 enheter. Detta leder i sin tur till ett markant mindre fotavtryck, mindre total strömförbrukning, mindre underhåll, färre potentiella felkällor, mindre kraft för att kyla serverhallar och så vidare.
För att lyfta den kanske viktigaste delen i detta, strömförbrukningen, ytterligare en nivå får vi en helt annan bild vi normalt är vana vid. På grund av de extremt höga elpriserna, något som kan hålla i sig under flera år, kan företag räkna hem en investering snabbare än någonsin tidigare, och vi har nästan kommit till det läge där vi kan ställa oss frågan – vem har råd att inte uppgradera sin serverpark?
Den minskade strömförbrukningen skulle, i en större skala, kunna vara den avgörande faktorn för att strömmen i ett helt land faktiskt räcker till för att klara även kallare vintrar utan att man tidvis behöver stänga ner delar eller områden, vilket är ett realistiskt scenario vi faktiskt står inför i skrivande stund.
Som sista och minst lika viktiga del som prestanda, säkerhet och effektivitet har vi tillgängligheten. För trots att AMD under flera år visat sig vara en minst sagt värdig motpart till Intel (som dominerat servermarkanden under decennier), så har tillverkarna varit lite försiktiga med att presentera lösningar som baseras på AMD:s plattformar. Till detta har vi i pandemins efterdyningar sett både komponentbrist och leveransproblem inom nästa alla områden.
Men under AMD-eventet presterade både Lisa Su och Forrest Norrod, SVP och GM för DataCenter solution business group ett flertal partners som Dell, HPE, SuperMicro och Lenovo som redan i skrivande stund har ett stort antal system redo att skeppas, så läget ser onekligen mycket ljus ut för både AMD, företagets partners och framför allt för alla slutkunder som använder eller planerar att använda Epyc 4 i sina datacenter.
Undertecknad avrundar med en mycket personlig reflektion. Jag har följt AMD under många år och varit på plats vid merparten av de större lanseringar som gjorts. När första generationen av Ryzen lanserades var känslan att detta kommer att förändra AMD:s position på ett så markant sätt att aktiekursen skulle skjuta i höjden. Det visade sig stämma.
Känslan denna gång är än kraftigare. För det steg i utveckling som Epyc 4 innebär sett till prestanda och funktionalitet per watt är ett av de största om mest omfattade steg vi kanske någonsin upplevt, och sett till den fortfarande begränsade marknadsandelen som AMD innehar, så kan detta knappast gå på annat sätt än rakt uppåt.