Andra generationens Epyc-processorer från AMD är här. Under ett tekniskt sett hektiskt event i San Francisco i början av augusti presenterade företaget Epyc 2 – processorn som gått under arbetsnamnet Rom. Datormagazin var givetvis på plats.
(Texten publicerades första gången i Datormagazin nr 12, 2019)
Trots att serien baseras på samma sockel och stomme som första generationens Epyc bjuder andra generationen på flera nyheter som sammantaget gör respektive modell till den kraftigaste inom sitt prissegment
Epyc 2 – en överblick
Vi börjar med en kort överblick över hela andra generationens Epyc-processorer. Utbudet sträcker sig från modellen 7232P som kommer med åtta kärnor och 16 trådar, en högsta frekvens på 3,2 gigahertz vid en TDP (thermal design power) på 120 watt till toppmodellen 7742 som har hela 64 kärnor, 128 trådar, en högsta frekvens på 3,4 gigahertz vid en TDP på låga 225 watt.
Inom detta spann rymmer sig vid första lanseringen totalt hela nitton olika modeller. Värt att notera redan här är att det bland dessa finns fem modeller märkta med ett P i slutet. De är generellt sett lägre prissatta jämfört med samma modell utan P. Anledningen är att den extra bokstaven innebär att enheten inte kan användas i en multisockel-konfiguration utan är låst till singelsockel-användning.
Stöd för upp till åtta terabyte DDR4-minne
Gemensamt för samtliga modeller är att de kommer med integrerat stöd för upp till åtta terabyte DDR4-minne med en frekvens på upp till 3 200 megahertz. Till detta har varje system tillgång till minst 128 fullhastighets PCIe Gen4-banor vilket ger såväl det grafiska gränssnittet som lagringen en kraftig ”boost” jämfört med föregående modell. Dessutom har AMD ökat cachemängden för samtliga modeller jämfört med likvärdig enhet från första generationen. Vi hittar även integrerad, klassledande, säkerhet i form av både SEV2 (Secure Encrypted Virtualization) och SME (Secure Memory Encryption).
Läs också: Test: AMD Ryzen 9 3900X och 7 3700X
Sett med lite andra siffror innebär detta en ökning med maximala antalet kärnor på 128 procent, 45 procent högre minnesbandbredd, en dubblering av dataöverföringen och upp till smått ofattbara 576 megabyte cache i ett två-socketsystem.
Infinity 2-arkitektur
I samband med första generationens Epyc-processorer fick vi även stifta bekantskap med det som AMD kallar infinity-arkitekturen, vilket i detta läge innebar att varje processor bestod av fyra SOC-delar (system on a chip) vilka vardera hade egen CPU, minne och I/O-del. Dessa knöts sedan samman av det som kallades Infinity fabric, som enkelt utryckt var en intern arkitektur som gav respektive enhet åtkomst till övriga delar.
Till denna, andra generations Epyc, har infinity-arkitekturen uppdaterats och förbättrats på flera punkter. Varje CPU-enhet består nu av totalt åtta så kallade CPU-chiplets eller enklare uttryckt celler eller kretsar där CPU-kärnorna huserar. Dessa är baserade på sju nanometers arkitektur och är i sin tur indelade i fyra grupper om varder två av dessa chiplets. I mitten på CPU-enheten finns ytterligare en speciell chiplet-del vilken hanterar I/O- och minnesdelen, en del som faktiskt fortfarande baseras på 14 nanometers arkitektur. Samtliga av dessa knyts sedan samman av Infinity fabric 2. En lösning som enligt AMD bland annat ger en större flexibilitet, lägre latenser och en optimerad strömhantering.
Det som gör dessa prestandavinster och effektiviseringar möjliga är till stor del kopplat till den i det närmaste helt omgjorda cachearkitekturen. Denna har en dubblerad OP cache-kapacitet, en helt ny/optimerad instruktionslösning för L1-cachen som även fått en näst intill dubblerad bandbredd. Till detta har L3-cachen fått en dubblerad kapacitet med en dubblering av databredden för Floating point samt en överlag helt ny TAGE branch predictor.
Bäst prestanda till lägst totalkostnad
Under AMD:s lansering av andra generationens Epyc fanns ett flertal kunder och partners på plats för att visa på den kraft som respektive modell levererar. Detta gjordes så klart genom en jämförelse med närmast likvärdiga Intel Xeon-baserade modell sett till både pris och antal kärnor. Dessa tester omfattade allt från diverse benchmarks till verkliga användarscenarion.
Den första jämförelsen gjordes mellan Intel Xeon platinum 8280 och Epyc 7742 – det vill säga respektive tillverkares flaggskeppsmodeller – ur ett Javaperspektiv.
I Javaservertestet SPECjbb gav AMD:s modell 68 procent högre QoS och hela 83 procent bättre genomströmning. Detta omvandlades sedan mot en onlineaffär som använder 60 två-socklade Xeon8280 servrar med 56 kärnor och 384 gigabyte minne per server vilket ger 11 miljoner Javaoperationer per sekund.
”Dessutom får vi ett betydligt mindre fysiskt fotavtryck och en lägre värmeutveckling vilket ger en positiv effekt för miljön.”
Dessa kunde matchas av 33 två-socklade Epyc 7742-servrar med 128 kärnor och en terabyte minne per server, vilket även här ger 11 miljoner Javaoperationer per sekund. Jämförelsen blir än mer intressant när vi tänker på att samma datanivå kan uppnås, tack vare 83 procent högre prestanda per server, med 45 procent färre servrar och en 44 procent lägre TCO. Dessutom får vi ett betydligt mindre fysiskt fotavtryck och en lägre värmeutveckling vilket ger en positiv effekt för miljön.
Nästa intressanta test utgår från SPEC CPU 2017. Här når Intels Xeon-baserade bronsmodeller upp i 42 poäng, silvermodellerna 184, guld 285 och platinum når upp i 381 poäng.
Samtliga resultat är för två-sockelsystem. Motsvarande värden för Epyc visar att åttakärnors-modellen når upp i 130 poäng och att redan vid 32-kärnorsmodellen har Intels toppmodell krossats med ett resultat på 431 poäng. Men som nämnts ovan finns här än mer kraft och 48-kärnorsenheten når 550 poäng och toppklassade 7742-modellen smått otroliga 748 poäng vilket nästan är en dubblering
För att spetsa till det hela rejält visades även Epycs toppmodell upp i singel-sockelutförande och trots att denna återigen ställdes mot Intels dubbla Platinumsystem lyckades AMD slå uppsättningen med ett resultat på 385 poäng, vilket är smått ofattbart.
Världsrekord, partnerns och kommande generationer
För att ytterligare förstärka sin ledande datacenter-position när det kommer till prestanda och effektivitet visade AMD även upp 80 olika världsrekord satta tillsammans med partners som Lenovo, HPE och Dell/EMC inom områden som HPC, SDI/Enterprise, Bigdata och Cloud. Och till skillnad mot första generationens Epyc står flera av de stora aktörerna redan redo att leverera färdiga lösningar baserade på denna andra generations Epyc.
Google och Twitter satsar på Epyc 2
För att lyfta fram några av de viktigaste nyheterna gällande partnersidan berättade Bart Sano, VP för Engineering på Google, att de redan jobbar med nya Epyc i sin interna infrastruktur och att de till slutet av 2019 kommer att använda lösningarna för företagets molnbaserade beräkningsmotorer. Även Jennifer Fraser från Twitter berättade att Twitter i skrivande stund jobbar med att implementera andra generationens Epyc i sin infrastruktur och räknar med att kunna sänka sin TCO med 25 procent. Utöver dessa visade såväl Microsoft, VMware, Grey med flera upp lösningar vilka samtliga baserades på olika modeller från andra generationens Epyc.
AMD:s börsvärde steg med 17 procent i samband med eventet. AMD:s VD Lisa Su passade även på att berätta att kommande, tredje generationens Zen 3-baserade Epycprocessor som går under namnet Milan redan har sin design färdig och att företaget är en god väg in på fjärde generationens Zen kallad Genoa som beräknas lanseras innan 2022.
Det ser onekligen mycket lovande ut för AMD både på konsumentsidan med tredje generationens Ryzen och framför allt på server- och datacentermarknaden där Epyc 2 numera är den processorfamilj som allt annat kommer att/måste jämföras med och mot.
Epyc 2 in-house
Som alltid när det kommer till event av den här typen och företags egna testresultat är dessa såklart alltid optimerade för att lyfta fram den egna produktens styrkor. Detta gjorde att vi lånade in en egen server baserad på Epyc 2 för att jämföra den med ett Intelbaserat system. För att få systemen så lika som möjligt använde vi samma minnesmängd, minnesfrekvens och disksubsystem. För att se ren datakraft använde vi alltså inte PCIe Gen4 i Epyc-systemet.
Lösningen vi fick testa baserades på Epyc 7402, en 24 kärning HT-processor vilket jämfördes med ett likvärdigt system baserat på en Intel Xeon Platinum 8268-processor, även detta en HT-processor med 24 kärnor. Båda systemen kördes i singelsocket-konfiguration.
För att undvika statiska benchmark i dessa fall valde vi att enbart fokusera på verklig datoranvändning.
Vi kan börja med att konstatera att Epyc-processorn kostar cirka 16 000 kronor, medan Intels processor ligger på smått ofattbara 85 000 kronor.
Rejäl uppförsbacke för Intel
När vi granskade virtualiseringsprestandan kunde AMD, med en blandad applikationslösning, hantera och processa cirka 27 procent mer data jämfört med Intelsystemet. När vi kom till Javahantering var skillnaden högre, där AMD kortade beräkningstiden med hela 38 procent. Slutligen tittade vi på HPC-prestandan där Intel var aningen närmare, men AMD gav oss ändå dryga 23 procent mer kraft, eller utfört arbete under samma tidsfaktor. Detta ger en tydlig bild på dels vilket arbete som AMD lyckats åstadkomma, men även vilken extrem uppförsbacke som Intel har att jobba emot.