Vi besöker Intel Innovation 2023 – årets utvecklingsevent för alla former av teknisk innovation och AI-utveckling.
Under tre högintensiva dagar i San Jose, Kalifornien, höll Intel sin årliga innovationskonferens. Datormagazin var på plats och fick en mycket intressant och givande bild på nuläget inom tekniksektorn rent allmänt, men framför allt en vision om framtiden för och inom AI, en teknik som har potentialen att förändra hur vi lever och hanterar bland annat sjukdomar men som även har en betydligt mörkare sida som är svår att blunda för. I lite av en centrumposition inom både hårdvaru- och den programbaserade sidan finner vi Intel som med en extremt hög intern teknisk kompetens och nära samarbeten med alla typer av företag och individer har en ganska tydlig bild över framtiden.
Följ med på en resa genom det viktigaste och mest intressanta från Intel Innovation 2023, en resa som sträcker sig över en mer öppen chipplett baserad teknik, öppen källkod och en glimt in i quantum-världen, en plats som kommer allt närmare.
Siliconomy – en nya ekonomisk era
En övergripande reflektion från dessa dagar som inte direkt har koppling till Intels teknik men som i slutändan ändå, med största sannolikhet, kommer vara den drivande faktorn som återigen placerar Intel som en av de givna ledarna inom framtidens teknik hittar vi i den nya uppsättningen av personer på flertalet toppositioner. För att efter att under ett flertal år, i varje fall sett utifrån, verkar ha kämpat med interna konflikter och en teknikutveckling som gått allt annat är rakt framåt och där Moores lag, som nästan varit ett mantra för Intel, mer eller mindre skuffats undan så ser allting numera extremt ljust ut. Hela Intel med personal på plats lyser av en framtidstro och en arbetsglädje som det var länge sedan vi såg och som till viss del nästan kan jämföras med det engagemang och glöd som man normalt bara ser hos startup företag.
En stor del av denna omvändning kan utan tvekan tillskrivas Pat Gelsinger, Intels CEO sedan början på 2021. Och med tanke på namnet, Pat heter egentligen Patrick, så kunde det knappast gå fel. Skämt åsido så blev tillträdet av Pat lite av ett nytt avstamp för Intel som efter denna tidpunkt även värvat ett flertal nya toppchefer och utvecklare som bland annat Deepak Patil som sedan april 2023 är CVP och General Manager för Accelerated Computing Systems och Graphics (AXG) group samt Pallavi Mahajan CVP, GM, Network and Edge Group (NEX) Software vilka tillsammans med ett ytterligare en handfull nya eller nygamla Intelansikten har sett till att skapa ordning på Intels roadmap och gått från att ligga steget efter, sett till den interna utvecklingen till att nu ligga om så inte steget så i varje fall ett halvt steg före.
Sedvanligt var det även CEO Pat som inledda Intel Innovation 2023 med den fösta Keynoten där fokus låg på AI och dess potential samt vad som kan ses som stommen i nutida och framför allt framtida ekonomi – Siliconomy.
- Allt i vår värld blir mer digitalt och även områden som vi normalt inte tänker på som digitala har någonstans en digital koppling. Tänk bara på det konstant växande skaran av smarta, uppkopplade lösningar där vi hittar allt från termostater och kameror till vatten- och luftreglering till alltmer kompletta smarta städer med mera. Detta är grunden till nuvarande och kommande ekonomi. En ekonomi som har sin grund i kisel (silicon) och därav namnet Siliconomy och som i sin tur accelereras med hjälp av AI som kan dra nytta av kraften från rätt hårdvara kombinerat med olika former av program och tjänster, berättar Pat.
- Redan idag så är Siliconomy en industri på motsvarande 574 miljarder dollar vilket i sin tur driver en global teknisk ekonomi värd nästan 8 biljoner dollar och detta ger en unik möjlighet för utvecklare. Vi har därför låtit förra årets betaprojekt med cloud.intel.com bli tillgänglig för alla och detta är en plats som jag rekommenderar vi här erbjuder en AI accelererad utvecklingsplattform baserad på Intel-optimerad programvara som körs på de senaste Intel Xeon-processorerna och även inkluderar GPU-baserad beräkningskraft.
Pat pratade i detta sammanhang även om teknikens fem superkrafter vilka möjliggjorts av kiselekonomin och som vi idag ser som en naturlig integration i nästan allting. Dessa är: Compute, Connectivity, Infrastructure, AI och Sensing. En av de snabbast drivande krafterna för dessa i skrivandes stund hittar vi olika former av sensorer. Dessa blir allt billigare och flera till antal och områden och med mer data så får vi en bättre insikt vilket i sin tut ger en mer korrekt AI.
- Ska vi ta detta till ytterligheterna så kan faktiskt delar som sjukdomar bli en av framtidens datas styrkor då de hjälper forskare och även inlärningsmotorer att analysera och skapa motmedel för en friskare framtid. För många gånger så är det just avvikelserna som är viktigare än det normala för där finns redan gott om data.
Age of the AI PC
Som en del i nämnda Siliconomy hittar kärnan för kommande generations konsumentbaserade datorer vilka till allt större del kommer att få en naturlig AI integration. Det första steget in i det som Pat kallar för ”the Age of the AI PC” hittar vi i nästkommande, fjortonde, generations Intel Core processorer vilka går under kodnamnet Meteor Lake och som ska lanseras den 14e december 2023. Under eventet så demonstrerades användning av kommande Intel Core Ultra vilket är den första CPU som baseras på Intel 4 arkitekturen samt har en integrerad NPU AI motor. Plattformen visades upp tillsammans med Microsofts nya tjänst Copilot som kommer att fungera lite som en personlig assistent som är integrerad i datorn och som tack vare insyn i vår data och kommunikation ska kunna underlätta vårt dagliga arbete. Till skillnad mot många av de alternativa lösningar som visades upp som krävde en molnbaserad anslutning så fungerar och körs Copilot lokalt och all AI beräkning sker i enheten som används.
- Genom att vi med kommande Core Ultra processorer har kunna integrera den senaste tekniken som en arkitektur baserad på Intel 4 med en hybrid 3D prestandaoptimerad kärna där vi får än mer energieffektiva E-kärnor och kraftfullare P-kärnor samtidigt som vi kombinerar CPU, ARC baserad GPU och NPU och senaste WiFi 7 har vi kunnat bygga stommen för framtidens AI centrerade datorer, berättar Pat. Vi har i alla tider pratat om personliga datorer men för första gången så kommer nästa generations datorer verkligen vara, eller rättare sagt bli, helt unika och personliga. För varje dator baserad på Core Ultra kommer ha möjligheten att, baserat på just ditt användarmönster och de program du använder, optimera datorn för just dig och ge dig den hjälp som just du behöver när du behöver den.
- Men detta är bara början och vi har redan en stabil roadmap där vi ligger i fas eller före planing för i varje fall kommande fyra till fem generationers processorer i form av Arrow Lake, Lunar Lake och Panther Lake vilka kommer att presenteras mellan 2024 och 2025, säger Pat.
Det ska här även tilläggas att såväl Pat som Deepak Patil gjorde det klart att ett område som kan komma att påverka kommande roadmap, och i förlängningen även mer eller mindre hela världen är kvantdatorers utveckling. I skrivandes stund så är kvantdatorer mer av ett extremt intressant forskningsprojekt men den dag som de kan ersätta och ta över traditionella datorer och servrar så kommer världen igen aldrig att bli sig lik.
Nästa generations wafer / substrat
Ett område som för varje år och varje event fått alltmer fokus är miljön och med tanke på senaste årens extrema elpriser och höjda globala värmenivåer så pratade Gelsinger även om vikten att hela industrin svänger och att den nya normen och mål måste vara att gå från ett rent fokus på prestanda till prestanda per energienhet. För vi behöver på en global nivå hitta ett läge där energi bara utnyttjas när den behövs i dessa lägen så effektivt som möjligt. Sett till Intels sida så gäller detta tänk så klart både klient- och serversidan.
- Ett steg i vår satsning på energieffektivare processorer ser vi vår plan att leverera fem processnoder på fyra år. Vi befinner oss i dag med en stomme i Intel 7 arkitekturen där vi har en hög volymtillverkning men vi har redan tagit de första stegen över till Intel 4 arkitekturen där de första processorerna både på klient och serversidan kommer att börja skeppas den 12e december. Tar vi sedan steget in till andra halvan av 2023 så lanseras produkter baserade på Intel 3 där vi redan har testexemplar av såväl Sierra Forest som Granite Rapids färdiga. Ytterligare ett år bort, 2024, går vi över till det som kallas Intel 20A vilket ligger helt i fas för tillverkning. Detta följs nästan samtidigt, under Q1 2024 av nästkommande kisel Intel 18A som då beräknas gå in till fabrik, berättar Pat.
- Intel 18A kommer på flera sätt även att symbolisera ett mycket viktigt avstamp i Intels utveckling då vi här dels går över till High-NA EUV teknik som kommer att ligga till grund för kommande processorer. Dessutom så går vi i denna tids era över till en avancerad paketering av kommande processorer då vi går från klassiska kiselbaserade wafers till wafers baserade på glas.
Tekniken som planeras vara en del av tillverkningsprocessen för såväl processorer och andra kretsar beräknas vara tillgänglig under andra halvan av detta årtionde och representerar en milstolpe en milstolpe för Intel då tekniken kommer att möjliggöra fortsatt skalning av transistorer enligt Moores lag.
Jämfört med dagens organiska lösning erbjuder glas distinkta egenskaper som att vara plattare med en bättre termisk och mekanisk stabilitet. Det resulterar i högre täthet vid länkning i ett substrat. Dessa fördelar kommer att göra det möjligt för kretsarkitekter att skapa lösningar med högre densitet och högre prestanda till en lägre energiförbrukning optimerad för dataintensiva arbetsbelastningar.
Som ett första steg i denna process så presenterades även Intel, den 29e september, en arkitekturväxling på Fab 34 på Irland. I denna så går Intel nu över till högvolymsproduktion av Intel 4 arkitektur och användning av extreme ultraviolet technology (EUV) vilket gäller både för kommande Intel Core Ultra och nästa generations Xeon 5 processorer, tidigare kallade Emerald Rapids. De senare kommer att erbjuda 40% mer kraft per watt jämfört med Xeon.
Intel visade även upp företagets roadmap för Xeon där fokus på ökad effekt per watt ligger i fokus och där kommande generationers modeller Sierra Forrers, Granite Rapids och Clearwater Forest följer, eller ligger före, planerat schema. Bland de mest intressanta nyheter inom detta område var de modeller som kommer lanseras under 2024 där Xeon kommer med nya E-kärnor samt upp till hela 288 kärnor vilket kommer att resultera i upp till 2,5 gånger högre rack scale, eller enklare utryckt, samma prestanda men till 40 procents rackutrymme.
Säkerhet & nya chipletlösningar
Ett område som alltid är, eller i varje fall borde vara, av högt intresse är säkerhet. Under Innovation pratade Greg Lavender, senior vice president, chief technology officer (CTO) och general manager på Software and Advanced Technology Group (SATG) vid Intel, om vikten av en end-to-end-säkerhet som kan verifiera integritet för både hård- och systemmjukvara över alla inblandade parter. Det senare har en grund i att Intel betonar att vi i allt större omfattning går mot lösningar som helt eller delvis baseras på öppen källkod.
- Då vi i allt större utsträckning går mot en värld där vi förlitar oss på AI för att snabbare kunna lösa mer komplexa problem så växer även behovet av att skydda våra AI modeller, dessa data och plattformar som används från manipulation, olika former av sabotage men även ren stöld. En lösning på detta problem är att använda en fullständig homomorf kryptering (FHE) vilket är en teknik som gör det möjligt att utföra beräkningar direkt på krypterade data. För att denna liveberäkning inte ska behöva lägga onödig belastning på systemens normala hårdvara så arbetar vi med att utveckla en dedicerad tillämpningsspecifik integrerad acceleratorkrets (ASIC) som kommer att hantera denna overheadbelastning, berättar Greg.
Målet från Intels sida är att redan under senare del av 2023 släppa en betaversion av ett krypterat verktyg för utvecklare. Till detta så visade Intel även upp en ny attesteringstjänst vilken går under namnet Intel Trust Authority. Tjänsten som kan användas på alla platser där Intels confidential computing implementeras, både on-prem, i olika molnlösningar samt på edge noder tillhandahåller en oberoende bedömning av integriteten och policytillämpning samt revisionsloggning för Intels trusted execution environment (TEE).
Som en del i tankarna kring en mer öppen lösning kring källkod och samarbeten över företagsgränser så visades även världens första multi-chiplet-paket upp. Denna fungerar genom att använda Universal Chiplet Interconnect Express (UCLe) interkopplingar som är en ny gemensamt utvecklad standard som utvecklats av olika företag och som i skrivandes stund har över 120 medlemmar. Enkelt utryckt fungerar UCLe som en sorts legobyggklossar som länkas via gränssnittet och som gör det möjligt för chiplets från olika leverantörer att samarbeta i en och samma produkt.
Under demonstrationen så använder EMIB lösning som kombinerade Intels UCIe baserad på Intel 3 teknik med Synopsys UCIe baserad på TSMC N3E teknik i en och samma enhet. Även om detta var en förhållandevis enkel demo så gav lösningen upp en tidig bild av något som definitivt kan komma att både förändra men fram för allt accelerera kommande IT system och lösningar där tillverkare betydligt enklare kan använda styrkorna från olika tillverkare och skapa ett nytt homogent system.
Pat Gelsinger betonade även företagets åtagande att adressera varje fas av AI-kontinuumet, från de största tänkbara DC skalade AI lösning till minsta AI lösningar vilka kan finna si mer eller mindre allt tänkbara enheter. Detta inkluderar även generativ AI och stora språkmodeller. Nyligen offentliggjorda prestandaresultat för MLPerf AI-inferens visade upp Intels Gaudi2-accelerator som det enda realistiska alternativet på marknaden för AI-prestandabehov.
För att nå den fulla potentialen för AI och verkligen göra tjänsten tillgänglig överallt så menade Pat att vi dels behöver lösningar för att accelerera databearbetningen som utförs och detta göra på både kisel och programnivå och gäller hela spannet från allmän till AI specifika data. Till detta så behöver den AI baserade infrastrukturen förenklas från klienter till moln och allt där emellan, ett lager där vi hittar Intels OpenVINO lösning som gör det möjligt för utvecklare att skriva AI körningar en gång och sedan applicera dem överallt. I nästa skede så ska arbetsflödet för AI effektiviseras och det är här som Gaudi kommer in med allt från träning och finjustering till gränssnitt och spridning. Gaudi 2 är i grunden en AI accelerator som tack vare sin programoptimering för djupinlärning och optimerat stöd för såväl PyTorch, Hugging Face och Optimum Library är lätt för utvecklare att använda samtidigt som lösningen erbjuder ledande prestanda inom området.
Som ett exempel på denna kraft och enkelhet så presenterades en demo baserad på The New Yorkers databas av tecknade serier. Vid testet jämfördes användning dels av Nvidias motsvarighet – H100 vilken ställdes mot Gaudi 2. Vi fick sedan så båda systemen, enbart baserat på denna databas och i realtid skapa en bild på giraff som sitter på en soffa. Bilden ritades upp på 0,42 sekunder och Gaudi2 var här 1,34 gånger snabbare.
Detta var som dock bara en del av de nyheter som presenterades och vi kommer med säkerhet att få möjlighet att återkomma till både Intels AI satsning som kommande, mycket spännande arkitektoniska nyheter.