NVIDIA GTC martā 2024. gadā Keynote NVIDIA iepazīstināja ar Blackwell čipu arhitektūru un uz tā bāzes grafisko procesoru B200. Jaunie GPU ar mākslīgā intelekta iespējām aizvietos H100 un H200, kas atrodas datu apstrādes centrās. Grace Blackwell GB200 čipi apvieno Grace ar Blackwell arhitektūru.
Grafiskais procesors B200 satur 208 miljardus tranzistoru (salīdzinot ar 80 miljardiem H100/H200). Tas nodrošina 20 petaflopus vienas GPU inteliģences veiktspējai - vienam H100 bija maksimums 4 petaflopsa intelektuālajos aprēķinos. Čipi saņems 192 GB HBM3e atmiņu ar līdz pat 8 TB/s caurlaidību.
Blackwell B200 nav vienīgais GPU tradicionālajā izpratnē. Tas sastāv no diviem cieši savienotiem kristāliem, kas darbojas kā viens vienots CUDA grafiskais procesors. Divi čipi tiek savienoti ar NV-HBI (NVIDIA Augstas joslas platums) interfeisu ar 10 TB/s ātrumu.
Blackwell B200 tiek izgatavots, izmantojot TSMC 4NP tehnoloģiju, uzlabotu 4N, kas tika izmantots Hopper H100 un Ada Lovelace. Tehnoloģija nesniedz ievērojamu blīvuma uzlabojumu, tāpēc, lai palielinātu skaitļošanas jaudu, bija nepieciešams veids, kā padarīt čipu lielāku, kas varētu izskaidrot šo kombināciju.
Katrs kristāls satur četrus HMB3e stekus pa 24 GB katrs ar 1 TB/s caurlaidību 1024 bitu interfeisā. Salīdzinājumam H100 bija seši HBM3 steki pa 16 GB. Blackwell B200 20 petaflop rezultāts tiek sasniegts, izmantojot jaunu FP4 skaitļu formātu ar divkāršu caurlaidību, salīdzinot ar Hopper H100 formātu FP8.
NVIDIA Blackwel čipu varianti
Lielākais un ātrākais risinājums būs superčips GB200, kas sastāv no diviem GPU B200. Šis "monstrs" piedāvā pielāgojamu TDP līdz 2700 W - diviem čipiem (apvienotiem četri GPU) un vienam procesoram Grace. Līdz 20 petaflopsiem FP4 vienam B200 - ņemot vērā pusē GB200 superčipa. nav norādīts, cik ir TDP vienam grafiskajam procesoram B200.
Vēl viens Blackwell variants ir HGX B200, kas balstīts uz astoņiem B200 grafiskajiem procesoriem ar vienu x86 procesoru vienā servera mezgā. Tie ir iestatīti uz 1000 W vienam B200, un grafiskie procesori nodrošina līdz pat 18 petaflopsiem FP4 veiktspējai - par 10% lēnāk nekā GB200.
Būs HGX B100 čips. tāda pati pamatkoncepcija kā HGX B200, ar x86 procesoru un astoņiem B100 grafiskajiem procesoriem, bet tas ir izstrādāts, lai būtu saderīgs ar esošo HGX H100 infrastruktūru un nodrošinātu ātrāko izvietošanu. TDP uz grafisko procesoru ir ierobežots līdz 700 W, tāpat kā H100, bet veiktspēja krīt līdz 14 petaflopsiem FP4 uz GPU. Šajās trim HGX konfigurācijām HBM3e attiecas uz vienādu 8 TB/s caurlaidību uz GPU.
NVIDIA NVLINK 7.2T
Savienojumam starp vairākiem mezgliem NVIDIA iepazīstina pēdējo NVLink čipu paaudzi un NVLink Switch 7.2T. Jaunais NVSwitch čips piedāvā divvirziena joslas platuma 1,8 TB/s. Šis 50 miljardu tranzistoru čips arī tiek ražots, izmantojot TSMC 4NP tehnoloģiju.
Savienotājs gandrīz sasniedz Hopper H100 lielumu, kas liecina par to, cik svarīga kļuvusi savienošana pēc skaitļošanas jaudas un datu pārsūtīšanas ātruma pieauguma. Iepriekšējā paaudze atbalstīja tikai līdz 100 GB/s caurlaidībai. Jaunais NVSwitch nodrošina 18 reizes lielāku paātrinājumu salīdzinot ar H100 daudzmezglu savienojumu.
Katrs Blackwell grafiskais procesors ir aprīkots ar 18 NVLink piektās paaudzes savienojumiem. Tas ir astoņpadsmit reizes vairāk nekā tas bija pieejams H100. Katrs savienojums piedāvā 50 GB/s divvirziena joslas platumu vai 100 GB/s uz savienojumu. Ar šādu ātrumu var teikt, ka lielas GPU grupas var darboties tā, it kā tās būtu viens masveida GPU.
NVIDIA B200 NVL72
Jaunie čipi ar jaunu interfeisu tiek apvienoti serveros NVIDIA B200 NVL72. Būtībā tas ir pilnvērtīgs 1U serveru risinājums, kurā ir 18 serveri, katrs ar diviem GB200 superčipiem. Divi GPU B200 tiek pāri savienoti ar vienu CPU Grace, savukārt HG100 tehnoloģija izmantoja mazāku risinājumu - vienu CPU Grace kopā ar vienu GPU H100.
Katrs skaitļošanas mezgls GB200 NVL72 ir aprīkots ar diviem superčipiem GB200, tāpēc viena kaste satur divus procesorus Grace un četrus grafiskos procesorus B200 ar 80 petaflopsiem FP4 AI un 40 petaflopsiem FP8 AI. Tas ir 1U serveris ar šķidruma dzesēšanu, kas aizņem ievērojamu daļu no standarta 42 vienību vietā stāvā.
GB200 NVL72 papildus skaitļošanas paneļiem ar superčipiem būs arī NVLink slēdžu paneļi. Tas arī ir 1U skapju risinājums ar šķidruma dzesēšanu, ar diviem NVLink slēdžiem uz katras kastes un deviņiem tādām kastēm uz stāvu. Katra kaste nodrošina 14,4 TB/s kopējo caurlaidību.
Kopumā GB200 NVL72 ir 36 procesori Grace un 72 Blackwell grafiskie procesori ar 720 petaflopsiem FP8 un 1440 petaflopsiem FP4. Ar esošo 130 TB/s daudzmezglu caurlaidību NVL72 var apstrādāt līdz 27 triljoniem AI runas modelis. Pārējais skapji ir paredzēti tīkliem un citiem datu apstrādes centra elementiem.
Tiek prezentētas arī superdatori SuperPOD, kas apvieno daudz GB200. Pašlaik NVLink atbalsta līdz 576 GPU domēniem, jaunie DGX SuperPOD tiek skalēti tieši līdz šādam grafisko procesoru GB200 Blackwell skaitam. Katrs SuperPOD var ietilpt līdz astoņām sistēmām GB200 NVL72, kas atbilst 288 Grace procesoriem un 576 Blackwell grafiskajiem procesoriem B200.
Avots: Tom's Hardware
Komentāri (0)
Šobrīd nav neviena komentāra