NVIDIA Ampere A100 250W TDP GPU na PCIe 4.0, narejen za umetno inteligenco, podatkovne znanosti in superračunalništvo, predstavljen z obljubljeno 90-odstotno zmogljivostjo 400W modela

Strojna oprema / NVIDIA Ampere A100 250W TDP GPU na PCIe 4.0, narejen za umetno inteligenco, podatkovne znanosti in superračunalništvo, predstavljen z obljubljeno 90-odstotno zmogljivostjo 400W modela 2 minuti branja

Nvidia



NVIDIA je uradno predstavila A100, PCIe 4.0 združljiv grafični procesor, ki temelji na arhitekturi Ampere naslednje generacije. Čeprav ima nižji TDP profil TDP, NVIDIA obljublja, da bo grafični procesor PCIe 4.0 Ampere A100 lahko ponudil do 90 odstotkov zmogljivosti celotnega 400 W A100 HGX GPU. Tretja različica naraščajoče družine grafičnih procesorjev Ampere A100, A100 PCIe, je namenjena strežnikom z umetno inteligenco (AI), Data Science in Supercomputing gručami.

NVIDIA je razkrila različico PCI-Express 4.0 grafičnega procesorja A100. GPU temelji na 7-nanometrski mikroarhitekturi Ampere. Poleg tega je podjetje napovedalo tudi nekaj sistemov, ki jih poganja A100, vodilnih proizvajalcev strežnikov, med njimi Asus, Dell, Cisco, Lenovo in druge. GPU pospeševalnik A100 PCIe 4.0 z močjo 250 W je precej podoben različici TDP s celotno močjo 400 W, NVIDIA pa obljublja tudi skoraj enako zmogljivost kljub občutnemu padcu profila TDP.



Grafični procesor NVIDIA A100 Ampere v obliki PCIe 4.0 z enako konfiguracijo grafičnega procesorja A100 HGX 400 W, vendar pri 250 W:

NVIDIA je objavila svoj GPI pospeševalnik PCIe 4.0 A100 PCIe. GPU Ampere je na voljo za raznolike primere industrijske uporabe s sistemi, ki segajo od enega GPU A100 PCIe do strežnikov, ki hkrati uporabljajo dve kartici prek 12 kanalov NVLINK, ki zagotavljajo skupno 600 GB / s pasovne širine medsebojnih povezav. GPU pospeševalnik TDP A100 PCIe 250 W se glede na konfiguracijo jedra v primerjavi z 400 W A100 HGX GPU ne spremeni veliko.



Grafični procesor GA100 ima specifikacije različice 400 W A100 HGX z 6912 jedri CUDA, razporejenimi v 108 SM enot, 432 Tensor jeder in 40 GB pomnilnika HBM2, ki zagotavlja enako pasovno širino pomnilnika 1,55 TB / s (zaokroženo na 1,6 TB / s). Vendar pa je uvajanje paketa GPU na Standard PCIe 4.0 imel lastno pomanjkljivost, da je znatno zmanjšal TDP. To naj bi pomenilo od 10 do 50 odstotkov kazni za uspešnost na podlagi delovne obremenitve. Poleg tega je varianta 250 W TDP grafičnega procesorja A100 bolj primerna za kratke rafale in ne za trajne obremenitve.

Grafični procesor NVIDIA A100 Ampere v zmogljivosti PCIe 4.0:

Zaradi znatnega zmanjšanja profila TDP bi lahko domnevali, da ima kartica nižje ure, da nadomesti manjši vhod TDP. Meritve zmogljivosti, ki jih je izdala NVIDIA, so resnično presenetljive, saj se povsem približajo različici TDP z močjo 400 W. Učinkovitost FP64 je še vedno ocenjena na 9,7 / 19,5 TFLOP-ov, zmogljivost FP32 je ocenjena na 19,5 / 156/312 TFLOP-ov (Sparsity), zmogljivost FP16 je ocenjena na 312/624 TFLOP-ov (Sparsity), INT8 pa na 624/1248 TOP-ov ( Redkost).



Preprosta matematika kaže, NVIDIA pa zagotavlja, da lahko grafični procesor PCIe 4.0 250W A100, ki temelji na Ampereju, zagotovi 90 odstotkov zmogljivosti kartice A100 HGX (400 W) v najboljših strežniških aplikacijah. To je upravičeno, ker traja manj časa, da nova različica izpolni zgoraj navedene naloge. Vendar bi morale biti številke veljavne le za kratke intervale. V zapletenih situacijah, ki zahtevajo trajne zmogljivosti GPU, lahko 250W PCIe 4.0 GPU doseže zmogljivosti 400 W A100 HGX GPU od 90 do 50 odstotkov.

Mikroarhitektura Ampere bo zagotovo koristila novemu A100. NVIDIA obljublja vsaj 20-kratno povečanje zmogljivosti v primerjavi s predhodnikom, ki temelji na Volti. GPI PCIe 4.0 A100 ima večstopenjsko tehnologijo GPU. To pomeni, da je mogoče en sam A100 razdeliti na kar sedem ločenih grafičnih procesorjev za obdelavo različnih računalniških nalog. Čeprav to povečuje segmentacijo, obstaja NVLink tretje generacije, ki omogoča povezovanje več grafičnih procesorjev v en velikanski GPU.

Oznake nvidia