Objavljen Radeon Open Compute “ROCm” Stack v3.1 z RAS za Vega 7nm, podporo SLURM za boljše upravljanje virov, Navi pa še vedno manjka

Strojna oprema / Objavljen Radeon Open Compute “ROCm” Stack v3.1 z RAS za Vega 7nm, podporo SLURM za boljše upravljanje virov, Navi pa še vedno manjka 2 minuti branja

AMD Radeon



Zdaj je nova različica Radeon Open Compute ali “ROCm” na voljo za prenos. Radeon Open Compute v3.1 prinaša kar nekaj funkcij, nenavadno pa je, da še vedno manjka podpora za AMD Navi in ​​GFX10.

ROCm, najbolj razširjena univerzalna platforma za GPU-pospešeno računalništvo, je zdaj na različici 3.1. Najnovejša posodobitev modularne platforme, ki prodajalcem strojne opreme omogoča izdelavo gonilnikov, ki podpirajo okvir ROCm, vključuje nekatere težko pričakovane funkcije, kot je podpora RAS za 7nm Vega in podpora SLURM za grafične procesorje AMD. Vendar iz še neznanih razlogov ROCm še vedno nima popolne podpore za naslednjo generacijo arhitekture AMD Navi.



Kaj je novega v Radeon ROCm v3.1:

Največja in najbolj očitna sprememba v novi namestitvi Radeon ROCm v3.1 je v strukturi imenika za namestitev ROCm. Nova namestitev orodja ROCm namesti pakete v / opt / rocm- mapo. Prej so bili paketi orodij ROCm nameščeni v / opt / rocm mapo.



Nova različica ROCm je izboljšala podporo za zanesljivost, dostopnost in servisiranje (RAS) za Vega 7nm grafične procesorje. To 7nm delo Vega je verjetno pod drobnogledom še vedno za 'Arcturus' na osnovi vege računalniški pospeševalnik, ki prihaja letos. Podpora vključuje:



  • UMC RAS ​​- HBM ECC (nepopravljiva vbrizgavanje napak), umik strani, ponastavitev RAS prek GPU (BACO)
  • GFX RAS - GFX, MMHUB ECC (nepopravljiva vbrizgavanje napak), ponastavitev RAS prek GPU (BACO)
  • PCIE RAS - PCIE_BIF ECC (nepopravljivo vbrizgavanje napak), obnovitev RAS prek GPU (BACO) ponastavitev

Radeon ROCm v3.1 dobi tudi podporo SLURM za grafične procesorje AMD. SLURM ali Simple Linux Utility za upravljanje virov je eden izmed najbolj zaželenih in zlahka uporabljenih sistemov za upravljanje gruč in razporejanje delovnih mest za grozde Linux. SLURM je zaželen, ker je odprtokoden, odporen na napake in zelo razširljiv.

Ta sistem lahko zdaj dobro komunicira z grafičnimi procesorji AMD. Najnovejša različica SLURM 20.02.0 vključuje AMD vtičnike, ki SLURM-u omogočajo samodejno zaznavanje in konfiguriranje grafičnih procesorjev AMD. Prav tako zbira in poroča o porabi energije grafičnih čipov. Podpora za SLURM je koristen dodatek glede na vse večje število uvedb superračunalnikov z grafičnimi procesorji Radeon in drugimi večjimi grozdi AMD GPU.

Kljub vključitvi več funkcij v ROCm še vedno ni znakov podpore za GFX10 / Navi. The Stran GitHub za ROCm je bil posodobljen tako, da odraža vse spremembe, opombe o namestitvi in ​​znane težave.



Oznake amd