AMD má oficiálně oznámit Nová generace grafického procesoru MI200 HPC s kódovým označením Aldebaran, který využívá 6nm architekturu CDNA 2 k poskytování šíleného výpočetního výkonu.
AMD představuje Instinct MI200, který pohání výpočetní výkon nové generace s prvním GPU 6nm MCM technologií a více než 95 výkonovými TFLOPs FP32
AMD je první společností, která oficiálně používá technologii MCM, a činí tak s hlavním produktem, Instinct MI200 s kódovým označením Aldebaran. AMD Aldebaran GPU přijde v různých tvarech a velikostech, ale všechny jsou založeny na zcela nové architektuře CDNA 2, která je nejpropracovanější z variant Vega. Některé z klíčových funkcí, než se pustíme do podrobností, jsou uvedeny níže:
- AMD CDNA 2. architektura – Druhá generace maticových jader urychluje operace matice FP64 a FP32 a poskytuje až 4krát vyšší teoretický výkon než FP64 oproti předchozí generaci GPU AMD.
- Vedoucí postavení v obalové technologii První víceblokový GPU v oboru s technologií 2,5D High Fanout Bridge (EFB) poskytuje 1,8x více jader a 2,7x vyšší šířku pásma paměti než předchozí generace AMD GPU a poskytuje nejlepší celkovou teoretickou šířku pásma paměti na trhu s 3,2 terabajty za sekundu.
- Technologie AMD Infinity Fabric 3. generace – Až 8 Infinity Fabric Links pro připojení AMD Instinct MI200 ke 3rd Gen EPYC CPU a další GPU v uzlu umožňují sjednocenou koherenci CPU/GPU paměti a maximalizují propustnost systému, což umožňuje snadnější škálování CPU kódů pro využití síly akcelerátorů.
Snímek grafického procesoru AMD Instinct MI200:
Uvnitř AMD Instinct MI200 je GPU Aldebaran, který obsahuje dvě matrice, sekundární a primární. Má dvě šablony, z nichž každá obsahuje 8 shader enginů pro celkem 16 SE. Každý engine Shader 16 obsahuje ovladač s plně modifikovaným FP64, krabicovým motorem FP32 a maticovým enginem druhé generace pro operace FP16 a BF16.
Každý blok jako takový se skládá ze 128 aritmetických jednotek nebo 8192 stream procesorů. To zaokrouhluje celkem 220 výpočetních jednotek nebo 14 080 stream procesorů pro celý čip. GPU Aldebaran je také poháněno novým rozhraním XGMI. Každý čip obsahuje VCN 2.6 engine a hlavní I/O řadič.
postavený na AMD CDNA 2. architekturaAkcelerátory AMD Instinct řady MI200 poskytují špičkový výkon aplikací pro širokou škálu pracovních zátěží HPC. The Akcelerátor AMD Instinct MI250X Poskytuje až 4,9krát lepší výkon než konkurenční akcelerátory HPC s duální přesností (FP64) a překračuje 380 teraflopů maximální teoretické poloviční přesnosti (FP16) pro pracovní zátěže s umělou inteligencí, což umožňuje rušivým metodám urychlit vyhledávání řízené daty.
Pokud jde o výkon, AMD nabízí několik zlepšení v benchmarku v segmentu HPC na řešení NVIDIA A100 s až trojnásobným zvýšením výkonu oproti AMG.
Pokud jde o dynamickou paměť, AMD použilo 8-kanálové rozhraní skládající se z 1024bitových rozhraní pro 8192bitové široké rozhraní sběrnice. Každé rozhraní může podporovat 2GB moduly HBM2e DRAM. To by nám mělo poskytnout až 16 GB kapacity paměti HBM2e na jeden zásobník, a protože je celkem osm zásobníků, celková kapacita bude 128 GB. To je o 48 GB více než u A100, který obsahuje 80 GB paměti HBM2e. Paměť bude nahrávat šílenou rychlostí 3,2 Gbps při plné šířce pásma 3,2 TB/s. To je o 1,2 TB/s větší šířka pásma než u A100 80 GB, který má 2 TB/s.
AMD Instinct MI200 bude pohánět tři superpočítače Tier 1 včetně Exascale v USA hraniční systém; Evropská unie před Exascale systém LUMI; petascal Austrálie Systém Setonix. Konkurence zahrnuje 80 GB A100, který poskytuje 19,5 TFLOPs z FP64, 156 TFLOPs z FP32 a 312 TFLOPs z FP16 výpočetního výkonu. Pravděpodobně však uslyšíme o GPU Hopper MCM od NVIDIA příští rok, takže v roce 2022 dojde k ostré konkurenci mezi těmito dvěma giganty GPU.
Akcelerátory AMD Radeon Instinct 2020
název metronomu | AMD Instinct MI300 | AMD Instinct MI250X | AMD Instinct MI250 | AMD Instinct MI100 | AMD Radeon Instinct MI60 | AMD Radeon Instinct MI50 | AMD Radeon Instinct MI25 | AMD Radeon Instinct MI8 | AMD Radeon Instinct MI6 |
---|---|---|---|---|---|---|---|---|---|
Architektura GPU | Bude oznámeno (CDNA 3) | Aldebaran (CDNA 2) | Aldebaran (CDNA 2) | Arcturus (CDNA 1) | Vega 20 | Vega 20 | Vega 10 | Fidži XT | Polaris 10 |
Uzel zpracování GPU | pokročilý procesní uzel | pokročilý procesní uzel | pokročilý procesní uzel | 7nm FinFET | 7nm FinFET | 7nm FinFET | 14nm FinFET | 28nm | 14nm FinFET |
GPU zemřít | 4 (miliony metrů krychlových)? | 2 (miliony metrů krychlových) | 2 (miliony metrů krychlových) | 1 (homogenní) | 1 (homogenní) | 1 (homogenní) | 1 (homogenní) | 1 (homogenní) | 1 (homogenní) |
jádra GPU | 28160? | 14 080 | 14 080? | 7680 | 4096 | 3840 | 4096 | 4096 | 2304 |
Rychlost hodin GPU | Bude oznámeno | 1700 MHz | ~1700 MHz | ~ 1500 MHz | 1800 MHz | 1725 MHz | 1500 MHz | 1000 MHz | 1237 MHz |
Účet FP16 حساب | Bude oznámeno | 383 nahoře | Bude oznámeno | 185 TFLOPs | 29,5 TFLOPs | 26,5 TFLOPs | 24,6 TFLOPs | 8,2 TFLOPs | 5,7 TFLOPs |
účet FP32 | Bude oznámeno | 95,8 TFLOPs | Bude oznámeno | 23,1 TFLOPs | 14,7 TFLOPs | 13,3 TFLOPs | 12,3 TFLOPs | 8,2 TFLOPs | 5,7 TFLOPs |
účet FP64 | Bude oznámeno | 47,9 TFLOPs | Bude oznámeno | 11,5 TFLOPs | 7,4 TFLOPs | 6,6 TFLOPs | 768 Gyflopů | 512 GFLOPs | 384 Gyflopů |
VRAM | Bude oznámeno | 128 GB HBM2e | 128 GB HBM2e | 32 GB HBM2 | 32 GB HBM2 | 16 GB HBM2 | 16 GB HBM2 | 4 GB HBM1 | 16 GB GDDR5 |
paměťové hodiny | Bude oznámeno | Bude oznámeno | Bude oznámeno | 1200 MHz | 1000 MHz | 1000 MHz | 945 MHz | 500 MHz | 1750 MHz |
Paměťová sběrnice | Bude oznámeno | 8192 bit | 8192 bit | 4096 bitová sběrnice | 4096 bitová sběrnice | 4096 bitová sběrnice | 2048bitový vektor | 4096 bitová sběrnice | 256bitová sběrnice |
Šířka pásma paměti | Bude oznámeno | ~2 TB/s? | ~2 TB/s? | 1,23 TB/s | 1 terabajt/sec | 1 terabajt/sec | 484 GB/s | 512 GB/s | 224 GB/s |
tvarový faktor | Bude oznámeno | Dvojitý slot, plná délka / OAM | Dvojitý slot, plná délka / OAM | Dvojitý rozparek, po celé délce | Dvojitý rozparek, po celé délce | Dvojitý rozparek, po celé délce | Dvojitý rozparek, po celé délce | Dvojitý rozparek, poloviční délka | Jeden otvor, po celé délce |
chlazení | Bude oznámeno | pasivní chlazení | pasivní chlazení | pasivní chlazení | pasivní chlazení | pasivní chlazení | pasivní chlazení | pasivní chlazení | pasivní chlazení |
TDP | Bude oznámeno | 500 wattů | Bude oznámeno | 300 wattů | 300 wattů | 300 wattů | 300 wattů | 175 W | 150 wattů |
GPU Aldebaran MI200 bude k dispozici ve třech konfiguracích, pouze OAM MI250 a MI250X a dvouslotové PCIe MI210. AMD sdílelo pouze úplné specifikace a výkonová čísla pro GPU řady MI250 HPC. MI250X nabízí 14 080 úplných konfigurací a nabízí 47,9, 95,7 a 383 TFLOP výkonu FP64/FP32/FP16, zatímco MI250 obsahuje 13 312 jader s 45 90,5 362,1 TFLOP výkonu FP64/FP3. Konfigurace paměti zůstává mezi konfiguracemi GPU stejná.
Balíček GPU AMD Instinct MI200:
„Přátelský průkopník popkultury. Hodně padá. Sociální média geek. Obecný fanatik do kávy. Televizní nadšenec. Potížista.“