Co je to Hopper GPU?

Obsah

Grafické procesory Hopper představují nejnovější generaci vysoce výkonných grafických procesorů společnosti NVIDIA, které jsou speciálně navrženy pro umělou inteligenci a vysoce výkonné výpočty (HPC). Díky špičkové architektuře s pokročilými jádry Tensor integrují několik inovativních technologií, které zajišťují maximální účinnost. Grafické procesory Hopper jsou ideální pro širokou škálu úloh a podporují AI inferenci, trénink hlubokého učení, generativní AI a další.

Jaká je architektura grafických procesorů NVIDIA Hopper?

Název „Hopper GPU“ je odvozen od architektury Hopper, což je mikroarchitektura GPU, která tvoří základ vysoce výkonných grafických procesorů a je optimalizována pro pracovní zatížení AI a aplikace HPC. GPU Hopper jsou vyráběny společností TSMC pomocí 4nanometrového procesu a mají více než 80 miliard tranzistorů, což z nich činí jedny z nejmodernějších grafických karet dostupných na trhu.

S architekturou Hopper kombinuje NVIDIA nejnovější generaci jader Tensor s pěti průlomovými inovacemi: transformátorovým enginem, systémy přepínačů NVLink/NVSwitch/NVLink, důvěrným výpočtem, grafickými procesory druhé generace s více instancemi (MIG) a instrukcemi DPX. Díky těmto technologiím dosahují GPU Hopper až 30násobného zrychlení AI inferencí oproti předchozí generaci (na základě chatbota NVIDIA Megatron 530B – nejkomplexnějšího generativního jazykového modelu na světě).

Jaké jsou inovativní vlastnosti grafických karet Hopper?

Grafické procesory Hopper mají několik nových funkcí, které pomáhají zlepšit výkon, efektivitu a škálovatelnost. Níže představujeme nejdůležitější inovace:

Transformer engine: S pomocí transformer engine jsou GPU Hopper schopny trénovat modely AI až devětkrát rychleji. U inferenčních úkolů v oblasti jazykových modelů dosahují GPU až 30násobného zrychlení oproti předchozí generaci.
Systém přepínačů NVLink: Čtvrtá generace NVLink poskytuje obousměrnou šířku pásma GPU 900 GB/s, zatímco NVSwitch zajišťuje lepší škálovatelnost klastrů H200. To zajišťuje, že modely AI s biliony parametrů mohou být zpracovávány efektivně.
Důvěrné výpočty: Architektura Hopper zajišťuje, že vaše data, modely AI a algoritmy jsou chráněny i během zpracování.
Multi-instance GPU (MIG) 2.0: Druhá generace technologie MIG umožňuje rozdělit jeden GPU Hopper až na sedm izolovaných instancí. To umožňuje několika lidem zpracovávat různé pracovní úlohy současně, aniž by se navzájem rušili.
Instrukce DPX: Instrukce DPX umožňují dynamicky programované algoritmy vypočítat až sedmkrát rychleji než u GPU architektury Ampere.

Pro jaké použití jsou GPU Hopper vhodné?

Grafické procesory NVIDIA založené na architektuře Hopper jsou navrženy pro širokou škálu vysoce výkonných úloh. Hlavní oblasti použití grafických procesorů Hopper jsou: ¬

Úkoly inferenčního zpracování: GPU patří mezi špičková řešení pro produktivní využití inferenčního zpracování AI. Ať už se jedná o doporučovací systémy v e-commerce, lékařskou diagnostiku nebo predikce v reálném čase pro autonomní řízení, GPU Hopper dokážou rychle a efektivně zpracovat obrovské množství dat.
Generativní AI: Špičkové GPU poskytují potřebný výpočetní výkon pro trénování a spouštění nástrojů s generativní AI. Paralelní zpracování umožňuje efektivnější výpočty pro kreativní úkoly, jako je generování textu, obrázků a videa.
Trénink hlubokého učení: Díky svému vysokému výpočetnímu výkonu jsou GPU Hopper ideální pro trénink velkých neuronových sítí. Architektura Hopper výrazně zkracuje dobu tréninku modelů AI.
Konverzační AI: GPU Hopper jsou optimalizovány pro zpracování přirozeného jazyka (NLP) a jsou ideální pro jazykové systémy založené na AI, jako jsou virtuální asistenti a chatboty AI. Urychlují zpracování velkých modelů AI a zajišťují responzivní interakci, kterou lze hladce integrovat do obchodních procesů, jako je například podpora.
Analýza dat a big data: GPU Hopper zpracovávají obrovské množství dat vysokou rychlostí a urychlují složité výpočty díky masivnímu paralelnímu zpracování. To umožňuje společnostem rychleji vyhodnocovat big data, aby mohly vytvářet prognózy a přijímat správná opatření.
Věda a výzkum: Jelikož jsou GPU navrženy pro aplikace HPC, jsou ideální pro vysoce komplexní simulace a výpočty. GPU Hopper se používají například v astrofyzice, modelování klimatu a výpočetní chemii.

Aktuální modely od společnosti NVIDIA

S uvedením modelů NVIDIA H100 a NVIDIA H200 na trh představila americká společnost dvě grafické karty Hopper. Naproti tomu model NVIDIA A30 je stále založen na předchozí architektuře Ampere. Technicky vzato není model H200 zcela novým modelem, ale spíše vylepšenou verzí modelu H100. Následující přehled zdůrazňuje klíčové rozdíly mezi těmito dvěma grafickými kartami:

Paměť a šířka pásma: Zatímco NVIDIA H100 je vybavena 80 GB pamětí HBM3, GPU H200 má paměť HBM3e s kapacitou 141 GB. H200 je také jasně vpředu, pokud jde o šířku pásma paměti, s 4,8 TB/s ve srovnání s 2 TB/s u H100.
Výkon pro AI inferenci: Ve srovnání s tím poskytuje NVIDIA H200 dvojnásobný inferenční výkon pro modely jako LLaMA 2-70 B. To umožňuje nejen rychlejší zpracování, ale také efektivní škálování.
HPC aplikace a vědecké výpočty: H100 již nabízí prvotřídní úroveň výkonu pro složité výpočty, kterou H200 ještě překonává. Rychlost inferenčních výpočtů je až dvakrát vyšší, výkon HPC je přibližně o 20 procent vyšší.