NVIDIA H100 je špičkový grafický procesor navržený speciálně pro aplikace umělé inteligence, hlubokého učení a HPC. Grafický procesor H100 je založen na inovativní architektuře Hopper a využívá výkonné jádra Tensor čtvrté generace, které zajišťují výjimečný výkon. Díky své enormní výpočetní kapacitě je NVIDIA H100 ideální pro trénování složitých neuronových sítí, datově náročných cloudových úloh a složitých HPC simulací.

Jaké jsou vlastnosti NVIDIA H100?

NVIDIA H100 nabízí výjimečnou úroveň výkonu založenou na nové architektuře Hopper. Ta kombinuje technologii Tensor Core s transformátorem, aby poskytla větší výpočetní výkon a výrazně urychlila trénování modelů umělé inteligence. NVIDIA nabízí GPU H100 ve dvou variantách, a to H100 SXM a H100 NVL.

Obě verze se liší svou formou, výkonem, šířkou paměťové sběrnice a konektivitou. H100 SXM je primárně určen pro použití ve vysoce hustých serverech a hyperscale prostředích. H100 NVL byl naproti tomu navržen pro PCIe sloty, což usnadňuje integraci GPU do stávajících serverových struktur. Následující tabulka poskytuje podrobný přehled výkonnostních vlastností obou variant NVIDIA H100:

Výkonnostní vlastnost NVIDIA H100 SXM NVIDIA H100 NVL
FP64 34 TFLOPS 30 TFLOPS
FP64 Tensor Core 67 TFLOPS 60 TFLOPS
FP32 67 TFLOPS 60 TFLOPS
TF32 Tensor Core 989 TFLOPS 835 TFLOPS
BFLOAT16 Tensor Core 1 979 TFLOPS 1 671 TFLOPS
FP16 Tensor Core 1 979 TFLOPS 1 671 TFLOPS
FP8 Tensor Core 3 958 TFLOPS 3 341 TFLOPS
INT8 Tensor Core 3 958 TOPS 3 341 TOPS
Paměť GPU 80 GB 94 GB
Šířka pásma paměti GPU 3,35 TB/s 3,9 TB/s
Dekodér 7 NVDEC, 7 JPEG 7 NVDEC, 7 JPEG
Maximální tepelný výkon (TDP) 700 W (konfigurovatelné) 350–400 W (konfigurovatelné)
Multi-instance GPU (MIG) Až 7 MIG s 10 GB každý Až 7 MIG s 12 GB každý
Formát SXM PCIe se dvěma sloty a vzduchovým chlazením
Rozhraní NVIDIA NVLink 900 GB/s, PCIe Gen5: 120 GB/s NVIDIA NVLink: 600 GB/s, PCIe Gen5 128 GB/s
Možnosti serveru Partneři NVIDIA HGX H100 a systémy certifikované společností NVIDIA se 4 nebo 8 GPU, NVIDIA DGX H100 s 8 GPU Partneři a systémy certifikované společností NVIDIA s až 8 GPU
NVIDIA AI pro podniky Doplněk Včetně
Poznámka

TFLOPS (TeraFloatingPoint OperationsPerSecond) je jednotka pro popis rychlosti zpracování počítačů (plovoucí desetinná čárka). Jeden TFLOPS odpovídá jedné bilionu výpočtů za sekundu. Totéž platí pro jednotku TOPS (TeraOperationsPerSecond) – s tím rozdílem, že zde jsou zastoupeny operace s celými čísly.

Jaké jsou výhody a nevýhody NVIDIA H100?

NVIDIA H100 je jedním z nejvýkonnějších grafických procesorů na trhu a je vybaven řadou pokročilých technologií a funkcí. Mezi nejdůležitější výhody grafického procesoru H100 patří:

  • Velmi vysoký výpočetní výkon: H100 nabízí obrovský výkon FP8 a FP16 Tensor Core, díky čemuž je ideální pro složité, datově náročné úlohy, jako jsou velké jazykové modely (LLM). Kombinace Tensor Core čtvrté generace a transformátorového enginu může výrazně zvýšit efektivitu operací AI.
  • NVLink a NVSwitch: NVIDIA H100 podporuje NVLink čtvrté generace, který umožňuje propojení více serverových GPU s obousměrnou šířkou pásma 900 GB/s. Díky NVSwitch je také možné flexibilně škálovat odpovídající clustery.
  • Multi-instance GPU (MIG): GPU lze rozdělit až na sedm nezávislých instancí GPU, což umožňuje současné provádění více úloh s vyhrazenými zdroji. To zvyšuje flexibilitu a efektivitu ve sdílených výpočetních prostředích.
  • Důvěrné výpočty: Díky integrované bezpečnostní funkci je důvěrnost a integrita dat chráněna po celou dobu trvání úlohy.
  • Paměť HBM3 a podpora PCIe Gen5: S až 94 GB paměti HBM3 a šířkou pásma až 3,9 TB/s nabízí NVIDIA H100 jedno z nejvýkonnějších paměťových řešení pro datově náročné pracovní úlohy. V kombinaci s PCIe Gen5 umožňuje velmi rychlý přenos dat.

To se však ukazuje jako nevýhoda, protože vysoký výkon NVIDIA H100 se odráží také v ceně. V závislosti na verzi stojí GPU mezi 25 000 a 35 000 librami. Instance H100 jsou proto také poměrně drahé v cloudových prostředích. Další nevýhodou je omezená dostupnost. Vzhledem k vysoké poptávce dochází vždy k nedostatku dodávek a dlouhým čekacím dobám.

Pro jaké aplikace je GPU NVIDIA H100 nejvhodnější?

Grafický procesor NVIDIA GPU H100 byl speciálně vyvinut pro výpočetně náročné úlohy a je obzvláště vhodný pro náročné aplikace v oblasti umělé inteligence a vysokovýkonného výpočtu (HPC). Následující přehled ukazuje klíčové oblasti použití grafického procesoru H100:

  • Trénování velkých modelů AI: Díky svému vysokému výpočetnímu výkonu GPU výrazně urychluje trénování modelů složitých neuronových sítí a velkých jazykových modelů, jako jsou GPT nebo LLaMA.
  • Inference AI v reálném čase: H100 dokáže spouštět předem trénované modely AI nejvyšší rychlostí, což je výhodou v oblastech, jako je zpracování řeči a rozpoznávání obrazu.
  • Cloudová a datová centra: GPU tvoří základ mnoha GPU serverů, protože poskytují výpočetní výkon potřebný pro komplexní pracovní zatížení.
  • Vysoce výkonné výpočty (HPC): Vědecké výpočty a simulace těží z vysokého výkonu FP64 grafických procesorů H100.
  • Generativní AI: NVIDIA H100 je ideální pro generování textu, obrazu a videa pomocí AI modelů. GPU umožňuje rychlé a efektivní zpracování velkých datových sad potřebných pro generativní AI.
  • Analýza dat: GPU Hopper podporují společnosti v různých odvětvích, jako je logistika a finance, při odvozování přesných prognóz a předpovědí z velkých objemů dat.

Jaké jsou možné alternativy k GPU H100?

Ačkoli NVIDIA H100 je jedním z nejvýkonnějších grafických procesorů pro AI a HPC, v závislosti na konkrétním použití a rozpočtu mohou být k dispozici alternativní řešení. Například z důvodu vyšší nákladové efektivity. Mezi možné alternativy patří mimo jiné:

  • NVIDIA A100: Předchozí model také nabízí solidní výkon pro trénink AI, inferenci a HPC, ale je levnější.
  • NVIDIA A30: Model A30 kombinuje vysoký výkon s dostupnou cenou.
  • NVIDIA H200: Model H200 je mírně vylepšenou verzí modelu NVIDIA H100, která má ještě vyšší šířku pásma paměti.
  • Intel Gaudi 3: Tento akcelerátor AI poskytuje vysoký výkon pro AI inferenci.
Poznámka

V našem článku, ve kterém porovnáváme serverové GPU, představujeme podrobněji nejčastěji používané grafické procesory.

Přejít do hlavního menu