NVIDIA H100とは?その性能やおすすめの利用シーンを解説【トゥモロー・ネット テックブログ】
昨今においては、競うようにAIの開発が進んでおり、AIを用いた事業を展開する企業が増えています。
AIの開発に欠かせない装置が「GPU」であり、その一つがNVIDIAが発表した「H100」です。H100 Tensor Core GPU(以下H100と省略)は、前世代のA100と比べ約6倍もの処理能力を有しています。
とは言え、「NVIDIA H100にはどのような性能なのか」「おすすめの活用シーンを知りたい」と考えるご担当者もいるのではないでしょうか。
そこで今回は、NVIDIA H100の概要から性能、またAI開発との関係についてを詳しく解説します。今後、ビジネスシーンで活用をお考えのご担当者は、ぜひ参考にしてください。
目次
NVIDIA H100とは
NVIDIA(エヌビディア)の H100 は、NVIDIA社によるイベント「GTC2022 Spring」で発表されました。
NVIDIA H100には、どのような特徴があるのでしょうか。
NVIDIAのH100は何がすごいのか
H100の処理性能は、前世代であるA100の約6倍にのぼります。A100ではFP16(16ビット浮動小数点演算)での処理を行っていましたが、H100では、新たにFP8(8ビット浮動小数点演算)の採用により、「4000TFLOPS」という高い演算性能を実現しました。
またH100は、新しいアーキテクチャ「Hopper(ホッパー)」を採用しており、前世代の「Ampere」アーキテクチャのGPUに比べ、AI(人工知能)の学習や推論における演算処理性能を高めています。
NVIDIA H100の性能について
NVIDIA H100には、NVLinkとPCIeの2種類があります。ノード全体で GPU ごとに通信を高速化するNVIDIA® NVLink® Switch System では、最大で256個ものH100の接続が可能で、劇的な高速化を実現しています。
専用の「Transformer Engine」の利用により、兆単位の言語モデルにおけるパラメーターの実装が可能です。
ここでは、H100の性能について詳しく解説します。
最大30倍のAI推論性能
現代において、企業によるAIの導入は主流となりつつあり、新しい時代に向けて組織を加速させるためのエンドツーエンドの「AI対応インフラストラクチャ」を必要としています。
H100では、複合的な技術革新により前世代と比べ言語モデルが30倍も高速化され「対話型AI」を可能としています。
また、DRAMはHBM2、メモリインターフェイスは6,144bit、トランジスタ数は540億とVoltaの2倍以上を誇り、メモリ容量は40GBを実現しています。
スペック表
NVIDIA H100 SXM5 | NVIDIA H100 PCIe | |
GPUダイコードネーム | GH100 | GH100 |
フォームファクター | SXM5 | PCIe Gen 5 |
GPUアーキテクチャ | NVIDIA Hopper | NVIDIA Hopper |
TPC | 66 | 57 |
SM | 132 | 114 |
FP32コア/GPU | 16,896 | 14,592 |
FP32コア/SM | 128 | 128 |
FP64コア/GPU(Tensorを含めない) | 8,448 | 7,296 |
FP64コア/SM (Tensorを含めない) | 64 | 64 |
INT32コア/GPU | 8,448 | 7,296 |
INT32コア/SM | 64 | 64 |
Tensorコア/GPU | 528 | 456 |
Tensorコア/SM | 4 | 4 |
GPUブースト時クロック | 調整中 | 調整中 |
最大TF32 Tensor TFLOPS※1 | 500/1,000*2 | 400/800*2 |
最大FP64 Tensor TFLOPS※1 | 60 | 48 |
最大FP8 Tensor TFLOPS FP16 Accumulate有効時※1 | 2,000/4,000*2 | 1600/3200*2 |
最大FP8 Tensor TFLOPS FP32 Accumulate有効時※1 | 2,000/4,000*2 | 1600/3200*2 |
最大FP16 Tensor TFLOPS FP16 Accumulate有効時※1 | 1,000/2,000*2 | 800/1600*2 |
最大FP16 Tensor TFLOPS FP32 Accumulate有効時※1 | 1,000/2,000*2 | 800/1600*2 |
最大INT8 Tensor TOPS※1 | 2,000/4,000*2 | 1,600/3,200*2 |
最大INT32 TOPS※1 | 30 | 24 |
最大BF16 TFLOPS (Tensor未使用時)※1 | 120 | 96 |
最大FP16 TFLOPS (Tensor未使用時)※1 | 120 | 96 |
最大FP32 TFLOPS (Tensor未使用時)※1 | 60 | 48 |
最大FP64 TFLOPS (Tensor未使用時)※1 | 30 | 24 |
メモリ容量 | 80GB | 80GB |
メモリインターフェース | HBM3(5120-bit) | HBM2e(5120-bit) |
メモリ帯域幅 | 3,000GB/s | 2,000GB/s |
メモリデータレート | 調整中 | 調整中 |
シェアードメモリサイズ/SM | 最大228KBに設定可能 | 最大228 KBに設定可能 |
テクスチャユニット | 528 | 456 |
L2キャッシュ(ダイ全体) | 50MB | 50MB |
レジスタファイルサイズ/GPU | 33,792KB | 29,184KB |
レジスタファイルサイズ/SM | 256KB | 256KB |
TDP*1 | 700W | 350W |
※2:スパース性を利用した場合です。
NVIDIA H100のおすすめの活用シーン
NVIDIA H100は、GPUとして初めて「コンフィデンシャルコンピューティング」に対応しています。例えば、医療データなどの重要な個人情報においても、高いプライバシーへ配慮したデータ保護が可能です。
またそれだけでなく、H100はAIの学習へ活用することも可能です。
生成AIやLLM(大規模言語モデル)などの、現代において人気を集める「推論AIワークロード」、HPC(ハイパフォーマンス コンピューティング )、データ分析など、大規模な計算に向けた設計となっています。
研究や開発において多大なる高速化の実現やパフォーマンスの向上だけでなく、コスト削減にも貢献できる点は、活用する上で大きなメリットとなるでしょう。
以下では、GPUとAIとの関係について見ていきます。
AI開発とGPUの関係
AI開発においてGPUが活用される理由として、並列計算能力の高さが挙げられます。
GPUとは(Graphics Processing Unit)の略語であり、本来は画像処理を行うものを意味しています。元々GPUは、パソコンのグラフィックボードなどに使用されていました。
AIは、多大なる演算処理が必要な技術であるため、高速処理が可能なチップを必要とします。CPUほど複雑で多くの処理はできないGPUですが、並列処理を得意としているので、似たような計算を高速でくり返すことが可能です。
GPUが用いられるAI分野とは
AIの開発において利用されているGPUですが、具体的にどのようなAIの分野で用いられているのでしょうか。
例えばディープラーニングは、ニューラルネットワークという「人の神経細胞の仕組み」へ着目した計算モデルをベースとした技術です。
ディープラーニングの基本的な仕組みは、データ出力を行う出力層とデータの入力を行う入力層の間に、データの特徴量の抽出や保持をする中間層を配置します。さらに、それぞれの層が連結することで難解な判断を可能とするものです。
行列計算を主としたディープラーニングには、並列計算能力が高いGPUが向いているため、画像処理に限らず言語処理や音声処理にもGPUが使用されています。
その計算能力をさらに幅広く活用できるようにした「GPGPU(General Purpose Computing on GPU)」があります。GPGPUは、画像処理のほか、高い並列計算能力を必要とされる分野で活用されています。
まとめ
NVIDIA H100の処理性能は、前世代であるA100の約6倍にのぼります。新たにFP8(8ビット浮動小数点演算)を採用したことで、高い演算性能を実現しています。
その高い演算性能からAI開発にも活用され、ディープラーニングなどのAI分野で利用されています。
トゥモロー・ネットでご支援できること
トゥモロー・ネットでは、NVIDIAのパートナーとしてH100をはじめとするGPU製品の販売や導入サポートを実施しています。きめ細やかな提案、構築、導入を提供いたしますので、GPUをお探しの方はぜひお問合せください。
お問合せ先
関連ページ
クラウドコンピューティングとは?仕組みやメリット・デメリットを解説
この記事の筆者
株式会社トゥモロー・ネット
クラウドソリューション本部
トゥモロー・ネットは「ITをもとに楽しい未来へつなごう」という経営理念のもと、感動や喜びのある、より良い社会へと導く企業を目指し、最先端のテクノロジーとサステナブルなインフラを提供しています。設立以来培ってきたハードウェア・ソフトウェア製造・販売、運用、保守などインフラに関わる豊富な実績と近年注力するAIサービスのコンサルティング、開発、運用、サポートにより、国内システムインテグレーション市場においてユニークなポジションを確立しています。
インフラからAIサービスまで包括的に提供することで、システム全体の柔軟性、ユーザビリティ、コストの最適化、パフォーマンス向上など、お客様の細かなニーズに沿った提案を行っています。
カテゴリー
タグ
- #ストレージ(ソフト)
- #VMware
- #Veeam Backup & Replication
- #AIインフラ
- #AMD EPYC
- #スケールアウトNAS
- #NVIDIA H200
- #NIC
- #LLM
- #AI
- #エンタープライズ
- #NVIDIA
- #NVMe
- #画像生成AI
- #コア
- #スケールアップ
- #NVIDIA A800
- #Ethernet
- #水冷サーバー
- #CPU
- #GPU
- #グリーンコンピューティング
- #SSD
- #NVIDIA H100
- #スレッド
- #スケールアウト
- #NVIDIA L40
- #Network
- #NVIDIA RTX 6000 Ada
- #Supermicro
- #GPUサーバー
- #グリーンIT
- #SAS SSD
- #ソフトウェア・デファインド・ストレージ
- #クロック周波数
- #Qumulo
- #SXM
- #InfiniBand
- #NVIDIA RTX A6000
- #Intel
- #マイグレーション
- #空冷
- #SATA SSD
- #Seagate
- #ECCメモリ
- #RedHat
- #PCle
- #NVIDIA MIG
- #量子コンピューター
- #AMD
- #レガシーアプリ
- #水冷
- #NVMe SSD
- #OSNEXUS
- #PCIレーン数
- #人工知能
- #SDS
- #DNN
- #QPU
- #サーバー
- #Windowsアップデート
- #Numecent
- #バックアップ
- #シーゲイト
- #L2 Cache
- #ChatGPT
- #水冷技術
- #NVIDIA Hopper アーキテクチャ
- #NVIDIA B200
- #朝日新聞
- #AVD
- #Azure Virtual Desktop
- #エンタープライズバックアップソリューション
- #EXOS AP
- #ストレージグリッド
- #コンテナ化
- #L4
- #NVLink
- #ProphetStor
- #ICXセンター
- #クラウドVDI
- #DX
- #Veritas NetBackup/BackupExec
- #EXOS CORVAULT
- #セキュリティ
- #OS
- #NVIDIA L4
- #NVSwitch
- #Windows10サポート終了
- #Windows10リプレース
- #アプリケーション
- #Acronis Backup
- #QuantaStor
- #SaaS
- #Docker
- #冷却機能
- #GPUアーキテクチャ
- #Windows Update
- #マイクロソフト
- #ランサムウェア
- #IBM Spectrum Protect
- #VMware
- #PaaS
- #Kubernetes
- #アプリケーション仮想化
- #vGPU
- #Cloudpaging
- #Intel筐体
- #サイバー攻撃
- #ArcServe
- #vSAN
- #仮想化
- #ITインフラ
- #アプリ仮想化
- #データセンター
- #ソフトウエア・ディファインド・ストレージ
- #AMD筐体
- #情報セキュリティ
- #NAS
- #HCI
- #IaaS
- #NVIDIA A100
- #Citrix
- #オンプレミス
- #ストレージ
- #VMware Explore
- #マルウェア
- #Network Attached Storage
- #Hyperconverged Infrastructure
- #パブリッククラウド
- #レガシーアプリケーション
- #ThinApp
- #エッジコンピューティング
- #ソフトウェア
- #NVIDIA AI Enterprise
- #ExaGrid
- #AI Enterprise
- #仮想化ストレージソリューション
- #ハイブリッドクラウド
- #NVIDIA L40S
- #App-V
- #ニューラルネットワーク
- #ストレージ(ハード)
- #VMware Tanzu
- #Veeam
- #NVAIE
- #Intel Xeon
- #マルチクラウド
- #NVIDIA A40
- #Microsoft Application Virtualization
- #ディープラーニング
アーカイブ
- 2024年11月 (6)
- 2024年10月 (15)
- 2024年9月 (10)
- 2024年8月 (10)
- 2024年7月 (10)
- 2024年6月 (11)
- 2024年5月 (10)
- 2024年4月 (10)
- 2024年3月 (8)
- 2024年2月 (9)
- 2024年1月 (8)
- 2023年12月 (11)
- 2023年11月 (8)
- 2023年10月 (14)
- 2023年9月 (9)
- 2023年8月 (8)
- 2023年7月 (11)
- 2023年6月 (3)
- 2023年5月 (1)
- 2023年4月 (6)
- 2023年3月 (1)
- 2023年2月 (6)
- 2023年1月 (1)
- 2022年12月 (4)
- 2022年11月 (4)
- 2022年10月 (4)
- 2022年9月 (3)
- 2022年8月 (4)
- 2022年6月 (5)
- 2022年5月 (3)
- 2022年4月 (1)
- 2022年3月 (4)
- 2022年1月 (1)
- 2021年11月 (3)
- 2021年10月 (2)
- 2021年7月 (2)