Volta(マイクロアーキテクチャ)

エヌビディア・ボルタ
発売日2017年12月7日
コードネームボルタ
製造プロセスTSMC 12 nm ( FinFET )
カード
愛好家
  • テスラV100
  • テスラ V100S PCIe
  • タイタンV
  • Titan V CEOエディション
  • クアドロ GV100
歴史
前任者パスカル
変異体チューリング(消費者、専門家)
後継Ampere(コンシューマー、プロフェッショナル)
サポート状況
2025年10月までの限定サポート、
2028年10月までのセキュリティアップデート[1]
建築家の名付け親、アレッサンドロ・ボルタの絵画

VoltaはPascalの後継としてNvidiaが開発したGPUマイクロアーキテクチャコードネームであり商標ではありません[2]。2013年3月にロードマップ上で初めて発表されましたが[3] 、最初の製品が発表されたのは2017年5月でした。[4]このアーキテクチャは、18~19世紀イタリアの化学者で物理学者のアレッサンドロ・ボルタにちなんで名付けられました。これは、通常のCUDAコアよりも優れたディープラーニング性能を持つ特別に設計されたコアであるTensorコアを搭載したNvidiaの最初のチップでした。[5]このアーキテクチャはTSMC12nm FinFETプロセスで製造されています。AmpereマイクロアーキテクチャはVoltaの後継です。

Voltaを採用した最初のグラフィックカードは、データセンター向けTesla V100で、例えばNvidia DGX-1システムの一部として使用されました[4]また、Quadro GV100やTitan Vにも採用されています。Voltaをベースにした主流のGeForceグラフィックカードはありませんでした。

2度のUSPTO審理を経て[6] [7]、2023年7月3日、NVIDIAは人工知能分野におけるVolta商標出願を棄却されました。Volta商標[8]の所有者は、ロボットおよび無人車両向けのAIおよび視覚アルゴリズムを専門とするVolta Robotsのままです。

詳細

Volta アーキテクチャのアーキテクチャ上の改善点は次のとおりです。

  • CUDAコンピューティング機能 7.0
    • 整数演算と浮動小数点演算の同時実行
  • TSMCの12nm FinFETプロセス[9] では、211億個のトランジスタが実現可能となる[10]
  • 高帯域幅メモリ2(HBM2)[9] [11]
  • NVLink 2.0:CPUとGPU間、および複数のGPU間の高帯域幅バス。PCI Expressよりもはるかに高速な転送速度を実現し、レーンあたり25 Gbit/sの転送速度が期待できる。[12](Titan Vでは無効)
  • テンソルコア:テンソルコアは、2つの4×4 FP16行列を乗算し、その結果に3つ目のFP16またはFP32行列を融合乗算加算演算を用いて加算し、オプションでFP16結果に降格可能なFP32結果を得るユニットです。[13]テンソルコアは、ニューラルネットワークのトレーニングを高速化することを目的としています。[13] Voltaのテンソルコアは第1世代であり、Ampereは第3世代のテンソルコアです。[14] [15]
  • PureVideo Feature Set I ハードウェアビデオデコード

計算能力の比較:GP100 vs GV100 vs GA100 [16]

GPU機能エヌビディア テスラ P100エヌビディア テスラ V100エヌビディアA100
GPUコードネームGP100GV100GA100
GPUアーキテクチャエヌビディア パスカルエヌビディア・ボルタエヌビディア アンペア
コンピューティング能力6.07.08.0
糸/経糸323232
最大ワープ / SM646464
最大スレッド数 / SM204820482048
最大スレッドブロック数 / SM323232
最大32ビットレジスタ/SM655366553665536
最大レジスタ数 / ブロック655366553665536
最大レジスタ数 / スレッド255255255
最大スレッドブロックサイズ102410241024
FP32 コア / SM646464
SMレジスタとFP32コアの比率102410241024
共有メモリサイズ / SM64KB最大96KBまで設定可能最大164KBまで設定可能

精度サポートマトリックスの比較[17] [18]

サポートされているCUDAコア精度サポートされているTensor Coreの精度
FP16FP32FP64INT1INT4INT8TF32BF16FP16FP32FP64INT1INT4INT8TF32BF16
エヌビディア テスラ P4いいえはいはいいいえいいえはいいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
エヌビディアP100はいはいはいいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえいいえ
エヌビディア・ボルタはいはいはいいいえいいえはいいいえいいえはいいいえいいえいいえいいえいいえいいえいいえ
エヌビディア・チューリングはいはいはいいいえいいえいいえいいえいいえはいいいえいいえはいはいはいいいえいいえ
エヌビディアA100はいはいはいいいえいいえはいいいえはいはいいいえはいはいはいはいはいはい

伝説:

デコード性能の比較

同時ストリームH.264 デコード (1080p30)H.265 (HEVC) デコード (1080p30)VP9デコード(1080p30)
V100162222
A10075157108

製品

Voltaは、自動運転車に重点を置いたTegra SoCXavier世代内のGPUマイクロアーキテクチャとして発表されました[19] [20]

2017年5月10日に開催されたNvidiaの年次GPU技術会議基調講演において、NvidiaはVoltaマイクロアーキテクチャとTesla V100を正式に発表しました。[4] Volta GV100 GPUは、900GB/sの帯域幅を持つHBM2メモリを使用して12nmプロセスサイズで構築されています。[21]

Nvidiaは2017年12月7日にNvidia TITAN Vを正式に発表した。[22] [23]

Nvidiaは2018年3月27日にQuadro GV100を正式に発表した。[24]

モデル打ち上げコードネームFab
( nm )
トランジスタ
(10億個)
ダイサイズ
(mm 2
バス インターフェースコア構成SM
カウント[a]
グラフィックス
処理
クラスター[b]
L2キャッシュ
サイズ(MiB
クロック速度フィルレートメモリ処理能力(GFLOPSTDP
(ワット)
NVLinkサポート発売価格
米ドル
CUDA
コア[c]
テンソル
コア[d]
ベースコア
クロック(MHz
ブーストクロック
MHz
メモリ
( MT/s )
ピクセル
( GP /秒)
テクスチャ
GT /秒)
サイズ
( GiB )
帯域幅
GB /秒)
バスの
種類
バス幅
ビット
単精度
(ブースト

倍精度
(ブースト

精度
(ブースト)
希望小売価格
エヌビディア・タイタンV [25]2017年12月7日GV100-400-A1TSMC 12nm21.1815PCIe 3.0 ×165120:320:966408064.5120014551700139.7465.612652.8HBM2307212288 (14899)6144 (7450)24576 (29798)250いいえ2,999ドル
エヌビディア クアドロ GV100 [26]2018年3月27日GV1005120:320:1286113216281696208.452132868.4409611592 (16671)5796 (8335)23183 (33341)はい8,999ドル
Nvidia Titan V CEOエディション[27] [28]2018年6月21日120014551700186.2465.6870.412288 (14899)6144 (7450)24576 (29798)該当なし
  1. ^ 1 つのストリーミング マルチプロセッサには 64 個の CUDA コアと 4 個の TMU が含まれます。
  2. ^ 1 つのグラフィックス処理クラスターには 14 個のストリーミング マルチプロセッサが含まれます。
  3. ^ CUDAコア :テクスチャマッピングユニット :レンダリング出力ユニット
  4. ^ Tensor コアは、 行列演算用に特別に設計された混合精度FPUです。

応用

VoltaはGPGPUコンピューティングに使用されるSummitおよびSierraスーパーコンピュータにも搭載されると報告されています。 [29] [30] Volta GPUはNVLink 2.0を介してPOWER9 CPUに接続され、キャッシュコヒーレンスをサポートしてGPGPUパフォーマンスを向上させることが期待されています。[31] [12] [32]

V100 アクセラレータと DGX V100

DGXで使用されるアクセラレータの比較: [33] [34] [35]

モデル建築ソケットFP32
CUDA
コア
FP64 コア
(Tensor を除く)

INT32/FP32
コアの混合
INT32
コア
ブースト
クロック
メモリ
クロック
メモリ
バス幅
メモリ
帯域幅
VRAM単精度(
FP32
倍精度(
FP64
INT8
(非テンソル)
INT8
密テンソル
INT32FP4
密テンソル
FP16FP16
密テンソル
bfloat16
密テンソル
TensorFloat-32
(TF32)
密テンソル
FP64
密テンソル
インターコネクト
(NVLink)
グラフィックプロセッサL1キャッシュL2キャッシュTDPダイサイズトランジスタ
プロセス発売
P100パスカルSXM/SXM235841792該当なし該当なし1480MHz1.4 ギガビット/秒 HBM24096ビット720 GB/秒16 GB HBM210.6 TFLOPS5.3 TFLOPS該当なし該当なし該当なし該当なし21.2 TFLOPS該当なし該当なし該当なし該当なし160 GB/秒GP1001344 KB (24 KB × 56)4096 KB300ワット610 mm 2153億TSMC 16FF+2016年第2四半期
V100 16GBボルタSXM251202560該当なし51201530MHz1.75 ギガビット/秒 HBM24096ビット900 GB/秒16 GB HBM215.7 TFLOPS7.8 TFLOPS62トップス該当なし15.7トップス該当なし31.4 TFLOPS125 TFLOPS該当なし該当なし該当なし300 GB/秒GV10010240 KB (128 KB × 80)6144 KB300ワット815 mm 221.1億TSMC 12FFN2017年第3四半期
V100 32GBボルタSXM351202560該当なし51201530MHz1.75 ギガビット/秒 HBM24096ビット900 GB/秒32 GB HBM215.7 TFLOPS7.8 TFLOPS62トップス該当なし15.7トップス該当なし31.4 TFLOPS125 TFLOPS該当なし該当なし該当なし300 GB/秒GV10010240 KB (128 KB × 80)6144 KB350ワット815 mm 221.1億TSMC 12FFN
A100 40GBアンペアSXM4691234566912該当なし1410MHz2.4 ギガビット/秒 HBM25120ビット1.52 TB/秒40 GB HBM219.5 TFLOPS9.7 TFLOPS該当なし624トップス19.5トップス該当なし78 TFLOPS312 TFLOPS312 TFLOPS156 TFLOPS19.5 TFLOPS600 GB/秒GA10020736 KB (192 KB × 108)40960 KB400ワット826 mm 254.2億TSMC N72020年第1四半期
A100 80GBアンペアSXM4691234566912該当なし1410MHz3.2 ギガビット/秒 HBM2e5120ビット1.52 TB/秒80 GB HBM2e19.5 TFLOPS9.7 TFLOPS該当なし624トップス19.5トップス該当なし78 TFLOPS312 TFLOPS312 TFLOPS156 TFLOPS19.5 TFLOPS600 GB/秒GA10020736 KB (192 KB × 108)40960 KB400ワット826 mm 254.2億TSMC N7
H100ホッパーSXM516896460816896該当なし1980MHz5.2 ギガビット/秒 HBM35120ビット3.35 TB/秒80 GB HBM367 TFLOPS34 TFLOPS該当なし1.98 ポップス該当なし該当なし該当なし990 TFLOPS990 TFLOPS495 TFLOPS67 TFLOPS900 GB/秒GH10025344 KB (192 KB × 132)51200 KB700ワット814 mm 280 BTSMC 4N2022年第3四半期
H200ホッパーSXM516896460816896該当なし1980MHz6.3 ギガビット/秒 HBM3e6144ビット4.8 TB/秒141 GB HBM3e67 TFLOPS34 TFLOPS該当なし1.98 ポップス該当なし該当なし該当なし990 TFLOPS990 TFLOPS495 TFLOPS67 TFLOPS900 GB/秒GH10025344 KB (192 KB × 132)51200 KB1000ワット814 mm 280 BTSMC 4N2023年第3四半期
B100ブラックウェルSXM6該当なし該当なし該当なし該当なし該当なし8 ギガビット/秒 HBM3e8192ビット8 TB/秒192 GB HBM3e該当なし該当なし該当なし3.5 ポップス該当なし7 PFLOPS該当なし1.98 PFLOPS1.98 PFLOPS989 TFLOPS30テラフロップス1.8 TB/秒GB100該当なし該当なし700ワット該当なし208 BTSMC 4NP2024年第4四半期
B200ブラックウェルSXM6該当なし該当なし該当なし該当なし該当なし8 ギガビット/秒 HBM3e8192ビット8 TB/秒192 GB HBM3e該当なし該当なし該当なし4.5 ポップス該当なし9 PFLOPS該当なし2.25 PFLOPS2.25 PFLOPS1.2 PFLOPS40 TFLOPS1.8 TB/秒GB100該当なし該当なし1000ワット該当なし208 BTSMC 4NP

参照

参考文献

  1. ^ Kampman, Jeffrey (2025年7月31日). 「Nvidia、MaxwellおよびPascal GPUのGame Readyドライバーサポート終了を発表 — 影響を受ける製品には2025年10月まで最適化されたドライバーが提供される」. Tom's Hardware . 2025年8月21日閲覧。
  2. ^ 「Nvidia Voltaの商標状況」. United_States_Patent_and_Trademark_Office . 2023年8月14日. 2023年8月14日閲覧
  3. ^ Gasior, Geoff (2013年3月19日). 「NvidiaのVolta GPU、オンチップDRAMを搭載へ」. The Tech Report . 2019年5月1日時点のオリジナルよりアーカイブ。 2017年3月14日閲覧
  4. ^ abc Smith, Ryan (2017年5月10日). 「NVIDIA GPU Tech Conference 2017 Keynote Live Blog」. 2017年5月10日時点のオリジナルよりアーカイブ。 2018年11月3日閲覧
  5. ^ 「NVIDIA Volta AIアーキテクチャ | NVIDIA」。NVIDIA . 2018年4月11日閲覧
  6. ^ 「Volta商標取消手続き」米国特許商標庁
  7. ^ 「Volta商標の一方的控訴手続き」.米国特許商標庁.
  8. ^ 「Voltaの商標ステータス」. United_States_Patent_and_Trademark_Office .
  9. ^ ab Killian, Zak (2017年3月14日). 「レポート:TSMC、12nmプロセスでVoltaとCentriqを製造する予定」. The Tech Report . 2017年3月14日閲覧
  10. ^ Durant, Luke; Giroux, Olivier; Harris, Mark; Stam, Nick (2017年5月10日). 「Inside Volta: The World's Most Advanced Data Center GPU」. Nvidia開発者ブログ.
  11. ^ Gasior, Geoff (2013年3月19日). 「NvidiaのVolta GPU、オンチップDRAMを搭載へ」. The Tech Report . 2019年5月1日時点のオリジナルよりアーカイブ2017年3月14日閲覧。
  12. ^ ab Shah, Agam (2016年8月22日). 「NvidiaのNVLink 2.0は来年Power9サーバーに初搭載される」. PC World . 2017年3月14日閲覧
  13. ^ ab Harris, Mark (2017年5月11日). 「CUDA 9の機能公開:Volta、協調グループなど」 . 2017年8月12日閲覧
  14. ^ 「NVIDIA Ampereアーキテクチャの詳細」。2020年5月14日。
  15. ^ 「NVIDIA A100 TensorコアGPUアーキテクチャ」(PDF) . 2023年12月15日閲覧
  16. ^ 「NVIDIA A100 Tensorコア GPUアーキテクチャ:あらゆるスケールで前例のない高速化」(PDF) . Nvidia . 2020年9月18日閲覧
  17. ^ 「NVIDIA Tensor コア: HPC と AI の多様性」。NVIDIA
  18. ^ 「要約」. docs.nvidia.com .
  19. ^ Cutress, Ian; Tallis, Billy (2016年1月4日). 「CES 2017: Nvidia Keynote Liveblog」. AnandTech . 2017年1月5日時点のオリジナルよりアーカイブ。 2017年1月9日閲覧
  20. ^ 「NVIDIA DRIVE Xavier、世界最強のSoCが劇的なAI新機能を搭載 | NVIDIAブログ」。NVIDIA公式ブログ。2018年1月7日。 2018年11月3日閲覧
  21. ^ Smith, Ryan (2017年5月10日). 「Nvidia Volta Unveiled」. AnandTech . 2017年5月11日時点のオリジナルよりアーカイブ。 2017年6月2日閲覧
  22. ^ 「NVIDIA TITAN V が PC を AI スーパーコンピュータに変える」
  23. ^ 「NVIDIA TITAN V のご紹介: 世界で最もパワフルな PC グラフィック カード」。
  24. ^ 「NVIDIA がリアルタイム レイ トレーシングでワークステーションを改革」。
  25. ^ 「NVIDIA TITAN Vのご紹介:世界最強のPCグラフィックカード」NVIDIA . 2017年12月8日閲覧。
  26. ^ 「NVIDIA Quadro GV100」 。 2018年3月27日閲覧
  27. ^ ライアン・スミス「NVIDIA、新型限定版32GB Titan V「CEOエディション」を発表&無料配布」。2018年6月21日時点のオリジナルよりアーカイブ。 2018年7月6日閲覧
  28. ^ 「NVIDIA TITAN V CEO Edition」。TechPowerUp 2018年7月7日閲覧
  29. ^ Shankland, Steven (2015年9月14日). 「IBMとNvidiaが3億2500万ドルのスーパーコンピュータ契約を締結」. CNET . 2015年12月29日閲覧
  30. ^ Noyes, Katherine (2015年3月16日). 「IBMとNvidia、次世代スーパーコンピュータ推進でHPCエンジンを刷新」. PC World . 2015年12月29日閲覧
  31. ^ ライアン・スミス(2014年11月17日)「Nvidia VoltaとIBM Power9、米国政府の新型スーパーコンピューター契約を獲得」Anandtech 2014年11月19日時点のオリジナルよりアーカイブ。 2017年3月14日閲覧
  32. ^ Lilly, Paul (2017年1月25日). 「NVIDIA 12nm FinFET Volta GPUアーキテクチャが2017年にPascalを置き換えると報道」HotHardware .
  33. ^ ライアン・スミス(2022年3月22日)「NVIDIA Hopper GPUアーキテクチャとH100アクセラレータ発表:よりスマートに、よりハードに」AnandTech。
  34. ^ ライアン・スミス(2020年5月14日)「NVIDIA Ampereの解放:NVIDIAが新しいGPUアーキテクチャ、A100 GPU、アクセラレータを発表」AnandTech。
  35. ^ 「NVIDIA Tesla V100をテスト:信じられないほどのGPUパワー」TweakTown、2017年9月17日。
「https://en.wikipedia.org/w/index.php?title=Volta_(microarchitecture)&oldid=1308687067」から取得