CDNA（マイクロアーキテクチャ）

AMD CDNA 2
発売日	2021年11月8日; （4年前）
製造プロセス	TSMC N6
歴史
前任者	CDNA 1
後継	CDNA 3

AMD CDNA 1
発売日	2020年11月16日; （5年前）
製造プロセス	TSMC N7 (フィンFET )
歴史
前任者	GCN 5
後継	CDNA 2

AMD CDNA
発売日	2020年11月16日; （5年前）
デザイン：	AMD
製造プロセス	TSMC N7; TSMC N6; TSMC N5 ;
歴史
前任者	GCN 5

CDNA（Compute DNA ）は、 AMDがデータセンター向けに設計した、コンピューティング中心のグラフィックス・プロセッシング・ユニット（GPU）マイクロアーキテクチャです。主に AMD Instinctシリーズのデータセンター向けグラフィックスカードで使用されているCDNAは、 Graphics Core Next （GCN）マイクロアーキテクチャの後継です。もう一つの後継は、コンシューマー向けグラフィックスに特化したマイクロアーキテクチャであるRDNA（Radeon DNA）です。

CDNAの第一世代は2020年3月5日に発表され、^[2] 2020年11月16日に発売されたAMD Instinct MI100に搭載されました。^[3]これはCDNA 1の唯一の生産製品であり、TSMCのN7 FinFETプロセスで製造されています。

CDNAラインの第2世代では、前世代のモノリシックアプローチとは異なる、マルチチップモジュール（MCM）アプローチが実装されました。AMD Instinct MI250XおよびMI250に搭載されたこのMCM設計では、ダイの接続にエレベーテッドファンアウトブリッジ（EFB） ^[4]が使用されました。これら2つの製品は2021年11月8日に発表され、11月11日に発売されました。CDNA 2ラインには、モノリシック設計を採用した後発製品であるMI210 ^{[5]が含まれています。MI250XとMI250は}、Open Compute Project （OCP）のOCPアクセラレータモジュール（OAM）ソケットフォームファクタを採用した最初のAMD製品です。低ワット数のPCIeバージョンも利用可能です。

CDNAの第3世代では、複数のノードで製造された異なるチップレットを活用したMCM設計に移行しました。現在MI300XとMI300Aで構成されるこの製品は、15個の独自ダイを搭載し、高度な3Dパッケージング技術を採用しています。MI300シリーズは2023年1月5日に発表され、2023年後半に発売されました。

CDNA 1

CDNAファミリは、 Arcturusという 1 つのダイで構成されています。ダイは 750 平方ミリメートルで、256 億個のトランジスタが含まれており、TSMC の N7 ノードで製造されています。^[6] Arcturus ダイには 120 個のコンピューティングユニットと 4096 ビットのメモリバスがあり、4 つのHBM2配置に接続され、ダイに 32 GB のメモリと 1200 GB/s を超えるメモリ帯域幅を提供します。前身と比較して、CDNA はグラフィックスアクセラレーションに関連するすべてのハードウェアを削除しました。削除された内容には、グラフィックスキャッシュ、テッセレーションハードウェア、レンダリング出力ユニット(ROP)、ディスプレイエンジンなどが含まれますが、これらに限定されません。CDNA は、HEVC、H.264、VP9デコード用のVCNメディアエンジンを保持しています。 ^{[7] CDNA は、}NvidiaのVolta アーキテクチャに追加されたものと同様の専用のマトリックスコンピューティングハードウェアも追加しました。

建築

120個の計算ユニット（CU）は4つの非同期計算エンジン（ACE）に分かれており、各ACEはそれぞれ独立したコマンド実行とディスパッチ機能を備えています。CUレベルでは、CDNA計算ユニットはGCNユニットと同様に構成されています。各CUには4つのSIMD16プロセッサが搭載されており、それぞれが64スレッドのウェーブフロント（Wave64）を4サイクルで実行します。

記憶システム

CDNAはHBMのクロック速度を20%向上させ、Vega 20 (GCN 5.0) と比較して約200 GB/sの帯域幅増加を実現しています。ダイには4MBの共有L2キャッシュが搭載されており、CUにクロックごとに2KBのデータを出力します。CUレベルでは、各CUが独自のL1キャッシュ、CUあたり64KBのローカルデータストア (LDS)、そして全CUで共有される4KBのグローバルデータストア (GDS) を備えています。このGDSは、制御データやリダクション演算の保存に使用したり、小規模なグローバル共有サーフェスとして利用したりできます。^[7]^[8]

実験的なPIM実装

2022年10月、サムスンはMI100のメモリ内処理（PIM）特化型バージョンを披露しました。2022年12月には、96基の改良型MI100からなるクラスターを公開し、様々なワークロードにおける処理スループットの大幅な向上と消費電力の大幅な削減を実現しました。^[9]

GCNからの変更点

個々の計算ユニットはGCNとほぼ同様ですが、CUごとに4つの行列ユニットが追加されています。サポートされるデータ型も増え、BF16、INT8、INT4が追加されました。^[7]行列ユニットと新しいデータ型を利用した演算の詳細なリストについては、CDNA ISAリファレンスガイドを参照してください。

製品

型式（コード名）	リリース	建築とファブ	トランジスタとダイサイズ	コア		フィルレート^[a]		処理能力（TFLOPS）								メモリ				TB P	ソフトウェアインターフェース	物理インターフェース
				コア		フィルレート^[a]		ベクトル^[a]^[b]			マトリックス^[a]^[b]					メモリ
				設定^[c]	クロック^[a] ( MHz )	テクスチャ^[d] ( GT /s)	ピクセル^[e] ( GP /s)	ハーフ（FP16）	シングル（FP32）	ダブル（FP64）	INT8	BF16	FP16	FP32	FP64	バスの種類と幅	サイズ ( GB )	クロック ( MT/s )	帯域幅（GB /秒）
AMD インスティンクト MI100 （アークトゥルス）^[10]^[11]	2020年11月16日	CDNA TSMC N7	25.6 × 10 ⁹ 750 mm ²	7680:480:- 120 CU	1000 1502	480 720.96	-	122.88 184.57	15.72 23.10	7.86 11.5	122.88 184.57	61.44 92.28	122.88 184.57	30.72 46.14	15.36 23.07	HBM2 4096ビット	32	2400	1228	300ワット	PCIe 4.0 ×16	PCIe ×16

^ abcd ブースト値（利用可能な場合）は、基本値の下にイタリック体で記載されます。
^ ab精度パフォーマンスは、 FMA操作に基づいてベース (またはブースト) コアクロック速度から計算されます。
^ 統合シェーダ :テクスチャマッピングユニット :レンダリング出力ユニットと計算ユニット (CU)
^ テクスチャフィルレートは、テクスチャマッピングユニットの数にベース (またはブースト) コアクロック速度を掛けて計算されます。
^ ピクセルフィルレートは、レンダリング出力ユニットの数にベース (またはブースト) コアクロック速度を掛けて計算されます。

CDNA 2

CDNAと同様に、CDNA 2もAldebaranと呼ばれる1つのダイで構成されています。このダイは790平方ミリメートルと推定され、TSMCのN6ノードで製造され、280億個のトランジスタを備えています。^[12] Aldebaranダイには112個のコンピューティングユニットのみが含まれており、Arcturusから6.67％減少しています。前世代と同様に、このダイには4096ビットのメモリバスが含まれており、容量が最大64 GBまで倍増したHBM2eを使用しています。CDNA 2の最大の変更点は、2つのダイを同じパッケージに配置できることです。MI250Xは、2つのAldebaranダイ、220個のCU（ダイあたり110個）、および128 GBのHBM2eで構成されています。これらのダイは4つのInfinity Fabricリンクで接続され、ホストシステムによって独立したGPUとしてアドレス指定されます。^[13]

建築

112個のCUはCDNAと同様に、4つの非同期演算エンジンに分割されており、各エンジンはそれぞれ28個のCUを搭載しています（前世代の30個ではなく）。CDNAと同様に、各CUには4つのSIMD16ユニットが搭載され、4サイクルで64スレッドのウェーブフロントを実行します。4つのマトリックスエンジンとベクターユニットはフルレートFP64のサポートを追加し、前世代と比べて大幅な性能向上を実現しています。^[14] CDNA 2では複数の内部キャッシュも改良され、帯域幅が全体的に倍増しています。

記憶システム

CDNA 2のメモリシステムは全面的に改良されている。HBM2eへの移行から始まり、容量は64GBに倍増し、帯域幅は約3分の1（約1200GB/秒から1600GB/秒）増加した。^[13] キャッシュレベル。各GCDには16ウェイ、8MBのL2キャッシュがあり、32のスライスに分割されている。このキャッシュはクロックあたり4KB、スライスあたりクロックあたり128Bを出力し、CDNAの帯域幅の2倍になっている。^[13] さらに、4KBのグローバルデータストアが削除された。^[14] L2とLDSを含むすべてのキャッシュにFP64データのサポートが追加されている。

相互接続

CDNA 2は、同一パッケージに複数のGPUを搭載した初の製品です。2つのGPUダイは4つのInfinity Fabricリンクで接続され、双方向帯域幅は合計400GB/秒です。^[14]各ダイには8つのInfinity Fabricリンクが搭載されており、それぞれが物理的に16レーンのInfinity Linkで実装されています。AMDプロセッサと組み合わせると、Infinity Fabricとして機能します。その他のx86プロセッサと組み合わせると、16レーンの PCIe 4.0にフォールバックします。^[14]

CDNAからの変更

最大の変更点は、すべての演算要素にフルレート（非パックFP32と比較して1:1）のFP64サポートを追加したことです。これにより、FP64行列演算は4倍に増加し、FP64ベクトル演算も大幅に増加しました。^[13] INT32乗算も、GCNで見られた1/4レートとは異なり、INT32加算と同様にフルレートで実行されるようになりました。^[15]

さらに、 V_PK_FMA_F32やV_PK_MUL_F32などのオペコードを使用して、パックされたFP32演算のサポートが追加されました。^[16]パックされたFP32演算は最大2倍のスループットを実現できますが、コードの変更（少なくとも再コンパイル）が必要です。^[13] CDNAと同様に、CDNA 2演算の詳細については、CDNA 2 ISAリファレンスガイドを参照してください。

製品

AMD Instinct CDNA 2世代GPU MI-2xx
アクセル	発売日	建築	リソグラフィー	コンピューティングユニット	メモリ			PCIeサポート	フォームファクター	処理能力								TB P
アクセル	発売日	建築	リソグラフィー	コンピューティングユニット	サイズ	タイプ	帯域幅（GB/秒）	PCIeサポート	フォームファクター	FP16	BF16	FP32	FP32行列	FP64パフォーマンス	FP64マトリックス	INT8	INT4	TB P
MI210	2022年3月22日^[17]	CDNA 2	6 nm	104	64GB	HBM2E	1600			181 TFLOPS		22.6 TFLOPS	45.3 TFLOPS	22.6 TFLOPS	45.3 TFLOPS	181トップス		300ワット
MI250	2021年11月8日^[18]			208	128GB		3200	OAM		362.1 TFLOPS		45.3 TFLOPS	90.5 TFLOPS	45.3 TFLOPS	90.5 TFLOPS	362.1 トップス		560ワット
MI250X	2021年11月8日^[18]			220	128GB		3200	OAM		383 TFLOPS		47.92 TFLOPS	95.7 TFLOPS	47.9 TFLOPS	95.7 TFLOPS	383トップス		560ワット

CDNA 3

AMD CDNA 3
歴史
発売日	2023年12月6日（23か月前） ( 2023-12-06 )
製造プロセス	TSMC N5とN6
前任者	CDNA 2

CDNA 3は、前世代の製品とは異なり、AMDのZen 2、3、4製品ラインと同様に、マルチチップシステムで使用される複数のダイで構成されています。MI300パッケージは比較的大規模で、 5nmで製造された9つのチップレットが 4つの6nmチップレットの上に配置されています。^[19]これらすべてが、8つのHBM配置を使用した128GBのHBM3と組み合わされています。^[20]このパッケージには、推定1460億個のトランジスタが含まれています。Instinct MI300XとMI300Aの形で提供され、後者はAPUです。これらの製品は2023年12月6日に発売されました。^[21]

MI300Xは、8つのアクセラレータ・コンプレックス・ダイ（XCD）と4つのIOダイ（IOD）で構成されています。MI300Aは、6つのXCD、3つのコア・コンプレックス・ダイ（CCD）（それぞれ3.7GHzで動作するZen 4コア8基を搭載）、そして4つのIODで構成されています。複数のMI300Aを同一システムで使用できます。例えば、Gigabyteは、このようなAPUを4基搭載できる4ソケット・マザーボードを製造しています。^[22]

製品

AMD Instinct CDNA 3世代GPU - MI-3xx
アクセル	発売日	建築	リソグラフィー	コンピューティングユニット	メモリ			PCIeサポート	フォームファクター	処理能力								TB P
アクセル	発売日	建築	リソグラフィー	コンピューティングユニット	サイズ	タイプ	帯域幅（GB/秒）	PCIeサポート	フォームファクター	FP16	BF16	FP32	FP32行列	FP64パフォーマンス	FP64マトリックス	INT8	INT4	TB P
MI300A	2023年12月6日^[23]	CDNA 3	6 nmと5 nm	228	128GB	HBM3	5300	5.0	APU SH5 LGA6096ソケット	980.6 TFLOPS 1961.2 TFLOPS（スパース性あり）		122.6 TFLOPS		61.3 TFLOPS	122.6 TFLOPS	1961.2 TOPS 3922.3 TOPS（スパース性あり）	該当なし	550 W 760 W（液冷時）
MI300X	2023年12月6日^[23]			304	192GB	HBM3	5300		OAM	1307.4 TFLOPS 2614.9 TFLOPS（スパース性あり）		163.4 TFLOPS		81.7 TFLOPS	163.4 TFLOPS	2614.9 TOPS 5229.8 TOPS（スパース性あり）	該当なし	750ワット
MI325X	2024年10月10日^[24]			304	256GB	HBM3E	6000		OAM	1307.4 TFLOPS 2614.9 TFLOPS（スパース性あり）		163.4 TFLOPS		81.7 TFLOPS	163.4 TFLOPS	2614.9 TOPS 5229.8 TOPS（スパース性あり）	該当なし	750ワット

CDNA 4

AMD CDNA 4
歴史
発売日	2025年6月12日（5か月前）（2025年6月12日）
製造プロセス	TSMC 3nm（XCD）、6nm FinFET（IOD）
前任者	CDNA 3

AMDはAdvancing AI 2025において、MI350XとMI355Xの計画を発表しました。^[25]新モデルには2つの形態があります。OCPアクセラレータモジュール（OAM）フォームファクタのシングルGPUと、ラックに収まるように設計された水冷式オクトGPU「プラットフォーム」です。どちらもUBB（OCPユニバーサルベースボード）を念頭に置いて設計されています。^[26]

製品比較

型式（コード名）	発売日	建築とファブ	トランジスタとダイサイズ	コア		フィルレート^[a]		ベクトル処理能力^[a]^[b] ( TFLOPS )			行列処理能力^[a]^[b] ( TFLOPS )					メモリ				TB P	ソフトウェアインターフェース	物理インターフェース
型式（コード名）	発売日	建築とファブ	トランジスタとダイサイズ	設定^[c]	クロック^[a] ( MHz )	テクスチャ^[d] ( GT /s)	ピクセル^[e] ( GP /s)	ハーフ（FP16）	シングル（FP32）	ダブル（FP64）	INT8	BF16	FP16	FP32	FP64	バスの種類と幅	サイズ ( GB )	クロック ( MT/s )	帯域幅（GB /秒）	TB P	ソフトウェアインターフェース	物理インターフェース
テスラV100（PCIE）（GV100）^[27]^[28]	2017年5月10日	ボルタ TSMC 12 nm	12.1 × 10 ⁹ 815 mm ²	5120:320:128:640 80 SM	1370	438.4	175.36	28.06	14.03	7.01	該当なし	該当なし	該当なし	112.23	該当なし	HBM2 4096ビット	16 32	1750	900	250ワット	PCIe 3.0 ×16	PCIe ×16
テスラV100（SXM）（GV100）^[29]^[30]	2017年5月10日	ボルタ TSMC 12 nm	12.1 × 10 ⁹ 815 mm ²	5120:320:128:640 80 SM	1455	465.6	186.24	29.80	14.90	7.46	該当なし	該当なし	該当なし	119.19	該当なし	HBM2 4096ビット	16 32	1750	900	300ワット	NVリンク	SXM2
Radeon Instinct MI50 （Vega 20）^[31]^{[32] [}^33]^[34]^[35]^[36]	2018年11月18日	GCN 5 TSMC 7nm	13.2 × 10 ⁹ 331 mm ²	3840:240:64 60 CU	1450 1725	348.0 414.0	92.80 110.4	22.27 26.50	11.14 13.25	5.568 6.624	該当なし	該当なし	26.5	13.3	?	HBM2 4096ビット	16 32	2000	1024	300ワット	PCIe 4.0 ×16	PCIe ×16
Radeon Instinct MI60 （Vega 20）^{[32] [}³⁷^{] [38]}^[39]	2018年11月18日	GCN 5 TSMC 7nm	13.2 × 10 ⁹ 331 mm ²	4096:256:64 64 CU	1500 1800	384.0 460.8	96.00 115.2	24.58 29.49	12.29 14.75	6.144 7.373	該当なし	該当なし	32	16	?	HBM2 4096ビット		2000	1024	300ワット	PCIe 4.0 ×16	PCIe ×16
テスラA100（PCIE）（GA100）^[40] ^[41]	2020年5月14日	アンペア TSMC 7 nm	54.2 × 10 ⁹ 826 mm ²	6912:432:-:432 108 SM	1065 1410	460.08 609.12	-	58.89 77.97	14.72 19.49	7.36 9.75	942.24 1247.47	235.56 311.87	235.56 311.87	117.78 155.93	14.72 19.49	HBM2 5120ビット	40 80	3186	2039	250ワット	PCIe 4.0 ×16	PCIe ×16
テスラ A100 (SXM) (GA100)) ^[42] ^[43]	2020年5月14日	アンペア TSMC 7 nm	54.2 × 10 ⁹ 826 mm ²	6912:432:-:432 108 SM	1275 1410	550.80 609.12	-	70.50 77.97	17.63 19.49	8.81 9.75	1128.04 1247.47	282.01 311.87	282.01 311.87	141.00 155.93	17.63 19.49	HBM2 5120ビット	40 80	3186	2039	400ワット	NVリンク	SXM4
AMD Instinct MI100 （アークトゥルス）^[44]^[45]	2020年11月16日	cDNA TSMC 7 nm	25.6 × 10 ⁹ 750 mm ²	7860:480:-:480 120 CU	1000 1502	480 720.96	-	?	15.72 23.10	7.86 11.5	122.88 184.57	61.44 92.28	122.88 184.57	30.72 46.14	15.36 23.07	HBM2 4096ビット	32	2400	1228	300ワット	PCIe 4.0 ×16	PCIe ×16
AMD Instinct MI250X (PCIE) (アルデバラン)	2021年11月8日	CDNA 2 TSMC 6 nm	58 × 10 ⁹ 1540 mm ²	14080:880:-:880 220 CU
AMD Instinct MI250X (OAM) (アルデバラン)	2021年11月8日	CDNA 2 TSMC 6 nm	58 × 10 ⁹ 1540 mm ²	14080:880:-:880 220 CU
テスラ H100 (PCIE) (GH100)	2022年3月22日	ホッパー TSMC 4 nm	80 × 10 ⁹ 814 mm ²
テスラ H100 (SXM) (GH100)	2022年3月22日	ホッパー TSMC 4 nm	80 × 10 ⁹ 814 mm ²

^ abcd ブースト値（利用可能な場合）は、基本値の下にイタリック体で記載されます。
^ ab精度パフォーマンスは、 FMA操作に基づいてベース (またはブースト) コアクロック速度から計算されます。
^ 統合シェーダー :テクスチャマッピングユニット :レンダリング出力ユニット : AIアクセラレータとコンピューティングユニット（CU） /ストリーミングマルチプロセッサ（SM）
^ テクスチャフィルレートは、テクスチャマッピングユニットの数にベース (またはブースト) コアクロック速度を掛けて計算されます。
^ ピクセルフィルレートは、レンダリング出力ユニットの数にベース (またはブースト) コアクロック速度を掛けて計算されます。

参照

参考文献

^ Smith, Ryan (2022年6月9日). 「AMD：2023年にCDNA 3とZen 4を組み合わせたMI300データセンターAPU」AnandTech . 2023年4月5日時点のオリジナルよりアーカイブ。 2022年12月20日閲覧。
^ ライアン・スミス「AMD、CDNA GPUアーキテクチャを発表：データセンター向け専用GPUアーキテクチャ」www.anandtech.com。2021年1月24日時点のオリジナルよりアーカイブ。 2022年9月20日閲覧。
^ 「GPUデータベース：AMD Radeon Instinct MI100」。TechPowerUp 。2022年9月20日閲覧。
^ ライアン・スミス「AMD、Instinct MI200アクセラレータファミリーを発表：サーバーをエクサスケール以上へ」www.anandtech.com。2021年11月8日時点のオリジナルよりアーカイブ。 2022年9月21日閲覧。
^ ライアン・スミス「AMD、Instinct MI210アクセラレーターをリリース：PCIeカード搭載のCDNA 2」www.anandtech.com。2024年3月7日時点のオリジナルよりアーカイブ。 2022年9月21日閲覧。
^ Kennedy, Patrick (2020年11月16日). 「AMD Instinct MI100 32GB CDNA GPUが発売」. ServeTheHome . 2022年9月22日閲覧。
^ abc 「AMD CDNAホワイトペーパー」（PDF） . amd.com . 2020年3月5日. 2022年9月22日閲覧。
^ 「AMD Instinct MI100 命令セットアーキテクチャリファレンスガイド」(PDF) . developer.amd.com . 2020年12月14日. 2022年9月22日閲覧。
^ Aaron Klotz (2022年12月14日). 「Samsung、AMD MI100 GPU 96基を急進的な計算メモリで強化」. Tom's Hardware . 2022年12月23日閲覧。
^ 「AMD Instinct MI100 パンフレット」（PDF） . AMD . 2022年12月25日閲覧。
^ 「AMD CDNAホワイトペーパー」（PDF） . AMD . 2022年12月25日閲覧。
^ Anton Shilov (2021年11月17日). 「AMDのInstinct MI250X OAMカードの写真：Aldebaranの巨大ダイが明らかに」. Tom's Hardware . 2022年11月20日閲覧。
^ abcde 「Hot Chips 34 – AMDのInstinct MI200アーキテクチャ」. Chips and Cheese . 2022年9月18日. 2022年11月10日閲覧。
^ abcd 「AMD CDNA™ 2アーキテクチャーの紹介」(PDF) . AMD.com . 2022年11月20日閲覧。
^ Lam, Chester (2023年7月28日). 「AMDのRadeon Instinct MI210：GCNは存続する」. Chips and Cheese . 2025年10月2日閲覧。
^ 「AMD Instinct MI200」命令セットアーキテクチャ(PDF) . developer.amd.com . 2022年2月4日. 2022年10月11日閲覧。
^ ライアン・スミス「AMD、Instinct MI210アクセラレーターをリリース：PCIeカード搭載のCDNA 2」www.anandtech.com。2024年3月7日時点のオリジナルよりアーカイブ。 2024年6月3日閲覧。
^ ライアン・スミス「AMD、Instinct MI200アクセラレータファミリーを発表：サーバーをエクサスケール以上へ」www.anandtech.com。2021年11月8日時点のオリジナルよりアーカイブ。 2024年6月3日閲覧。
^ ライアン・スミス、「CES 2023：AMD Instinct MI300データセンターAPUシリコンが到着 - トランジスタ146B個、2023年下半期に出荷」www.anandtech.com。2023年1月5日時点のオリジナルよりアーカイブ。 2023年1月22日閲覧。
^ Paul Alcorn (2023年1月5日). 「AMD Instinct MI300 Data Center APU を間近で撮影：13個のチップレット、1460億個のトランジスタ」. Tom's Hardware . 2023年1月22日閲覧。
^ Kennedy, Patrick (2023年12月6日). 「AI時代に向けてAMD Instinct MI300X GPUとMI300A APUが発売」ServeTheHome . 2024年4月15日閲覧。
^ ラム、チェスター。「AMD Instinct MI300Aの巨大メモリサブシステムの内部」。chipsandcheese.com 。2025年10月2日閲覧。
^ Bonshor, Ryan Smith, Gavin. 「AMD Advancing AI & Instinct MI300 Launch Live Blog (Starts at 10am PT/18:00 UTC)」www.anandtech.com . 2023年12月7日時点のオリジナルよりアーカイブ。 2024年6月3日閲覧。{{cite web}}: CS1 maint: 複数の名前: 著者リスト (リンク)
^ ライアン・スミス「AMD、2024年第4四半期に大規模メモリInstinct MI325Xを発表、2026年までのアクセラレータロードマップを発表」www.anandtech.com。2024年6月3日時点のオリジナルよりアーカイブ。 2024年6月3日閲覧。
^ 「Advancing AI 2025 基調講演」AMD。
^ 「AMD Instinct™ MI350シリーズGPU」. amd.com .
^ Oh, Nate (2022年12月16日). 「NvidiaがPCIe Tesla V100を正式発表」. AnandTech .
^ 「NVIDIA Tesla V100 PCIe 16GB」。TechPowerUp。
^ ライアン・スミス（2022年12月19日）「Nvidia Volta 発表」AnandTech。
^ 「NVIDIA Tesla V100 SXM3 32GB」。TechPowerUp。
^ Walton, Jarred (2019年1月10日). 「AMD Radeon VIIを体験」. PC Gamer .
^ ab 「Next Horizon – David Wangプレゼンテーション」(PDF) . AMD .
^ 「AMD Radeon Instinct MI50 アクセラレーター (16GB)」。AMD。
^ 「AMD Radeon Instinct MI50 アクセラレーター (32GB)」。AMD。
^ 「AMD Radeon Instinct MI50 データシート」(PDF) . AMD .
^ 「AMD Radeon Instinct MI50 スペック」。TechPowerUp 。2022年5月27日閲覧。
^ “Radeon Instinct MI60”. AMD . 2018年11月22日時点のオリジナルよりアーカイブ。2022年5月27日閲覧。
^ 「AMD Radeon Instinct MI60 データシート」(PDF) . AMD .
^ 「AMD Radeon Instinct MI60 スペック」。TechPowerUp 。2022年5月27日閲覧。
^ 「Nvidia A100 Tensor Core GPUアーキテクチャ」(PDF) . Nvidia . 2022年12月12日閲覧。
^ 「Nvidia A100 PCIE 80 GB 仕様」。TechPowerUp 。2022年12月12日閲覧。
^ 「Nvidia A100 Tensor Core GPUアーキテクチャ」(PDF) . Nvidia . 2022年12月12日閲覧。
^ 「Nvidia A100 SXM4 80 GB スペック」。TechPowerUp 。2022年12月12日閲覧。
^ 「AMD Instinct MI100 パンフレット」（PDF） . AMD . 2022年12月25日閲覧。
^ 「AMD CDNAホワイトペーパー」（PDF） . AMD . 2022年12月25日閲覧。

外部リンク

公式ウェブページ
AMD CDNAアーキテクチャのホワイトペーパー
AMD CDNA 2 アーキテクチャのホワイトペーパー
AMD CDNA 3 アーキテクチャのホワイトペーパー
AMDGPUバックエンドのLLVMユーザーガイド::命令 - アーキテクチャとその命令セットの一覧

[Boost-10] ブースト値（利用可能な場合）は、基本値の下にイタリック体で記載されます。

[FLOPS-11] 精度パフォーマンスは、 FMA操作に基づいてベース (またはブースト) コアクロック速度から計算されます。

[Core_config-12] 統合シェーダ :テクスチャマッピングユニット :レンダリング出力ユニットと計算ユニット (CU)

[Texture_fill-13] テクスチャフィルレートは、テクスチャマッピングユニットの数にベース (またはブースト) コアクロック速度を掛けて計算されます。

[Pixel_fill-14] ピクセルフィルレートは、レンダリング出力ユニットの数にベース (またはブースト) コアクロック速度を掛けて計算されます。

[Boost-32] ブースト値（利用可能な場合）は、基本値の下にイタリック体で記載されます。

[FLOPS-33] 精度パフォーマンスは、 FMA操作に基づいてベース (またはブースト) コアクロック速度から計算されます。

[Core_config-34] 統合シェーダー :テクスチャマッピングユニット :レンダリング出力ユニット : AIアクセラレータとコンピューティングユニット（CU） /ストリーミングマルチプロセッサ（SM）

[Texture_fill-35] テクスチャフィルレートは、テクスチャマッピングユニットの数にベース (またはブースト) コアクロック速度を掛けて計算されます。

[Pixel_fill-36] ピクセルフィルレートは、レンダリング出力ユニットの数にベース (またはブースト) コアクロック速度を掛けて計算されます。

[1] Smith, Ryan (2022年6月9日). 「AMD：2023年にCDNA 3とZen 4を組み合わせたMI300データセンターAPU」AnandTech . 2023年4月5日時点のオリジナルよりアーカイブ。 2022年12月20日閲覧。

[2] ライアン・スミス「AMD、CDNA GPUアーキテクチャを発表：データセンター向け専用GPUアーキテクチャ」www.anandtech.com。2021年1月24日時点のオリジナルよりアーカイブ。 2022年9月20日閲覧。

[3] 「GPUデータベース：AMD Radeon Instinct MI100」。TechPowerUp 。2022年9月20日閲覧。

[4] ライアン・スミス「AMD、Instinct MI200アクセラレータファミリーを発表：サーバーをエクサスケール以上へ」www.anandtech.com。2021年11月8日時点のオリジナルよりアーカイブ。 2022年9月21日閲覧。

[5] ライアン・スミス「AMD、Instinct MI210アクセラレーターをリリース：PCIeカード搭載のCDNA 2」www.anandtech.com。2024年3月7日時点のオリジナルよりアーカイブ。 2022年9月21日閲覧。

[6] Kennedy, Patrick (2020年11月16日). 「AMD Instinct MI100 32GB CDNA GPUが発売」. ServeTheHome . 2022年9月22日閲覧。

[:0-7] 「AMD CDNAホワイトペーパー」（PDF） . amd.com . 2020年3月5日. 2022年9月22日閲覧。

[8] 「AMD Instinct MI100 命令セットアーキテクチャリファレンスガイド」(PDF) . developer.amd.com . 2020年12月14日. 2022年9月22日閲覧。

[9] Aaron Klotz (2022年12月14日). 「Samsung、AMD MI100 GPU 96基を急進的な計算メモリで強化」. Tom's Hardware . 2022年12月23日閲覧。

[15] 「AMD Instinct MI100 パンフレット」（PDF） . AMD . 2022年12月25日閲覧。

[16] 「AMD CDNAホワイトペーパー」（PDF） . AMD . 2022年12月25日閲覧。

[17] Anton Shilov (2021年11月17日). 「AMDのInstinct MI250X OAMカードの写真：Aldebaranの巨大ダイが明らかに」. Tom's Hardware . 2022年11月20日閲覧。

[:1-18] 「Hot Chips 34 – AMDのInstinct MI200アーキテクチャ」. Chips and Cheese . 2022年9月18日. 2022年11月10日閲覧。

[:2-19] 「AMD CDNA™ 2アーキテクチャーの紹介」(PDF) . AMD.com . 2022年11月20日閲覧。

[20] Lam, Chester (2023年7月28日). 「AMDのRadeon Instinct MI210：GCNは存続する」. Chips and Cheese . 2025年10月2日閲覧。

[21] 「AMD Instinct MI200」命令セットアーキテクチャ(PDF) . developer.amd.com . 2022年2月4日. 2022年10月11日閲覧。

[22] ライアン・スミス「AMD、Instinct MI210アクセラレーターをリリース：PCIeカード搭載のCDNA 2」www.anandtech.com。2024年3月7日時点のオリジナルよりアーカイブ。 2024年6月3日閲覧。

[23] ライアン・スミス「AMD、Instinct MI200アクセラレータファミリーを発表：サーバーをエクサスケール以上へ」www.anandtech.com。2021年11月8日時点のオリジナルよりアーカイブ。 2024年6月3日閲覧。

[:3-24] ライアン・スミス、「CES 2023：AMD Instinct MI300データセンターAPUシリコンが到着 - トランジスタ146B個、2023年下半期に出荷」www.anandtech.com。2023年1月5日時点のオリジナルよりアーカイブ。 2023年1月22日閲覧。

[:4-25] Paul Alcorn (2023年1月5日). 「AMD Instinct MI300 Data Center APU を間近で撮影：13個のチップレット、1460億個のトランジスタ」. Tom's Hardware . 2023年1月22日閲覧。

[26] Kennedy, Patrick (2023年12月6日). 「AI時代に向けてAMD Instinct MI300X GPUとMI300A APUが発売」ServeTheHome . 2024年4月15日閲覧。

[27] ラム、チェスター。「AMD Instinct MI300Aの巨大メモリサブシステムの内部」。chipsandcheese.com 。2025年10月2日閲覧。

[28] Bonshor, Ryan Smith, Gavin. 「AMD Advancing AI & Instinct MI300 Launch Live Blog (Starts at 10am PT/18:00 UTC)」www.anandtech.com . 2023年12月7日時点のオリジナルよりアーカイブ。 2024年6月3日閲覧。{{cite web}}: CS1 maint: 複数の名前: 著者リスト (リンク)

[29] ライアン・スミス「AMD、2024年第4四半期に大規模メモリInstinct MI325Xを発表、2026年までのアクセラレータロードマップを発表」www.anandtech.com。2024年6月3日時点のオリジナルよりアーカイブ。 2024年6月3日閲覧。

[30] 「Advancing AI 2025 基調講演」AMD。

[31] 「AMD Instinct™ MI350シリーズGPU」. amd.com .

[37] Oh, Nate (2022年12月16日). 「NvidiaがPCIe Tesla V100を正式発表」. AnandTech .

[38] 「NVIDIA Tesla V100 PCIe 16GB」。TechPowerUp。

[39] ライアン・スミス（2022年12月19日）「Nvidia Volta 発表」AnandTech。

[40] 「NVIDIA Tesla V100 SXM3 32GB」。TechPowerUp。

[41] Walton, Jarred (2019年1月10日). 「AMD Radeon VIIを体験」. PC Gamer .

[NH-DWP-42] 「Next Horizon – David Wangプレゼンテーション」(PDF) . AMD .

[43] 「AMD Radeon Instinct MI50 アクセラレーター (16GB)」。AMD。

[44] 「AMD Radeon Instinct MI50 アクセラレーター (32GB)」。AMD。

[45] 「AMD Radeon Instinct MI50 データシート」(PDF) . AMD .

[46] 「AMD Radeon Instinct MI50 スペック」。TechPowerUp 。2022年5月27日閲覧。

[47] “Radeon Instinct MI60”. AMD . 2018年11月22日時点のオリジナルよりアーカイブ。2022年5月27日閲覧。

[48] 「AMD Radeon Instinct MI60 データシート」(PDF) . AMD .

[49] 「AMD Radeon Instinct MI60 スペック」。TechPowerUp 。2022年5月27日閲覧。

[50] 「Nvidia A100 Tensor Core GPUアーキテクチャ」(PDF) . Nvidia . 2022年12月12日閲覧。

[51] 「Nvidia A100 PCIE 80 GB 仕様」。TechPowerUp 。2022年12月12日閲覧。

[52] 「Nvidia A100 Tensor Core GPUアーキテクチャ」(PDF) . Nvidia . 2022年12月12日閲覧。

[53] 「Nvidia A100 SXM4 80 GB スペック」。TechPowerUp 。2022年12月12日閲覧。

[54] 「AMD Instinct MI100 パンフレット」（PDF） . AMD . 2022年12月25日閲覧。

[55] 「AMD CDNAホワイトペーパー」（PDF） . AMD . 2022年12月25日閲覧。

歴史

発売日	2020年11月16日（5年前） ( 2020-11-16 )
デザイン：	AMD
製造プロセス	TSMC N7 TSMC N6 TSMC N5 ^[1]
前任者	GCN 5

歴史
発売日	2021年11月8日（4年前） ( 2021-11-08 )
製造プロセス	TSMC N6
前任者	CDNA 1
後継	CDNA 3