GPU種類多すぎてよくわかんない
こんにちは!ふるのーと(fullnote)です!(*^^*)
GPGPUとかAIとかディープラーニングとか、最近GPUが話題ですよね。
ちょっと調べて見ましたのでシェアします。
なお、記載値はカタログ値だったり計算値だったり、WEBニュースの情報だったりと、混ざったりしてますので正式値は、公式をご確認ください。
GPUスペックまとめ(Hopper/Ampere/Volta)
Tesla シリーズ
V100まではTeslaシリーズと呼ばれていましたが、Teslaという名前はなくなりました。
特徴は以下のような感じです。
- 100シリーズはHPC向け。倍精度演算が高い。
- A40/A2はディープラーニング、VDI向け。INT8が高い。
- 外部出力端子はなし。
- NVIDIA社が全てのTeslaの動作確認⇒Qualified System Catalog
H100 | H100 | A100 | A100 | |
---|---|---|---|---|
フォーム ファクター | SXM5 | PCIe5.0 | SXM4 | PCIe4.0 |
FP64 | 34 TF | 26 TF | 9.7 TF | 9.7 TF |
FP64 Tensor コア | 67 TF | 51 TF | 19.5 TF | 19.5 TF |
FP32 | 67 TF | 51 TF | 19.5 TF | 19.5 TF |
Tensor Float 32 (TF32) | 989 TF | 756TF | 156 TF | 156 TF |
BFLOAT16 Tensor コア | 1,979 TF | 1,513 TF | 312 TF | 312 TF |
FP16 Tensor コア | 1,979 TF | 1,513 TF | 312 TF | 312 TF |
INT8 Tensor コア | 3,958 TOPS | 3,026 TOPS | 624 TOPS | 624 TOPS |
GPU メモリ | 80GB | 80GB | 80GB | 80GB |
HBM | HBM3 | HBM2e | HBM2 | HBM2 |
GPU メモリ帯域幅 | 3.35TB/s | 2TB/s | 2,039 GB/秒 | 1,935 GB/秒 |
最大熱設計電力 (TDP) | 700W | 350W | 400W | 300W |
相互接続(NVLINK) | NVLink: 900 GB/秒 | 600GB/秒(2GPU) | NVLink: 600 GB/秒 | 600GB/秒(2GPU) |
相互接続(PCIe) | Gen5: 128GB/秒 | Gen5: 128GB/秒 | Gen4: 64 GB/秒 | Gen4: 64 GB/秒 |
LINK | WhitePaper | WhitePaper | WhitePaper | WhitePaper |
このシリーズは市販はあまりされていないようですので、購入ルートが限られそうです。
PC4U 公式オンラインショップでは販売されていました ⇒ NVIDIA A100 80G PCI
Quadroシリーズ
Quadroはハイエンドグラフィックスで業務向けが多い。
OpenGLに最適化。3DCGやCAD分野で使われる。
NVIDIAがサンプルを公開かつ認定した企業のみグラフィックボードの製造が許されているらしい。
Quadro GV100 | Quadro GP100 | Quadro P6000 | Quadro P5000 | |
---|---|---|---|---|
GPU | GV100 | GP100 | GP102 | GP104 |
CUDA Cores | 5120 | 3584 | 3840 | 2560 |
Boost Clock | 1450 MHz | 1430 MHz | 1531 MHz | 1733 MHz |
FP64 | 14.8TF | 5.13 TFLOPS | 0.37 TFLOPS | 0.28 TFLOPS |
FP32 | 7.4TF | 10.25 TFLOPS | 11.76 TFLOPS | 8.87 TFLOPS |
Tensor | 118TF | – | – | – |
Mem | HBM2 | HBM2 | GDDR5 | GDDR5 |
Mem Clock | 1.7Gbps | 1.43 Gbps | 9 Gbps | 9 Gbps |
Mem Bus Width | 4096 bit | 4096 bit | 384 bit | 256 bit |
Mem Band Width | 870GB/s | 732 GB/s | 432 GB/ | 288 GB/s |
VRAM | 32GB | 16 GB | 24 GB | 12 GB |
TDP | 250W | 235 W | 250 W | 180 W |
LINK | ||||
Price(Amazon) | $8,999 | 115万円前後 | 70万円前後 | 30万円前後 |
Quadro GV100とTesla V100(PCIe)の違いが殆ど無いですね。(同じチップ使っているので当然ですが。)
冷却方式がActive FanかPassive Fanで搭載制限の違いはありそうですね。
1~2GPU搭載であればQuadro GV100のほうが良さそうですね。
Geforce(GTX)シリーズ
Geforceは、ゲーミング向けが多い。
DirectXに最適化。
チップ開発・製造はNVIDIAだが、それを載せるグラフィックボードはOEMが担当。
TitanV | TitanXp Pascal | TitanX Pascal | GTX 1080 ti Pascal | GTX 1080 Pascal | |
---|---|---|---|---|---|
GPU | GV100 | GP102-450 | GP102 | GP102 | GP104 |
CUDA Cores | 5120 | 3840 | 3584 | 3584 | 2560 |
Tensor Cores | 640 | ||||
Boost Clock | 1455 MHz | 1582 MHz | 1531 MHz | 1582 MHz | 1733 MHz |
FP64 | 6.9TF | 0.37 TFLOPS | 0.34 TFLOPS | 0.35 TFLOPS | 0.28 TFLOPS |
FP32 | 13.8TF | 12.1 TFLOPS | 10.97 TFLOPS | 11.3 TFLOPS | 8.87 TFLOPS |
Tensor Performance | 110TF | ||||
Mem Clock | 1.7 Gbps | 11.4 Gbps | 10 Gbps | 11 Gbps | 10 Gbps |
Mem Bus Width | 3072-bit | 384 bit | 384 bit | 352 bit | 256 bit |
Mem Band Width | 652.8 GB/s | 547.7 GB/s | 480 GB/s | 484 GB/s | 320 GB/s |
GDDR5 | – | 12 GB | 12 GB | 11 GB | 8 GB |
HBM2 | 12GB | ||||
TDP | 250W | 250 W | 250 W | 250 W | 180 W |
LINK | WEB | WEB | WEB | ー | Whitepaper |
Price(Amazon) | $2999 | $1200 | 20万円前後 | 10万円前後 | 10万円前後 |
参考にしたページ
GPUのスペックはtechpowerupやwccftechも参考にしました。
NVIDIA Tesla GPUのロードマップ
NVIDIA Tesla GPUですが、Pascal、Volta、Turing、Ampere、Hopperだそうです。
2022年9月20日のGTCでH100の量産開始が発表されましたので市場に出回るのは2023年くらいになるのではないかと思います⇒https://www.nvidia.com/ja-jp/about-nvidia/press-releases/2022/nvidia-hopper-in-full-production/
それでは今日はこの辺で!ふるのーと(fullnote)でした!(*^^*)