【比較】NVIDIA Pascal/Volta GPUのTeslaとQuadroとGTXの違いを見てみた

【比較】NVIDIA Pascal/Volta GPUのTeslaとQuadroとGTXの違いを見てみた

シェアする

GPGPUとかAIとかディープラーニングとか、最近GPUが話題ですよね。

ちょっと調べて見ました。

Voltaも発表されたので少し追記しました。

スポンサーリンク
fullnote1

Pascal+Volta世代GPUスペックまとめ

Tesla シリーズ

P100はHPC向け。倍精度演算が高い。

P40/P4はディープラーニング向け。INT8が高い。

外部出力端子はなし。

NVIDIA社が全てのTeslaの動作確認。

QUALIFIED TESLA SERVERS

Voltaの情報が出てきたので追記しました。
Tesla V100
(NVLINK)
Tesla V100
(PCIe)
Tesla P100
(NVLINK)
Tesla P100
(PCIe)
Tesla P40 Tesla P4
GPU  GP100  GP100  GP102  GP104
Cores  5120  5120  3584  3584 3840 2560
Boost Clock  1462 MHz  1480 MHz  1328 MHz  1531 MHz  1063 MHz
FP64  7.48 TF  7 TF  5.30 TF  4.76 TF  0.37 TF  0.17 TF
FP32  14.9TF  14 TF  10.61 TF  9.52 TF*  11.76 TF  5.44 TF
FP16  21.22 TF  19.04 TF
INT8  47 TOPS  22 TOPS
Mem  HBM2  HBM2  HBM2  HBM2 GDDR5 GDDR5
Mem Clock 1.43 Gbps 1.43 Gbps 7.23 Gbps 6 Gbps
Mem Bus Width  4096bit  4096bit 4096 bit 4096 bit 384 bit 256 bit
Mem Band Width  900GB/s  900GB/s 732 GB/s 732 GB/s 347 GB/s 192 GB/s
VRAM  16GB  16GB 16GB  16GB  24GB  8GB
TDP  300W  250W  300 W 250 W 250 W  75 W
LINK  WhitePaper  Whtepaper  Product Brief Product Brief  WEB
Price(Amazon) 70万円前後?

*3584cores x 1328 MHz x2 = 9.519になるのだが、公式ページでは9.3TFになっている。

GP100は歩留まりの関係で60個のSM(Streaming Multiprocessor:1SM=64cores)中、4個が無効にされているみたい(参考:後藤弘茂さんのWeekly海外ニュース)なんですが、PCIe版は実は5個向こうになっているとか?
詳しい人いたら教えてください。

3584cores x 1.3 GHz x2 = 9.3が濃厚。。

Quadroシリーズ

Quadroはハイエンドグラフィックスで業務向けが多い。

OpenGLに最適化。

NVIDIAがサンプルを公開かつ認定した企業のみグラフィックボードの製造が許されているらしい。

Quadro GP100 Quadro P6000 Quadro P5000
GPU  GP100  GP102  GP104
CUDA Cores  3584  3840  2560
Boost Clock  1430 MHz  1531 MHz  1733 MHz
FP64   5.13 TFLOPS   0.37 TFLOPS  0.28 TFLOPS
FP32  10.25 TFLOPS  11.76 TFLOPS  8.87 TFLOPS
Mem Clock  1.43 Gbps  9 Gbps  9 Gbps
Mem Bus Width  4096 bit  384 bit  256 bit
Mem Band Width 732 GB/s 432 GB/ 288 GB/s
VRAM 16 GB 24 GB 12 GB
TDP 235 W 250 W 180 W
LINK
Price(Amazon)  115万円前後 70万円前後 30万円前後

Geforce(GTX)シリーズ

Geforceは、ゲーミング向けが多い。

DirectXに最適化。

チップ開発・製造はNVIDIAだが、それを載せるグラフィックボードはOEMが担当。

TitanXp
Pascal
TitanX
Pascal
GTX 1080 ti
Pascal
GTX 1080
Pascal
GPU GP102-450 GP102 GP102 GP104
CUDA Cores  3840 3584 3584 2560
Boost Clock  1582 MHz 1531 MHz 1582 MHz 1733 MHz
FP64  0.37 TFLOPS 0.34 TFLOPS 0.35 TFLOPS 0.28 TFLOPS
FP32  12.1 TFLOPS 10.97 TFLOPS 11.3 TFLOPS 8.87 TFLOPS
Mem Clock  11.4 Gbps 10 Gbps 11 Gbps 10 Gbps
Mem Bus Width  384 bit 384 bit 352 bit 256 bit
Mem Band Width  547.7 GB/s 480 GB/s 484 GB/s 320 GB/s
VRAM  12 GB 12 GB 11 GB 8 GB
TDP  250 W 250 W 250 W 180 W
LINK WEB WEB  WEB Whitepaper
Price(Amazon) $1200 20万円前後  10万円前後 10万円前後

参考にしたページ

GPUのスペックはtechpowerupwccftechGTCJ資料も参考にしました。

この記事が気に入ったら
いいね!しよう

最新情報をお届けします

Twitter でふるのーとをフォローしよう!

スポンサーリンク
fullnote1
fullnote1

シェアする

フォローする

スポンサーリンク