Youtube100曲アップ達成しました!
fullnoteblogへようこそ

fullnoteblogは「音楽」「旅行」「食事」をテーマにしたブログです

【比較】NVIDIA Pascal/Volta GPUのTeslaとQuadroとGTXの違いを見てみた

スポンサーリンク

ふるのーと
ふるのーと

GPU種類多すぎてよくわかんない

 

こんにちは!ふるのーと(fullnote)です!(*^^*)

 

GPGPUとかAIとかディープラーニングとか、最近GPUが話題ですよね。

 

ちょっと調べて見ましたのでシェアします。

 

なお、記載値はカタログ値だったり計算値だったり、WEBニュースの情報だったりと、混ざったりしてますので正式値は、公式をご確認ください。

理論演算性能FLOPSの計算方法

メモリバンド幅の計算方法

 

スポンサーリンク

Pascal+Volta世代GPUスペックまとめ

Tesla シリーズ

P100はHPC向け。倍精度演算が高い。

P40/P4はディープラーニング向け。INT8が高い。

外部出力端子はなし。

NVIDIA社が全てのTeslaの動作確認。

QUALIFIED TESLA SERVERS

Tesla V100
(NVLINK)
Tesla V100
(PCIe)
Tesla P100
(NVLINK)
Tesla P100
(PCIe)
Tesla P40Tesla P4
GPU GP100 GP100 GP102 GP104
Cores 5120 5120 3584 358438402560
Boost Clock 1462 MHz 1480 MHz 1328 MHz 1531 MHz 1063 MHz
FP64 7.48 TF 7 TF 5.30 TF 4.76 TF 0.37 TF 0.17 TF
FP32 14.9TF 14 TF 10.61 TF 9.52 TF* 11.76 TF 5.44 TF
FP16 21.22 TF 19.04 TF
INT8 47 TOPS 22 TOPS
Tensor
Mem HBM2 HBM2 HBM2 HBM2GDDR5GDDR5
Mem Clock1.43 Gbps1.43 Gbps7.23 Gbps6 Gbps
Mem Bus Width 4096bit 4096bit4096 bit4096 bit384 bit256 bit
Mem Band Width 900GB/s 900GB/s732 GB/s732 GB/s347 GB/s192 GB/s
VRAM 32GB/16GB32GB/16GB16GB 16GB 24GB 8GB
TDP 300W 250W 300 W250 W250 W 75 W
LINK WhitePaper Product Brief Whtepaper Product BriefProduct Brief WEB
Price(Amazon)70万円前後?

*3584cores x 1328 MHz x2 = 9.519になるのだが、公式ページでは9.3TFになっている。

GP100は歩留まりの関係で60個のSM(Streaming Multiprocessor:1SM=64cores)中、4個が無効にされているみたい(参考:後藤弘茂さんのWeekly海外ニュース)なんですが、PCIe版は実は5個向こうになっているとか?
詳しい人いたら教えてください。⇒3584cores x 1.3 GHz x2 = 9.3が濃厚。。

 

 

Quadroシリーズ

Quadroはハイエンドグラフィックスで業務向けが多い。

OpenGLに最適化。

NVIDIAがサンプルを公開かつ認定した企業のみグラフィックボードの製造が許されているらしい。

 

Quadro GV100Quadro GP100Quadro P6000Quadro P5000
GPUGV100 GP100 GP102 GP104
CUDA Cores5120 3584 3840 2560
Boost Clock1450 MHz 1430 MHz 1531 MHz 1733 MHz
FP6414.8TF  5.13 TFLOPS  0.37 TFLOPS 0.28 TFLOPS
FP327.4TF 10.25 TFLOPS 11.76 TFLOPS 8.87 TFLOPS
Tensor118TF
MemHBM2HBM2GDDR5GDDR5
Mem Clock1.7Gbps 1.43 Gbps 9 Gbps 9 Gbps
Mem Bus Width4096 bit 4096 bit 384 bit 256 bit
Mem Band Width870GB/s732 GB/s432 GB/288 GB/s
VRAM32GB16 GB24 GB12 GB
TDP250W235 W250 W180 W
LINK
Price(Amazon)$8,999 115万円前後70万円前後30万円前後

Quadro GV100とTesla V100(PCIe)の違いが殆ど無いですね。(同じチップ使っているので当然ですが。)

冷却方式がActive FanかPassive Fanで搭載制限の違いはありそうですね。

1~2GPU搭載であればQuadro GV100のほうが良さそうですね。

 

 

Geforce(GTX)シリーズ

Geforceは、ゲーミング向けが多い。

DirectXに最適化。

チップ開発・製造はNVIDIAだが、それを載せるグラフィックボードはOEMが担当。

TitanVTitanXp
Pascal
TitanX
Pascal
GTX 1080 ti
Pascal
GTX 1080
Pascal
GPUGV100GP102-450GP102GP102GP104
CUDA Cores5120 3840358435842560
Tensor Cores640
Boost Clock1455 MHz 1582 MHz1531 MHz1582 MHz1733 MHz
FP646.9TF 0.37 TFLOPS0.34 TFLOPS0.35 TFLOPS0.28 TFLOPS
FP3213.8TF 12.1 TFLOPS10.97 TFLOPS11.3 TFLOPS8.87 TFLOPS
Tensor Performance110TF
Mem Clock1.7 Gbps 11.4 Gbps10 Gbps11 Gbps10 Gbps
Mem Bus Width3072-bit 384 bit384 bit352 bit256 bit
Mem Band Width652.8 GB/s 547.7 GB/s480 GB/s484 GB/s320 GB/s
GDDR5 12 GB12 GB11 GB8 GB
HBM212GB
TDP250W 250 W250 W250 W180 W
LINKWEBWEBWEB WEBWhitepaper
Price(Amazon)$2999$120020万円前後 10万円前後10万円前後

TitanVとTesla V100の構成はcore数やclockほとんど変わらないので、TitanVのFLOPS値は、少し低めになっています。

クロックが低いのか使えるコア数が少ないのか分かる人いたら教えてください。

 

 

参考にしたページ

GPUのスペックはtechpowerupwccftechも参考にしました。

 

NVIDIA Tesla GPUのロードマップ

NVIDIA Tesla GPUですが、Pascal、Voltaときて次はAmpereだそうです。

出る時期は未定です。NVIDIA’s GTC( GPU Technology Conference) 2018では発表されませんでしたので詳細情報が出てくるのはもう少し先になりそうですね。

 

スポンサーリンク

美味しい食事と音楽に囲まれて毎日笑顔を大切に過ごしています。
ブログもYoutubeものんびりとやっています。(*^^*)

fullnoteをフォローする
この記事が気に入ったら
いいね!しよう
最新情報をお届けします。
コンピュータ
スポンサーリンク
fullnoteをフォローする
ふるのーとさんのブログ