NVIDIA® Tesla® K40の特長
NVIDIA社の従来のGPUアーキテクチャーFermi世代のTesla シリーズでは1つのタスク処理しか実行できませんでしたが、新世代GPUアーキテクチャーKeplerからHyper-Qという機能が実装されたことで、最大32のタスクの並列実行が可能となりました。
それにより、複数のCPU が一台のGPU 上で同時に作業を開始する事ができるようになり、さらに並列的に大量の処理が実行できるため非常に高いパフォーマンスを発揮します。
4GPU/3GPUサーバー・ソリューションに搭載可能なNVIDIA® Tesla® GPU アクセラレーターのスペック
NVIDIA® Tesla® K40M | NVIDIA® Tesla® K20X | NVIDIA® Tesla® K20M | NVIDIA® Tesla® K10 | NVIDIA® Tesla® M2090 | NVIDIA® Tesla® M2075 | |
搭載GPU数 | 1基 | 1基 | 1基 | 2基 | 1基 | 1基 |
CUDAコアプロセッサー | 2880コア | 2688コア | 2496コア | 3072コア (1GPUあたり1536コア) | 512コア | 448コア |
単精度演算性能 | 4.29 Tflops | 3.95 Tflops | 3.52 Tflops | 4.58TFlops (1GPUあたり2.29TFlops) | 1.33TFlops | 1.03TFlops |
倍精度演算性能 | 1.43 Tflops | 1.31 Tflops | 1.17 Tflops | 0.19TFlops (1GPUあたり0.095TFlops) | 0.67TFlops | 515GFlops |
メモリー規格 | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM | GDDR5 SDRAM |
メモリー容量 | 12GB | 6GB | 5GB | 8GB (1GPUあたり4GB) | 6GB | 6GB |
メモリー転送帯域(ECC OFF) | 288 GB/sec | 250GB/sec | 208GB/sec | 320 GB/sec (1GPUあたり160 GB/秒) | 1GPUあたり178GB / sec | 1GPUあたり150GB / sec |
バス | PCI Express 3.0 x16 | PCI-Express 2.0 x16 | PCI-Express 2.0 x16 | PCI-Express 3.0 x16 | PCI-Express 2.0 x16 | PCI-Express 2.0 x16 |