gpu圖形處理服務(wù)器NVIDIA Tesla GPU系列P4、T4、P40以及V100參數(shù)性能對(duì)比
一、關(guān)于NVIDIA TESLA系列GPU詳細(xì)介紹如下:
NVIDIA TESLA V100
NVIDIA Tesla V100選用NVIDIA Volta架構(gòu),十分適合為要求極為嚴(yán)苛的雙精度核算作業(yè)流程供給加速,而且仍是從P100晉級(jí)的抱負(fù)途徑。該GPU的渲染功能比Tesla P100提升了高達(dá)80%,借此可縮短規(guī)劃周期和上市時(shí)刻。
Tesla V100的每個(gè)GPU均可供給125 teraflops的推理功能,配有8塊Tesla V100的單個(gè)服務(wù)器可實(shí)現(xiàn)1 petaflop的核算功能。
NVIDIA TESLA P40
The Tesla P40可以供給高達(dá)2倍的專(zhuān)業(yè)圖形功能。Tesla P40可以對(duì)安排中每個(gè)vGPU虛擬化加速圖形和核算(NVIDIA CUDA® 和 OpenCL)作業(yè)負(fù)載。支持多種行業(yè)標(biāo)準(zhǔn)的2U服務(wù)器。
Tesla P40可供給出色的推理功能、INT8精度和24GB板載內(nèi)存。
NVIDIA TESLA T4
NVIDIA Tesla T4的幀緩存高達(dá)P4的2倍,功能高達(dá)M60的2倍,關(guān)于利用NVIDIA Quadro vDWS軟件敞開(kāi)高端3D規(guī)劃和工程作業(yè)流程的用戶(hù)而言,不失為一種抱負(fù)的解決方案。憑借單插槽、半高外形特性以及低至70瓦的功耗,Tesla T4堪稱(chēng)為每個(gè)服務(wù)器節(jié)點(diǎn)實(shí)現(xiàn)最大GPU密度的絕佳之選。
NVIDIA TESLA P4
Tesla P4可加速任何外擴(kuò)型服務(wù)器的運(yùn)行速度,能效高達(dá)CPU的60倍。
二、NVIDIA Tesla GPU系列P4、T4、P40以及V100
NVIDIA Tesla系列GPUP4、T4、P40以及V100功能標(biāo)準(zhǔn)參數(shù)比照表,阿里云GPU云服務(wù)器供給的實(shí)例GN4(Nvidia M40)、GN5(Nvidia P100)、GN5i(Nvidia P4)及GN6(Nvidia V100),也會(huì)基于NVIDIA Tesla GPU系列。
| 云服務(wù)器 | Tesla T4:世界領(lǐng)先的推理加速器 | Tesla V100:通用數(shù)據(jù)中心 GPU | 適用于超高效、外擴(kuò)型服務(wù)器的 | Tesla P4 適用于推理吞吐量服務(wù)器的 Tesla P40 |
|---|---|---|---|---|
| 單精度功能 (FP32) | 8.1 TFLOPS | 14 TFLOPS (PCIe) 15.7 teraflops (SXM2) | 5.5 TFLOPS | 12 TFLOPS |
| 半精度功能 (FP16) | 65 TFLOPS | 112 TFLOPS (PCIe)125 TFLOPS (SXM2) | — | — |
| 整數(shù)運(yùn)算才能 (INT8) | 130 TOPS | — | 22 TOPS* | 47 TOPS* |
| 整數(shù)運(yùn)算才能 (INT4) | 260 TOPS | — | — | — |
| GPU 顯存 | 16GB | 32/16GB HBM2 | 8GB | 24GB |
| 顯存帶寬 | 320GB/秒 | 900GB/秒 | 192GB/秒 | 346GB/秒 |
| 體系接口/外形標(biāo)準(zhǔn) | PCI Express 半高外形 | PCI Express 雙插槽全高外形 SXM2/NVLink | PCI Express 半高外形 | PCI Express 雙插槽全高外形 |
| 功率 | 70 W | 250 W (PCIe) 300 W (SXM2) | 50 W/75 W | 250 W |
| 硬件加速視頻引擎 | 1 個(gè)解碼引擎,2 個(gè)編碼引擎 | — | 1 個(gè)解碼引擎,2 個(gè)編碼引擎 | 1 個(gè)解碼引擎,2 個(gè)編碼引擎 |
