GPU計算性能比較
単位はFLOPS
table:nvidia_consumer
FP16 FP32 FP64 VRAM TDP After_Market _price
GTX1660 10.05 T 5.027 T 156.1 G 6GB 120W
GTX1660 Super 10.05 T 5.027 T 157.1 G 6GB 125W
GTX1660 Ti 10.87 T 5.437 T 169.9 G 6GB 120W
RTX2060 12.90 T 6.451 T 201.6 G 8GB 160W
RTX2060 Super 14.36 T 7.181 T 224.4 G 8GB 175W
RTX2070 14.93 T 7.465 T 233.3 G 8GB 175W
RTX2070 Super 18.12 T 9.06 T 283.2 G 8GB 215W
RTX2080 20.14 T 10.07 T 314.6 G 8GB 250W
RTX2080 Super 22.30 T 11.15 T 348.5 G 8GB 250W
RTX3050 9.098 T 9.098 T 142.2 G 8GB 130W
RTX3060 12.74 T 12.74 T 199.0 G 8GB / 12GB 170W
RTX3060 Ti 16.20 T 16.20 T 253.1 G 8GB 200W
RTX3070 20.31 T 20.31 T 317.4 G 8GB 220W
RTX3070 Ti 21.75 T 21.75 T 339.8 G 8GB 290W
RTX3080 29.77 T 29.77 T 465.1 G 10GB / 12GB 320W
RTX3080 Ti 34.10 T 34.10 T 532.8 G 12GB 350W
RTX3090 35.58 T 35.58 T 556.0 G 24GB 350W
RTX3090 Ti 40.00 T 40.00 T 625.0 G 24GB 450W
RTX4060 15.11 T 15.11 T 236.2 G 8GB 115W
RTX4060 Ti 22.06 T 22.06 T 344.8 G 8GB 160W
RTX4070 15.11 T 15.11 T 455.4 G 12GB 200W
RTX4070 Super 35.48 T 35.48 T 554.4 G 12GB 220W
RTX4070 Ti 40.09 T 40.09 T 626.4 G 12GB 285W
RTX4070 Ti Super 44.10 T 44.10 T 689 G 16GB 285W
RTX4080 48.74 T 48.74 T 761.5 G 16GB 320W
RTX4080 Super 52.22 T 52.22 T 816.0 G 16GB 320W
RTX4080 Ti 73.50 T 73.50 T 1148 G 16GB 400W
RTX4090 82.58 T 82.58 T 1290 G 24GB 450W
table:Nvidia_Enterprise
FP16 FP32 FP64 VRAM TDP
V100 PCIe
A100 PCIe 77.97 T 19.49 T 9.746 T 40GB 250W
RTX T10-8
RTX T10-4
RTX A6000
A40 PCIe
RTX A5000-8Q
RTX A5000-12Q
RTX A5000
RTX A4000H
RTX A4000 19.17 T 19.17 T 299.5 G 16GB 140W
A30 PCIe
A16 PCIe
T400
T1000
A100 PCIe 80 GB
RTX A2000
RTX A4500
A10M
RTX A5500
Tesla T40 24 GB
L40S
L40G
A800 PCIe 80 GB
A800 PCIe 40 GB
RTX 6000 Ada Generation
H800 PCIe 80 GB
H100 PCIe 80 GB 204.9 T 51.22 T 25.61 T 80GB 350W
H100 PCIe 96 GB 248.3 T 62.08 T 31.04 T 96GB 700W
RTX 5000 Ada Generation
RTX 4500 Ada Generation
RTX 4000 Ada Generation
L20
P100 19.05 T 9.526 T 4.763 T 16GB 250W
table:amd consumer
FP16 FP32 FP64 VRAM TDP
RX 6400 7.13 T 3.56 T 222.8 G 4GB 53W
RX 6500 XT 11.53 T 5.76 T 360.3 G 4GB 107W
RX 6600 17.86 T 8.92 T 558.0 G 8GB 132W
RX 6600 XT 21.21 T 10.60 T 662.8 G 8GB 160W
RX 6650 XT 21.59 T 10.79 T 674.6 G 8GB 176W
RX 6700 XT 26.43 T 13.21 T 825.9 G 12GB 230W
RX 6750 XT 26.62 T 13.31 T 832.0 G 12GB 250W
RX 6800 32.33 T 16.17 T 1010 G 16GB 250W
RX 6800 XT 41.47 T 20.74 T 1296 G 16GB 300W
RX 6900 XT 46.08 T 23.04 T 1440 G 16GB 300W
RX 6950 XT 47.31 T 23.65 T 1478 G 16GB 335W
RX 7600 43.50 T 21.75 T 679.7 G 8GB 165W
RX 7600 XT 45.14 T 22.57 T 705.3 G 16GB 190W
RX 7700 XT 70.34 T 35.17 T 1099 G 12GB 245W
RX 7800 XT 74.65 T 37.32 T 1166 G 16GB 263W
RX 7900 GRE 91.96 T 45.98 T 1437 G 16GB 260W
RX 7900 XT 103.0 T 51.48 T 1.609 T 20GB 300W
RX 7900 XTX 122.8 T 61.39 T 1.918 T 24GB 355W
table:amd_server
FP16 FP32 FP64 VRAM TDP
Instinct MI6 5.682 T 5.682 T 355.1 G 8GB 150W
Instinct MI8 8.192 T 8.192 T 512.0 G 4GB 175W
Instinct MI25 24.58 T 12.29 T 768.0 G 16GB 300W
Instinct MI50 26.82 T 13.41 T 6.705 T 16GB 300W
Instinct MI60 29.49 T 14.75 T 7.373 T 32GB 300W
Instinct MI100 184.6 T 23.07 T 11.54 T 32GB 300W
Instinct MI200 181.0 T 22.63 T 22.63 T 64GB 300W
Instinct MI210 181.0 T 22.63 T 22.63 T 64GB 300W
Instinct MI250 362.1 T 45.26 T 45.26 T 128GB 500W
Instinct MI250X 383.0 T 47.87 T 47.87 T 128GB 500W
Instinct MI300 383.0 T 47.87 T 47.87 T 128GB 600W
Instinct MI300X 653.7 T 81.72 T 81.72 T 192GB 750W
Instinct MI325X 653.7 T 81.72 T 81.72 T 288GB 750W
table:Intel
FP16 FP32 FP64 VRAM TDP
Arc A58-
解説
CUDAコア
行列の加算処理が得意なコア
Tensorコア
CUDAv9から使える
アーキテクチャでいうとVoltaから
4*4行列(FP16)の積を1サイクルで計算できる
RTコア
レイトレーシング用のやつ
VulcanとかDirectXとかそういうやつから使える
リファレンス
CUDA Capability
InstinctのFP16とFP32の演算性能の差の理由がわかる