Tesla
D1は、機械学習における帯域幅のボトルネックを取り除くために自社設計されており、プロセスノードはTSMCの7nmが採用されているとのこと。D1のダイ面積は645mm2で、トランジスタ数は500億以上。TDP(熱設計電力)400Wで単精度(FP32)での浮動小数点数性能は22.6TFLOPS、bfloat16(BF16)形式やCFP8形式だと最大362TFLOPSになるとテスラは述べています。
このD1を25基集積したマルチチップモジュール「トレーニングタイル」は、BF16・CFP8で9P(ペタ)FLOPS、オフタイル帯域幅が最大36TBpsになるそうです。
テスラが最大362TFLOPSのASIC「D1」を搭載するAIトレーニング用スパコン「Dojo」を発表
https://gyazo.com/1f08970c4ae12bcbd657eb7cda8d2fd0
Tesla (TSLA) becomes world’s most valuable automaker, hits $1,000 per share