MAB
Matrix Arithmetic Block(MAB) は、4つのPEと、1つのMatrix Arithmetic Unit(MAU) に よって構成されています。
https://gyazo.com/6af068784051a0b36aef63f4489b033c
MAUはPEから入力データを受け取り、浮動小数点演算を行い、PEに戻す
MAUは行列演算用の行列レジスタを持っている
行列レジスタは2個あるので行列のdouble-bufferingができる
できる演算
積和演算
ベクトル積和(A x B + C):半精度、単精度、倍精度
3.6.9.2 dmfma-倍精度行列ベクトル積和演算の基本動作
3.6.9.4 fmfma-単精度行列ベクトル積和演算の基本動作
3.6.9.6 gmfma-疑似単精度行列ベクトル積和演算の基本動作
3.6.9.8 hmfma-半精度行列ベクトル積和演算の基本動作
行列積和(A x 行列レジスタ + C) :半精度、疑似単精度、単精度、倍精度
3.6.9.10 dvfma-倍精度ベクトル積和演算の基本動作
3.6.9.12 dvadd-倍精度ベクトル和の基本動作
3.6.9.14 fvfma-単精度ベクトル積和演算の基本動作
3.6.9.18 hvfma-半精度ベクトル積和演算の基本動作
行列レジスタ書き込み
3.6.10 行列レジスタ書き込み命令式
行列レジスタ転置読み出し
3.6.1.18 mreadf-行列レジスタ転置読み出しフォワーディング