ベクトル積和モード
from 1.4 浮動小数点数演算性能
ベクトル積和モードでは、ひとつのMAUは 1 サイクルで、m次元ベクトルa, b, cに対しy=a×b+cの演算を行える。ここで×,+は要素ごとの独立な演算であって、mと演算精度は次のいずれかである。
倍精度:m= 4、a, b, c, yはすべて通常の倍精度
ただし積は0,1番目の要素か、2,3番目の要素のどちらかしか有効にできない。
有効にしなかった側は積の項は 0 になる
4要素のFMA全体を実行するには、この演算を2回実行すればよい。
その際、2回目のcには1回目の結果を渡す
単精度:m= 8、a, b, c, yはすべて通常の単精度
半精度:m= 16、a, bは通常の半精度、c, yは通常の単精度