3.6.8.18l1bmr4<rrn_opcode>-1長語4x4縮約
各L1BMについて、各MAB配下の4PEからサイクルあたり 1 長語ずつを読み出し、PE方向には結合
し、第3.6.8.1節で述べた対応でMABに対して縮約と結合を行ってL1BMにサイクルあたり 16 長語で書き
込む。
code:txt
文法
l1bmr4<rrn_opcode> <src>$lb<addr_b>
code:txt
<rrn_opcode>は第3.5.5節で定めた縮約演算指定である。
<src>は読み出し元PEオペランドである。
L1BMアドレス<addr_b>は 16 長語アラインである必要がある。
code:txt
効果
for cycle= 0:4
forall group,l2b,l1b
data: = get_unit_value(rrn_opcode) forall mab,pe
uint_t idx= (mab>> 2) * 4 +pe
cycle))
uint_t dst_addr=addr_b +cycle* 16
code:txt
注意:縮約を内部的に実際にこの手順で行っているわけではない。