3.6.8.18l1bmr4<rrn_opcode>-1長語4x4縮約
各L1BMについて、各MAB配下の4PEからサイクルあたり 1 長語ずつを読み出し、PE方向には結合
し、第3.6.8.1節で述べた対応でMABに対して縮約と結合を行ってL1BMにサイクルあたり 16 長語で書き
込む。
code:txt
文法
l1bmr4<rrn_opcode> <src>$lb<addr_b>
code:txt
<rrn_opcode>は第3.5.5節で定めた縮約演算指定である。
<src>は読み出し元PEオペランドである。
L1BMアドレス<addr_b>は 16 長語アラインである必要がある。
code:txt
効果
for cycle= 0:4
forall group,l2b,l1b
LongWord data16
data: = get_unit_value(rrn_opcode)
forall mab,pe
uint_t idx= (mab>> 2) * 4 +pe
dataidx =rrn_opcode(dataidx, MEMgroupl2bl1bmabpe.refer_pemem(src,
cycle))
uint_t dst_addr=addr_b +cycle* 16
MEMgroupl2bl1b.l1bmdst_addr:dst_addr+16 =data0:16
code:txt
注意:縮約を内部的に実際にこの手順で行っているわけではない。