HDCアクセラレータとRISC-Vを組み合わせたエッジサーバの開発

クリエータ：井阪友哉（奈良先端科学技術大学院大学先端科学技術研究科博士前期課程）

担当PM：竹迫良範（株式会社リクルートデータプロダクトユニットユニット長）

最近はTPUとかいろいろあって分からないですね......今宿祐希.icon

わからないです…がProcessing Unitを作ってるという時点で凄そう...akihiro-kiuchi.icon

power is power!kunihirotanaka.icon

money is moneyってコピーをどこかでみたけど、それと同じものを感じるsowawa.icon

力はパワー!皆川達也(みなたつ).icon

パワー！

Power is power今宿祐希.icon

HDC演算とは

bind, permutation, bound

字面だけ見ても何もわからないと諦めたnishio.icon

画像認識が適用例の１つっぽい伊藤謙太朗.icon

bind, bound, bound と英語で勉強させられたのが頭をよぎりました今宿祐希.icon

ややこしいw伊藤謙太朗.icon

確にCPUでしんどいのは、なんとなくわかる気がする。アンローリングされていい感じ早くなるといいんだけど。

こういうヘテロジーニアスな計算機ってこれまでもたくさんあったのだが、いい感じにDMA転送するのって結構大変だったようなsowawa.icon

今説明してくれたような

HDCについて理解を深めたいけれども、ウェブ上にリソースが少なくて、表層でしか理解できていないkunihirotanaka.icon

論文の実装を実際に自分で作ったプロセッサで動かして動くのがすごいと思う伊藤謙太朗.icon辻口輝.icon今宿祐希.icon大迫勇太郎.iconsowawa.iconjarakawa.icon

GPU と性能比較をするとどんな感じになるのか気になります。GPU には向いていないタスクなんですかね？ :sugiyama:

GPUすごいから、電力性能で戦うことになりそうsowawa.icon

そうなのかなーとは思うけど具体的な処理がピンと来てないnishio.icon

細かい処理が並列になってるのではなくパイプライン的に頭から処理していく？(のをハードウェア的に並列するのかなと思ったが)

昔あったっていうと怒られるかもだけどベクトル計算機みたいな方が得意なのかな。数値計算用で符号の計算ではなさそう

比較しないとsowawa.icon

さらに、性能を上げることができるのかが気になります。現在のボトルネックはどこにありますか？メモリ律速は解決したけど、学習データ自体の生成（供給）がボトルネックになっていたりしそう？ :sugiyama:

解説

はー、なるほど、並列化して高速にしてもメモリ転送がボトルネックになる

キャッシュを置いても、キャッシュに乗り切らないのでメモリから取ってくるのに時間が掛かる

「最小構成」と言ってるのはキャッシュがないということを指してる？

深層学習が脳を担当して、HDCが筋肉の記憶を担当する？伊藤謙太朗.icon これ面白かった sowawa.icon

最近は心臓にも記憶があるんじゃないかという説がありますねkunihirotanaka.icon

なぜHDCの考え方は廃れてしまったのだろう。なぜいま再度見直しているのか。akfujii.icon

やっばりHDC演算が具体的にどういう演算なのか調べないと僕的にはよくわからないなぁnishio.icon

それを詳細に説明しようとしたら一般の視聴者向けでなくなっちゃうのは理解できる、説明のバランス難しいよね

構成情報の段階でストリームの繋ぎ方を宣言してあって、実際の処理は各計算ユニットが「データが来たら処理して次に渡す」をしてるからデータ待ちが発生しないということ？nishio.icon

そういうことっぽいsowawa.icon