HDCアクセラレータとRISC-Vを組み合わせたエッジサーバの開発
クリエータ:井阪友哉(奈良先端科学技術大学院大学 先端科学技術研究科博士前期課程)
担当PM:竹迫良範(株式会社リクルート データプロダクトユニット ユニット長)
最近はTPUとかいろいろあって分からないですね......今宿祐希.icon
わからないです…がProcessing Unitを作ってるという時点で凄そう...akihiro-kiuchi.icon
power is power!kunihirotanaka.icon
money is moneyってコピーをどこかでみたけど、それと同じものを感じるsowawa.icon
力はパワー!皆川達也(みなたつ).icon
パワー!
Power is power今宿祐希.icon
HDC演算とは
bind, permutation, bound
字面だけ見ても何もわからないと諦めたnishio.icon
画像認識が適用例の1つっぽい伊藤謙太朗.icon
bind, bound, bound と英語で勉強させられたのが頭をよぎりました今宿祐希.icon
ややこしいw伊藤謙太朗.icon
確にCPUでしんどいのは、なんとなくわかる気がする。アンローリングされていい感じ早くなるといいんだけど。
こういうヘテロジーニアスな計算機ってこれまでもたくさんあったのだが、いい感じにDMA転送するのって結構大変だったようなsowawa.icon
今説明してくれたような
HDCについて理解を深めたいけれども、ウェブ上にリソースが少なくて、表層でしか理解できていないkunihirotanaka.icon
論文の実装を実際に自分で作ったプロセッサで動かして動くのがすごいと思う伊藤謙太朗.icon辻口輝.icon今宿祐希.icon大迫勇太郎.iconsowawa.iconjarakawa.icon
GPU と性能比較をするとどんな感じになるのか気になります。GPU には向いていないタスクなんですかね? :sugiyama:
GPUすごいから、電力性能で戦うことになりそうsowawa.icon
そうなのかなーとは思うけど具体的な処理がピンと来てないnishio.icon
細かい処理が並列になってるのではなくパイプライン的に頭から処理していく?(のをハードウェア的に並列するのかなと思ったが)
昔あったっていうと怒られるかもだけどベクトル計算機みたいな方が得意なのかな。数値計算用で符号の計算ではなさそう
比較しないとsowawa.icon
さらに、性能を上げることができるのかが気になります。現在のボトルネックはどこにありますか?メモリ律速は解決したけど、学習データ自体の生成(供給)がボトルネックになっていたりしそう? :sugiyama:
解説
はー、なるほど、並列化して高速にしてもメモリ転送がボトルネックになる
キャッシュを置いても、キャッシュに乗り切らないのでメモリから取ってくるのに時間が掛かる
「最小構成」と言ってるのはキャッシュがないということを指してる?
深層学習が脳を担当して、HDCが筋肉の記憶を担当する?伊藤謙太朗.icon これ面白かった sowawa.icon
最近は心臓にも記憶があるんじゃないかという説がありますねkunihirotanaka.icon
なぜHDCの考え方は廃れてしまったのだろう。なぜいま再度見直しているのか。akfujii.icon
やっばりHDC演算が具体的にどういう演算なのか調べないと僕的にはよくわからないなぁnishio.icon
それを詳細に説明しようとしたら一般の視聴者向けでなくなっちゃうのは理解できる、説明のバランス難しいよね
構成情報の段階でストリームの繋ぎ方を宣言してあって、実際の処理は各計算ユニットが「データが来たら処理して次に渡す」をしてるからデータ待ちが発生しないということ?nishio.icon
そういうことっぽいsowawa.icon
Next