TVM
DLフレームワークで構築した計算グラフを、TVMを介して様々なバックエンドを用いたランタイムに変換するコンパイラ https://tvm.ai/images/main/tvm-stack.png
構成
グラフレベル
ネットワーク設計を表現
オペレータレベル
テンソル計算を表現
グラフレベル最適化
Operator fusion
複数のオペレータを融合
Constant folding
定数から始まるノードを事前に計算、簡約
Static memory planning
中間テンソルのためのメモリを確保
Data layout ransformation
テンソル計算効率化のためにデータのレイアウトを変換
オペレータレベル最適化
テンソル計算の最適化
ループの最適化
量子化
剪定
関連
AutoTVM
機械学習を用いたオペレータ自動最適化
VTA
TVM専用のAIチップデザイン
参考
結構詳しいが、途中から未読