IRIAM
https://youtu.be/TOc8MJISbWs
自作顔認識モデル
20名程度のデータを使ってドメイン知識を使うアプローチ
PyTorchやLightGBMはONNIXならONNIXランタイム上で動くが、Unity Barraqudaでは動かない...
Unity組み込み
推論コストの概算
PC GPUで計測
アプリ負荷
Unity ProfilerやSRDebuggerで計測
端末の要件
Androidなら64bit専用か
OpenGLかValkanか
OpenGL ESなら3.1移行か
iPhoneは6S以降なら2GB+
まずCPUから
https://gyazo.com/01e728424695891f3f3798f501ad6236
ANE、DSP、NPUはプロセッサに特化した実装が必要になり難易度が高い
MLモデルの量子化
推論ランタイムがたくさんある。目的に応じて使い分ける
PoCではTensorflow liteがおすすめ
汎用的に速度が出る
同じモデル、同じCPUでも推論ランタイムで10倍ぐらい違う
LightGBMから比較的簡単にTFLiteに出力できるエコシステムがある
Unity導入が簡単
PoC(CPUでのやる)ではボトルネックがどこか明らかにしておく
推論そのものが重いケース
こっちだと面倒
一般にGPUにすれば推論は早くなる
しかし、CPUからGPUへの変換コストが乗っかるため、トータルが早くなるとは限らない
前処理、後処理が重いケース