量子化
一般的に
連続的な値を持つデータ信号(アナログ)を離散的な値(デジタル)に変換する
機械学習において
モデルの重みや演算制度を低ビットに縮小する
計算量の削減 → モデルの軽量化
推論時の最適化
リソース制限のあるデバイスで有効
電力消費減, リアルタイム推論