MP3
https://gyazo.com/e14c1bf03fb7335feb6b1b3e0dab028e
MP3(エムピースリー、英: MPEG-1 Audio Layer-3)は、音響データを圧縮する技術の1つであり、それから作られる音声ファイルフォーマットでもある。ファイルの拡張子は「.mp3」である。
特徴
最もよく使用されている音声フォーマットの1つ。
2017年4月23日にMP3の特許保護期間が終了し、誰でも自由に使用できるようになった。
以前はライセンスの制限を受けていた。
MP4と名称が似ているが、MP4は動画と音声の規格であり直接の関連性はない。 アルゴリズム
https://gyazo.com/b02c0146d6f05fa8a8bcaacb866485de
MP3では、1フレームあたり1152サンプル(=サンプリング周波数44.1kHzにおいて約26ms)の情報を有する
パケットはgranuleと呼称され、伝送はこのパケット単位で行う
同時/経時マスカ成分とその周波数を得る目的がある
32帯域のフィルタバンクへ分割する(共役ミラーフィルタ)
それぞれのフィルタバンクをMDCT(修正離散コサイン変換)によって周波数解析し、さらに18帯域に分ける(全体としては576帯域に分割される) 22のスケールファクタバンドにまとめ、サウンドマスキングレベルに応じてスケールファクタ(全体的な音量を決定する)を決定
スケールファクタの大きさに基づいてMDCT係数の不均一量子化を行う
MDCT係数をハフマン符号化によって圧縮し、ビットストリームを得る
参考