MP3
https://gyazo.com/e14c1bf03fb7335feb6b1b3e0dab028e
MP3 - Wikipedia
MP3(エムピースリー、英: MPEG-1 Audio Layer-3)は、音響データを圧縮する技術の1つであり、それから作られる音声ファイルフォーマットでもある。ファイルの拡張子は「.mp3」である。
特徴
最もよく使用されている音声フォーマットの1つ。
2017年4月23日にMP3の特許保護期間が終了し、誰でも自由に使用できるようになった。
以前はライセンスの制限を受けていた。
MP4と名称が似ているが、MP4は動画と音声の規格であり直接の関連性はない。
非可逆圧縮音声フォーマットの一つであり、聴覚マスキングを利用した圧縮を行う
アルゴリズム
https://gyazo.com/b02c0146d6f05fa8a8bcaacb866485de
MP3では、1フレームあたり1152サンプル(=サンプリング周波数44.1kHzにおいて約26ms)の情報を有する
パケットはgranuleと呼称され、伝送はこのパケット単位で行う
高速フーリエ変換によって時間領域から周波数領域へ変換し、心理音響解析
同時/経時マスカ成分とその周波数を得る目的がある
32帯域のフィルタバンクへ分割する(共役ミラーフィルタ)
それぞれのフィルタバンクをMDCT(修正離散コサイン変換)によって周波数解析し、さらに18帯域に分ける(全体としては576帯域に分割される)
22のスケールファクタバンドにまとめ、サウンドマスキングレベルに応じてスケールファクタ(全体的な音量を決定する)を決定
スケールファクタの大きさに基づいてMDCT係数の不均一量子化を行う
MDCT係数をハフマン符号化によって圧縮し、ビットストリームを得る

参考
MP3は本当に「死んだ」のか? 特許権消滅が意味するもの - ITmedia NEWS
5.3.8 Algorithms for Audio Companding and Compression
#音声ファイルフォーマット