VVC
Versatile Video Coding
ISO/IEC 23090-3 MPEG-I Part 3
類似
勧告
ITU-T H.266 (V3) (2023年9月)
SERIES H: 映像音声およびマルチメディアシステム
映像音声サービス基盤 - 動画の符号化
概要
ITU-T勧告H.266は、Versatile Video Coding(多用途ビデオ符号化)と呼ばれるビデオ符号化技術を規定しており、主に2つの目標を掲げて設計されています。1つ目は、従来の標準規格を大幅に凌駕する圧縮能力を備えたビデオ符号化技術を規定すること、2つ目は、この技術が従来の標準規格で対応していた範囲よりも幅広いアプリケーションで効果的に使用できるよう、高い汎用性を備えることです。この規格が使用される主な応用分野としては、特に、超高精細ビデオ(例:Rec. ITU-R BT.2100で規定されている3840×2160または7620×4320の画像解像度と10ビットのビット深度)、高ダイナミックレンジおよび広色域のビデオ(例:Rec. ITU-R BT.2100で規定されている知覚量子化またはハイブリッドログガンマ転送特性)、および一般的な投影形式(正距円筒図法やキューブマップ投影形式など)を使用して投影された360°全方向ビデオなどの没入型メディアアプリケーション用のビデオが挙げられ、さらに、従来のビデオ符号化規格で一般的に対処されてきたアプリケーションも含まれます。第3版では、ビデオプロファイルに新しいレベル(レベル15.5)の仕様が追加され、他のすべての規定レベルの制限を超える可能性のあるビットストリームに適切なラベルが付与されるようになりました。また、追加の補足拡張情報、および本勧告の以前の内容における様々な軽微な欠陥の修正も行われました。
本勧告はISO/IEC JTC 1/SC 29と共同で開発され、技術的に整合されたツインテキストとしてISO/IEC 23090-3に対応しています。
はじめに
目的
この勧告|国際規格は、汎用ビデオ符号化(Versatile Video Coding)として知られるビデオ符号化技術であるITU-T勧告H.266|国際規格ISO/IEC 23090-3を規定する。この勧告は、主に2つの目標を掲げて策定されている。1つ目は、従来の規格を大幅に凌駕する圧縮能力を備えたビデオ符号化技術を規定することであり、2つ目は、この技術が従来の規格で対応されていたよりも幅広い用途で効果的に使用できるように、高い汎用性を備えることである。この規格の主な応用分野としては、超高精細ビデオ(例:ITU-R勧告BT.2100で規定されている3840×2160または7620×4320の解像度と10ビットのビット深度)、高ダイナミックレンジおよび広色域ビデオ(例:ITU-R勧告BT.2100で規定されている知覚量子化またはハイブリッドログガンマ伝達特性を持つビデオ)、そして、従来のビデオ符号化規格で一般的に対応されてきたアプリケーションに加えて、等距円筒図法やキューブマップ投影形式などの一般的な投影形式を用いて投影される360°全方位ビデオなどの没入型メディアアプリケーション向けビデオが挙げられます。
プロファイル、階層、およびレベル
この勧告|国際規格は、幅広いアプリケーション、ビットレート、解像度、品質、およびサービスに対応できるという点で汎用性を持つように設計されています。アプリケーションには、デジタルストレージメディア、テレビ放送、ビデオストリーミングサービス、リアルタイム通信などのビデオ符号化が含まれますが、これらに限定されません。本勧告 | 国際規格の作成過程において、典型的なアプリケーションからの様々な要件が考慮され、必要なアルゴリズム要素が開発され、それらが単一の構文に統合されました。
したがって、本勧告 | 国際規格は、異なるアプリケーション間でのビデオデータの交換を容易にするように設計されています。
ただし、本勧告 | 国際規格の完全な構文を実装することの実用性を考慮し、構文の限られた数のサブセットも「プロファイル」、「階層」、「レベル」によって規定されています。これらおよびその他の関連用語は、第3項で正式に定義されています。
「プロファイル」とは、本勧告 | 国際規格で規定されるビットストリーム構文全体のサブセットです。
特定のプロファイルの構文によって課される範囲内であっても、ビットストリーム内の構文要素が取る値(デコードされた画像の指定サイズなど)に応じて、エンコーダとデコーダの性能に大きな変動が生じる可能性があります。多くのアプリケーションにおいて、特定のプロファイル内の構文の想定されるすべての使用法に対応できるデコーダを実装することは、現状では現実的でも経済的でもありません。
この問題に対処するために、各プロファイル内で「階層」と「レベル」が規定されています。階層のレベルとは、ビットストリーム内の構文要素の値に課される一連の制約のことです。これらの制約の中には、単純な値制限として表現されるものもあれば、値の算術的組み合わせ(例えば、ピクチャの幅×ピクチャの高さ×1秒あたりのデコード枚数)に対する制約の形をとるものもあります。下位階層に規定されたレベルは、上位階層に規定されたレベルよりも制約が厳しくなります。
この勧告|国際規格に準拠する符号化ビデオコンテンツは、共通の構文を使用します。完全な構文のサブセットを実現するために、ビットストリームには、ビットストリームの後半に出現する構文要素の有無を示すフラグ、パラメータ、その他の構文要素が含まれます。