DensePose
https://www.youtube.com/watch?v=Dhkd_bAwwMc
Claude 3 Opus.icon
DensePose は、RGB 画像の全ての人間のピクセルを人体の 3D 表面にマッピングすることを目的とした密な人物姿勢推定の研究プロジェクトです。主な特徴は以下の通りです。
50K の COCO 画像に手動で画像 - 表面対応付けのアノテーションを付けた大規模データセット DensePose-COCO を構築
人物領域内の部位特有の UV 座標を高速に回帰する DensePose-RCNN モデルを提案 (Mask R-CNN の派生)
人物表面を部位に分割し、各ピクセルについて属する部位とその 2D パラメータ上の対応点を推定
教師ネットワークを用いたアノテーション値の補間により性能向上
キーポイント推定やインスタンスセグメンテーションなど関連タスクとのカスケーディングにより更なる性能改善
DensePose は人物姿勢推定の新しいアプローチとして、画像上の人物の 3次元的な姿勢や形状の詳細な理解に役立つ技術です。