Modeling Dwell Time Engagement on Visual Multimedia
2019/10/17
イントロ
マルチメディア(画像や動画)が増加
滞在時間は重要な指標のひとつ
明示的なアクション(like, follow)に比べて扱いが難しい
滞在時間の長いコンテンツはユーザの価値が高く、ユーザの満足度や注意度合いを表していると考えられる
コンテンツ推薦にも使われてきているが、マルチメディアではまだ分析とモデリングがきちんとされていない
擬似ビュー数
YoutubeやInstagramのビュー数が1000views/10$で売られている
推薦アルゴリズムに悪影響を与える
滞在時間を使って異常なビューアーを判断する異常検知はまだ行われていない Research Question
RQ1: Individual Modeling
コンテンツ、ビューアーに対する滞在時間の分布をどう記述するか
RQ2: Aggegate Modeling
コンテンツ、ビューアーの滞在時間をどのように結合してモデル化するか
RQ3: Anomaly Detection
異常な滞在時間を検出するモデルは作れるか
様々なコンテンツを扱う
コンテンツの長さ
メディアフォーマット(looped、unlooped)
Contirubution
C1: Individual Modeling
解釈可能なパラメトリックモデルを提案
UM-DP, LM-DP, V-DP
C2: Aggregate Modeling
looped media (LM-AM), unlooped media (UM-AM), viewer (V-AM)
多変数の依存関係を保持するためコピュラを利用
C3: Anomaly Detection
異常なエンゲージメントを発見する実験を実データを利用して実施
https://gyazo.com/f4377f3a50629e158fb158e27eadb380
データ
Snapchatのデータを利用
24時間で消えるコンテンツをシェア
10秒までのコンテンツ
ループするかどうかを設定
https://gyazo.com/804d9644d0fe3fa959025d060e12aa7b
初期分析
時間が違うので、正規化
unlooped は (0, 1]
looped は (0, ∞)
ヒートマップ
明るさは密度を表す
スパースなところは異常の可能性
https://gyazo.com/1fc988884bb5f30ab41d51d50f7088c2
滞在時間分布
傾向
looped と unlooped で滞在時間の傾向が異なる
画像と動画では滞在時間分布は似ている
looped と unlooped だけを区別してモデルを作成
https://gyazo.com/6b7e9e268e9f6bf8c7278e73a9af6441
Individual Dwell Time Modeling
Looped Content
滞在時間は (0, ∞)
対数ロジスティック分布
T ~ LL(α, β)
https://gyazo.com/f291c9f84eb3214d7177e9017ea03540
推論
Nelder-Mead simplex method
検証
KS (Kolmogorov-Smirnov) 検定
比較手法
CL-LN (Log-normal)
CL-IG (Inverse Gaussian)
CL_WB (Weibull)
CL-G (Gamma)
https://gyazo.com/f1c5bc82ca6fddf2b929c1e11b94057f
https://gyazo.com/f140adef3fbcb996a16f0a3c04eaa07a
Unlooped Content
滞在時間は (0, 1]
https://gyazo.com/4ed9d2bcafc032f68c7e43025df5aebb
推論
最尤推定
検証
KS検定
https://gyazo.com/bd15031b076022a208551bd18c591016
https://gyazo.com/92008faf9debf964f86733e353c8fee2
Viewers
loopedとunloopedで同じモデル
対数正規分布
https://gyazo.com/eea3e20038f195c1e8743f2ef7b55065
推論
最尤推定
検証
KS検定
https://gyazo.com/fc18c0185a4c530e7fc6ddbbb820867f
https://gyazo.com/2a576c4c5e81773ee0490593ec4fd34e
Aggregate Dwell Time Modeling
コンテンツ、もしくは、ビューアーの滞在時間を特定
80%以上みられる動画とは?など
copula を利用
多数のコンテンツ、ビューアーに対するパラメータの分布を柔軟にモデル化
Bicariate, C-Vine (Vine Copula)
Multimedia Content
Looped Content: 2 parameters
Unlooped COntent: 3 parameters
Views: 6 parameters
https://gyazo.com/ba8499f41a844689a8019a7e187c894a
検証
Q1: Dependency preservation
Q2: Training Size
Q3: Temporal consistency
Q1: Dependency preservation
C-vineが実データをどのように近似するか
シミュレーション
https://gyazo.com/79d698b1b469158904543d1562dd34b4
Q2: Training Size
学習サイズがC-vineのモデル化にどう影響するか
Maximum Mean Discrepancy (MMD) 検定
https://gyazo.com/7ddf9596d2ffb51607a35e0615c52a1a
Q3: Temporal consistency
時間フレームの異なるデータに対して頑健か
別の月のデータを利用
MMD検定で 0.032
https://gyazo.com/70a2753c688ec6ec2fe1fc894bf12d23
Anomaly Detection
Q1: Robustness to contamination
Q2: Qualitative efficacy
Q1: Robustness to contamination
ノイズのあるデータに対して異常検知を頑健にできるか
半教師ありのシナリオ
4つのモデル
Complete Views: 滞在時間1のみ
Long Views: 滞在時間が0.8-1.0
Short Views: 滞在時間が0.2未満
Uniform Views: 滞在時間が0.0-1.0 の中で一様
割合を1%, 2%, 5%
https://gyazo.com/76786af042123b5c795f774379d50832
Q2: Qualitative efficacy
実データに対して異常検知できるか
Snapchatのデータを利用
最尤推定で通常データと異常データを1000選択
例
5000 views/day, dwell ratio < 0.03, adding more than 200 friends/day
https://gyazo.com/7827b872837d40f41f0355f5c312718b
まとめ
ビジュアルマルチメディアの滞在時間のモデリング
looped media, unlooped media, viewer のモデリング
異常検知
所感
マルチメディアに焦点当てて、ループと非ループで区別して分析、モデリングしていておもしろい
分析してからモデリングしているのもよさそう
長い動画でも同じ傾向になる?
分布自体はあまり変わらない気もするから、分布だして動画の価値を計測してみたい