ピンクノイズによる眼球運動の合成
Eye Movement Synthesis with 1/ f Pink Noise
まとめ
バーチャルキャラクター
キャラクターの目の動きは感情を伝え、見る人の印象に大きな影響を与える。リアルなキャラでも重要だが、マンガ調のキャラでも視線の動きをそれらしく表現することは効果的である。
目のサッカード
サッカードは視線移動の動きのこと。目の方向を変えるのには2.2θ+ 21ミリ秒かかる。θは最大で約20°。
マイクロサッカード
凝視している時にも目は微妙に動く。これをマイクロサッカードと呼ぶ。
振幅は1°以下、時間は25ミリ秒程度、平均速度は10°/秒、頻度は1~3Hz。個体差がある。
マイクロサッカード以外にもトレモロ、ドリフトという動きがある
瞳孔径変動
眠い時や疲れている時は縮瞳する。
まばたき
まぶたはゆっくり開き、次に速く閉じる。平均14回/分。
アブストラクト
ゲームNPCの非言語での行動はプレイヤー体験に重要。本論文では微細な眼球運動をピンクノイズで合成する手法を提案する。
実験では超クロースアップで撮影した眼球の動きと、ピンクノイズで合成された動きを比較してパラメータの自然さを調べる。
結果として平均では、データドリブンが最も自然で、ピンクノイズが次に続く。マイクロサッカードのジッター(眼球の不随意運動)が欠けていると最も不自然に見える。
本文
1 Introduction
ゲームNPCの視線は、NPCがプレイヤーを信頼しているかなどの、プレイヤーに与える印象に影響する。
Normoyleらによる2013年の論文
The Effect of Posture and Dynamics on the Perception of Emotion
バーチャルエージェントの注視は、感情や表現を伝えることができる。
Lance and Marsella、2008年の論文
A model of gaze for the purpose of emotional expression in virtual embodied agents
オーストラリアのTeam Bondiが開発したゲーム、L.A.ノワールでは目の微妙な動き、顔の向きがゲームプレイの重要な要素になっている。嘘をついているのか、本当のことを言っているのかは、これらの手がかりの上に成り立っている。
特にキャラクターが非常にリアルである場合、リアルな目のアニメーションが仮想俳優の信頼性を高める可能性があることを示唆する証拠がある。リアルなキャラクターでは、より精巧な視線行動が好まれる。
Garau、2003年の論文
The Impact of Avatar Fidelity on Social Interaction in Virtual Environments
しかしながらマクドネルらの研究では、モーキャプした体と顔の動きは、マンガ調のキャラでもリアルなキャラでも親和性があり効果的であることを導き出した。
McDonnell、2012年の論文
Moral Character, Motive, and the Psychology of Blame
(略)
3 Procedural Eye Movement Modeling
眼球のサッカードはステレオタイプであるため、振幅(θ)および持続時間(∆t)は線形方程式∆t =2.2θ+ 21(ミリ秒)でモデル化できる。θは最大約20°。眼の回転(θ)が大きいほど、目の回転に必要な時間は大きくなる。
Bahillらによる1975年の論文、Knoxによる2001年の論文
サッカード運動か、あるいは何かを目で追いかけることでの目の動きがなくとも、対象を凝視している場合にはマイクロサッカードという重要な動きがある。マイクロサッカードという眼球運動は非常に重要であるが、あまり知られていない。
Martinez-Condeらによる2009年の論文
Microsaccades: a neurophysiological analysis.
3.1 Modeling Microsaccades
https://gyazo.com/6019ac9de8ea60fa230fabb948cc8160
振幅はポワソン分布で確率質量関数をモデル化できる。Figure 1(a)参照。P(x,λ) = λ^x*e^−λ /x!
モンテカルロシミュレーション5.5P(x − 8.5, λ = 6)でモデル化され、正規分布5.5N (x − 8.0, µ =λ, σ =√λ)で近似される。
ピンクノイズでのマイクロサッカードのモデル化。式(1)参照。(Hollos and Hollos 2014)
https://gyazo.com/1169ff23ec742b47b593ed974ae8d750
ここでGn(α)は理想的なアナログピンクノイズフィルターでのn番目の近似である。フィルタ関数はG(s) = 1/√s、ak = tan2(kπ)/(2n+1)、qk = (1−αak)/(1+αak)、pk =(α −ak)/(α +ak)であり、統一ゲイン周波数ω0はα =tan(ω0T)/(2)、フィルタ順のサンプリング周期Tはn ∈ Zである。
α = 1.0の時、フィルターはホワイトノイズの入力から得られたピンクノイズを作りだすことになる。
T = 1/60秒のサンプリング周期では、ω0 = 0.85 Hz、α = 0.3であり、結果としてホワイトノイズからフィルタされて生じるピンクノイズはFigure 1(b)のように30秒以上プロットされる。
3.2 Modeling Pupil Diameter via Pupil Unrest
瞳孔膨張は認知負荷の指標として使われ、視覚における検出に影響するというエビデンスがある。(Privitera et al. 2008)
アニメーションの用途では瞳孔動揺、つまり瞳孔膨張と瞳孔狭窄の間で発生するわずかな振動はたぶんモデルにとって面白いものだ。
Starkらによる1958年の研究では、 et al. 1958 describe 瞳孔直径pupil diamater fluctuations as noise in a biological system with the major component of the pupil unrest as random noise in the 0.05–0.3 Hz range, with transfer function G(s) = .16 exp(−.18s)/(1 + 0.1s) 3 and gain equal to 0.16. This transfer function can be modeled by a third-order Butterworth filter with system function G3(s) =1/(s 3 +2s 2 +2s+1) with cutoff frequency set to 1.5915 (see Hollos and Hollos 2014b). Such a filter can thus be used to smooth Gaussian noise (e.g., N (0,0.5), see Figure 1(c)), but will result in uncorrelated noise.
We can model pupil diameter oscillation with pink noise by once again filtering white noise with the same digital pink noise filter as for microsaccadic perturbations. For pupil oscillation, we chose a 4th order filter for reshaping pupil oscillation modeled as Gaussian noise, N (0,σ = 0.5), and vary α to test the perceptual effect of signal gain on pupil oscillation. For example, with T =1/60 seconds, the sampling period, ω0 = 0.16 Hz, and α =0.8, the resultant pink noise is plotted over 30 seconds in Figure 1(c).
バターワースフィルタ
pupil unrest/hippus/瞳孔動揺
眠気や疲労の指標に使える。眠い時や疲れている時は縮瞳する。
3.3 Modeling Blinks
Trutoiu et al. 2011
まぶたはゆっくり開き、続いてすばやく閉じるthe faster closure followed by a slower opening
https://gyazo.com/7ab8027c152b69c2ccda363f50c6875b
with C=1 indicating lid fully open and C=0 lid fully closed, where t ∈ [0,100] represents normalized percent blink duration (scalable to an arbitrary duration), µ =37 the point when the lid should reach full (or nearly-full) closure, a=0.98 indicating percent lid closure at the start of the blink, with b=1.18 and c=µ/100 parameters used to shape the asymptotic lid opening function (see Figure 1(d)).
2019/9