連鎖不平衡
同一染色体上に存在する遺伝子(アレル)の多くはそのまま親から子に伝わる(連鎖)ため強い相関をもつが,世代を経るにしたがって組換えによってその相関は弱くなる.このようにアレル間の相関が保たれた状態を連鎖不平衡と呼ぶ.ゲノム内のSNPの多くは互いに連鎖不平衡にある.連鎖不平衡の程度やゲノム内の構造は集団ごとに異なっている. https://gyazo.com/34822ec709399a0c44d7db56378b5afb
$ \begin{aligned} p_{AB} & = & p_Ap_B & +D \\ p_{Ab} &= & p_Ap_b & -D \\ p_{aB} &= & p_ap_B & -D \\ p_{ab} &= & p_ap_b& +D\end{aligned} \qquad (2.8)
$ Dは次のようにも表すことができる
$ D=p_{AB}p_{ab}-p_{Ab}p_{aB} \qquad (2.9)
また、連鎖不平衡量をハプロタイプに見られるアレルAとBとの相関で評価する方法もある アレルAとBとを$ 0、aとbとを$ 1といったようにラベルすることにより(ピアソンの)相関係数を用いて評価することができる 相関係数$ Rと連鎖不平衡量$ Dとの関係は、次のようになることがわかっている
$ R^2=\frac{D^2}{p_Ap_ap_Bp_b}\qquad(2.10)
$ D値はアレル頻度の影響を強く受けるので、異なったサイト間の$ D値を比較することは難しい
そのため、$ D値がとりうる最大値と最小値によって基準化した$ D'という統計量がしばしば用いられる
同様に、相関係数$ Rは常に$ -1から$ 1の間の値をとるため、サイト間の比較が容易
ヒトの場合、ゲノム上で数十kbp程度離れたサイト間においても、連鎖不平衡を観察することができる