G*power for Mac
https://scrapbox.io/files/6204bdd04d6333001d17b403.png
G*power for Mac.icon G*Power は検定力分析を行うためのソフトである
統計的検定で検定結果の良し悪しを決定する重要な4つの要素:
サンプル・サイズ 有意水準 効果量 検定力
* 他の3つが決まれば、残りの1つが決まるという関係 ←ここ大事
統計的検定を用いる研究では 効果量報告 と 検定力分析 の使用が推奨される
G*power for Mac.icon*28
効果量 とは何か
code: 確率的な推測統計の論法
標本(sample)データ間の平均値に差がありそう
→ 母集団(population)でも同じように見られるか?
→ 「平均値に差がない確率」が低ければ、「差がある!」と主張できるよね
⇨ この低いと嬉しい確率が "p値"
p 値が有意かどうかは有意水準(significance level)に基づいて判断されるが、サンプル・サイズが大きいとp値は小さくなることが問題
* 「p 値が小さければ小さいほど,差が大きい」という主張はそもそも間違い
効果量(effect size)はサンプル・サイズによって変化しない、標準化された指標💯
◇ 代表的な指標
- Cohen's d ...「グループごとの平均値の差を標準化した効果量」
t検定など2グループ間での比較に使用
https://scrapbox.io/files/6204a7dfd78cc9001d2a4f0f.png
◇ 効果量の特徴のまとめ
- 平均値と標準偏差のみでの直感的な判断とほとんど同じ解釈ができる
- 効果量は p 値のようにサンプル・サイズによって影響されることはない
- 実質的な差を考えた場合、p値ではなく、効果量による解釈がふさわしい
👉 まずは平均値,標準偏差,そして効果量によって,実質的な差を検討すべきだよ
(p値によって有意差があろうがなかろうが、いずれにせよ効果量は報告しなければならないと考える)
◇ p値などの確率を用いる「推測統計」との関係
「母集団の特性を示そうする」目的は同じ👍
効果量が違うのは「手元のデータから母集団にまで一般化を目指す」点で目的が異なる
code: 持っていくべき理想
- 実質的な差を示す効果量が大きい
- 統計的有意差もある(p < .05)
t値・p値は統計的に少しでも差があるかないかの可能性の評価であり、
効果量は差の大きさの評価...両方大事
特に繰り返しのあるデータで効果量を報告するときは,どの計算式を使ったのかわかるよう
分析結果を提示する際は、2つのデータの相関係数(あるいは差得点の平均値と標準偏差)
* 分析の再現性は量的研究の最低必要条件だよ
◇ データの対応のあり(paired)・なし(two sample)
実験デザインの話。集団間を比較する際に、
-「違いが集団にあるのか(対応のない場合)」
e.g. 治療群と対照群の平均握力に差があるかどうか
-「違いが個人の変化にあるのか(対応がある場合)」
e.g. A~Dの4名を対象として、介入前と介入後の片脚立位保持時間の平均値に差があるかどうかを調べるとき
◇ 繰り返しのある・ない
使用するデータの話。
https://scrapbox.io/files/6204ba9e469f00001f1ad610.png
https://scrapbox.io/files/6204bad8b4516d001eac064f.png
効果量については以上!
G*power for Mac.icon*28
検定力分析 とは何か?
【Cohen, 1988】
「実際には差がないのに差がある」と誤って判定される確率を α (通常は0.05で設定される)
「実際には有意差があるのに有意差なし」と誤って判定される確率を β (0.20(20%)での設定が望ましい)
有意差を正しく検出できる確率のことを,検定力 もしくは 検出力(power)と呼び、1-βで定義される
「実際には有意差があり、有意差あり」と判断される確率のこと
検定力が 0.8 = 「実際に有意差があるときには,80%の確率でそれを検出できる」ことを意味する
* 「母集団に差があることが真」という前提で実際に有意差が正しく(高確率で)検出できることを示すための根拠としても使える
◇ サンプル・サイズを決めるための検定力分析(事前の分析:A priori)
これまでの先行研究からわかっている(推測される)効果量,有意水準(α),目指している検定力(1-β)からサンプル・サイズを決定
* 実験を行う前に、検定力分析(power analysis)を利用し、適切なサンプル・サイズ(大きすぎても、小さすぎてもだめ)を決定することが推奨される
G*Powerでは、以下に対応
(1) 対応なしの t 検定 (independent t-test)
(2) 対応ありの t 検定 (dependent t-test)
(3) 対応なしの一元配置分散分析 (one-way ANOVA)
(4) 対応ありの一元配置分散分析 (one-way repeated measures ANOVA)
(5) 二元配置分散分析 (two-way ANOVA)
(6) 共分散分析 (ANCOVA)
(7) 多変量分散分析 (MANOVA)
(8) カイ 2 乗検定 (χ2 test)
(9) ノンパラメトリック検定 (nonparametric tests)
(10) 相関係数 (correlation)
(11) 単回帰・重回帰分析 (regression analysis)
◇ 検定力を調べるための検定力分析(事後の分析:Post hoc)
実験を実施した後に,サンプル・サイズ,効果量,有意水準(α)から,検定力
(1-β)を確認する。
出典
- 元 札幌学院大学心理学部臨床心理学科 葛西教授
反復測定分散分析のG*Powerの設定例
- G*Powerの設定の1~54の全て(Exact, F tests, t tests, χ2tests, Z tests)について網羅している
Rstudio for Mac.icon*28
Rを使って検定力分析をしてみよう !
◆「パッケージ」→「パッケージのインストール」 からpwrをインストール
or
$ install.packages("pwr")
◆ 以下のコマンドを入力して準備完了
$ library(pwr)
https://scrapbox.io/files/620b4cf7ee2b7c002221aebe.png
pwrパッケージに含まれる関数
$ pwr.2p.test()
:2つの比率の差の検定(サンプル数が等しい場合)
$ pwr.2p2n.test()
:2つの比率の差の検定(サンプル数が異なる場合)
$ pwr.anova.test()
:一元配置分散分析
$ pwr.chisq.test()
:カイ二乗検定
$ pwr.f2.test()
:一般線形モデル(分散分析・回帰 分析など)
$ pwr.anova.test()
:分散分析
一元配置分散分析のサンプルサイズ計算方法
◆ Quick-Rによると、
pwr.anova.test -> balanced one way ANOVA(1要因の分散分析)
$ pwr.anova.test(k = , n = , f = , sig.level = , power = )
where k is the number of groups and n is the common sample size in each group.
code: 必要な4つの数値
k: 群の数
f: Effect Size(群間平均平方/一群のサンプルサイズの平方根群間の標準偏差と sig.level: 有意水準(デフォルトでは0.05)
power: 検出力 (大抵の場合 80%を使用)
※ Effect sizeはパイロットスタディにおいて作成した分散分析表から計算するか、
Cohenの基準を用いる{ f = 0.10(効果量小),0.25(効果量中),0.40(効 果量大)}
例:
$ pwr.anova.test(k=4, f=0.25, power=0.8)
code: conosle
Balanced one-way analysis of variance power calculation
k = 4
n = 44.59927
f = 0.25
sig.level = 0.05
power = 0.8
NOTE: n is number in each group
◆ その他出典
*要因と水準の違い:
https://scrapbox.io/files/620b5785566641001f2d6a84.png
→ 2要因の分散分析を行う例と考え方
https://scrapbox.io/files/620b59692dc670001de2049d.png
二元配置分散分析のサンプルサイズ計算方法
そもそも、pwr.anova.test() と power.anova.test() がある
差分:power.anova.test で群の個数を表す変数が groups
power.anova.test:
code: usage
power.anova.test(groups = NULL, n = NULL,
between.var = NULL, within.var = NULL,
sig.level = 0.05, power = NULL)
groups Number of groups
n Number of observations (per group)
between.var Between group variance (群間分散)
within.var Within group variance (群内分散)
sig.level Significance level (Type I error probability) -> 0.05
power Power of test (1 minus Type II error probability) -> 0.8
二要因の分散分析を行う場合、被験者の割り当てに寄って3種類の方法
① 被験者はどれかひとつの条件に割り当てられる パターン (between-subjects design)
被験者間計画:条件間の学習効果を最小限に抑え、セッションを短時間にし、設定や分析が容易である。
② 被験者は全条件に割り当てられる パターン (within-subjects design: 反復測定)
被験者内計画:必要とする参加者の数が少なく、条件間の真の差が発見しやすい。
③ 要因Aは被験者間配置。要因Bは被験者内配置 となるパターン