統計の自学シリーズです。第7回目の今日も下記の本の第2章の続きを読み、統計を理解するために必要な概念について学びました(p.46-50) 。
- Larson-Hall, Jenifer. A guide to doing statistics in second language research using SPSS and R. Routledge, 2015.
Degree of freedom (自由度)
統計を使った論文を読むとき、結果の報告のところで、p-valueだけでなく、degree of freedom (自由度)もみなければなりません。自由度とは、文字通り、自由に決めることのできる値のことです。
教科書の例だと(p. 47)、例えば、4人の人がいて、1人ずつ1~4のドアを選んでいくとします。
1番目の人が1, 2, 3, 4のドアのうち2のドアを選び、2番目の人が残りの1,3,4のドアから1のドアを選び、3番目の人が残りの3, 4のドアから3のドアを選ぶと、残りの1人は4のドアを自動的に選ぶことになります。
この場合、自由度は「3」となります。なぜなら、4人中、(選択肢の数は違ったとしても)最後の1人を除く、3人は選択肢があったからです。
現在、自由度はコンピューターで計算してくれますが、自分が論文を書くときにも、結果のところで自由度を記載することは重要になってくきます。その理由として2つあるそうです。
1つ目は、自由度は統計的有意差を考えるときのcritical value(棄却限界値)を決めるために必要になるからです。
2つ目は、自由度がわかれば、参加者などのサンプルの数も(もし論文自体では記載していなかったとしても)割り出せるからです。
例えば、論文に「F(4, 45) = 76.25、 p <.0001」と書かれていたとします。
昨日も書きましたが、F(4, 45)のところの2つの数字4と45が自由度になります。
詳しくは書きませんが、1つ目の数字(4)は条件差による自由度というものです。自由度はn-1で示されるのですが(nがサンプル数です)、自由度が「4」であれば、4=n-1でn=5、つまり、サンプルとなったグループ数は5つだったのだと逆算できます。
2つ目の数字(45)は誤差による自由度というものです。これは k(n-1)とあらわされるのですが(kはグループの数です。この場合は5つのグループがあったので、k=5になります)、45 = 5 (n-1)になり、n=10で、各グループには10名の参加者がいたということがわかります。
過去のシリーズです。