第二言語習得研究における統計⑥:p-value(p値)

統計の自学シリーズです。第6回目の今日も下記の本の第2章の続きを読み、統計を理解するために必要な概念について学びました(p.46-50) 。

  • Larson-Hall, Jenifer. A guide to doing statistics in second language research using SPSS and R. Routledge, 2015.

統計の結果を示すときに出てくる記号

まず、どの統計テストを使ったか筆者が明示していない場合でも、以下のとおり、記号を見ればどの統計テストを使ったかが分かるといっています。

 

  • ✗(chi) → chi-square
  • r → correlation
  • t → t-test
  • F→ ANOVA

それ以外にも、p-value、df(degree of freedom)などが統計を使った論文では出てきます。今日はこのp-valueについてみていきます。

 

p-value

p-valueは「null hypothesisが正しかった場合、統計結果が、データから実際に計算した統計量の値 よりも大きくなる確率」のことです。これだけだとわかりづらいので、例を使って考えてみます。

例えば、論文に「F(4, 45) = 76.25、 p <.0001」と書かれていたとします。

この場合、「F」と書いてあるので、上記の記号一覧を参考にすると、ANOVAテストをしたのだということがわかります。(4, 45)というのは自由度のことですがこれはまた明日書きます。

「p <.0001」のところがp-valueです。

この意味するところは、「もしグループ間に差異がない」というnull hypothesisが正しい場合、実際にこのF=76.25以上の数値が出てくる確率は、1000回に1回以下だという意味になります。

つまり、1000回のうち999回は76.25未満になり、1000回に1回以下しか76.25以上にならないということは、「グループ間に差異はない」というnull hypothesisそのものが間違えているのではないかという可能性が高くなります。

ちなみに、統計テストの結果として出る数値が高ければ高いほど、1よりも大きければ大きいほど、p-valueは小さくなる傾向があるといっています。上の例の76.25という数値はかなり大きく、そのためp-valueも小さくなっています。

第二言語習得研究ではp-valueは0.05を基準にすることが多いです。つまり「グループ間に差異はない」という仮説が正しい場合に調査結果のような数値になる確率が100回に5回以下である場合、null hypothesisは否定されたと考えていいということになるようです。

 

過去のシリーズです。