統計の自学シリーズです。第3回目の今日は下記の本の第2章を読み、統計を理解するために必要な概念について学びました(p.31-41) 。
- Larson-Hall, Jenifer. A guide to doing statistics in second language research using SPSS and R. Routledge, 2015.
Variables(変数)
まず、必要となる概念は「変数」です。自分の研究で使う変数はどういった種類のものなのか理解しないと、自分の仮説を研究するために適切な統計テストを選べないと言っていました。変数というのは、文字通り、変化する値のことです。
例えば、「スペイン語のオンラインゲームをするとスペイン語が上手になるか」というリサーチ・クエスチョンを立てたとします。これを検証するため、オンラインゲームをするグループ、しないグループに学習者を分けた上で、それぞれのグループのスペイン語能力を調べたとします。
この場合、「オンラインゲームをするグループ」「しないグループ」も変数になりますし、結果として出てくるスペイン語能力の違いも変数になります。
Continuous variables vs categorical variables
変数について考えるときに、まず自分が調べようとしているものが連続変数なのかカテゴリー変数なのかを認識する必要があるそうです。なぜなら、その変数の種類によって選ぶ統計テストが異なってくるからです。
連続変数は、点数、時間、長さなど、連続的な数値をとるものです。
上記に述べた、
「オンラインゲームをするとスペイン語が上手になるか」
というリサーチ・クエスチョンで考えてみます。
これを調べるため、「オンラインゲームをするグループ」「しないグループ」に分けた上で、100点満点の言語テストを使って両グループのスペイン語言語能力を測ったとします。この場合、学習者は0~100点までの数をもらう可能性があります。こういう連続的な数字で表されるような変数は、Continuous variables(連続変数)と呼ばれるそうです。
カテゴリー変数は、連続の数値ではなく、カテゴリーで示される変数を言います。
例えば、上記の場合、「オンラインゲームをするグループ」「しないグループ」という2つは連続する数字ではなく、カテゴリーなので、これはcategorical variables(カテゴリー変数)と呼ばれます。
Independent variables vs dependent variables
連続変数・カテゴリー変数の他、自分の調査で使う変数のうち、どれがindependent variables(独立変数)でどれがdependent variables(従属変数)かも認識する必要があります。
Independent variablesは結果に影響を及ぼすような原因のこと、dependent variablesは調査の結果として出てくるものを意味します。
例えば、
「オンラインゲームをするとスペイン語が上手になるか」
という先ほど挙げた例の場合、
「オンラインゲームをするグループ」「しないグループ」というのは、結果に影響を及ぼす原因となるようなものです。これをindependent variablesと言います。独立変数はよく研究者が自らで設定することが多いようです。
学習者のレベル、年齢、バイリンガル/モノリンガルなどのグループ分けなどがよくある独立変数のようです。
これに対して従属変数は、調査の結果、出てくる変数なので、上記の例の場合は、実際に学生がもらった言語テストの点数のことになります。
この従属変数は実際に調査をするまでどういう数値が出てくるかわからず、研究者がコントロールできないものです(これを知りたいがために調査をしています)。何か他の変数によって変化するようなものであれば、従属変数といえるようです。
独立変数はカテゴリー変数のことが多く、従属変数は、連続変数・カテゴリー変数のどちらもあり得るそうです。
過去のシリーズです。