Nativelikeを調べる第二言語習得研究
第二言語学習者が、その言語のネイティブレベルの能力を持っているか(nativelike)を調査した研究は多々あります。
今回は、第二言語学習者をネイティブかどうか判断する際の問題を指摘したVanhove(2020)の論文を読みました。
- Vanhove, Jan. “When labeling L2 users as nativelike or not, consider classification errors.” Second Language Research (2019): 0267658319827055.
なお、ネイティブスピーカーを第二言語研究の基準とすることについての批判もあるので、そこも議論の対象になるのですが、この論文はそこは対象にしていません)
見逃し率の問題
Vanhoveは、これらの研究の問題として、見逃し率(miss rate)を考慮に入れていないことを挙げていました。
つまり、同じ基準でネイティブスピーカーに対して同じ調査をした場合、ときとしてネイティブスピーカーが「非母語話者」として誤って判断される可能性もあります。この見逃し率を考慮にいれる必要があるといっています。
既存の研究ではその見逃し率を考慮したものが少ないようですね。
見逃し率を考慮するために
その見逃し率を考慮するためにできることは2つあるといっています。
まずは、研究対象の第二言語学習者と似た年齢等のネイティブスピーカーを探して、同じ基準でテストをして、どのくらい見逃し率がでるか調べることです。
これはシンプルなやり方ではありますが、労力が半端ないです。
もう一つは、統計上の分類モデルを使って、研究データを再分析し、推測見逃し率を算出することです。
使える分析法の例として以下をあげていました。
- ロジスティック回帰分析(logistic regression)
- 判別分析(discriminant analysis)
- 分類木法( classification trees)
- ランダムフォレスト(random forests)
また、この論文では、自分が過去に収集したデータを使って、見逃し率を算出していました。
興味のある方は
第二言語習得研究の研究手法に興味のある方は、以下の入門書がおすすめです。
- Mackey, Alison, and Susan M. Gass. Second language research: Methodology and design. Routledge, 2015.
研究とは何かや、データ収集にあたっての問題、質的・量的研究の手法などを網羅しています。