Usage-based Language Learning(用法基盤学習)
昨日のUsage-based Language Learning(用法基盤学習)の動画の続きです。
- “Usage-based Language: Investigating the Latent Structures that Underpin Acquisition,” Nick Ellis. Wiley, 2013.
Nick EllisはUsage-based Language Learningについて多く執筆しています。
- Ellis, N. C., Römer, U. & O’Donnell, M. B. (2016). Usage-based Approaches to Language Acquisition and Processing: Cognitive and Corpus Investigations of Construction Grammar. Language Learning Monograph Series. Wiley-Blackwell.
この動画では、ジョージ・キングズリー・ジップ(George Kingsley Zipf)の提唱したジップの法則についても少し説明していました。全部理解したかわかりませんが、理解した範囲で記録しておきます。
L字型分布
ある文章で頻出頻度が高い順に単語を並べ、その頻度をグラフに表すと「L」の字のようになるようです。
つまり、少数の上位の単語の頻出頻度が非常に高く、その他の単語の頻度は非常に低いということになります。
これは文章でなくて、構文でもあてはまるようです。
例えば、動画に出てきていた例ですが、「動詞+along」という構文で考えてみると、
- Get along
- Come along
などいくつかの動詞の頻度が非常に高いようです。
それ以外の「動詞+along」の構文(driving alone, sing alongなど)の頻度は少ないようです。
ジップの法則(ジフの法則)
ジョージ・キングズリー・ジップ(George Kingsley Zipf)は、「頻度がN番目に大きい要素が全体に占める割合は1/Nに比例する」という法則も提示しています。
例えば、ある文章で、一番多いのが「の」、二番目が「を」、三番目が「に」という助詞だったとすると、一番多い「の」が全体に占める割合は10%、二番目の「を」は5%、三番目の「に」は3%になるようです。
これから、頻度がN番目に大きい要素が全体に占める割合は「10/順位(N)」で表せるといっているようです。
1番目の「の」は「10/1=10(%)」、2番目の「を」の場合「10/2= 5(%)」、3番目の「に」の場合は「10/3=3.333 %」ということになるようです。