04/21

(0:47) 今日は特に何もなかった日。

こういうときはじっくり考えて日記を書きたいところだが、スペイン語単語リストを作ろうとして遅くなってしまった。

 

英語以外の言語は、スペイン語ほどの言語でも親密度習得段階順の単語リストがなくて困る。

英語なら SIL SVL 12000 とか JACET 8000 とかあるんだけど。

(日本人ぐらいしかこういうことしないのか? 確かに基本○○語みたいな感じの単語帳使ってるのは日韓ぐらいというイメージがあるけど。台湾もかな)

 

単語を覚えるのに、基本単語から覚えるというのがいいに決まっている。

しかし、この基本単語というのが曲者で、単純に頻度で測ってはいいリストにならない。

頻度が低くても、子供が使うような身近な単語だと頭に入りやすいし、逆に頻度が高い単語でも抽象的なものだと頭に入りにくい。

(そういうわけで、英語の SIL SVL とか JACET とかのリストがあるわけだ)

 

スペイン語でも、そういう親密度習得段階順のリストがほしいところだ。

もし lemmatize された均衡コーパスがあれば、それぞれの文書の難しさをパラメータとして設定して、それによって機械学習で求めることができるかもしれない。

でも、現実的にはそのコーパスを手に入れるのでさえ大変だ。

ぼく個人のスペイン語学習のためではとても割に合わない。

 

それにしても、どうして英語圏のようなところでこういうリスト作りをやらないんだろう?

スペイン語学習者は多いはずなのに。

まったく。

 

結局、無駄だと思いながら適当に個人用単語リストをメンテナンスすることにする。

志が低い。

はぁ。