(1:55) 結局、昨日の夜は日記を書いた後に例の操作性の悪い教習所ゲームで 3時ごろまで夜更かししてしまった。
QOL が下がってよくない。
今日も1時間以上やってしまった。
運転を学ぶ役には立ちそうもない(操作感が違いすぎる)のに。
面白くもないし、完全な時間の無駄だ。
もう触らないようにしよう…。
今日は韓国語の分割の実験を CRFSuite でやってみた。
だいたい F値が 95% ぐらいになった。
言語のタスクはこれぐらいの精度になりがちだな…。
結果を見てみると、テストデータの "한명" が "한 명" と切れているなど、問題のないところもそれなりにあった。
そのほかにも、昔書いた N-gram 変換で分割するのもやってみた。
共用環境なのでちょっと設定に手間取ったけど、なんとか動かすことができた。
まあまあいい感じだ。
ちょっとバグがあったので、精度は測れていないけど。
単語の切れ目の前後に "-" や "_" をつけるというので分かち書きを表現してみた。
"안 간다" なら、"_안_ _간- -다_" の 3つというように。
前後につけるのは冗長だけど、そうしないとうまくいかないという直感。
しかし、これはちょっと不自然かもしれないな。
スペースまたはその欠如をひとつの存在と見なして、"안 _ 간 - 다" という 5-gram と考えるほうがいいかもしれない。
ただ、これだとだいぶ N を増やさないといけなくなる。
10-gram ぐらいで、実質的に文字 5-gram になる感じかな。
それに、これも「文字」と「スペースまたはその欠如」という別のものを同列に並べることになるので、ちょっとモデル的におかしくなるかもしれない。
(未考察)
ところで、さっきツイッターの TL でおぞましいブログが流れてきた。
http://utsunomiyasoh.blog.fc2.com/blog-entry-127.html
子供が自殺したというのに、成績のことしか頭にない親…。
親が殺したようなものだ。
しかし、殺人罪も何も適用できない。
法律は無力だ…。
ぼくの母親も、これと似たようなタイプだったからよくわかる。
幸い、うちの場合は親のほうが死んでくれたからよかったけど。
この時代は未開社会なので、子供をどうしようとほぼ親の勝手ということになっている。
直接手を下さない限り、どんな精神的な虐待でも加え放題だ。
恐ろしい世の中だ。
まあ、ほかの記事もじっくり読んでみよう…。
それにしても、このコンテンツはもっと評価されてもいいと思う…。