08/22

(1:55) 結局、昨日の夜は日記を書いた後に例の操作性の悪い教習所ゲームで 3時ごろまで夜更かししてしまった。

QOL が下がってよくない。

 

今日も1時間以上やってしまった。

運転を学ぶ役には立ちそうもない(操作感が違いすぎる)のに。

面白くもないし、完全な時間の無駄だ。

もう触らないようにしよう…。

 

今日は韓国語の分割の実験を CRFSuite でやってみた。

だいたい F値が 95% ぐらいになった。

言語のタスクはこれぐらいの精度になりがちだな…。

結果を見てみると、テストデータの "한명" が "한 명" と切れているなど、問題のないところもそれなりにあった。

 

そのほかにも、昔書いた N-gram 変換で分割するのもやってみた。

共用環境なのでちょっと設定に手間取ったけど、なんとか動かすことができた。

まあまあいい感じだ。

ちょっとバグがあったので、精度は測れていないけど。

単語の切れ目の前後に "-" や "_" をつけるというので分かち書きを表現してみた。

"안 간다" なら、"_안_ _간- -다_" の 3つというように。

前後につけるのは冗長だけど、そうしないとうまくいかないという直感。

 

しかし、これはちょっと不自然かもしれないな。

スペースまたはその欠如をひとつの存在と見なして、"안 _ 간 - 다" という 5-gram と考えるほうがいいかもしれない。

ただ、これだとだいぶ N を増やさないといけなくなる。

10-gram ぐらいで、実質的に文字 5-gram になる感じかな。

それに、これも「文字」と「スペースまたはその欠如」という別のものを同列に並べることになるので、ちょっとモデル的におかしくなるかもしれない。

(未考察)

 

ところで、さっきツイッターの TL でおぞましいブログが流れてきた。

 

http://utsunomiyasoh.blog.fc2.com/blog-entry-127.html

 

子供が自殺したというのに、成績のことしか頭にない親…。

親が殺したようなものだ。

しかし、殺人罪も何も適用できない。

法律は無力だ…。

 

ぼくの母親も、これと似たようなタイプだったからよくわかる。

幸い、うちの場合は親のほうが死んでくれたからよかったけど。

 

この時代は未開社会なので、子供をどうしようとほぼ親の勝手ということになっている。

直接手を下さない限り、どんな精神的な虐待でも加え放題だ。

恐ろしい世の中だ。

 

まあ、ほかの記事もじっくり読んでみよう…。

それにしても、このコンテンツはもっと評価されてもいいと思う…。