8/20

(23:51) しまった。うっかりしているとこんな時間に。

いろいろ考えることがあったはずなのに。

 

今日は「数理言語学事典」を読んだ。

分野全体を概観する本で、刺激になった。

そういえば構文解析にも興味があったことを思い出した。

ちゃんと理解しているのはCYK(CKY)法ぐらいしかない。

アーリー法とか、ほかのもまた勉強してみようかな。

 

そういえば、N-gram デコードとか高次CRFとか、ほったらかしのやつがあるから何とかしたい気持ちもある。

これまでスライド書いたりブログ記事書いたりいろいろしたんだけど、なかなか人に伝わらない。

 

特に N-gram デコードなんか、そんなに難しいことをやっているわけでもないのに。

でもたぶん、あれは「真面目に読まないで理解できる」範囲を超えているんだろう。

そして、人間が何かを真面目に読むのはそれに権威があるときだけだ。

つまり、論文にして権威のある学会に出したらいい。

でも、それはぼくにとって利益がない割に面倒すぎる。

はぁ。

 

(日付の都合でいったん切った)

この問題に関してはずーっと同じ所を堂々巡りしている。

面白い(と思う)ネタがある→人と共有したい→それには論文にして学会に出すという(面白いネタをわかってもらうという利益を超えた)負担がある→しょうがない

 

そういえば、CRF に関してはツイッターで興味を持ってくれそうな人もいるから直接話してみたいなーと思いつつ、何となく雰囲気的にできない。

まあ、東京にいればいつかはそういう機会もあるかもしれないな。

 

(0:05) そういえば、N-gram デコードに関しては、それを使った IME を作って公開するという手もあった。

再就職前まではその路線で頑張ってたんだけど。

しかし、IME というのは言語モデルだけではだめで、数字の処理とか細かいところまで含めて実用レベルにするのは大変だ。

まあ、実用レベルに行かないものを公開するというのもありかもしれないな。

それにしても、mozc があるとはいえ IME として使える形にするだけでも面倒だけど。

 

(1:20) 寝る。