04/22

(1:07) 今日も疲れた。

でも、昨日に比べるとだいぶマシになっている気がする。

 

妻は旅行のことを考えるだけでテンションが上がるようだ。

いいことをしたようでよかった。

(ぼくはあまりテンションが上がらない)

 

そういえば、ネットは SIM フリー端末を日本橋あたりで買って SIM カードを買ってテザリングするのがいいんじゃないかというツイッター情報をいただいた。

次に行くときに見てみよう。

 

仕事のほうはそこそこ順調。

 

辞書情報付与のところは、やはり大きなデータを使ったらちょうど 99% ぐらいになった。

しかし、よく見ると「ヴ」が含まれるやつで辞書とコーパスが不一致を起こしている。

直そうと思ったが、頭がこんがらがってしまった…。

語彙素・書字形・語形・発音があるので死ぬほど混乱する。

まあ、明日また見てみよう…。

 

セグメンテーション部分が動かなくなっていて(L-BFGS が止まってしまう)焦ったけど(こういうのは直せるかどうかわからないので)、Git で動いていたころのバージョンと比べてみると、素性の計算を二回やってしまっているようだった。

それでそのあたりを見てみると簡単に直せた。

よかった。

 

しかし、どういうわけか並列処理が相変わらずうまくいっていないので、だいぶ時間をかけて学習しないといけない。

といっても数時間なんだけど。

 

これで、生テキストから辞書情報付与までいけるメドが立った。

後はどうやって公開できるように持っていくかというところだな。

(公開するとなったら、いま Perlワンライナーでごちゃごちゃやってる処理も Python などできれいに書き換えないと)

Perl のままでも問題ない?)

(使う人のほうで触る必要がなければそれでもいいか)

(当然ワンライナーというわけにはいかないけど)

 

明日はプールがない日なので、またくら寿司に行こうという話になった。

贅沢だけど、月曜の寿司がひどかったので口直しにはいいかもしれないな。