(1:07) 今日も疲れた。
でも、昨日に比べるとだいぶマシになっている気がする。
妻は旅行のことを考えるだけでテンションが上がるようだ。
いいことをしたようでよかった。
(ぼくはあまりテンションが上がらない)
そういえば、ネットは SIM フリー端末を日本橋あたりで買って SIM カードを買ってテザリングするのがいいんじゃないかというツイッター情報をいただいた。
次に行くときに見てみよう。
仕事のほうはそこそこ順調。
辞書情報付与のところは、やはり大きなデータを使ったらちょうど 99% ぐらいになった。
しかし、よく見ると「ヴ」が含まれるやつで辞書とコーパスが不一致を起こしている。
直そうと思ったが、頭がこんがらがってしまった…。
語彙素・書字形・語形・発音があるので死ぬほど混乱する。
まあ、明日また見てみよう…。
セグメンテーション部分が動かなくなっていて(L-BFGS が止まってしまう)焦ったけど(こういうのは直せるかどうかわからないので)、Git で動いていたころのバージョンと比べてみると、素性の計算を二回やってしまっているようだった。
それでそのあたりを見てみると簡単に直せた。
よかった。
しかし、どういうわけか並列処理が相変わらずうまくいっていないので、だいぶ時間をかけて学習しないといけない。
といっても数時間なんだけど。
これで、生テキストから辞書情報付与までいけるメドが立った。
後はどうやって公開できるように持っていくかというところだな。
(公開するとなったら、いま Perl のワンライナーでごちゃごちゃやってる処理も Python などできれいに書き換えないと)
(Perl のままでも問題ない?)
(使う人のほうで触る必要がなければそれでもいいか)
(当然ワンライナーというわけにはいかないけど)
明日はプールがない日なので、またくら寿司に行こうという話になった。
贅沢だけど、月曜の寿司がひどかったので口直しにはいいかもしれないな。