08/27

(1:06) 今日はプリンタ共有設定で時間を取られてしまい、スペイン語の勉強ができなかった。

残念。

 

家には古い iMac があり、プリンタは USB でそれにつながっている。

印刷するとき、iMac からは普通にできるのだが、できれば地球(MacBook Pro Retina)からも印刷したいところ。

それで、iMacと地球の設定をいろいろいじってみたのだが、どうしてもできなかった。

 

ところで、家の中のネット環境は、NTT のルータに無線LANルータをブリッジモードにしてつないで、リビングなどではそれを使ってネットにアクセスしている。

しかし、自室ではその電波が弱すぎるため、有線でつないだiMacから Wifi でインターネット共有をして使っている。

 

しかし、どうもこのインターネット共有をしているとプリンタが使えないようなのだ。

ファイル共有はできているのに。

何とか解決したくて1時間以上触っていたが、結局どうにもならないままだった…。

 

今後、自室で地球から何かを印刷しようと思ったら、そのたびにルータ・ブリッジ側のネットにつながないといけない。

自室からだと電波も弱いのに…。

 

こういうとき、ぼくはどうしても根本的に解決してしまいたくなるほうだ。

しかし、どうしても方法が見つからないような場合(今日みたいに)、かなり時間を無駄にしてしまう…。

そのせいでスペイン語の単語を勉強する時間がなくなってしまった。

はぁ。

 

N-gram デコードについて先行研究がないか調べていると、こんなのがあった。

Restoration of arabic diacritics using dynamic programming

Higher Order n-gram Language Models for Arabic Diacritics Restoration

似たことをやっているのかな? と思ったけれど、やっぱり実際のプログラムを見てみたいところ。

 

実験を再現しようと思ったけれど、書いてあるアラビア語コーパスを落として解凍してみると、アラビア語のディレクトリが多数できて、どれをトレーニングに使ってどれをテストに使えばいいのかなど、まったくわからない。

困った。

 

それで、論文の著者に連絡して、使ったスクリプトなどをもらえないか聞いてみた。

それにしても、アラビア語が全然わからないので、それが残念だ。

結果を見ても、直感を働かせることができない。

 

そういえば、韓国語の文区切りを CRF でやった結果は 98.5% で、N-gram の99%より悪いと思ったのだが、diff を取ってみるとどちらも同じぐらいいい。

おかしいなと思って評価スクリプトを揃えてみると(これまで CRF のほうは CRFSuite の結果をそのまま見ていた)、どちらもほぼ 99% になった。

それなら、速度で圧倒的に上回る CRF のほうがいいに決まっている。

さすが、判別は判別器。(餅は餅屋的な)

(それで言うと、アラビア語の発音記号付与も判別タスクになるか)

(もし返事がもらえたら、N-gram のほかに CRF でもやってみたい)