03/27

(1:09) 子供の熱はちょっと下がった。

(人間が日記に書く内容っぽい)

(こういうカッコをつけるのがよくないのでは)

(いいとは? よくないとは?)

 

今日も簡繁変換。

ランダムフォレストを試してみようかと思って Anaconda と scikit-learn をインストールしてみたけど、ランダムフォレストで簡繁変換をやろうとすると、前後の文脈を一文字一次元で扱わないといけなそうだな…。

前に「一」が出てくるかどうかで一次元、「二」が出てくるかどうかで一次元、といった感じで。

面倒そうなのでやめてしまった…。

 

独自実装のほうはそれなりにうまくいっている。

ルール同士をレーティングするようにして、ダメなルールの副作用を減らすようにしたら、精度99.8%にまで上がった。

(この精度は「判断すべき箇所」についての精度なので、変換文字数に対する精度はもっと高い)

(それに、テストデータの間違いもあるので、それを考えると精度は99.9%が上限ぐらいだと思う)

(訓練データとテストデータの間違いを修正したいところ)

 

後は、要らないルールを消すようにしてサイズを小さくしたら完成かな。

 

マザー2をちょっと進めた。

ツーソンで行方不明になった子の名前は「も」にしている。

(藻さんが喜びそうだ)

(ちなみに犬の名前を「かやこ」にしている)

(深い意味はない)