(1:09) 子供の熱はちょっと下がった。
(人間が日記に書く内容っぽい)
(こういうカッコをつけるのがよくないのでは)
(いいとは? よくないとは?)
今日も簡繁変換。
ランダムフォレストを試してみようかと思って Anaconda と scikit-learn をインストールしてみたけど、ランダムフォレストで簡繁変換をやろうとすると、前後の文脈を一文字一次元で扱わないといけなそうだな…。
前に「一」が出てくるかどうかで一次元、「二」が出てくるかどうかで一次元、といった感じで。
面倒そうなのでやめてしまった…。
独自実装のほうはそれなりにうまくいっている。
ルール同士をレーティングするようにして、ダメなルールの副作用を減らすようにしたら、精度99.8%にまで上がった。
(この精度は「判断すべき箇所」についての精度なので、変換文字数に対する精度はもっと高い)
(それに、テストデータの間違いもあるので、それを考えると精度は99.9%が上限ぐらいだと思う)
(訓練データとテストデータの間違いを修正したいところ)
後は、要らないルールを消すようにしてサイズを小さくしたら完成かな。
マザー2をちょっと進めた。
ツーソンで行方不明になった子の名前は「も」にしている。
(藻さんが喜びそうだ)
(ちなみに犬の名前を「かやこ」にしている)
(深い意味はない)