04/09

(0:24) 髪を切った。

プールにちょっと入ってから、銀座のアップルストアに行ってMacBook Airの修理を依頼してきた。

めっっっっっっっっっちゃ感じ悪かった。

 

キーボード交換。

17000円。

はぁ。

 

MacBook Pro 買おうかなと思っていたけど、すっかり買う気が失せた。

まあ、買うにしても大赤字なんだけど…。

 

その後、人に会った。

 

多少、自然言語処理に関わることができるようになるかもしれない。

 

しかし、心境は複雑だ。

いろいろなことが頭に渦巻いている。

 

ぼくは自然言語処理が好きだ。

だから、自然言語処理に関わることであれば、ほかのことに優先してでもやってみたい。

 

でも、今回の件にはいろいろな不安点がある。

 

何より、ぼくは傲慢さが苦手なのだ。

機械翻訳というタスクに対して、また一般企業に対して、などなど。

 

たとえば、アカデミアでは高電社という会社に対するバカにしたような態度をだいぶ目にした。

機械翻訳業界にはぼくがゴキブリと呼んでいる人間のゴミが一匹いるが、あれもそのタイプだ。

高電社が何か悪いことでもしたというのか?

取るに足りない技術的に遅れた小さな会社ということでバカにしているだけだ。

 

ビッグデータを扱うと人間はハイになる。

扱っているデータサイズの分だけ自分が偉くなったような感覚があるようだ。

子供が電車の運転手になりたがるような、素朴な感覚だろうか。

 

そして、本質的なことを考えず、とりあえずデータサイズを大きくすればいいやみたいなヒャッハーな考え方になる。

そりゃ、データサイズを大きくすれば、その分はよくなるだろう。

しかし、そのデータサイズというのはどこまで大きくできるんだ?

人間が言語を産出する速度は有限だ。

ネット上のデータを全部使ったら、それで終わりじゃないか。

 

ネットは指数的に成長してきたから、人間の感覚ではこれから先も指数的に成長するような錯覚があるのかもしれない。

しかし、人間が言語を産出する速度が指数的に増えるわけがないじゃないか。

全人類がツイッター中毒になったときのデータ量が上限だ。

そしてそれは、今の何万倍というオーダーでもない。

 

要するに、精度を上げようと思うといつかは形態素解析構文解析という本質的なところに立ち戻らないといけなくなる。

しかし、ヒャッハーな思考回路を身につけてしまうと、それは難しいように思う。

 

このあたり、Google の K さんは非常に言語に誠実に向き合っている。

細かいところまで、誠心誠意気を配っている。

ビッグデータがあるうえにそんな熱意まであったら、ほかのところがいくら頑張っても勝てるわけがないじゃないか。

 

前にも書いたけど、機械翻訳にはどうも人を惑わす力があるようだ。

一番大きなデータと、一番優れた技術者を揃えた Google という非常にわかりやすいプレーヤーがいるのに、どういうわけか(真剣に謎だ)自分たちにはそれを覆すだけの何かがあると信じる。

それによる悲劇を、過去に何回も見た。

本当に、なんで、Google に勝てる(あるいはいいところまで行ける)と思うんだろう?

 

もっとも、ルールベース的なやり方なら、Google と別の側面で強さをアピールできるかもしれない。

というのは、統計的にやっている限り、どれだけやっても変なデータが入ることを防げないから、変な訳を出さないということに価値を置く場合には、平均的な精度は低くてもそれがアピールポイントになりうる。

しかし、ルールベースで今からやるということはもちろん問題外だ。

ルールベースで昔からの積み上げがあるところに一朝一夕で勝てるはずもない。

 

勝てるポイントがあるとしたら、Googleにはできることに制約があるというところがある。

人手のアノテーションというのを病的に嫌う文化がある(今は知らないが)から、ほかがそこを真面目にやったら勝てる可能性がないでもない。

しかし、いま機械翻訳をやるところはだいたいヒャッハー系だから、Google同様そういう地道なことを真面目にやるのは難しい。

(聞いた話では、そこに力を入れているというところもあるらしい。本当だろうか?)

 

まったく別の観点からの話。

 

もしぼくが自然言語処理をすることになったら、ぼくは一般プログラマのルートから降りることになる。

 

前の職場はいろいろクソだったけど、それでも Java 周りについてはいろいろ知識が増えた。

バージョン管理システムの運用ノウハウなんかも、一般企業で働きながらじゃないとなかなか身につかなかっただろう。

 

いくら、一人で WEB+DB PRESS とかを読んだとしても、第一線のウェブプログラマではいられない(まだ全然なってもいなかったけど)。

机上の勉強と実務とでは大違いだ。

 

仮に、ぼくが5年間自然言語処理をやった後で別のところに行きたいとなった場合、まったくつぶしが利かない。

ある言語の形態素解析器を開発できたとして、それが一般企業で何の役に立つと言うんだ?

結局、また1からやり直しだ。

 

ブログ記事はだいぶ多くの人に読んでもらえて、一部の人にはスーパーエンジニアのように勘違いされたような気がする。

でも、あの記事をちゃんと読めばわかるけど、ぼくはスーパーエンジニアじゃないから苦労していると書いてある。

そもそも、ぼくは仕事外のプログラミングはあまりしない。

たまに例外的に面白そうな題材があったら少しするぐらいだ。

 

もちろん、プログラミングに対する態度(よりよい方向の追求)は身についているつもりだし、あと5年後にまたプログラマをやることになったとしてもその時代の技術をちゃんと身につけるつもりではいるけれど、それじゃ20歳そこそこのプログラマと同じ条件でしか雇ってもらえない。

20歳そこそこでも、そういう態度を身につけた人ぐらいいくらでもいる。

5年後の45歳のぼくが、20歳のプログラマと同水準の給料をもらって、それで子供をちゃんと育てられるのか?

それに、加齢による劣化を考えたら、20歳よりも条件は下だろう。

過去からの積み上げなんて、この業界じゃ何にもならない。

MSX-BASICの昔話とか、話のネタにしかならない。

 

それでもぼくは、一般のプログラミングよりは自然言語処理がやりたい。

なんでこうなってしまったんだろう…。