03/10

(0:38) 今日もいつもと同じ。

別宅で論理出勤。

 

昼食はカレーヌードル。

(同じカップ麺というカテゴリーでも、人に押しつけられたよくわからないカップ麺とは大違いだ)

 

昼、やたらと眠かった。

昨日クローラを書いて夜更かししすぎた…。

 

5時半退勤、プールに行って帰宅。

 

クローラは無事に全データを取得して停止していた。

 

データはツイートのdivのinnerHTMLをそのまま保存したもの。

そのままではかなり冗長で、1GBぐらいある。

bzip2圧縮すると16MBぐらいになった。

 

簡単なスクリプトでテキスト部分を抽出した。

今度は圧縮前19MB、圧縮後5MBぐらい。

 

今日は早寝しよう…。