(0:38) 今日もいつもと同じ。
別宅で論理出勤。
昼食はカレーヌードル。
(同じカップ麺というカテゴリーでも、人に押しつけられたよくわからないカップ麺とは大違いだ)
昼、やたらと眠かった。
昨日クローラを書いて夜更かししすぎた…。
5時半退勤、プールに行って帰宅。
クローラは無事に全データを取得して停止していた。
データはツイートのdivのinnerHTMLをそのまま保存したもの。
そのままではかなり冗長で、1GBぐらいある。
bzip2圧縮すると16MBぐらいになった。
簡単なスクリプトでテキスト部分を抽出した。
今度は圧縮前19MB、圧縮後5MBぐらい。
今日は早寝しよう…。