proxy のログ → ブックマ

何度か考えている proxy のログからよくアクセスするページを抜き出して、ブックマーク作成のサポートツールにするってやつ。

まずは、どうやってノイズを取る(or取りやすくする)かを考えないといかんのですなぁ。 拡張子で弾けるやつはそれほど苦労しないのですが、サーバーサイドで作成しているページや広告なんかをリストから除去する方法を考えないと。bloglines や mixi の URL がたくさんあるから、ドメイン毎にまとめる機能のもあるといいかも。

ん〜。もっとしっかり掘り下げないとダメだなぁ。