あけましておめでとうございます。
今年もよろしくお願いします。たぶんにもれず、年越しプログラミングをしてました。
検索結果をCouchDBにとっておく。
昨日、twitter のTLで流れてはっとしたのですが、確かにtwitterの検索結果、履歴がさかのぼれなくなることがあって、これはこれで不便だなぁ、というときがあります。ということで、例によってCouchDBに放り込んじゃいましょう。今回は年も変わったということで、今後触る機会が減るであろうPythonで書きました(去年はPython結構仕事で書いた...)。
twitter の search API は twitter.com/search.json?q=XXX でとれて、認証がいらない、その上、必ず次のページへのリンクを"next_page"というフィールドに含めてくれるので非常に使いやすかったです。pagingをするAPIを提供する場合は、next/prev はHTMLだろうがJSONだろうがXMLだろうがちゃんと提供すべき。ハイパーリンク重要だっていってるじゃん。ちょうどCouchDB本のページングのレシピの部分を翻訳しているんだが、こんなのレシピでも何でもない、Viewの結果に next: "startkey=XXXX&...", prev:"startkey=XXX" というフィールドいれればいいだけじゃん、と一昨年の年末ぼやいてたっけか。変わってない。
検索結果は認証がいらないので、後日キーワード監視?サービスとして公開することにしようかと思います。これで、
- キーワードを登録して保管しておける。
- サービスとしてどんな検索キーワードがモニターされているのかがわかる(タグクラウドっぽく)
- あるtweetに対して、どんな検索キーワードを引っかけられているのかがわかる。
かなぁ。似たようなのありそうな気もしますが、ひとまず自分がほしいのと、探して試すより作った方が早そうなので。
あとは、ネガティブtweetが多いのかポジティブtweetが多いのか、とか盛り上がり具合とか。。その辺は 2004年頃のBlogの付加価値サービスとかわらんですね。そこまではやるかどうかしりませんが、githubにおいとくことにします。
とりあえず以下は書いたPythonスクリプト。Pythonは素人です。こんなのを書いていたら除夜の鐘が鳴っていました。
続きを読む