すべての夢のたび。

1日1記事ぐらいな感じでいきたい雑記ブログ

検索語で選挙結果予測

こんにちは、「Yahoo! JAPANビッグデータレポート」チームです。
今回は7月21日に投票を控える参議院選挙についての分析をご報告いたします。
実施した分析とはズバリ、“「比例区」および「選挙区」での政党別獲得議席数予測”です。
昨年12月「衆議院議員選挙とYahoo!検索の驚くべき関係」という「Yahoo! JAPANビッグデータレポート」を公開しましたが、その分析結果から「Yahoo!検索」データなどのネット上の動きと、実際の得票数の間に高い相関があることがわかりました。
そこで、「Yahoo! JAPANビッグデータレポート」チームでは、前回の結果を元にしたモデルと、さらに前回とは異なるアプローチのモデルも加えて参議院選挙の投票前に獲得議席数を予測するという試みを行いました。


ビッグデータって流行語についてはいまひとつよくわかってないのですが、Wikipediaで調べると「通常のデータベース管理ツールなどで取り扱う事が困難なほど巨大な大きさのデータの集まり」となっています。ふむ。それじゃ容易に分析できたらそもそもビッグデータではないのではないかみたいな。

それはともかく、Yahoo!検索の検索データごときがビッグデータなの?って言われるとなんか違うような気がします。しかも要はこれ「いっぱい検索される党/候補にはいっぱい票が入る」って言ってるだけですよね。なんかそれExcelでもできそうな分析だよなぁ。

んで結果はというと自民圧勝で。どうなの? みんなそれでいいの? って思ってはてブのコメント見てみると、みなさん「投票日前に予想結果出すのって法律違反だろ」としか言ってなかったりして、突っ込みどころはソコなんか、って気持ちになりました。圧勝は覆しようがないってことなんですかね。

でもたとえばぼくのイメージではYahoo!の検索なんてネットリテラシーが低い人が使うもんで、ふつうはGoogleを使うんじゃないの?って思うわけです。その辺でなんか予測に偏りが出るんじゃないのかなーって気が少ししました。でも、より数が多く、選挙結果に影響を及ぼしやすい「そもそもネットなんか使わない年寄り」の投票行動は、Google利用者よりYahoo!利用者に近そうだからいいのかな。はてな利用者で分析したらすっげー左寄りになりそうですしねw