すべての夢のたび。

1日1記事ぐらいな感じでいきたい雑記ブログ

blogmapの汚染

更新のネタ探しのためにblogmapはよく見ていますけど、さいきん、ときどき、URLランキングが広告ページでいっぱいになってしまうことがあります。

RSSを配信しているWebサイト(主にblogサイト)を巡回し、記事中に含まれているURLの出現回数ランキングを生成しています。


という手法を利用し、「広告ぺージへのリンクだけのblog」を複数運営して、同じページをリンクすることでランキング入りしているようです。手法としてはシンプルですが、ランキングの汚染を防ぐのはなかなかむずかしいかもしれないですね。

やっぱり、人間によるフィルタのほうが、SPAM的なものを取り除くには向いているのかもしれない(要するにソーシャルブックマークですが)。その一方で、どうすればこの手合いを排除できるのかアルゴリズムを考えるのも、また楽しいものです。