私たちが必要としているのはゲーム化(操作)しづらいランキングアルゴリズムだ。ここでは、SEOの影響を受けず、かつシンプルに計算できるランキングアルゴリズムMarketRankを紹介しよう。MarketRankの利点と限界を論じ、Googleと比較した結果も示していく。
1. イントロダクション&モチベーション
Google検索の「劣化」には多くの人が気づいている[3][4][5]。Googleにとって、高品質のウェブサイトとは適切なキーワードとバックリンク(相互リンク)を最適化しているサイトのことだ。SEOに最適化されたウェブサイトでなければ無視される。そのために、多くの人が「スパム」または「低品質」と見なすウェブサイトがGoogleの検索結果の上位に表示されるようになった。
ランキングアルゴリズムの筋の良しあしは、人々がゲーム化しようとしたときに生成される結果によって判断できる。例えば「システムのゲーム化」と「高品質のコンテンツの作成」が同じであれば、優れたアルゴリズムを作成したと言えるだろう。必要なのは、真に優れたコンテンツを作成することによってのみゲーム化できるランキングアルゴリズムなのだ。
品質は主観的なものであり、まだGoogleの検索結果で十分だと考えている人は多い。しかし私たちは、MarketRankによって生成される品質の種類は明らかに異なり、それが有用であると考えている。
2. MarketRankのアルゴリズム
2.1 マーケットのアナロジーPageRank[6]は、研究論文のアナロジーで構築されている。引用回数の多い研究論文ほどより良いものと見なされる。
MarketRankは、市場のアナロジーをベースに構築されている。市場価値が高いものは、おそらく良いものであると考えられる。
ここで言う市場とは、Reddit、Hacker News、Twitterといったオンラインコミュニティのことだ。これらのコミュニティにはそれぞれ、「いいね!」などに代表されるアップボート(賛成票)メカニズムがあり、ユーザーがアップボートするのはそのウェブサイトが過小評価されていると考えていると解釈できる。彼らはアップボートすることによってウェブサイトの市場価値を競り上げているのである。
したがって、MarketRankとは何かをごく大ざっぱに説明すれば、「すべての賛成票を合計するだけ」なのだ。値の精度を高めるためにもう少しやるべきことはあるが、基本的にはそう言い切ってよい。
2.2 生の市場価値
どんなウェブサイトも、その生の市場価値はオンラインコミュニティ内で与えられたメインスコアということになる。RedditとHacker Newsの場合は明らかに、メインスコアはアップボートの数である。Twitterでは、いくつか選択できる指標があるが、ここでは「いいね!」をメインスコアとして選択する。
ひとつのウェブサイトに対するすべてのコミュニティのメインスコアを集めたら、今度はその生の値を比較可能なものに変えることになる。インフレーションを調整し、すべてをひとつの通貨に変換する必要がある。