3.3 CSS Centering Guide
おそらくウェブ開発者なら誰しも一度は「CSSで何かをセンタリングする方法」という悪名高い質問を検索したことがあるだろう。この"css centering guide"という特定のクエリを選んだのは、この言葉がさまざまなタイトルに登場し、関連性のノイズを減らし、検索結果の順序をほぼGoogleの考える品質にするためである。
このクエリは、GoogleとMarketRankとが必ずしも一致しないわけではないことを示してくれる。
この場合、どのページが高品質であるかという点では一致するが、その順序についてはいくらかの差異が生じる。
3.4 スパム検出
これは、MarketRankの反SEO的な性質を示す小さな例だ。Googleで"biggest mistakes that kill startups"を検索すれば、私たちは"The 18 Mistakes That Kill Startups"というかなり似たタイトルのポール・グレアムのエッセーが出てくると予想するはずだ。
ところが代わりに表示されたのは、Business Insider Indiaの“Biggest Mistakes that kill Startups”(スタートアップを殺す最大の間違い)という記事だった。タイトルに"biggest"という単語が入っているため、より関連性が高いと判断された可能性がある。
一番の問題は、さまざまな広告に、ポール・グレアムのエッセーをペーストした“Biggest Mistakes that kill Startups”(スタートアップを殺す最大の間違い)という安っぽいフレーズが使われていることだった。
たとえGoogleが正当なウェブサイトであると見なしても、MarketRankはそのウェブサイトに0ポイントを付けているはずだ。
スパムや低品質のウェブサイトが正規のオンラインコミュニティで多くのポイントを得られることはないと想定できるから、MarketRankがスパムのフィルタリングに役立つと考えてよいだろう。
4. 制限と今後の課題
今回のMarketRank利用はかなりラフな方法で行ったため、改善の余地はまだまだ残っている。ただ、そうした改善とは別に、MarketRankにはもっと根本的な問題がある。この項でそこを説明しておこう。4.1 アップボートが真に意味するもの
前に、アップボートは品質の良さの指標であると言ったが、それは必ずしも真実ではない。実際にはどのプラットフォームでも、アップボートは記事の品質や著者の人気、記事によって生み出された議論の質、その他多くのものの組み合わせなのだ。
アップボートの価値のうち、品質が占める割合とそれ以外が占める割合は不明である。アップボートから品質を抽出するためのより良い方法を見つけることが、今後取り組むべき重要な課題になる。
4.2 誤検知と低いカバレッジ
MarketRankの最大の問題のひとつは、MarketRankでは多くのウェブサイトが表示されないことだ。多くの最高のウェブサイトは表示されるだろうが、MarketRankに表示されない良いウェブサイトもたくさんあるはずだ。
オンラインコミュニティの性質上、誤検知はほとんどないが、検知漏れは数多くある。優れたウェブページでも、タイミングが悪いせいでメインフィードやフロントページに掲載されないものが少なくない。
トップページのスペースが限られているため、その日にどんなに良いものが投稿されても、市場から正当に評価される機会を得られるものはごくわずかしかないのだ。
こうした問題は修正した方がいいのかもしれないが、おそらくこれはバグではなくもともとの特性なのだ。誤検知を減らし、検知漏れの率が高くなるように最適化するのは問題ないのだろう。インターネット上のほとんどのものはジャンクであり、私たちの見るものが間違いなく良いものである限り、多少良いものを見落としても構わないのだ。