誤差が大きい個別調査、組み合わせれば信頼度増す
物理学者で、2004年からウェブサイト「プリンストン選挙コンソーシアム」で全米の世論調査データを収集し、選挙結果の統計モデルを構築しているワン博士によると、世論調査では国民全員に対する調査は不可能であるため、数パーセントポイントの誤差はどうしても避けられない。
また、各調査機関はそれぞれの判断に基づき、結果に修正を加えている。対象となるグループによって、電話に出る割合や、実際に投票を行う割合に偏りがあるため、正確な結果を出すためには、調査実施側の独自判断と計算が必要とされる。
だが、各世論調査の統計を取れば、本物に近い結果が出せるという。世論調査の統計を取る各組織がまとめたデータを見ると、今年に入ってからの選挙戦ではクリントンがトランプに対し常に一定のリードを保っていることが分かる。次のグラフは、ハフポスト・ポールスターによる統計結果の例だ。
(Credit: Huffington Post Pollster)
ここで重要なのは、各調査結果の「平均値」ではなく、統計対象となる一連の数値を順番に並べ、ちょうど中間にある数値を取った「中央値」を調べることだ。平均値は、少数ながらも極端な数値の影響を受けやすい。
例えば、ミシガン州での世論調査では、クリントンが数ポイントリードしているとの結果がほとんどだが、うち一つだけ、クリントンが20ポイントもの差をつけているとの調査結果が出ている。中央値を取れば、クリントンのリードは数ポイントという結果が得られるが、平均値を取った場合、クリントンのリードが実際よりも大きく解釈されてしまう可能性が高い。