データの罠
統計マジック――仕事でデータ解析システムを構築したり、また、データに基づく事業計画を立てるとき、常に頭をよぎる言葉である。
本書によれば、「ある比率の精度をプラスマイナス5%の誤差で推定する場合、母集団が大きくても400弱」(22ページ)で十分だという。ただ、母集団が「無作為抽出」であって、誤差が「5%」あるというのが曲者である。ネット・アンケートの場合、ネット住人というフィルターがかかるから無作為抽出ではない。また、テレビの視聴率のようにコンマ数パーセントの単位で結果がほしい場合は、はるかに大きな母集団が必要である。
したがって、われわれが日常接している統計数値から得られる考察の大部分が、不正確な表現であると言える。
私自身、事業計画書を作成する際、データから恣意的な考察を導き出し、あたかも客観的結論であるかのようなまとめかたをしている意識がある。ただ、私が事業計画書に対して責任を負うので、ある程度は恣意的にさせてもらっており、この点は経営者も認識している。困るのは、調査結果に責任を持たないにもかかわらず、主観を含んだ結論を示す世論調査の類である。ある意味、国家ぐるみの詐欺とも言える。
このためか、本書の終盤は、社会批判が中心となってしまったことは残念である。終始客観的に「データの罠」を指摘してほしかった。
■メーカーサイト⇒集英社 データの罠
■販売店は こちら