2023年3月13日月曜日

【読書感想文】ゲアリー・スミス『データは騙る 改竄・捏造・不正を見抜く統計学』 / ランダムなものにもパターンを見つけてしまう私たち

このエントリーをはてなブックマークに追加

データは騙る

改竄・捏造・不正を見抜く統計学

ゲアリー・スミス(著) 川添節子(訳)

内容(e-honより)
「ビッグ・データ」の活用が叫ばれる一方、政府から科学界に至るまで、データの改竄や捏造は絶えない。世の中にあふれる一見もっともらしい数字や調査に、私たちはどう向き合えばいいのか?そんな声に応え、統計経済学のエキスパートがさまざまな数値から巧妙に導き出されるトリックを明かし、ダマされないための極意を伝授。ビジネス、研究、日常生活の各場面で役立つ楽しい統計学入門。


 データは正しい。とはよく言うが、現実的にはデータが嘘をつくことは多々ある。データが嘘をつくというより、嘘をつくためにもデータを使えるといったほうがいいかもしれない。

 データは食材だ。生のまま食べることはほとんどない。たいていは加工、調理されてから我々の前に運ばれてくる。その過程でうっかり、あるいは故意に、誤った情報が入ることがよくある。

 そんな「データが人を騙す例」を、実例を挙げて紹介した本。

「偶然の結果にもパターンは見いだせる」「生存者バイアス」「平均への回帰」「大数の法則」「あやしいグラフ」「交絡因子」「テキサスの狙撃兵」「理論なきデータ」「データなき理論」など、陥りやすいワナについて紹介している。




 たとえば生存者バイアス。

 まぎらわしい例もある。ニューヨーク・シティの動物病院に運びこまれた、高所から落ちたネコ一一五匹のうち、九階以上から落ちたネコの五パーセントが助からなかったのに対して、それより低い階から落ちたネコでは一〇パーセントが助からなかったという。獣医師らは、高いところから落ちたほうが滞空時間が長く、体を広げることができるため、パラシュート効果が見込めるからではないかと予想した。ほかに考えられる理由はあるだろうか。
 ここにも生存者バイアスがある。落下して死んでしまったネコは病院には運ばれないからだ。さらに、たとえ息があったとしても、高い階から落ちてひどいけがをしていれば、飼い主はあきらめて病院に連れていかないかもしれない。一方、低い階から落ちていれば、飼い主も希望を持って病院に連れていくだろうし、治療費の支払いも躊躇しないだろう。

「八十歳以上の喫煙者の健康状態を調べたら、非喫煙者と大きな差はなかった。喫煙は健康に害を及ぼさない」みたいなものだ。じつは多くの喫煙者が八十歳になる前に死んでいるかもしれないのに、生き残った人だけを調べているから正しい結論が得られない。

 よく見るのが「成功者が語る成功の秘訣」である。サンプルが少ないのはもちろん、そこには成功者バイアスが多く含まれている。

「成功している経営者の多くは不眠不休でがんばっていた。寝る間も惜しんで仕事にはげめば成功する」。その裏に、不眠不休でがんばって死んでしまった者や、不眠不休でがんばったのに倒産してしまった経営者は調査の対象に含まれない。

 スポーツでも一流選手はインタビューをされたり成功の秘訣を聞かれたりするが、同じように努力をして同じ練習をしたのに一流選手になれなかった者はインタビューされない。

「成功者が語る成功の秘訣」はほぼすべてが嘘っぱちだ。




「平均への回帰」も陥りやすい失敗だ。

 偶然や運に左右されることは、短期的にはすごく調子のいいときや絶不調のときもあるが、長期間続けていけば平均へと収束してゆく。

 であれば「短期的にすごく調子のいい選手」は、その後は平均へと近づく(つまり絶頂期よりも調子を落とす)可能性が高い。

 プロ野球の「2年目のジンクス(新人で活躍した選手は翌年調子を落としやすい)」、芸能界の「流行語大賞をとった芸人は一発屋になりやすい」などもただの「平均への回帰」で、ふしぎでもなんでもない。


 ノーベル賞を受賞したダニエル・カーネマンは、かつてイスラエルの飛行訓練の教官に、訓練生は怒るよりもほめたほうが早く上達するとアドバイスした。ところが、教官は強く反発した。

訓練生がアクロバット飛行を見事にやってのけたときにはよくほめた。ところが、それでもう一度やらせると、たいていうまくいかない。一方、下手くそな飛行をしたときには、わたしは怒鳴りつける。すると、次回はたいていうまくいく。だから、ほめるとうまくいく、怒ればうまくいかないなどと言わないでほしい。実際にはまったく逆なのだから。

 カーネマンには、この教官が平均への回帰にだまされているとわかった。いい飛行を行なった訓練生は、その飛行が示すような平均をはるかに上回る能力を持っているとは限らない。多くの場合、次の飛行の技術は前回を下回る。教官がほめようが、怒鳴ろうが、口をつぐもうが関係ない。カーネマンに反発した教官は、自分がほめたから訓練生の飛行がうまくいかなくなったと思っていた。実際には、訓練生の本当の出来はそれほどよくなかったのだ。同じように、下手くそな飛行をした訓練生は、概してその見た目ほど下手くそではないし、教官がどなり散らさなければ、次の飛行はもっとうまくやるだろう。
 カーネマンはのちにこう書いている。

 あれはうれしい瞬間で、あのとき私は世の中の重要な真実を一つ理解した。私たちには人がうまくやったときにはほめ、失敗したときには罰する傾向があり、さらに平均への回帰があるため、統計的に人をほめて報われず、罰して報われるという状況を人間は避けることができない。

 平均への回帰により「褒めると調子を落とし、叱ると調子が上がる」ことが起こりやすい。その結果、「人は褒めるより叱って伸ばすほうがいい」と誤った認識を持ってしまう指導者が多い。不幸なことだ。




 人には、パターンを見いだす習性がある。「右の道を通ったら悪いことが起こることが三回続いた。あっちには行かないようにしよう」「三百六十日ぐらいの周期で暑い寒いをくりかえしている。今は暑いから、そのうちまた寒い日が来るにちがいない」とか。これはきわめて有用な能力だ。パターンを見つけられるからこそ生きのびてこられたといってもいい。

 問題は、意味のないパターンにも意味を見いだしてしまうことだ。


 著者が株価チャートを投資家に見せたところ、投資家はこの株で儲ける方法を見つけた。だが、そのチャートは無作為に作られたグラフだった。

 チャートは本物の株価ではなかった。いたずら好きの教授(実は私である)が、学生にコインを投げさせてつくったものだった。どのケースでも「株価」は五〇ドルからスタートし、毎日の変動はコインを二五回投げて、それぞれ表が出れば五〇セントアップ、裏が出れば五〇セントダウンとした。たとえば一四回表、一一回裏が出たとしたら、その日は一ドル五〇セントの上昇となる。こうしてたくさんのチャートをつくり、そのうちの一〇枚を、パターンを見つけてくれれば、という期待とともにエドに送った。エドは期待を裏切らなかった。
 種明かしをすると、エドは心底がっかりしていた。売り買いすれば本当に利益を出せると思っていたからだ。しかし、彼がこの件から引き出した教訓は、期待していたものとはまるでちがった。エドが到達した結論は、「テクニカル分析でコイン投げを予想できる」というものだった。
 この一件が明らかにしているのは、データをあされば偶然以外の何物でもない統計パターンが必ず見つかるということを理解している人は少なく、プロの投資家も例外ではないということだ。理論なきデータは魅力的だが、過ちを犯しやすくなる。

 コイン投げの結果は完全にランダムだ。次に何が出るか、50%より高い確率で予想することはできない。

 にもかかわらず、人はランダムな結果からも「これまでのパターン」「これから起こるであろう傾向」を見いだしてしまう。

 サイコロを振って、奇数、奇数、偶数、奇数、奇数、偶数、ときたから次は奇数だ、とかね。

 私たち人間は生まれながらにして、自分を取りかこむ世の中を理解するようにできている。理解するというのは、パターンを見いだし、そのパターンを説明する理論を作り出すということだ。そして、そのパターンが、運不運といったランダムな事象によっていかに簡単に生まれるか、私たちはわかっていない。
 人間はパターンの誘惑に負けてしまうものだと肝に銘じたほうがいい。引き込まれる前に疑うべきだ。相関関係や傾向などのパターンは、それ自体は何の説明にもならない。パターンは理にかなった説明がなければ、ただのパターンでしかなく、理にかなった理論は新しいデータで検証しなければならない。




「人が陥りやすい罠」が数多く紹介されているので、知っておくと判断ミスを防ぐのに役立つかもしれない。

「○○必勝法」「勝ちパターン」みたいな言葉に引っかからないために。


【関連記事】

【読書感想文】まちがえない人は学べない / マシュー・サイド『失敗の科学』

【考察】自己啓発書を数学的に否定する



 その他の読書感想文はこちら


このエントリーをはてなブックマークに追加

0 件のコメント:

コメントを投稿