2018年9月26日水曜日

【読書感想文】人の言葉を信じるな、行動を信じろ/セス・スティーヴンズ=ダヴィドウィッツ『誰もが嘘をついている』

このエントリーをはてなブックマークに追加

『誰もが嘘をついている
~ビッグデータ分析が暴く人間のヤバい本性~』

セス・スティーヴンズ=ダヴィドウィッツ (著)
酒井 泰介 (訳)

内容(e-honより)
グーグルの元データサイエンティストが、膨大な検索データを分析して米国の隠れた人種差別を暴くのを皮切りに、世界の男女の性的な悩みや願望から、名門校入学の効果、景気と児童虐待の関係まで、豊富な事例で人間と社会の真の姿を明かしていく。ビッグデータとは何なのか、どこにあるのか、それで何ができるのかをわかりやすく解説する一方、データ分析にまつわる罠、乱用の危険や倫理的問題にも触れる。ビッグデータ分析による社会学を「本当の科学」にする一冊!

Googleのデータサイエンティストが、検索データやその他さまざまなビッグデータから人の行動を解き明かしていく。
社会学や心理学といえば、これまではフロイトのように「ほんまかいな。わからんと思ってテキトーに言ってるやろ」的な言説が幅を利かせていた分野だが、数多くのデータが手に入るようになったことで統計的な裏付けのある事実が次々に明らかになるようになった。
この本の中でも書かれているように、ビッグデータを扱えるようになったことで社会学は検証可能な「本当の科学」になるのだ。
意外な事実が数多く紹介されていて、すごくおもしろい。

ただサブタイトルがどうも安っぽいのだけがマイナス点。
『ヤバい経済学』もそうだけど、この手の翻訳書ってどうしてこういうダサいタイトルをつけちゃうのかなあ。



2016年の大統領選挙で、大方の評論家の予想を裏切ってドナルド・トランプがアメリカ大統領選挙に勝利した。
多くの人の予想がはずれたわけだが、Googleの検索結果にはトランプ勝利の兆候は表れていたという。
 2012年、私はこのグーグル検索を通じて得た人種差別地図を使って、オバマが黒人であったことの真の影響を検証した。データは明白に示していた。人種差別的検索の多い地域でのオバマの得票率は、彼の前の民主党大統領選候補者として立ったジョン・ケリーの得票率よりもはるかに低かった。当該地域におけるこの関係は、学歴、年齢、教会活動への参加、銃所有率など他のどんな要因でも説明できなかった。そして高い人種差別的検索率は、他のどの民主党大統領選候補の劣勢ぶりの説明にもならなかった。オバマだけに当てはまることだったのだ。
この傾向は2012年だけの話ではない。

「あなたは有色人種に対して差別意識を持っていますか?」という質問をすれば、ほとんどの人はノーという。
ところが、「人種差別意識を持っていない」と答えた人が、ひとりでパソコンモニターやスマートフォンを前にするときは「Nigger」といった人種差別的な言葉を打ちこむのだ。
トランプ氏が下馬評を覆して勝利したのは、表にはあらわれないが根深く残る人種差別意識も一員だったとGoogleの検索データは教えてくれる。



人はかんたんに嘘をつく。他人に対して見栄を張るのはもちろん、匿名アンケートや無記名投票でも嘘をつく。
 さらに人は時に自分自身に対しても噓をつくという奇妙な習性がある。「たとえば学生として、自分は落ちこぼれであるだなんて認めたくはないものです」
 これが多くの人が自分は平均以上であると考える理由なのかもしれない。その程度たるや甚だしい。ある会社では、技術者の40%が自分はトップ5%以内だと回答し、大学教授の90%が自分は平均以上の仕事をしていると考えている。高校3年生の4分の1は協調性でトップ1%に入ると考えている。自分さえ欺く人々が、どうして世論調査に正直になれるだろうか?
ぼくはマーケティングの仕事をしているが、「マーケティングリサーチなんて嘘っぱち」ということはよく知られている。
「〇〇という商品があったら買いますか?」とアンケートをとったら多くの人が「買う」と答えるが、いざ発売してみたらぜんぜん売れない。こういうことがよくある。
アンケートに答えた人だって嘘をついたつもりはない。「あーいいねー」と思って「買う」と答えるわけだ。
でもじっさいに自分の財布からお金を出す場面になると「やっぱりいいか」となる。

自動車会社の創業者であるヘンリー・フォードの言葉(とされる言葉)に
「もし顧客に彼らの望むものを聞いていたら、彼らは『もっと速い馬が欲しい』と答えていただろう」
というものがある。
消費者は、自分がほしいものをよくわかっていないのだ。

リサーチと実際の商売がぜんぜん異なる結果になることなんてごくあたりまえのことだ。

過去の社会学では、アンケートが大きなウェイトが占めていた。
「人々は〇〇と答えた。だから〇〇だ」
そんな血液型占いレベルの信憑性しかなかった調査に、ビッグデータが風穴を開けてくれる。
 ネットフリックスも似た教訓を早期に学んだ。人の言葉を信じるな、行動を信じろ、だ。
 かつて同社のサイトでは、ユーザーが今は時間がないがいずれ見たい映画のリストを登録できた。こうすれば、時間ができたときにリマインド通知してやれるからだ。
 だがデータは意外だった。ユーザーは山ほどこのリストを登録したのに、後日それをリマインドしてもクリック率がほとんど上がらなかったのだ。
 ユーザーに数日後に見たい映画を登録させると、第二次世界大戦時の白黒の記録映画や堅い内容の外国映画など高尚で向学心あふれる映画がリスト入りする。だが数日後に彼らが実際に見たがるのは、ふだん通り、卑近なコメディや恋愛映画などである。人は常に自分に噓をついているのだ。
 この乖離に気づいたネットフリックスは見たい映画登録をやめ、似たような好みのユーザーが実際に見た映画に基づいた推奨モデルを作り出した。ユーザーに、彼らが好きと称する映画ではなく、データから彼らが見たがりそうな映画を提案するようにしたのだ。その結果、サイトへのアクセス数も視聴映画数も伸びた。ネットフリックスのデータサイエンティストだったサビエ・アマトリエインは、「アルゴリズムは本人よりもよくその人をわかっているんだ」と語った。
そうそう、わかる。
ぼくのAmazonお気に入りリストにも、小難しい本が並んでいる。「これは今読む気がしないけどいつか読んどいたほうがいい」とウィッシュリストに放りこむ。
でもいざ本を買うときになると「もうちょっと手軽に読めるやつのほうがいいな」「これは時間があってゆっくり読めるときに」と、べつの本を買うことになる。
かくしてぼくのウィッシュリストにある『キリスト教史』『サピエンス全史』 『進化の運命 -孤独な宇宙の必然としての人間-』はずっと買われぬままリストの下のほうに居座りつづける。

「人の言葉を信じるな、行動を信じろ」ってのはいい言葉だね。



ぼくもマーケターの端くれとして、さまざまなデータを活用している。

広告運用をしているのだが、よくクライアントから「こんな広告文がええんちゃうか?」といった提案を受ける。
キャッチコピーは誰でもすぐに作ることができるので(作るだけならね)、素人でも口をはさみやすいのだ。
ぼくは云う。「そうですか、では試してみましょう」
Webのいいところは、かんたんに複数パターンをテストできるところだ。
「見た目の美しさ、信頼性、そして機能性をあわせもつ高級腕時計」と「超クールでイカした高級腕時計。99,800円」のどちらがいいか、頭をひねって考える必要はない。アンケートをとる必要もない。
両方均等に配信すれば、どちらがクリックされたか、どちらが購入につながったのかがすぐにわかるのだ。
素人が五秒で思いついたコピーがいちばん良い成果を出すこともめずらしくない。

少し前なら広告代理店のコピーライターという人種にコピーを作ってもらう必要があった。作ってもらったコピーをありがたく拝受して、それがどれだけ売上につながっているのかもわからぬまま漫然と垂れ流すしかなかった。
そんな不確かなものに高いお金を払っていたのだから、今の時代から見るとなんてばかばかしいお金の使い方をしていたんだろうと呆れるばかりだ。



題材はGoogleの検索データだけではない。
ポルノサイトの意外な検索データ、「大成する競走馬を見つけるにはどうしたらいいか」や「好きなプロ野球チームは生まれた年によって決まる」など、話題は多岐にわたっている。どれもおもしろい。

データ解析の強みだけでなく、「ビッグデータではまだまだ予測できないこと」も書いているのが誠実でいい。

個人的に強い将来性を感じたのは医療の分野。
 結果は驚くべきものだった。当初「腰痛」を調べ、後に「肌の黄ばみ」と検索することはすい臓がんの予兆となるが、単に「腰痛」だけを調べた人の場合はさにあらず。同様に「消化不良」と調べてから「腹痛」を検索した人はすい臓がんになるが、「消化不良」と調べたものの後に「腹痛」と調べていない人はすい臓がんと診断されてはいないようだった。研究者たちは、すい臓がんらしいパターンで検索する人の5%から15%は、ほぼ確実にがんであるようだと突き止めた。あまり高い率ではないと思うかもしれない。だが本当にすい臓がんにかかっていれば、その程度でも、生存率を倍にできると思えば福音には違いない。
たとえば子供の身長と体重をデータベース化して、そこに彼らの持病を加味するだけで小児科分野での一大飛躍だというのだ。こうすれば子供の成長過程を、他の子の成長過程と比較できるようになる。コンピュータ分析によって、似たような成長軌道を示す子供同士を見つけ出し、自動的に警戒信号を発することもできる。身長の伸びが早期に止まってしまうこと――甲状腺機能低下症や脳腫瘍が疑われる――も発見できる。いずれも早期に診断ができれば恩恵は大きい。「子供はおおむね健康なものなので、これらは非常に珍しい症例で、1万人に1人というレベルです。データベース化されていれば、診断を少なくとも1年は早められると思います。請け合いですよ」とコハネは言う。

これはすごい。

1万人に1人というようなめずらしい病気であれば、ベテランの医師でも過去に1人診察したかどうか。人間の目だとどうしたって見落としが起こる。
しかし1万人に1人でも、世界中の子どもの成長履歴をデータベース化すればまとまった量になる。予測精度は人間よりもずっと高くなるだろう。

こういう研究が進めば、医師の仕事はずっと少なくなるだろう。少なくとも診察は機械任せにできそうだ。
発見の制度は上がる、医師の負担は軽減される、やればやるほどデータは溜まって正確になる。いいことだらけだ。

AIが人々の仕事を奪うと言われているが、医師の仕事がなくなって看護師の仕事だけが残る、みたいなことになるかもしれないね。



ビッグデータからさまざまなことがわかるようになって、これから仕事や学習の方法はどんどん変わるだろう。
今までは「なんとなくよさそうだから」「ずっとこうやってきたから」「経験者がおすすめするから」「専門家がこういうから」という理由でやってきたことが、「それじつは意味ないよ」「もっといい方法があるよ」となってしまうのだ。それも、統計的にきちんと裏付けられた形で。

それってすごくいいことだよね。従来のやりかたでやってきた年寄りは困るだろうけど。

ただ気がかりなのは、こうしたデータを誰が持つのかってこと。
人類に広く共有されるのか、それとも数少ない大企業が独占して利益のために使うのか……。

【関連記事】

人工知能を大統領に

【読書感想文】スティーヴン・D・レヴィット他『ヤバい経済学』 

【読書感想文】 スティーヴン・D・レヴィット 他 『超ヤバい経済学』



 その他の読書感想文はこちら



このエントリーをはてなブックマークに追加

0 件のコメント:

コメントを投稿