誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性

  • 光文社
3.99
  • (32)
  • (46)
  • (19)
  • (4)
  • (2)
本棚登録 : 478
レビュー : 52
  • Amazon.co.jp ・本 (352ページ)
  • / ISBN・EAN: 9784334962166

感想・レビュー・書評

並び替え
表示形式
表示件数
  • 著者はGoogleの検索データをもとに、統計分析を行って、いかに人々が周りの目がないときには正直になるのかを明らかにした。ことさら、セックスと人種差別に関する検索ワードからわかる事実はいくぶんか衝撃的でもあり、ある意味では予想に沿ったものでもあった。著者は、「グーグル検索こそ、人間心理についてこれまで収集された最も重要なデータセットだと確信している」ーなぜなら「グーグルのデータの価値が非常に高いのは、規模が大きいからではない。人々が真情を吐露しているからだ」

    たとえば、「トランプ支持が最も強かった地域は、「ニガー」という語を最もよく検索していた地域だったのだ」ということがデータ分析の結果として明らかになってしまう。

    たとえば、「米国では「天気」よりも「ポルノ」の検索のほうが多い」

    たとえば、「妻が夫をゲイなのではないかと疑うことは案外多いこともわかっている。彼女たちはそれを、驚くほど共通の検索フレーズ――「私の夫はゲイか?」――で調べている。「私の夫は……」検索において、「ゲイか?」はそれに次いで2番目に多い「浮気しているか?」よりも10%多い。「アルコール依存症か?」よりも8倍、「鬱か?」より10 倍も多いのだ。何より啓示的なことに、夫がゲイなのではないかと疑っている女性の人口比は、寛容性の低い地域のほうがずっと多い」

    たとえば、「失業率が1%上がるたびに、「児童虐待」と「児童ネグレクト」の検索は3%上がっていた」

    ビッグデータ分析の重要性が叫ばれているが、重要なのは量ではなく、その質であると著者はいう。たとえば、「フェイスブックはデジタル自白剤ではなく、「自分はこんなにいい暮らしをしていると友人にデジタル自慢させる薬」」だし、ネットフリックスは「人の言葉を信じるな、行動を信じろ」といった上で「アルゴリズムは本人よりもよくその人をわかっているんだ」と付け加える。「借金希望者の言葉遣いが、返済率の強力な予言因子になる」こともわかる - 「神に言及した人は2.2倍も借金を踏み倒しやすい」らしい。

  • ビッグデータ分析に興味があるけど今のところ内容はさっぱり、という人にオススメ。ビッグデータ分析の魅力と効用、限界について平易な文章でわかりやすく解説されている。取り上げている実例も面白く、楽しく読めた。
    「広告には効果がある?」「脱税するのはどんな人?」「子育てするのに最適な場所は?」…なんてことがわかるというのだから、本書の諭すように『正しいデータと正しい問い』によりビッグデータをきちんと使いこなせれば、来る数十年で社会は劇的に変わるのではないかと思う。
    私たちは未だかつてなかった「人間の本当の欲望や恐れを知ることの出来る道具」を手に入れたのだなー。
    個人的に大好きなピンカーが序文を寄せてるのもポイントが高い(3ページ半だけど)。ビッグデータ分析を「人間の妄念を覗く魅力的な窓」なんて流石シャレた言い回し!

  • 人は、アンケートにはついつい見栄を張ったりやウソをついてしまう。
    でも、検索窓にウソはつかない。
    だからGoogleの検索履歴とかを分析すれば、かなり真実に近い人間の嗜好が読み取れるぞコレ!!

    という本。

    それはいいんだけど、それにしても性的な話が多過ぎないか。そんなにそこ重要?確かにウソをつきたくなりやすい分野だから、特徴が出やすいとは思うけどそれにしてもだ。人間ってそんなにセックスに支配されてるかなぁ?

    ということで、1/3くらい読んだところでもういいやってなった。

    ふと、30年も前に読んだブライアン・キイのメディア・セックスを思い出したよ。

  • 著者によると、本書は『ヤバい経済学』の現代強化版。
    アンケート調査のような方法だと、必ずしも正直な回答が得られない。どうしてもバイアスがかかってしまう。また、多くの回答者を集めるのは時間とコストがかかる。ところがgoogleのような検索エンジンで、人々は自分に正直に検索を行うし、しかも膨大なデータを簡単に得ることができる。このデータを用いると色んなことがわかる(例:ゲイは男性人口の5%)し、新たな発見が今後もみつかるだろうという話。
    どのくらい人種差別しているか、たとえ面と向かって聞かれなくても、自分は人種差別するような人間ではないと多くの人は答えるだろうが、黒人を差別するniggerなんて検索数が多い地域とオバマが大統領選で苦戦した地域が重なる。
    コンドームの年間販売量は年6億個に満たないのに、女性の回答によると11億個、男性の回答によると16億個のコンドームを使用していることになる。嘘だらけだ。
    本書で紹介されている興味深い事実は多々あるので、興味があれば、一読をお勧めしたい。
    例えば、「セックスレス 結婚」の検索回数は、「不幸 結婚」の3.5倍、「愛のない結婚」の8倍も多い。
    子供を持てば後悔するかという検索より、子供を持たないと後悔するかという検索の方が7倍も多い。他方、子供がいる成人は子供がいない成人より、3.6倍もその決断を悔いているとgoogleに告白する。
    女性は、男性がペニスについて検索するのと同じほど、陰部について検索しており、最大の関心は、その悪臭と対策だ。
    言い間違いや書き間違いには性的願望は現れない。
    貧困層が長生きできる都市は、汚染度が最も少ない都市や健康保険の被保険率が最も高い都市などではなく、多くの富裕層が住んでいる都市である。
    借金を踏み倒す人は、融資申し込みの際に「神(God)」「お返しします(will pay)」「病院(hospital)」「約束します(promise)」「ありがとうございます(thank you)」という言葉を良く使う。
    暴力映画が封切られると、街の犯罪は減る。等々。

  • 人間はアンケート調査のとき、匿名でも嘘をつく(社会的望ましさバイアス)。セックスの回数を多く申告し、人種差別はしないし偏見もないと答える。しかし、コンドームの消費される数を調べるとじっさいのセックスの回数が少ないことが分かるし、「nigger」とググるひとはまだまだいる。

    直観はしばしば頼りになるが、バイアスは避けられない。夫婦関係は共通の友人がいたほうが長続きするように直観的には思えるが、それは間違っている。バスケ選手は貧しい地域から生まれるような気がするが、中流が出身の選手の方が多い。

    ビッグデータは1.新しいデータをもたらし2.正直なデータをもたらしい3.部分集合に絞り込みやすく4.比較対象試験が手軽にできる。

    ビッグデータを使って何かをするときの教訓1.データが重要視されていない領域に乗り込む2.予測がなぜ正確になるのかを説明できる必要はない

    データから分かることいろいろ。SNSでは自分の幸福を盛る。暴力的な映画は暴力的な人間を隔離し、アルコールから遠ざけることで暴力犯罪を減らす。一部の女性は暴力的なポルノについて検索する。パートナーがセックスに応じてくれないという検索は女性の方が多い。学校の教育方針は生徒の今後を予測しない

  • 著者はグーグルの元データ分析者。
    グーグルの検索から、アンケートでは決して現れない人の本音を探ることができる、というのがタイトルにもなったテーマ。
    それだけではなく、データ量が膨大なだけに対象を細かく絞って比較検証を行ったり、これまで見過ごされていたデータの有効性が明らかになったり、オンラインの同時性を活かして容易に実験を行ったり、とビッグデータの守備範囲は広い。ビッグデータという言葉は一般的にはなったが、その本当の意味合いを教えてくれる。
    しかしデータの量は膨大になったが、それをどのように使うのか、どう解釈するのかは人間。その点、データサイエンティストの役割が決定的に重大になったと言える。
    ビッグデータ礼賛ではなく、その限界や陥りやすい罠も解説されているのも良かった。

  • グーグル検索などのデジタル自白剤で得られたビッグデータでわかった人間の本性。
    ひとは、アンケート調査に対しては嘘をつく。
    貧困層の多い町からは有力スポーツ選手は出にくい。
    農村人口の多い地域のほうが、精神的に不安を抱えているひとが多い。
    書き間違いは、性的な潜在意識を表すものではない。
    夫婦が異なる趣味、異なる交際範囲を持っている方が、離婚する率が低い。
    オバマは、人種差別によって不利益を被っていた。
    男は性器の大きさに悩み、女は性器の臭いに悩む。
    私はXXXとセックスしたい、という検索の4分の3は、母親とのセックス願望。
    女性は、自分の話題に同調し、共感してくれる男性を好む。相手のことを尋ねてきたら、話題が尽きた証拠。
    親は性別で子供を差別している。男児には知性を求め、女児には容姿を求める。
    実は、リベラルも保守も同じようなニュースサイトを見ている。
    子供が8歳のときに流行っていたスポーツが生涯の好みのスポーツになる。
    データの絞り込みで得られる真実。所得階層の流動性は、アメリカ全土では高くないが、非常に高い地域もある。
    多くの富裕層が住んでいる地域の住民は、(その人自身が貧困でも)長生きできる可能性が高い。
    教育費支出が高いと、子供が中の上くらいまで豊かになる可能性が高まる。大学町、大都市、移民が多い地域は、超有名人が出る確率が高まる。
    A/Bテストで分かる真実。
    有力学校にギリギリで受かった子供とギリギリで落ちた子供の、成人後の所得水準は大して違わない。
    ビッグデータでも、成果が出ない分野もある。すでに徹底的な調査・分析が行われれいる分野、例えば、証券投資分析など。



  • 社会科学者にはいい時代になったなあ、と。
    物理など実験室で再現可能な科学と比べて、社会科学は実証が難しい、あるいは、ほぼ不可能である。
    その実証が、ビッグデータを用いて、ある程度まで可能になる。すべてではないが、計量的に実証可能なことが増える。

    フロイトの理論をデータで実証するあたりとか、面白かった。
    言い間違い、書き間違いに性的願望が現れるという理論は、偽である。現実の書き間違いのデータとランダムに生成した書き間違いのデータを比較した時、性的な言葉の言い間違いの量が現実の書き間違いのデータで有意に大きいということはなかった。
    大量のテキストデータと、ランダムなテキストの生成ができれば、こんな風に実証できるのね、と思う。

  • 調査や質問には表れてこない本音が、グーグル検索データから浮かび上がる。分割し、フィルターをかけても統計的に十分な数のデータ。人の行動を変えることに応用できるが、次元の呪いや倫理問題には留意。

    結果については断片的に読んだことがありましたが、初出は衝撃だったと思います。

  • 元Googleのデータサイエンティストが(普通に公開されてる範囲の)Google検索履歴などを用いて、直感的・通説とされている社会科学に対して検証を行っていく本書。
    著者が結びで、本書が「ヤバい経済学」の現代強化版であること、また人々がどう言ってるかでなく(データに従って)実際にどうしているかに従うことを重視する、といってるのを聞けばどう言った話題を取り扱ってるかなんとなくイメージできる人も多いのではないだろうか。

    ビッグデータというワードが目を引くが、正確には今まで大学の実験室の中で時間をかけて研究をしなければならなかった内容の一部を、検索履歴を含む急増している公開データを使って大きな分母から関心のあるサンプルデータを次々取得して通説などを検証していく印象が強かった。トピックは性的嗜好・差別・立身出世の可能性・親の無意識性差別・SNSの実態などなど、ネガティブなものも多いが、これは通説には、あるべき世界の願望をある程度反映していることが多いのではないかと思う。

    また著者がデータサイエンティストだったこともあってか、WebでのABテスト・次元の呪い・相関関係と因果関係の違い・ビッグデータに対するデータ分析の姿勢など、ある程度データサイエンス領域の分析方法自体に対する言及も多くあったように感じる。こういったトピックはあまり馴染みのない人にとっては(難しく感じるところもあると思うが)、興味深い内容は多いと思う。

全52件中 1 - 10件を表示

誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性のその他の作品

誰もが嘘をついている~ビッグデータ分析が暴く人間のヤバい本性~ Kindle版 誰もが嘘をついている~ビッグデータ分析が暴く人間のヤバい本性~ セス・スティーヴンズ=ダヴィドウィッツ

誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性を本棚に登録しているひと

ツイートする