誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性

  • 光文社
3.97
  • (33)
  • (46)
  • (22)
  • (4)
  • (2)
本棚登録 : 491
レビュー : 53
  • Amazon.co.jp ・本 (352ページ)
  • / ISBN・EAN: 9784334962166

感想・レビュー・書評

並び替え
表示形式
表示件数
  • 著者はGoogleの検索データをもとに、統計分析を行い、いかに人々が周りの目がないときには正直になるのかを明らかにした。ことさら、セックスと人種差別に関する検索ワードからわかる事実はいくぶんか衝撃的でもあるが、ある意味では予想に沿ったものでもあった。著者は、「グーグル検索こそ、人間心理についてこれまで収集された最も重要なデータセットだと確信している」ーなぜなら「グーグルのデータの価値が非常に高いのは、規模が大きいからではない。人々が真情を吐露している」からだ。

    ー たとえば、「トランプ支持が最も強かった地域は、「ニガー」という語を最もよく検索していた地域だったのだ」ということがデータ分析の結果として明らかになってしまう。

    ー たとえば、「米国では「天気」よりも「ポルノ」の検索のほうが多い」という不都合な真実も明らかにされる。

    ー たとえば、「妻が夫をゲイなのではないかと疑うことは案外多いこともわかっている。彼女たちはそれを、驚くほど共通の検索フレーズ――「私の夫はゲイか?」――で調べている。「私の夫は……」検索において、「ゲイか?」はそれに次いで2番目に多い「浮気しているか?」よりも10%多い。「アルコール依存症か?」よりも8倍、「鬱か?」より10 倍も多いのだ。何より啓示的なことに、夫がゲイなのではないかと疑っている女性の人口比は、寛容性の低い地域のほうがずっと多い」ということもわかる。

    ー たとえば、「失業率が1%上がるたびに、「児童虐待」と「児童ネグレクト」の検索は3%上がっていた」という形で貧困と虐待の相関性が明らかになる。

    今般、ビッグデータ分析の重要性が叫ばれているが、重要なのはその量ではなく、質であると著者はいう。その意味で、それぞれのOTTが集めているデータの質の違いにも着目されるべきである。「フェイスブックはデジタル自白剤ではなく、「自分はこんなにいい暮らしをしていると友人にデジタル自慢させる薬」」だし、ネットフリックスは「人の言葉を信じるな、行動を信じろ」といった上で「アルゴリズムは本人よりもよくその人をわかっているんだ」と付け加える。

    なお、「借金希望者の言葉遣いが、返済率の強力な予言因子になる」こともわかる - 「神に言及した人は2.2倍も借金を踏み倒しやすい」らしい...。

    • kazuya030さん
      とても面白そうなので、購入しました!情報ありがとうございます
      とても面白そうなので、購入しました!情報ありがとうございます
      2019/09/23
  • ビッグデータ分析に興味があるけど今のところ内容はさっぱり、という人にオススメ。ビッグデータ分析の魅力と効用、限界について平易な文章でわかりやすく解説されている。取り上げている実例も面白く、楽しく読めた。
    「広告には効果がある?」「脱税するのはどんな人?」「子育てするのに最適な場所は?」…なんてことがわかるというのだから、本書の諭すように『正しいデータと正しい問い』によりビッグデータをきちんと使いこなせれば、来る数十年で社会は劇的に変わるのではないかと思う。
    私たちは未だかつてなかった「人間の本当の欲望や恐れを知ることの出来る道具」を手に入れたのだなー。
    個人的に大好きなピンカーが序文を寄せてるのもポイントが高い(3ページ半だけど)。ビッグデータ分析を「人間の妄念を覗く魅力的な窓」なんて流石シャレた言い回し!

  • 人は、アンケートにはついつい見栄を張ったりやウソをついてしまう。
    でも、検索窓にウソはつかない。
    だからGoogleの検索履歴とかを分析すれば、かなり真実に近い人間の嗜好が読み取れるぞコレ!!

    という本。

    それはいいんだけど、それにしても性的な話が多過ぎないか。そんなにそこ重要?確かにウソをつきたくなりやすい分野だから、特徴が出やすいとは思うけどそれにしてもだ。人間ってそんなにセックスに支配されてるかなぁ?

    ということで、1/3くらい読んだところでもういいやってなった。

    ふと、30年も前に読んだブライアン・キイのメディア・セックスを思い出したよ。

  • ビックデータが明らかにする色々な真実を語った本。ただ、事例が当然ながら全部アメリカなので、もうちょっと…
    Googleの検索ワードを分析することで、人の考えや行動がわかる、というのはやはり面白く、いろんな事例が出てきて楽しい。SNSはやっぱり皆自分を良く見せようとしている、とか。世論調査とfacebookのプロフィールや投稿データの分析と検索傾向、それぞれの結果が異なるのは面白い。対面ベースの調査、オンラインだけど個人特定される環境での調査、完全匿名での調査。だんだん本音に近づいていくのでは、というのは確かにね。
    個々の事例は面白いけど、アメリカの事例なので割愛。ただ、ビックデータによって、より細かな分析が出来るのは面白いかな。データが増えたことでこれまでより詳細な分析が出来ると。これまでは国全体の状況しかわからなかったものが州単位とか、場合によっては市単位とか、で把握できるのは、より細かな打ち手が考えられるようになり、効果を上げやすいのかも。
    とかいうのを考えてみると、やっぱり地方への権限委譲がもっと進むべき、と思う。国単位で考えるべき政策はもちろんあるけど、県や市区町村レベルで考えた方が良いものもあるはず。
    良い環境に身を置くと人は良くなる。よく言われるけど、ビックデータ的には証明されているらしい。

  • 著者によると、本書は『ヤバい経済学』の現代強化版。
    アンケート調査のような方法だと、必ずしも正直な回答が得られない。どうしてもバイアスがかかってしまう。また、多くの回答者を集めるのは時間とコストがかかる。ところがgoogleのような検索エンジンで、人々は自分に正直に検索を行うし、しかも膨大なデータを簡単に得ることができる。このデータを用いると色んなことがわかる(例:ゲイは男性人口の5%)し、新たな発見が今後もみつかるだろうという話。
    どのくらい人種差別しているか、たとえ面と向かって聞かれなくても、自分は人種差別するような人間ではないと多くの人は答えるだろうが、黒人を差別するniggerなんて検索数が多い地域とオバマが大統領選で苦戦した地域が重なる。
    コンドームの年間販売量は年6億個に満たないのに、女性の回答によると11億個、男性の回答によると16億個のコンドームを使用していることになる。嘘だらけだ。
    本書で紹介されている興味深い事実は多々あるので、興味があれば、一読をお勧めしたい。
    例えば、「セックスレス 結婚」の検索回数は、「不幸 結婚」の3.5倍、「愛のない結婚」の8倍も多い。
    子供を持てば後悔するかという検索より、子供を持たないと後悔するかという検索の方が7倍も多い。他方、子供がいる成人は子供がいない成人より、3.6倍もその決断を悔いているとgoogleに告白する。
    女性は、男性がペニスについて検索するのと同じほど、陰部について検索しており、最大の関心は、その悪臭と対策だ。
    言い間違いや書き間違いには性的願望は現れない。
    貧困層が長生きできる都市は、汚染度が最も少ない都市や健康保険の被保険率が最も高い都市などではなく、多くの富裕層が住んでいる都市である。
    借金を踏み倒す人は、融資申し込みの際に「神(God)」「お返しします(will pay)」「病院(hospital)」「約束します(promise)」「ありがとうございます(thank you)」という言葉を良く使う。
    暴力映画が封切られると、街の犯罪は減る。等々。

  • 人間はアンケート調査のとき、匿名でも嘘をつく(社会的望ましさバイアス)。セックスの回数を多く申告し、人種差別はしないし偏見もないと答える。しかし、コンドームの消費される数を調べるとじっさいのセックスの回数が少ないことが分かるし、「nigger」とググるひとはまだまだいる。

    直観はしばしば頼りになるが、バイアスは避けられない。夫婦関係は共通の友人がいたほうが長続きするように直観的には思えるが、それは間違っている。バスケ選手は貧しい地域から生まれるような気がするが、中流が出身の選手の方が多い。

    ビッグデータは1.新しいデータをもたらし2.正直なデータをもたらしい3.部分集合に絞り込みやすく4.比較対象試験が手軽にできる。

    ビッグデータを使って何かをするときの教訓1.データが重要視されていない領域に乗り込む2.予測がなぜ正確になるのかを説明できる必要はない

    データから分かることいろいろ。SNSでは自分の幸福を盛る。暴力的な映画は暴力的な人間を隔離し、アルコールから遠ざけることで暴力犯罪を減らす。一部の女性は暴力的なポルノについて検索する。パートナーがセックスに応じてくれないという検索は女性の方が多い。学校の教育方針は生徒の今後を予測しない

  • 著者はグーグルの元データ分析者。
    グーグルの検索から、アンケートでは決して現れない人の本音を探ることができる、というのがタイトルにもなったテーマ。
    それだけではなく、データ量が膨大なだけに対象を細かく絞って比較検証を行ったり、これまで見過ごされていたデータの有効性が明らかになったり、オンラインの同時性を活かして容易に実験を行ったり、とビッグデータの守備範囲は広い。ビッグデータという言葉は一般的にはなったが、その本当の意味合いを教えてくれる。
    しかしデータの量は膨大になったが、それをどのように使うのか、どう解釈するのかは人間。その点、データサイエンティストの役割が決定的に重大になったと言える。
    ビッグデータ礼賛ではなく、その限界や陥りやすい罠も解説されているのも良かった。

  • グーグル検索などのデジタル自白剤で得られたビッグデータでわかった人間の本性。
    ひとは、アンケート調査に対しては嘘をつく。
    貧困層の多い町からは有力スポーツ選手は出にくい。
    農村人口の多い地域のほうが、精神的に不安を抱えているひとが多い。
    書き間違いは、性的な潜在意識を表すものではない。
    夫婦が異なる趣味、異なる交際範囲を持っている方が、離婚する率が低い。
    オバマは、人種差別によって不利益を被っていた。
    男は性器の大きさに悩み、女は性器の臭いに悩む。
    私はXXXとセックスしたい、という検索の4分の3は、母親とのセックス願望。
    女性は、自分の話題に同調し、共感してくれる男性を好む。相手のことを尋ねてきたら、話題が尽きた証拠。
    親は性別で子供を差別している。男児には知性を求め、女児には容姿を求める。
    実は、リベラルも保守も同じようなニュースサイトを見ている。
    子供が8歳のときに流行っていたスポーツが生涯の好みのスポーツになる。
    データの絞り込みで得られる真実。所得階層の流動性は、アメリカ全土では高くないが、非常に高い地域もある。
    多くの富裕層が住んでいる地域の住民は、(その人自身が貧困でも)長生きできる可能性が高い。
    教育費支出が高いと、子供が中の上くらいまで豊かになる可能性が高まる。大学町、大都市、移民が多い地域は、超有名人が出る確率が高まる。
    A/Bテストで分かる真実。
    有力学校にギリギリで受かった子供とギリギリで落ちた子供の、成人後の所得水準は大して違わない。
    ビッグデータでも、成果が出ない分野もある。すでに徹底的な調査・分析が行われれいる分野、例えば、証券投資分析など。



  • 社会科学者にはいい時代になったなあ、と。
    物理など実験室で再現可能な科学と比べて、社会科学は実証が難しい、あるいは、ほぼ不可能である。
    その実証が、ビッグデータを用いて、ある程度まで可能になる。すべてではないが、計量的に実証可能なことが増える。

    フロイトの理論をデータで実証するあたりとか、面白かった。
    言い間違い、書き間違いに性的願望が現れるという理論は、偽である。現実の書き間違いのデータとランダムに生成した書き間違いのデータを比較した時、性的な言葉の言い間違いの量が現実の書き間違いのデータで有意に大きいということはなかった。
    大量のテキストデータと、ランダムなテキストの生成ができれば、こんな風に実証できるのね、と思う。

  • 調査や質問には表れてこない本音が、グーグル検索データから浮かび上がる。分割し、フィルターをかけても統計的に十分な数のデータ。人の行動を変えることに応用できるが、次元の呪いや倫理問題には留意。

    結果については断片的に読んだことがありましたが、初出は衝撃だったと思います。

  • 元Googleのデータサイエンティストが(普通に公開されてる範囲の)Google検索履歴などを用いて、直感的・通説とされている社会科学に対して検証を行っていく本書。
    著者が結びで、本書が「ヤバい経済学」の現代強化版であること、また人々がどう言ってるかでなく(データに従って)実際にどうしているかに従うことを重視する、といってるのを聞けばどう言った話題を取り扱ってるかなんとなくイメージできる人も多いのではないだろうか。

    ビッグデータというワードが目を引くが、正確には今まで大学の実験室の中で時間をかけて研究をしなければならなかった内容の一部を、検索履歴を含む急増している公開データを使って大きな分母から関心のあるサンプルデータを次々取得して通説などを検証していく印象が強かった。トピックは性的嗜好・差別・立身出世の可能性・親の無意識性差別・SNSの実態などなど、ネガティブなものも多いが、これは通説には、あるべき世界の願望をある程度反映していることが多いのではないかと思う。

    また著者がデータサイエンティストだったこともあってか、WebでのABテスト・次元の呪い・相関関係と因果関係の違い・ビッグデータに対するデータ分析の姿勢など、ある程度データサイエンス領域の分析方法自体に対する言及も多くあったように感じる。こういったトピックはあまり馴染みのない人にとっては(難しく感じるところもあると思うが)、興味深い内容は多いと思う。

  • おもろかった!自分にも思い当たるけど、意識的か無意識的かウソついてんだなあみんなという気持ち
    1パートごとに分かれ気味で読みやすかった

  • 人の考えていることはわからない。全てをさらけ出して生きていける人はほとんどいない。
    社会を多くの人が住みやすくするために、データを使う。これまでは簡単には手に入らなかったビッグデータを使う。データサイエンティストは大切な仕事だ。

  • とても興味深く読み進めることができた。
    しかし、探索ワードをこのように調べられるなんて、恐ろしい。笑

  • こういうの読むとデータサイエンスを勉強したくなるだろうな〜高校生とかに読んでほしい。

  • 19/01/05読了
    おもしろかった!

    Google検索ではひとは取り繕わない、本音を吐くインセンティブがある、ことに依拠した分析が中心。

    人の言葉を信じるな、行動を信じろ、はエスノグラフィでも出てきた考えかた。ネットフリックスは見たい映画登録に意味はなく、似たような好みのユーザ(のちに分身検索として扱われる)の視聴歴からのリコメンドモデルを作り出した。

    オバマがイスラム教徒への敬意を語っても相手は怒りを募らせたが、彼らがどういった人物かを語れば(好奇心を刺激し情報を与えれば)ヘイトは減った。

    ビッグデータの利点は属性での絞り込み検索ができること。

    アメリカ人男性は自分が8歳頃に優勝した野球チームのファンになる傾向。
    低所得層から高所得層へあがる確立は都市により違う。教育投資が高く、宗教心が篤く犯罪率が低い地域。
    著名人を輩出しやすいのは大学町。また、移民が多い町。教育費の支出は関係ない。

    ビッグデータは、自然実験での因果検証を可能にもする。
    学校の格はさほど影響を与えない。境界線付近で進路がわかれたひとびとの、職や収入は同じ。

    できないことはある。
    次元、変数を増やすのは危うい。偶発的な相関性を示すかも。追検証は必須。

    倫理的にやってはいけないこともある。



  • 検索等のデータに隠された不都合な真実。人間の欲求の本質を思い知らされたような気分。

  • 広報・広告に携わる人にとって、知っておくべきことが広く著されている。
    ビックデータが、社会科学を、再現可能性のある本当の科学に変えていく、その具体的な道のりを紹介した本。

    6章の「世界中が実験室」では、「無作為抽出された比較対象実験」である「A/Bテスト」について紹介されている。企業のWEBサイト構築にも生かすべきではないかと思った。
    「A/Bテストの教訓は通説を警戒せよということである」「A/Bテストのもう一つの重要性は、えてして小さな違いが大きな効果を生むことにある」というところは、しっかりと認識しておきたい。ついつい自分の感覚が、論理が、正しいものであると固執しがちだが、(WEBサイト上の見出しのどれが選ばれやすいかということについては)「つまるところ、何一つ推測などできません。文字通り、すべてを試すのです」という結果であったようだ。

    7章の「できること、できないこと」では、ビックデータだけが魔法の剣ではないことにも触れており、バランス感もある一冊。

  • タイトルにある誰もが嘘をついている、というのの嘘は、例えばSNS上や各種調査などに対する回答で、見栄を貼ったりとか何かしらのインセンティブがある場合は嘘をつくことがあるという意味。
    対してビッグデータ分析はgoogle等での検索ワードへの分析のことで。google検索では嘘をつくインセンティブが無いため正直な欲望が表されていて、かつ大量のデータがあるため、人間の本性をかなり表しているだろう、という内容。

    性生活に関する各種統計調査と、ポルノサイトを含む各種検索ワードの分析の乖離がセンセーショナルで分かりやすい。例えばアメリカ人は統計調査ほどセックスはしていない、パートナーへの不満はセックスレスがかなり多い、各国で人気のポルノなど。この辺りは本の中でとても多くのスペースを割いており、中々センセーショナル。

    ポルノ以外にも人種差別、投票予測、広告の効果、医療政策、教育など、ビッグデータ分析が有効な示唆をもたらす内容が多く紹介されている。学歴とその後の人生の成功にの因果関係は無いと言う話は割と衝撃的だった。

    後半ではビッグデータ分析の限界にも触れられている。ビッグデータ分析はポルノや人種差別といった、割に曖昧な認識や慣習、少ない統計での理論づけがされている事物について明確な知見を得ることには向いているが、一方で株式投資や遺伝子分析といった余りにデータの数や関係する因子が多いものの分析には注意が必要とかも説明されている。

    全体に分析の手法や基本的な概念の説明も丁寧で、勉強になる本だった。経済学に関する本を最後まで読み通す人の割合は数パーセントというようなことが最後に書いてあったけども、割と最後まで読んで良かったなと思える本だった。
    実際、目次に「ここまで読み通して来た人は何人?」というようなことが書いてあって、気になったのもあって最後まで読んでしまったのもあるのだけれども。

    長かったけど、良い本だった。

  • ビックデータ分析によって明かされる社会の仕組み、そして人間の本性。

    データ分析の凄さをまざまざと見せつけられます。

    それにしてもGoogleというのは世の中を今までとは全く違う世界にしたともいえる存在ですね。

    興味深く、かつ面白い内容なので夢中で読みました。

    続編が出るのがとても楽しみです。

  • 「次元の呪い」

  • 書評を上手く書くのはなかなか難しいので
    「ビッグデータが世の中に何をもたらしてくれるか
    楽しみにします」とだけ書いておきます。

  • Google検索のトレンド情報とアドワーズの件数と、現実のアンケートがずれているのは面白い。ただ、トレンド情報はどこまで信用して良いのだろう。

  • グーグルを主に使用している国ならば、グーグルトレンドやグーグルコリレイトを使って、利用者の深層心理へアクセスできる、という主旨の本。ただしビッグデータ分析にも限界があることをあわせて示唆している。

  • データ分析が好きな人にはとってもオススメな本。グーグルの検索結果を利用して本音を探ったりと面白い内容がたくさん。

  • ビックデータで何ができるのか?を超え、何をしてはいけないのか?まで踏み込んでいる。ビッグデータ分析で何でも分かると浮かれているこころを冷静にさせる書。それでも、直感的に信じていたことがGoogleトレンド検索で否定されるなど、ビックデータの力をまざまざと見せつけられると、これならなんでも分かってしまうとワクワクしてしまう。

  • グーグル検索をビッグデータ分析することで、SNS書き込みやアンケート調査では見えない人間の「ヤバい」本性が見えてくる。
    仕込まれているA/Bテストが莫大な利益を稼ぎ出している。
    ビッグデータ分析の可能性を示唆すると共に、その限界、次元の呪い、そして個人の特定はできないことも示している。

  • 匿名ユーザーによるGoogle検索で得たデータを基に人間や社会について『統計学的に』論じている風ではあるのだが、フロイトの胡散臭い夢占い並みのこじつけを感じた。
    というのも、そもそも一体どうやって匿名ユーザーの性別・人種・年齢などを特定したのかハッキリ示されていないので、検索から得たというデータを根拠にされると根本から信憑性を怪しまずにはいられなかった。
    インターネットではすべてを偽ることができるし、偽る以前に自分の個人情報の設定なんて細かいことをいちいちしているユーザーの存在自体も疑問だ。もちろん正確な個人情報を示しつつ正直にインターネットと向き合っているユーザーも大勢いるだろうけども。

    筆者自身も人々はFacebookに本音は綴らないのでソースにならないと疑念を呈する一方、Facebookと似たり寄ったりなSNSをソースにしてたりと論がわりかし雑な印象を受ける。
    そしてセックスの話が多いのだが、特に目新しさのないネタを何章にも渡って引き伸ばすので退屈だった。3分の1くらいのページで収まる内容だったのでは。

    p162まで熟読

  • ビッグデータで何がわかるか?というのを具体的に教えてくれる。
    多くのデータが集まる程、カテゴリー分けができて細かい分析ができるというのが興味深い。多くの変数をそれより少ない観察数で分析すると、あやまった因果関係や相関に翻弄される。観察数の数がビッグなのがポイントなのである。

    以下 具体例の数々
    Googleの検索は口ほどに物を言う。アンケート調査では現れない本音の欲望や悩みを分析すると・・・・
     人種差別とトランプの当選
     男女の性的悩み
     景気と児童虐待は 公的調査結果と反対の結果に・・・
    名門校にぎりぎり入れた人と落ちた人の将来比較
    スーパーボールの広告効果の金額は・・・・3億の広告費で8億売りあげ増
    プロ野球チームのファンになる理由は少年期のチーム成績
    ABテストはオバマの政治資金収集にも役に立った
     左心室の大きな馬は大成する。

  • トランプ氏が大統領になったのは大番狂わせだと言われているが、グーグルの検索データを分析するとそうでもないらしい。口では人種差別をなくしましょうと言っているが、裏では差別的な単語を検索したりしている。みんな日常的に嘘をついているのだ。最近ではビッグデータが誰にでも手に入るようになったので、様々な可能性を秘めているが、逆に分析する人間のばいあがかかったりと問題がいろいろありそうだと感じた。この本の著者はご家族が仰られるように変人だと思った。いろいろ頑張れ!

全53件中 1 - 30件を表示

誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性のその他の作品

誰もが嘘をついている~ビッグデータ分析が暴く人間のヤバい本性~ Kindle版 誰もが嘘をついている~ビッグデータ分析が暴く人間のヤバい本性~ セス・スティーヴンズ=ダヴィドウィッツ

誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性を本棚に登録しているひと

ツイートする