- Amazon.co.jp ・本 (352ページ)
- / ISBN・EAN: 9784334962166
感想・レビュー・書評
-
ビックデータから分析できるもの、わかることを説明する本
まあコラムの集合としては良いかなレベル。冗長感がある。
ビックデータを用いることで多くの部分集合を見つけ出すことができる。そこから統計的な傾向を見ることができる。
ビックデータは大きな集合なのでいくつものランダム化試験を見つけ出すことができる。特に検索結果トレンドは本人の興味というなかなか表に出せないものを見いだせる詳細をみるコメント0件をすべて表示 -
誰もが嘘をついている
セス・スティーヴンズ=ダヴィドウィッツ
2018年2月20日発行
読んで、なんだか嬉しい
ビッグデータの活用の例を届けてもらえた
ビッグデータ解析が可能にしてくれたのは社会科学であり、行動科学の分野での新たな一面を見出してくれる事だろう
Googleでデータ・アナリストをしていた著者が
検索ワードをはじめとした、さまざまなビッグデータのデータセットを分析している
Googleのワード検索データから読み取れるのは、例えば 本を最後まで読んでくれる確率だ
90%が完読したと推定される
ドナ・タートの ゴールドフィンチという小説もあるが、経済学などの書籍の完読率は5%前後だ
たいていは最初の50Pまでで読んだ事にされていると言う
だから、この本の結びの項では、推敲を重ねるより飲みに出た方が得策だと締め括ってる
検索ワードの組み合わせが重要なのは理解できる
健康医療関連での例が引かれている
すい臓癌の場合
消化不良と検索してから、腹痛と検索する人は すい臓癌になるが
消化不良と検索してから、腹痛と検索しない人にはすい臓癌と診断される人はいなかったという
社会経済学でも社会調査に基づく研究がなされていて、例えば貧困とキラキラネームは関連性が高いことや
性生活で使用されるコンドームの数量などの試算データもあるそうだ 男女での回答の集計には11億個と16億個という開きがあり、さらにコンドームの実売数は6億個だと調査がある
嘘だらけだというのはこうした、アンケート回答など表向きの言葉は正確なものではないということだ
そこでGoogle検索ワードの活用に意味が出てくる
セルゲイ ブリンとラリー ペイジ Google創業者
が作ったリンク重視の検索システムが他の検索システムと差別化した優位点だった
これは新聞社のサイトは信用性が高いという証でもある
Google検索には新聞社のサイトからのリンクが重要だったからだ
この検索をするワードこそが人の本性を示しているビッグデータとなったのだ
人は常に嘘をついている
もしくは都合の良いことだけを言っている
Facebookなどを見ればわかりやすいだろう
SNSは秘密の上に成り立っていると言う
本性を表すようなことは言おうとしないのが人間なのだ
でも自分ひとりだけの時に検索するワードには本性が滲み出てくる
NetflixもAmazoのグレナードリンデンも、見たがりそうな情報をレコメンド:推薦する方法を選んだのは、自分が見たいものを質問しても本当に見てくれるとは限らないからだ
人は自分にも平気で嘘をついているのだ
デジタル自白剤という言い方でネット上のシステムを表現した
その効能は、
◆不安や気恥ずかしい行動を抱えているのは自分だけじゃないと自信を持たせてくれる
◆苦しんでいる人に気づかせてくれる
◆最も強力な価値は、問題を解決へと導く力
だと言う
◆◆◆ 多くの実験 ◆◆◆
ビッグデータの価値のひとつは、絞り込んだ上でパターン抽出もできること
小規模なサーベイでは決してできないことだ
例えば、貧困層の長寿は富裕層が多く住んでいるエリアであることのみが、相関因子であると言う
また出世する確率は出生地大きく起因していると言う
大学町と大都市だ かつ移民人口の多い事だ
少なくともアメリカでは、これが明らかな偏りとしてあるそうだ
逆に影響を与えない変数として驚くのは、自治体の教育費支出だった
Googleで、妊婦がよく検索するのは、
妊婦は○○をして良いか?
というものだ
国別で見ると
アメリカ 小エビを食べる
イギリス エビを食べる
オーストラリア クリームチーズを食べる
ナイジェリア 冷水を飲む
シンガポール 緑茶を飲む
スペイン パテを食べる
ドイツ 飛行機に乗る
ブラジル 髪を染める
日本はどんなワードなんだろう
◆ 暴力映画の公開後は、犯罪が減る
◆ 医療に役立てようと試みる研究者たち
アイザック コハネ、ジェームス ヘイウッドなど
◆ ビルゲイツが研究資金の提供を申し出た実験
インド農村部の教師に出勤手当の加算をした場合の欠勤率の低下と生徒の学力向上を調査した研究だ 識字率が7%上昇
◆ A/Bテストの容易な実施
◆ テレビ広告は、やっぱり効く
◆ 実験できない事象もある
例えば、指導者が暗殺された国で何が起こるか?
宝くじのように偶発的なもの
大学の合格者と落ちた人の差
ビッグデータで証券市場を予測できるか
IQを遺伝子研究で予言できるか
実験結果としては、お門違いであることを証明しただけだったさそうだ
ビッグデータもスモールデータで補完する必要がある 、、、
いや、むしろビッグデータを使ってスモールデータで検証されたことを補完することが重要だとした
倫理的にビッグデータの活用に適さないこともある
活用すべきでない局面もあることを理解するひつようがあるということを強調している
-
人の表層的な建前と、データの矛盾が具体的に示されていて面白かった。ビッグデータからどこまで人の医療や経済の要求や流行を読み取れるようになり、今後の戦略的なマーケティング等に影響を及ぼすものになり得ると考えると興味深い。
自分の見ているものが、本質的に果たして正しいことか疑う視野を持ちたい。 -
調査や質問には表れてこない本音が、グーグル検索データから浮かび上がる。分割し、フィルターをかけても統計的に十分な数のデータ。人の行動を変えることに応用できるが、次元の呪いや倫理問題には留意。
結果については断片的に読んだことがありましたが、初出は衝撃だったと思います。 -
とても興味深く読み進めることができた。
しかし、探索ワードをこのように調べられるなんて、恐ろしい。笑 -
人は、アンケートにはついつい見栄を張ったりやウソをついてしまう。
でも、検索窓にウソはつかない。
だからGoogleの検索履歴とかを分析すれば、かなり真実に近い人間の嗜好が読み取れるぞコレ!!
という本。
それはいいんだけど、それにしても性的な話が多過ぎないか。そんなにそこ重要?確かにウソをつきたくなりやすい分野だから、特徴が出やすいとは思うけどそれにしてもだ。人間ってそんなにセックスに支配されてるかなぁ?
ということで、1/3くらい読んだところでもういいやってなった。
ふと、30年も前に読んだブライアン・キイのメディア・セックスを思い出したよ。 -
トランプ氏が大統領になったのは大番狂わせだと言われているが、グーグルの検索データを分析するとそうでもないらしい。口では人種差別をなくしましょうと言っているが、裏では差別的な単語を検索したりしている。みんな日常的に嘘をついているのだ。最近ではビッグデータが誰にでも手に入るようになったので、様々な可能性を秘めているが、逆に分析する人間のばいあがかかったりと問題がいろいろありそうだと感じた。この本の著者はご家族が仰られるように変人だと思った。いろいろ頑張れ!
-
アプローチはおもしろいが、性的なこと以外のテーマについては若干の物足りなさを感じる。
-
装丁はひどいが中身は良かった