本ページはアフィリエイトプログラムによる収益を得ています
Amazon.co.jp ・電子書籍 (366ページ)
感想・レビュー・書評
-
アンケートでの回答よりもグーグルで検索される内容の方が本当のことが分かる。など、ビッグデータの活用で分かるようになること、それでも分からないもの、活用すべきシーン、むしろ活用すべきでないシーンなどが書かれている。
データ分析の分野というよりは、行動経済学の内容。実際、スティーブン・レヴィットの『ヤバい経済学』にインスパイアされたと最後に著者も述べているし、何度か引用もされている。
ビッグデータは万能ではなく、使える場面と使うべきでない場面がある。データを扱う人やデータに翻弄されたくない人は一度読んでみても良いかも。詳細をみるコメント0件をすべて表示 -
著者はグーグル勤務経験のあるデータサイエンティスト。少し前にもてはやされた(そして最近ちょっと聞かなくなっている)ビッグデータ分析を紹介している。特にグーグル検索のデータを利用した興味深い事例紹介が中心で、技術的な説明ではない。一般向けにビッグデータ分析の面白さを伝える本としてちょうどいいだろう。
従来、何かについて人々の意識調査を行う場合はアンケート形式で情報を集めるのが普通だった。しかしタイトルのように人々は嘘をつく。特にセックスや人種差別などがテーマの場合は、正直に答えなかったり見栄を張ったりする。しかしパソコンやスマホに検索ワードを入力する時は本音が出る。しかもアンケート等よりはるかに膨大なデータが集まるため、従来の方法ではわからなかった傾向や関連性を見出すことができる。
だが重要なのはむしろ後半で語られる、ビッグデータ分析では不可能なこと、やってはいけないことの説明だろう。特に「次元の呪い」という概念は初耳だった。説明される事象よりずっと多くの説明変数を調べると、統計的に有意と言えるほど相関のある変数が偶然に発生してしまう現象だ。株式相場の予測で実際にこの呪いにはまって失敗した事例が紹介されているが、これはビッグデータならではの誤謬と言えるだろう。
最近あまり話題にならなくなったのは、AIやVRなど新しい技術が流行し始めたからというのと、普通に活用される段階になったため話題性がなくなったというのがあるだろう。私の周囲ではあまり使われていないが、多くの企業で事業を検討する際に参考にされているのではないかと思う。置いていかれない程度に勉強しておきたい。 -
初めのほうはなるほど~と思って読んでいたものの、1/4あたりからいろいろな論文や事例を取り上げつつも実質同じことの繰り返し。タイトルどおり、「人間はアンケートなどの表面上の意見(収集される生データ)と、本心(実際の売上など結果)は違うよ」ということが手を変え品を変え書かれています。
-
ビッグデータを用いた分析事例。筆者の主張は、大事なのは「魔法のようにすごいこと」がビッグデータの分析によってできるようになるわけではなく、今までデータの入手が難しかったものの分析ができるようになるということ。これにより、心理学や社会科学がより実証可能になる。一方でファイナンスのように昨今の膨大なデータによってもなおデータが足りない(もしくは特徴づけられない)分野は残っている。そのような場合にはやはりまだ人によるトリアージやサポートが重要な貢献をする。
また、キャッチャーなタイトルにあらわされているとおり、インターネットの発達により従前のサーベイによると「観測による誤謬」とでもいうものにより真実のデータが手に入らなかった分野についてある程度信頼できるデータを集められるようになった。つまり、人々の表層的な言説ではなく行動に近い分析ができるようになった。
-
アンケート調査は(たとえそれが匿名で回答するタイプであっても)、人は「よく思われたい」というスケベ心が働いて本当に思っていることではなく美化した姿をもとに回答してしまうという。ところが検索エンジンの検索キーワード欄に対して嘘をつく人は少ない。そこに着目した著者は誰がいつどんなキーワードをどんな組み合わせで使っているのかを解析してみた。
ひゃー面白い。著者本人はもう少し違った表現を使っているけど、私の印象に残ったのは「これらのデータをちゃんと扱うことができれば、人は(アームチェアディテクティブならぬ)ビッグデータ人類学者になれる」というくだり。 -
グーグルの有効な使い方。事例がアメリカだけど面白い。
-
google検索データ、Pornhub(世界最大のポルノサイト)の閲覧データを解析し実証した著者による本。
ベースはビッグデータ解析についての本で、他の研究も豊富に紹介されている。
アメリカに暗然と存在する人種差別について明かしたり、中絶を厳しくする法律が施行されると非合法な中絶数が増えることを示すなど、かなりヘヴィな内容も含まれるが、著者のユーモアでそこまで重くならずに読めた。
途中でちょっと非モテっぽい自虐ネタを入れたりと、アメリカのギークの雰囲気が少し伝わってくる。
結局ビッグデータで明かされるのは「ああ、そう言われてみればそうだよね」とう内容が多い。
例えばセックスレスについて検索するのは女性が多い。直感には反しているかもしれないが、妻とセックスレスの夫に比べ、妻のほうが「他所で」解決するのは困難だから、それは検索数も増えるだろう。とも考えられる。
Pornhubのデータを解析した著者であり、性的な内容も多い。その中で筆者にとって「衝撃的」であったのは、例えば、男性の欲求対象として「女装した男」(検索順位77番目)、「おばあちゃん」(110番目)などがあること。そして女性によるPornhubの検索の25%は、女性がかぶる苦痛や恥辱を強調した動画であり、5%はどう有為を伴わないセックスの動画を(同サイトでは禁止されているにもかかわらず)探している。ということであった。
これは日本の男の娘や、レディコミック、少女マンガで描かれる性ファンタジーを見れば一目瞭然でもあるだろう。
結局ビッグデータで明かされるのは、社会の本音であり、露悪的だと感じる人もいるだろうが、それでもこれからの時代はデータを使いながら少しずつ前進していくしかないのだろう。オバマによる道徳心や寛容さを説く演説は、各社新聞紙に絶賛されたが、その裏では人種差別的な検索が増えていた。一方で、多くのアメリカ系イスラム教徒は、スポーツヒーローであり愛国的な兵士として国を守っているという演説の後には、イスラム教徒に肯定的なキーワードをつけて検索されることが増えた、というデータは示唆に富む。
それとPornhubのデータで筆者にとって「衝撃的」であったのは、例えば、男性の欲求対象として「女装した男」(検索順位77番目)、「おばあちゃん」(110番目)などがあること。そして女性によるPornhubの検索の25%は、女性がかぶる苦痛や恥辱を強調した動画であり、5%はどう有為を伴わないセックスの動画を(同サイトでは禁止されているにもかかわらず)探している。ということであった。
これは日本の男の娘や、レディコミック、少女マンガで描かれる性ファンタジーを見れば一目瞭然でもあるだろう。 -
人々が表面上で言っていることと、内心で思っていることが異なることをックデータ分析の事例によって示している。様々なバイアスや人々の醜悪な内面を暴いた例が書かれている。
-
サーベイにはいい格好してしまうけど、検索窓には自白してしまう、か。自白しているつもりはないだろうけれどね(笑
-
過去3度の大統領選では、検索語として先に入力された候補が当選している。さらに面白いのは、この入力順は、個々の州の投票動向の良い先行指標になる
ある技術分野の特許母集団を形成しようとしています。現在できているのは、検索式で1000件抽出した後に目視で100数十件まで絞る、ということです。目視の作業をできるだけ減らしたい。この100数十件を教師データにして、何とかできるだけ機械的に抽出できないものかと思います。
そもそも、近接言語検索で使うnearなどの閾値がわかりません。漠然と7とか10とか、勘と言えるほど良いモノでもなく、過去の誰かの検索結果から引っ張ってきたただただ適当です。
こういうところにも使えないかなと思って、統計の勉強しています。試験日まで後3ヶ月ちょっと、夏休み開けたら、本格的に勉強始めたいと思います。 -
たとえば 「夫は … … 」という語句と併せて 、 「私に授乳してほしいのか 」という検索がダントツに多い国はインドだなんて思ったことがあるだろうか?さらに男に授乳しているシ ーンを含むポルノの検索も 、インドとバングラデシュではどんな国より 4倍も多い 。こんなことは実際にデ ータを見るまで予想だにしなかった 。
セス・スティーヴンズ=ダヴィドウィッツの作品
本棚登録 :
感想 :
