ビッグデータの正体 情報の産業革命が世界のすべてを変える

  • 講談社
3.99
  • (79)
  • (119)
  • (50)
  • (11)
  • (3)
本棚登録 : 988
感想 : 111
  • Amazon.co.jp ・本 (322ページ)
  • / ISBN・EAN: 9784062180610

作品紹介・あらすじ

2013年最大のキーワード「ビッグデータ」を初めて本格的に論じたベストセラー、待望の翻訳!!

我々の未来の生活、仕事、意識、すべてが「ビッグデータ」によって大きく変わる。
■なぜグーグルは複数の検索語と数式を組み合わせてインフルエンザの流行を予測できるのか■なぜアマゾンは社内の編集者や書評家をすべてお払い箱にして、データによる「お勧め本」システムを採用したのか■なぜ日本の研究者が集める「一人一人のお尻の形」のデータが「金の成る木」に変身するのか■なぜ「オレンジ色に塗られた中古車は故障が少ない」と判明したのか■なぜ電子書籍が発達すると「本」「読書」の概念が根本から変わってしまうのか?■なぜ今日の映画産業は、クランクインの前から「ヒット作」や「具体的な黒字・赤字」を予想できるのか?■なぜ「これからもっともセクシーで金を稼げる職業」は「データ・サイエンティスト」なのか 

伊藤穰一(MITメディアラボ所長)
「押し寄せる情報の波によって、世の中の捉え方自体が根本から変わろうとしている。この事実をあぶり出すうえで新境地を切り開いたのが、本書『ビッグデータの正体』だ。企業はいかに新たな価値を生み出すことができるのか、人々は物事の認知のあり方をどのように変える必要があるのか――本書は大胆な主張と見事な語り口でその答えをはっきりと示している」     
                
ローレンス・レッシグ(ハーバード大学ロースクール教授、『Free Culture』著者)
「物の見方を大きく変えてしまう本が10年に数冊は登場するが、まさに本書がそれだ。社会はビッグデータがもたらす変化に目を向け始めている。本書はその重要な出発点となる」

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • 2013年の作品。一見、無駄と思えるようなデータを大量に収集できるようになると、データをもとにした相関関係から、次に起きることが予測できるようになる。それは、因果関係で判断されてきた事項が変わることを意味する。因果関係としては不明だが相関関係としては正しいということが発生するからである。
    ビッグデータというのは、相関関係で物事を予測できるようになることであるという主張が非常にわかりやすく、その本質を捉えているように思う。このあと、AIの進化で、さらにその威力、予測力が増してくるわけである。
    AI+Big Dataというのは、インターネットの登場に匹敵する革命であると思う。そんな革命が短い期間のうちに次々と起こる現代。10年後の世界はもう、今とは全く異なるものになっていても別におかしくはない。

  • 最近流行りのビッグデータについて。

    中心的な話題は、ビッグデータは(数学的に)どのような手法で宝を見つけるかということよりも、どのようにビッグデータを使うかということ。
    ビッグデータの具体的な例を交えて説明している。

    本書を読んだ結果、ビッグデータという分野をあまり好きになれない。
    理由は2つ。
    1つは、どんなデータでも、ある程度数学の素養があれば、あるデータ間の相関関係は見つけることができるだろう。いわんや、ビッグデータと呼ばれる、巨大なデータの集合ならば・・・
    が、これらの相関を見つけるのがビッグデータの本質なのだろう。
    つまり、どんなデータでも都合よくデータを解析すれば、ある程度のアウトプットは見つけられるのです。
    従って、そのアウトプットが正しいことを検証する必要があると思います。
    そこで、2つめ。

    ビッグデータで評価された結果(相関)については、因果関係を問わないという風潮なのだとか。
    これは科学ではない。なぜならば、科学とは反証可能性を有する必要があるからである。
    しかしながら、ビッグデータのアウトプットは、複雑すぎてどのような計算結果から因果関係が出てきたのか調べることができない(著しく困難)。さらに、できたとしてもこじつけでしかない。

    例えば、アメリカではハリケーンが近づと、あるお菓子(ストロベリー味!)の売り上げが伸びるそうだ。
    なるほど。ビジネスをする限りでは因果関係なんて必要ない。
    全てはデータが語ってくれるのだから。

    しかし、エンジニアとして考えを述べると理由が必要なのです。
    全ての物事には因果関係があるのです(あるはずなのです)。
    なぜ、特定のお菓子の、特定の味の売上が伸びるのだろうか。。。
    この「なぜ」を突き詰めるのが面白いのですが、結果が使えれば全てよし。という姿勢。

    話がそれたが、ストロベリー味のお菓子の売り上げが伸びるのはハリケーンが来るからなのか、そこに別の隠れたパラメータがあって、それがハリケーンと関係があり、結果として、お菓子が売れるという可能性もある。
    が、反証できないし検証もできない。
    再度いうが、ビジネスという純粋に利潤を追い求めるのであれば、それはそれで価値があると思うが、科学として興味の対象とはなりえないと思います。

  • 2章から4章の章題が端的に言い表されていますね。
    壮大な帰納法、大掛かりなデータ・フィッティング。
    例えば、e^xという真理に基づく現象であると人類が気が付かなくても、a+bx+cx^2+dx^3+・・・と知っている関数で「近似式」ができればそれでいいじゃないか、という割り切り。
    実際には多項式だけでなく、例えばシグモイド関数?とか、〇〇関数、とかの変な関数もたくさん入れて、線形連結しても、データがビッグだから各項の係数は求められる、
    いや普通データの方が多くなるはずなので最小二乗近似の考えで「input→outputを予測する まともそうなモデル」ができるじゃないか、という考え方。
     要点は「モデルを記述するパラメータが3つ以上になると、人間の頭や手計算では 主因の3つのパラメータがどれか見出すことや、
    そこそこ当たる予測モデルを作るには どれだけ時間かけても判らん、となる現象であっても、
    計算機の力でフィッティングモデルが生成できて、それを用いて改善策とか未来を予測できる」という所かと思います。
     便利な道具があるのなら、これからどんどん それを使うべき。
    しかしエンジニアにとって悩ましいのは、以下の2点です。
    1)ブラックボックスのままで使えるなんて認めたら、人類は馬鹿のまま進化しないのでは?と思えてしまう。 本書p112あたりの話に関係します。
    2)本書第3章「精度は重要ではない」は上記の「まともそうなモデルができさえすれば、それで使い物になる」という点で認めます。
      しかし、ゴミデータを含むことを許容した際に、他のデータと著しく異なる「外れ値」を「バグ」とか「ゴミ」だと思い込むのは危ない気がします。
      その外れ値は、実は ある鋭敏かつ決定的な前提条件に依存している現象で、その発見が、「イノベーションの芽」が、見過ごされないか?が心配。
       p65~p66には「スペルミスや文法間違いがあっても間違いがどれくらいの確率で起こるか分かることが重要。
      その間違いも「あなたの言いたいことは〇〇では?」と自動修正コメント出せるので」とありますが、
      「間違い発見」の意味でのゴミの重要性ではなく、そのスペルミスや間違いが「新たな若者言葉発生」予測とか「言語の進化(変質)」予測になりえる、という様な捉え方です。

    1)2)を通じ、人間の役割は未だ残っていて、
      「ブラックボックスに甘んじず、その現象を言い表す真のモデルを考える努力をすること」と、
      「突飛な外れ値(異端児)を捨てずに、どうして突飛になったのか放っとかないこと」ではないかと思います。
     本書p288では「予測不能な物事、が人間に残されたこと」とありますが、それはビッグデータが未だ集まらない時点だけ人間が必要、という意味なら寂しい話です。

    あとは
    3)意図的なことがない自然科学、サイエンスの世界でも、この考え方は有用ですが、
     意図的なことが混じったり、因果関係が余計判らない人文科学、特に(社会)心理学や行動経済学方面に絶大な効果を示す気がします。p141当たりに関連します。
     ここが今後の莫大な利益の源泉になりそうなので、躍起になっている人たちがいるんですね。
     人類の常識が通じずコミュニケーションがとれない「宇宙人」の行動予測をするのに効果的、いや嫁さんの次の発言や行動を予測するのに有用な気がします。

  • データの活用が、社会やビジネスを劇的に変えていっている様子が、簡潔に分かりやすく描写されている。ビッグデータは、バズワードではなく、本当に世の中を変えるムーブメントなのかもしれない。ただし、今の世の中に存在もしないものを生み出す人間の独創性は依然として必要とも述べられており、個人的には、ビッグデータと独創性を生み出すデザイン思考の組み合わせが、これからのビジネスや社会の発展のエンジンになっていくのではないかと感じた。

  • 買う価値あり

  • ビッグデータの特徴として「因果から相関の関係へ」、つまり、答えが分かれば理由は要らないという点を本書は掲げている。これは大事な視点。しかし、この2つの関係は対立軸ではない。相関関係がわかることで因果関係の解明につながる。そいの意味で統計学だけが重要ではない。デザイン思考が求められる。また、知恵や価値創造といった部分がより重要な要素を持つ世界になるだろう。非常に落ち着いた視点でビッグデータを分析した良書。ぜひご一読を。

  • ☆は3つ

    この手のビジネス書は途中で眠くなって放り出してしまうので久しく読まなかったのだけれど、あることがきっかけで何年か振りに読んでしもうた。

    いつもほとんど本の内容やそれにまつわる感想を書くことは無いのだけれど今回は何も印象に残らなかったので感想を書く?

    人間は、なぜ?何?どうした?という「因果関係」を知りたがるのだそうだ。でもビッグデータがもたらすものは「相関関係」だけであってそこにあるかも知れない「因果関係」という事には端から注目しないらしい。換言すると、原因なんてどうでもよくて結果さえ予測出来ればそれで良し、ということになるのだ!

    ビッグデータと呼ばれるものの正体は、盗聴や盗撮はそこら中で行われているので、みなさま重々気をつけないといけんのだよ・・・というようなことではなくて、電話やNETを遣ったり、とにかく電気/電子機器を使った情報発信をすると、それらは全部記録されていて、悪い奴らがしたなめずりしながらこのビッグデータをどうやって使ってみんなを騙して金儲けしようか、と企んでいるから気をつけないといかんよ、ということなのらしい。

    ありゃ結局金儲けの話と、あんた気をつけにゃいかんよ、ということが結論の本やったのか。存外つまらんかったのう。

    しかし、巻末の参考文献のページが27ペシもあるのには参った。そんでそれが英語で書いてある!ときたもんだぁ~。もちろん全部無視したけどさw。 すまんこってす。すごすこ。

    • ryoukentさん
      おけえさん、こばんわぁ。今日はとても暑くてあつくてびぃ-るが旨くて幸せだよね。
      >流石の境地、ってなんかどっかの名所旧跡みたいな名前だねぇ。...
      おけえさん、こばんわぁ。今日はとても暑くてあつくてびぃ-るが旨くて幸せだよね。
      >流石の境地、ってなんかどっかの名所旧跡みたいな名前だねぇ。行くと、でかいお地蔵さんとかが居そうだし。すまぬ。
      2013/06/13
    • ほんやだワンさん
      何度見ても『ビッグダディの正体』に見えてしまう。

      ・・・ま、はやりモンとゆうことで。
      よく知らないのですケド。
      何度見ても『ビッグダディの正体』に見えてしまう。

      ・・・ま、はやりモンとゆうことで。
      よく知らないのですケド。
      2013/06/14
  • ビッグデータ、情報処理などに興味がある人にオススメの本。

    本書ではビッグデータのメリット、デメリット、デメリットへの対策について描かれている。

    様々なデータから得られる因果関係ではなく、相関関係に焦点を合わせることで情報に価値を生み出していると本書では述べられている。

    人間の脳は物事に因果関係を見出すことが好きなので勘違いしがちだが、ビッグデータの利用法を少しでも理解しておくことで昨今の企業(Facebookなど)に対する印象も変わってくるかもしれない。

    また、本書ではビッグデータによる個人情報の特定などへの対策も述べられている。現在の社会的な動きとしては情報銀行が挙げられると思う。気になる方はそちらについても調べてみるとよいと思う。

    重要なので示しておくが、著者はビッグデータだけを利用して課題を解決することを是としていない。やはり計算機が得意なこともあるし、人間が得意なこともあるといった具合である。

    気になった方は是非とも本書を読んで欲しい。
    個人的にはとてもお気に入りの本である。

  • 2020年代に読んでも記載されている将来に対する見通しは正確なものが多く、筆者がビッグデータに関して造詣が深いことがよく分かる。ビッグデータによって使う側のマインドをどのように変えていかなければならないのかが端的に述べられていて、そこも好感が持てた。

  • ビッグデータの時代には、データの扱い方や価値の創出の方法が根本から変わるということをいち早く指摘した本。

    標本に基づく推計から全データを用いた相関関係の把握へと、データ分析のあり方は大きく変わる。そのため、データの正確さはそれほど重要ではないが、雑多なデータを分析するアルゴリズムの力が重要になってくる。

    更に印象的だったのが、データの価値は最初から分かっているものではなく、様々なデータを取り込んで機械学習により分析していくことで、新しい価値が見えてくる。そのため、データの価値自体がそのデータを集めた本来の目的とは関係のないところから生まれることが大いにあり得る。むしろ、情報化社会においてはデータとは無秩序かつ無意識に生み出されるものになりつつあり、価値はデータ自体にあるというよりデータの中から作り出すというものに近いのではないかと感じた。

    一方で、本書はデータによってさまざまな判断がなされることに、一定の警鐘を鳴らしてもいる。データがすべてを決するわけではなく、データはさまざまな可能性を指し示すにすぎないこと、データによって示されるのはあくまで相関関係であって因果関係ではないことなど、これからのビッグデータの社会において心に留めておかなければならないことだと思う。

    ビッグデータの波に踊らされるのではなく、ビッグデータによって拓かれる新しい知識をうまく活用してより良い社会をつくっていくために必要な知識を得られる本だと感じた。

全111件中 1 - 10件を表示

著者プロフィール

オックスフォード大学オックスフォード・インターネット研究所教授(専門はインターネットのガバナンスと規制) 前職はハーバード大学ケネディスクール(行政大学院)。ビッグデータ分野の第一人者として知られる。邦訳に世界的な反響を得た『ビッグデータの正体』(講談社)。

「2019年 『データ資本主義』 で使われていた紹介文から引用しています。」

ビクター・マイヤー=ショーンベルガーの作品

この本を読んでいる人は、こんな本も本棚に登録しています。

有効な左矢印 無効な左矢印
リチャード・P・...
ジェームス W....
ウォルター・アイ...
シーナ・アイエン...
クリス・アンダー...
エリック・ブリニ...
伊賀 泰代
有効な右矢印 無効な右矢印
ツイートする
×