- Amazon.co.jp ・本 (594ページ)
- / ISBN・EAN: 9784822249809
作品紹介・あらすじ
「私たちはシグナルを探そうとしてノイズを集めている」米大統領選で「オバマの勝利」を完璧に予測し、世界を騒然とさせた希代のデータアナリストが、情報の洪水のなかから真実(シグナル)を見つけ出す統計分析理論と予測技法を初公開!
感想・レビュー・書評
-
データアナリシスの基本を学ぶ本としてよいのではないだろうか?
ノイズをいかに見抜き、それを排除して思考することが大切。詳細をみるコメント0件をすべて表示 -
地震予知、地球温暖化予測で用いられるデータの信憑性に関して、もやもやとしたものがあったが、本書を読んで見方が多少分かってきた。因果関係と相関関係、データ中に含まれるノイズ、そのデータを使う人の目的などを知り、安易に騙されないよう心掛けたい。特に自分に都合の良い意見を持っている人のよりどころとしているデータに関しては客観的に見直したり、反対意見の人の考えも排除しすぎないよう注意しよう。
-
2008年に気候学者に対して実施された調査によると、94%が気候変動が起きていることに同意しており、84%が人間の活動によるものだと思っている。しかし、地球の気温を予測するモデルの能力についてはさまざまな意見があり、気候変動が引き起こす事象をモデル化することについては疑問視する声が多い。今後50年で海面がどれだけ上昇するかを予測するモデルが有効だと思っている人は19%しかいない。
-
データ解析する場合に、シグナルとノイズをどのように扱うべきか書かれた本。気象、地震、テロなどなど予測に携わる人ならば一読すべき一冊。
-
「ベイズの定理を実践する一番の近道は、たくさん予想をすること」
ベイズの定理を実践しなくても、たくさん予想することはものすごく大事。
機会だけでなくパターンも多く。 -
格付け会社は、透明系を高めるという理由で、格付けソフトウエアを発行者に渡した。
ひとつひとつのデフォルト確率が5%でも、前提条件によって統合されたデフォルト率は違ってくる。
恐怖と欲望のバランスが崩れた時、バブルが起き、崩壊する。
ハリネズミとキツネはどちらが予測できるか。
ハリネズミは基本原則を信じている。キツネは、原則を持たない。キツネのほうが当たるが、テレビにはハリネズミのほうがよく出る。
「ベースボールプロスペクタス」を使って、統計的に勝負を予測できるか。
打率はホームランより不安定。勝ち星は安定しない。
相関関係と因果関係は別物。
経済モデルが前提とする過去のデータは、当時の政策決定の結果でもある。
グットハートの法則=ある変数をターゲットにすると、それは経済指標にはならない。
経済モデルでは、インプットとアウトプットがあるが、それらは実際には区別できない。
外挿法=現在の傾向が続くと予測すること。これが予測が外れるときの間違いの元。指数関数的に増減する者は予測できない。
自己成就予言と自己破壊予言。自閉症は、新聞に使われる頻度と同じように患者数が伸びた。GPSで早くつくと指示されたルートにみんなが集中するため、遅くなる。
ベイズ統計=間違いは減っていく。
ハララボスボブブルガリス=MBAの賭けで生活している。
自信過剰警報=絶対とか、理論を信じる、など。これはギャンブラーにとっては、致命的な欠陥になる。
ベイズ的思考。ベイズは牧師。
事前確率のうえで、事後確率を考える。それを統合する。ことが起きるごとに、確率を改定する。
相関関係ではなく因果関係を示すものはけた違いに少ない。
フィッシャーの統計=頻度主義。
効率的市場化説は正しいか。
ファンドマネージャーは、暴落する危険がわかっていても降りるわけにはいかない。みんなと違う行動をとるほうが自分自身のリスクが高い。運用資金が自分のものではないから。これが効率的市場化説の弱点。
自信過剰なものが多ければ、それだけで効率的市場化説は成り立たなくなる。
価格は正しくないが、フリーランチがない、という点では正しい。
ミュラー・リラー錯視を避けることはできない。上がっているものは上がり続けるように見える。
ベイズ予測では、常に反対になる危険性を考える。それに対して、みんなの予測とどうか、を決める。
天気予報は、予測の中の成功事例。
ベイズの定理を正確にするには、何回も予測すること。 -
尊敬しているデータサイエンティストの人がおすすめしていたので手にとった。
-
予測情報とベイズ定理について。確かにメディアで大胆な予測をする人は言い切る分目立つが多面的な予測力に欠ける。
-
・統計学の勉強本ではなくて,「目の前にあるデータの見方についての誤りを正すための警告をしている本」だろうか。この本で統計学の勉強はできないが,普通の教科書よりもずっと豊富な知見を与えてくれる。
・人はシグナルとノイズの区別はできない。特に事前には。
・データ量を多くしても予測が正確になるとは限らない。シグナルよりもノイズが増える方が多い。
・結果として人はデータに騙される。本当は「騙された」わけではなくて,「見誤っている」だけなのだが。 -
予測が如何にあてにできないかが分かる本。NBAのレイカーズの例が興味深かった。
-
邦訳されたすぐ後に買っていたのだが1/3くらい読んだところで放りだしていた。分厚いながらも別に読みにくい本ではないのに。このたび、家ですごす連休のお供として引っぱり出したのだが、これがまたコロナの時代にピッタリの内容であった。いま世界中が、きわめて不確実な状況に置かれながら少しずつ明らかになるウイルス/疾病の情報をもとに今後の見通しを更新していく、まさにベイズ的な過程のただなかにいる。私たちが「知っていること」と「知っていると思っていること」の違いを識別しなければならないと教えてくれる本だ。
ネイト・シルバーの文章には論理的な明晰さがあって読みやすい。少し斜に構えたユーモアとあわせて、なんとなく余白がない感じがアメリカ的な薄っぺらさとも言えるのかもしれないが、読んでいるこちらまで少しアタマが良くなったような気がしてくる。
本領である選挙やスポーツの予測にはじまり、金融、経済、気候、地震、テロリズムなどなど意欲的に幅広い分野の予測をテーマとしている。個人的には、シルバーの個人的な体験であるオンライン・ポーカーのくだりを特に興味深く読んだ。彼の実践的なスタイルは鉄火場で培われたのではないかと思わせる。
まさにタイムリーにインフルエンザなどの感染症の予測、疫学モデルにも1章を割いている。SIRモデルはシンプルすぎる(多様な行動をとる異なる人々のグループを捨象してしまっている)として批判しているが、ワタクシの最近の付け焼き刃知見では、そこらへんの多様性を導入したモデルもすでにあるようだ。これについては、この数年間での疫学の進歩なのか、単に著者のリサーチ不足なのかは不明。 -
難しい
-
最近データの活用が大事だと言われているが、データに対するリテラシーが不足していることに気付かされる。過剰適合等データの取り扱いは単純にはいかない。
まさにノイズの中からシグナルを予断なく見出すかが問題だ。 -
自分が興味ある分野だけに、500ページのボリュームでしたが、かなり興味深く読みました。
リーマンショックや巨大地震、インフルエンザなどの予測に関する失敗のエピソードは、参考になりました。
著者は、最近のビックデータ分析で用いられているベイズ統計の重要性と推奨をしてます。
ある事象を分析する上で、その事象が起こる前の事前確率を見積もり、現実の事実を組み合わせて、確率的に予測する理論です。
ベイズ的アプローチは、問題解決のための観察・仮説形成・検証というアプローチと、概ね同じプロセス・思考法であるという切り口は、圧巻でした。
また、ベイズ統計が批判されている部分である、事前確率に主観性が入ることについても、大まかですが人間が思考して行動する以上は主観性は避けられず、またベイズ統計の、日々変化している世の中の事実に対応出来る柔軟性があれば、問題を最小限に抑えることができるという論には、なるほどと感じました。
いままで自分は、多変量解析など頻度論での統計解析を経験してきましたが、解析対象と実際の頻度理論が乖離しており、解析後に再解釈するという場面が多く、馴染みにくいというのが現実です。それ故、なかなか統計学が世の中に浸透しない一因かと思います。
一方、ベイズ統計の場合、自分の思考そのものをベイズ的に変えることができれば、解析対象そのものの思考がベイズ的思考で考えるので、合理的であると思います。
ぜひ自分の身の回りに適用していきたい考え方だなと、あらためて感じ入りました。
ちなみに、他の予測に関するエピソードとして、ポーカー勝負、地球温暖化、テロ防止のための国家インテリジェンスなど、多様です。
この様な予測に関する学習ができる本を探していた自分としては、大ラッキーでした。 -
途中で挫折
-
予測の難しさ、過去に基づく予測がいかに誤りであるかがよくわかる。個人的にはUSの民間天気予報サービスの降水確率の発表手法を取り上げた章はニュースの受け手を考えた工夫があり、興味深かった。