統計学が最強の学問である

著者 :
  • ダイヤモンド社
3.52
  • (333)
  • (799)
  • (770)
  • (219)
  • (53)
本棚登録 : 9240
感想 : 903
本ページはアフィリエイトプログラムによる収益を得ています
  • Amazon.co.jp ・本 (320ページ)
  • / ISBN・EAN: 9784478022214

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • この本を、これまで全く数学的な考えをしてない人が読んで果たして面白いと思えるのか?と疑問になったけど、統計学を学ぶモチベーションを挙げる効果はあるかと。エビデンスの集め方は為になった

  • <なぜ統計学が最強の学問なのか?>
    ・学者の仮説や推論でなく、データ調査結果の裏づけをもとに考える。
    ・エビデンスをもとに考えることで最善の解に最速で至ることができる。
    ・最善の答えはすでに周囲のデータの中に眠っている。

    <サンプリングが情報コストを削減する>
    ・全体から無作為に抽出して調査するのがサンプリング調査。
    ・全数調査よりサンプリング調査の方が精度は低いのは間違いない。しかし、精度の誤差が0.01%など無視できるほど極小なら、サンプリング調査の方が効率的。
    ・正しい判断に必要な最小十分のデータを取ること(=サンプリング)を行えば、ビッグデータを使わなくても最善の解に至ることができる。
    ・有る一定の数を集めると、それ以上数が増えても全数調査との誤差が変わらなくなる。
    ・データを集めるだけでは意味がない。それを活かして何を行い、どれだけの価値を得ることができるのかが重要。

    <データをビジネスに使うための3つの問い>
    1、何かの要因が変化すれば利益は向上するのか?
    2、そうした変化を起こすような行動は実際に可能なのか?
    3、変化を起こす行動が可能だとしてそのコストは利益を上回るのか?
    ・十分なデータをもとに適切な比較を行う。

    <誤差と因果関係が統計のキモである>
    ・p値(誤差)5%以下を目標にする。
    ・比較調査結果で出た違いが単なる誤差なのか、意味のある結果なのか考えていない統計は役立たない。
    ・比較調査をして結果が出たとする。「誤差でもこれくらいの差が生じるのか」を調べるのがカイ二乗検定。

    <「ランダム化」という最強の武器>
    ・ミルクティーについて、紅茶を先に入れたのか、ミルクを先に入れたのか、飲めば違いがわかるとある貴婦人は言った。統計学者のフィッシャーは、ランダム化比較実験を行い、婦人の主張が正しいか検証した。具体的には、ミルクを先に入れたミルクティーと紅茶を先に入れたミルクティーをランダムに飲んでもらい、どちらのタイプか答えてもらう。こうしたランダム化比較実験の方法は、どの分野にも応用できる。
    ・ランダム化比較実験は最強。人間の制御しえる何物についても、その因果関係を分析できるから。ランダム化比較実験は、科学で扱える領域を爆発的に増大させた。
    ・占い師が当たるかどうかもランダム化比較実験で検証可能。ランダム化比較実験で検証できないもの、拒否するものは、科学になれない。
    ・ランダムに抽出した実験結果を見て、因果関係を見つける。
    ・データを用いずに仮設だけで述べるやり方、うまくいかなかった事例は隠してうまくいった事例だけ並べるやり方は、ランダム化比較実験で否定された。ランダム化を用いれば、因果関係を確率的に表現できる。

    <ランダム化できなかったらどうするか?>
    ・ランダム化できなかったら、ケースコントロール研究をする。具体的には、煙草の健康被害を調べる場合、煙草を吸った人と吸っていない人のそれぞれが、肺がんになった結果を調べる。煙草を吸っていること、吸っていないことだけが集団の違いになるようケースをコントロールする。
    ・煙草以外の要因が、肺がんの原因になっているのではないかという批判はある。しかし、世界中で同様のやり方で調査して、同じ結果になった。つまり、ケースコントロール研究とランダム化比較実験の誤差が極小ならば、ケースコントロール研究も使える。
    ・回帰分析とは、データ間の関係を記述する、あるいは一方のデータから他方のデータを予測する数式を推定する方法のこと。y=f(x)であらわすことができる。
    ・オリンピック直前の試合で成績のよかった選手は、オリンピック本番で失敗する場合がある。「オリンピックの魔物」と呼ばれるこの現象も、回帰分析で分析できる。オリンピック直前で調子がよくても、オリンピック当日は平均的な調子に戻る可能性がある。これを「平均値への回帰」と言う。
    ・分析軸は説明変数、比較したいものは結果変数という。試合の日程を説明変数xとし、試合の結果を結果変数yとする。この2軸の間で線を引くと、いい結果の後は、悪い結果の日もあり、平均値に回帰する。

  • こういった本は初めて。人気がありそうだったので読んでみた。
    実際、ビッグデータが何たらっていう流れが来ているので、
    こういった数字をどう扱い、ビジネスに結び付けていくかをしるきっかけにはなった。ただ、中盤の議論は専門的であまり理解できていない。もう二冊ぐらいこういった本を読めば、理解がきちんとできるの気がする。
    メモ
    ランダム化比較実験は一見成功しそうで、しかし結果が見えないものについて行い、倫理、感情、リスクが大きすぎる現実というフィルターを通すことも重要。
    終わりの、聖書に書かれた、「過ちは人間の常、許すは神の技」というのは、考え深かった。
    j-stage, google scholar

  • 最近はやや下火になって来ましたが、バズワード「ビッグデータ」が一時web界隈を賑わせたものでした。

    ビッグデータはクラウド技術の発展により、大量のweb上のデータを扱うことが出来るようになったことと、人工知能の領域で活発であった統計学的なデータ分析が融合することで花開いた技術として注目を集めています。

    その解説書では、多くの場合Hadoopなどの新たなデータ処理のフレームワークについて解説するものと、企業でのデータ解析の活用事例を紹介するものにわかれると思います。

    本書は、そういったビッグデータの潮流に冷笑的な立場を示しつつ、「統計学」が、様々な領域で根幹をなす働きをしていることを強調した内容となっており、「統計リテラシー」への啓蒙書と言った趣になっております。

    詳しくはブログにて→http://p.tl/OXHQ

  • 統計学が様々な分野で、どのように役立っているかがわかり易く書かれている。また、初心者が陥りがちな誤解(因果関係と相関関係など)にも言及されている。第5章の一般化線形モデルをまとめた表は役に立つ。6章と終章もなかなか示唆に富む内容だ。

    しかし、難点が2つある。一つは、ビジネスに関する事例が少なく、掘り下げ方も浅い点だ。著者は、医学畑なのでその分野には造詣が深いと思われるが、ビジネスで役立つ統計の説明という点になると、やや苦しい。

    また、全体的に冗長な印象があり、その結果、扱っている内容が表面的だったり、途中で尻切れトンボになっているような点が幾つかあるのも残念だ。

  • 統計学が最強の学問であるかどうかはともかく、昔に比べて身近に使いやすくなった学問であることは間違いないだろう。今では、データの整理はパソコンがやってくれるし、Excelで3回ほどクリックすれば、子供でも回帰分析ができる。

    本書は、前半で、統計学の基本的な哲学をわかりやすく説明してくれる。強調されているのは、何を目的に分析するのか、そのために必要なデータは何かという当たり前のこと。そして、とりあえず分析しました、的な曖昧な利用を戒めている。特に、何でもかんでもデータを集めて分析するという最近のビッグデータ礼賛には手厳しい。この1~3章は価値ある内容と思う。

    後半は、細かいテクニカルな話に終始しており冗長。特に著者が医学系であるためか疫学調査に偏っており、ちょっと食傷気味。できれば経済に関した統計を知りたかったところ。

    偉そうなことを言って恐縮だが、自分は、日本人には決定的に確率・統計のリテラシーが不足しているんじゃないかと思う。医療、社会保障、原発事故対応などなど、あらゆる場面で、日本人にリスク・ベネフィットの概念がほとんどないような気がする。学校教育でこの分野が欠落していることが最大の問題だと思う。

  • 統計リテラシーを身につけて仕事や私生活に生かしましょうという話で、いろんな分野でいろんな統計手法が使われてるよ、と。

    標本から母集団を推定する上で標本のばらつきが重要。推定結果には必ず誤差がある。ランダム化できない場合でも傾向スコアというのがあって、それが似ている人たちの中で比較するという手法もあったり。

    回帰分析の説明のところが一番おもしろかった。
    回帰分析というのは、あるデータ(説明変数)から他方のデータ(結果変数)を数式から推定するという手法。重回帰分析とかロジスティック回帰とか名前を聞くとびびりがちなんだけど、こうやって説明を読むと別に難しい考え方じゃないなーという気がした。

  • マーケティングにも造詣が深い西内氏の著書。
    今まで遠ざけていた統計学の重要性を実例を交えて非常に説得力ある内容で啓蒙してくれる良書。
    頭がキレる人特有の社会を斜めに見て、短い言葉でズバッと切り捨て本質を明らかにする痛快な言説が健在なのもいい。

    頭の良さはピカイチだが、ところどころ文章の修飾関係が不明瞭で読みにくい箇所があるのが残念。これは編集者の問題だろうが・・・。

  • あらゆる分野において統計学が最善のアプローチを提供し得るものである。ということについて書かれている。

    身近な例を豊富に取り上げ、軽妙な筆致で統計学がといういかにも一般の人には関係のないことについて、実に丁寧に順序だてて書かれていた。とても分かりやすくて、自己啓発系の本を久しぶりに一気読みしてしまった。逆にいうと、基本の簡単な話から丁寧に積み上げて説明しているので、必然的に段々専門的な統計学がの細かい話になっていったので、後半難しかったが。。。

    ですが、問題に対するアプローチについての価値観が少し変わったような気がする。それぐらい個人的にはインパクトのある内容だった。

    「ビックデータ」というキーワードに興味があったり、マーケティングや広報担当の方には、斜め読みでかまいませんので、ぜひ読んで欲しいと思います。私はたち話みで「ビックデータ」というキーワードにひかれて、読んでみましたが、いい意味で期待を裏切られました。

  • いやー面白かった。大学の卒論を思い出し、SPSSで回析なんぞしているときにこの本に出会えていたら、もう少し統計について理解できたんじゃないだろうか…(笑)疫学が得意とする統計と、経済学が得意とする統計が、異なるものだというのも面白かった。一方はサンプルの偏りを堂々と公表し、一方ではそれじゃあなっとらんという態度。分野ごとに傾向が異なるのも面白いなと思った。あとがきの筆者の考えが好きだなあと思った。全力の方向性を、統計を用いて考えてもいいなあと。

    • 猫丸(nyancomaru)さん
      「分野ごとに傾向が異なるのも面白い」
      ふ~ん、、、
      この一言で読んでみたくなりました。。。
      「分野ごとに傾向が異なるのも面白い」
      ふ~ん、、、
      この一言で読んでみたくなりました。。。
      2013/06/10
全903件中 91 - 100件を表示

著者プロフィール

1981年、兵庫県生まれ。統計家。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、2014年11月に株式会社データビークル創業。自身のノウハウを活かしたデータ分析支援ツール「Data Diver」などの開発・販売と、官民のデータ活用プロジェクト支援に従事。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)など。

「2017年 『ベストセラーコード』 で使われていた紹介文から引用しています。」

西内啓の作品

この本を読んでいる人は、こんな本も本棚に登録しています。

有効な左矢印 無効な左矢印
デールカーネギ...
カイザー・ファン...
シーナ・アイエン...
佐々木 圭一
クリス・アンダー...
スティーヴン・D...
有効な右矢印 無効な右矢印
  • 話題の本に出会えて、蔵書管理を手軽にできる!ブクログのアプリ AppStoreからダウンロード GooglePlayで手に入れよう
ツイートする
×