統計学が最強の学問である [Kindle]

著者 :
  • ダイヤモンド社
3.68
  • (28)
  • (73)
  • (50)
  • (8)
  • (5)
本棚登録 : 791
感想 : 65
本ページはアフィリエイトプログラムによる収益を得ています
  • Amazon.co.jp ・電子書籍 (352ページ)

感想・レビュー・書評

並び替え
表示形式
表示件数
絞り込み
  • 【所感】
    ・このような本を読んで概観や専門家からの活きているメッセージを取得するのも大切だが、統計検定等でベースとなる統計知識を体系だって先に取得した方がより、理解度が増すと思われる。
    ・世の中最後の違いを創り出すのは美意識だと言われているけれど、これまで美意識(=定性的な判断)領域だと思われていた部分がどんどんDSにより定量化出来るようになっている。DSの学習により美意識に頼らないjudgeが可能になっていくのでは。
    【各論】
    ・自身が個人的な経験がある領域(ヘルスケア、教育)には、なんらデータに基づいておらずただ自身の経験のみから意見をする人がしばしば散見される。
    ・全数調査よりサンプリング調査の方が精度が落ちるのは間違いないが、判断や行動に影響しないレベルの精度に拘るのは無意味。
    ・標準誤差の上下2倍に95%の確立で収まる。
    ・トースト(落とすとバターの面が床につく)や傘(勝った瞬間に雨やむ)と同様に、ビジネス上の成功法則も、ほんの数例程度の偏った成功体験を過剰に一般化したものとは言えないだろうか。
    ・p値が5%以下なら、「この結果は偶然得られたとは考えにくい」と言える。
    ・統計的な裏付けがないのに、それが間違いだとか正しいと決めつけることが間違い。

  • 統計学を勉強し直す

  • あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。

    挑戦的なカバーの文に恥じない内容だった。
    統計学の重要性を、身近な例(あみだくじ)や過去の実例(コレラなど)をもとに分かりやすく説明。そもそもデータを分析する目的は何か、正しい分析手法を用いることが出来ているのか、どこまで精度を求めるのかなど見つめ直すべきポイントがクリアになった。内容的にはさらっと触れるものなので、初心者におすすめ。中級者は物足りないかも。

    ①何かの要因が変化すれば利益は向上するのか
    ②そうした変化を起こすような行動は実際に可能か
    ③変化を起こす行動が可能だとしてその利益はコストを上回るのか

  • 東大医学部出身の生物統計学の専門家による統計学の話。学術的にまとめられておらず体系的ではないが、トピックス的にさまざまな知識がちりばめられており、統計学の概要を理解できた。大事な点は、「誤差」と「因果関係」と「ランダム化」であると理解した。

    「誤差と因果関係が統計学のキモである」p57
    「(p値)実際には何の差もないのに誤差や偶然によってたまたまデータのような差が生じる確率のことをp値という」p84
    「ランダム化してしまえば、比較したい両グループの諸条件が平均的にはほぼ揃う」p116
    「倫理的にも予算的にも許されるものである限り、ごちゃごちゃ理屈を唱えるよりもとりあえず研究参加者をランダムに分けて、異なる状況を設定し、その差を統計学的に分析してしまえばいいのだから、これほどわかりやすく強力な研究方法はない」p116
    「人間が「無作為らしく」あるいは「テキトーに」出した数字は、しばしばそれほどランダムではなかったりする。択一式の試験問題の正解を何にするか、出題者は「テキトーに」決めているはずだが、なぜかAが正解である確率よりも、Cが正解である確率のほうが偶然とは考えにくいレベルで高かったりする。また、Aという文字とBという文字をランダムに3つ並べると、「AAA」もしくは「BBB」という同じ文字が3連続するのは8パターン中2つ(25%)もある。一方で、Aという文字とBという文字を「3つテキトーに」並べてくださいというと、人間はしばしば「3文字続くと不自然かな?」と、よくわからない配慮でこのパターンを避けがちだ」p123
    「統計学はそれ自体最強の学問だが、その最強さをさらに盤石なものにするためには、ありとあらゆる統計学の考え方に対してオールラウンダーになることが求められる」p276
    「現場の実務者や専門家である研究者がその成果を実証せず、彼らの仕事を批判する評論家や政治家がろくに論文も読まず、無責任な意見を述べる。一方、彼らの仕事を評価すべき市民側にそうした現状への問題意識がない」p297

  • あみだくじで無作為に横棒を設定する場合、真下につながる可能性が一番高い

    ビジネスインテリジェンス:ビジネス領域における統計学を応用したソリューション

    EBM(Evidence-based medichine)科学的根拠に基づく医療 
     →その一つが統計データとその分析結果

    標準誤差:サンプルから得られた割合に対して、標準誤差の2倍を引いた値から標準誤差の2倍を足した
    値までの範囲に真の値が含まれている信頼性が訳95%となる値
    →まずは正しい判断に必要な最小十分のデータを

    A/Bテスト :デザイン・機能など、すべてのパターンを試して比較する
    (=ランダム化比較実験)

    カイ二乗検定:意味のある偏りor誤差でもこれくらいの差は生じるのか
                        →誤差が生じる確率P値
    →誤差を理解し、誤差を考慮したうえでも意味がある結果といえるかどうか

    ビジネスにおいて解析すべき指標
    →直接的な利益orそこに至る因果関係の道筋が明らかな何か


    誤差へのアプローチ
    ・仮説のみの理論
    ・うまくいったものだけ提示
    ・ランダム化を用いて因果関係を確率的に表現する
     →ランダムは意外と難しい(でたらめということではない)

    回帰分析:データ間の関係性を記述・一方のデータから他方のデータを予測する数式を推定する
         →この数式で記述される直線を回帰直線という

    たまたま得られた計算値からどの程度の誤差で真偽を推定しているかを数学的に整理すれば、
    無限にデータを集めることなく、適切な判断が下せる
    p値:回帰係数が0の時にデータのばらつきのせいで回帰係数が推定されてしまう確率
       (0.05を上回ると厳しい)
    95%信頼区間:p値が5%超のありえない数値とはならない範囲≒ほぼこの範囲に真値がある

    ダミー変数:2つのグループ・変数を0 or 1で表す方法
    →回帰分析もt検定と同じ計算で実行でき、結果も同じになる


    重回帰分析:層の違いにより結果が平均的にどれくらい異なるのかを複数同時に推定
          →互いに相乗効果が無いという仮定の下、説明変数(分析軸)が結果にどの程度影響を与えるかを示す

    ロジスティック回帰:0or1の2値の結果変数を変換し、もともと連続値でないものを連続値として扱うことで重回帰分析を行えるようにする

    統計学の6分野
    1.社会調査   :ランダムサンプリングによる正確な推定値 →偏りがないか、すべての場合に当てはまるかを重視

    2.疫学・生物統計 :ランダム化による妥当な判断  → 誤差に基づき原因・関連性を見つけることを重視

    3心理統計学   :抽象的なものの測定を目指す → 因子分析 ex IQなど

    4.データマイニング:マーケティングの現場で生まれた  →予測事態が目的なら有効 ⇔ 今後何をすべきかは回帰モデルの方が役立つ

    5.テキストマイニング:自然言語で書かれた文章を統計学的に分析する →形態素解析など(Googleの検索技術など)

    6.計量経済学 :演繹によってより多くの情報を推計・導くことを重視 ⇔ 疫学・生物統計学は帰納重視で原因が分かればよい、誤差を認識し推計は少ない方が望ましい


    確立自体の考え方の対立
    ・頻度論者:確立を頻度でとらえ、事前には何も確立を想定しない  → 保守的・間違いは許されない(新薬の承認など)
    ・ベイズ派:事前確率とデータに基づいて算出された確率(事後確率)をまとめる → 効率的・迅速にある程度の確率で正解を得たい(迷惑メールの判別など)

    エビデンス  系統的レビュー・メタアナリシス>ランダム化比較実験>疫学・観察研究>基礎研究・専門家の意見
    系統的レビュー:論文の条件を決めて、条件に当てはまるもの全てを収集・分析し、どういうことが分かるか結論をまとめる
    メタアナリシス:系統的レビューの中で、複数のランダム化比較実験や観察研究の結果を更に解析してまとめあげる方法


    統計学は、最善の道を最も早く確実に示してくれる

  • 概要書。実務応用には向かない。

  • 統計学の6つの分野を紹介している第6章が興味深かった。社会調査法、疫学・生物統計学、心理統計学、データマイニング、テキストマイニング、計量経済学、それぞれの特徴を説明している。

    コロナウイルス関係で巷に溢れる情報からディープラーニングなどのホットトピックまで、統計学が基礎になっていると考えると、やはり「最強の学問」といっても過言ではない気がしてくる。

  • kindleのセールで688円で購入。
    最初の二章は「統計学入門」と題されるような内容を少しやわらかい言葉で書いた感じ。統計学に触れたことのないワタシのような人間にも、なるほどと感じられて読みやすかった。ただ、中盤から後半にかけてはトーンが変わって、説明がくどく、最後は読者を突き放すような印象。たぶん著者はこの後半部分を書きたかったんだろうと思うが、それが通じる相手はワタシのような統計学素人ではない。対象とする読者設定にもう少し配慮があってもよかった。

  • 【この商品は1冊単品版です。「最強の学問『統計学』」(週刊ダイヤモンド 特集BOOKS(Vol.11))(定価300円・税抜)とセットになったお得なサービスパック版(2冊で1400円/税抜)も販売しています。詳しくは『ダイヤモンド社 統計学』で検索ください】

    あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。

    どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。

    「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人が、その本当の魅力とパワフルさを知っているだろうか。



    本書では最新の事例と研究結果をもとに、基礎知識を押さえたうえで統計学の主要6分野

    ◎社会調査法

    ◎疫学・生物統計学

    ◎心理統計学

    ◎データマイニング

    ◎テキストマイニング

    ◎計量経済学

    を横断的に解説するという、今までにない切り口で統計学の世界を案内する。



    ------



    統計学によって得られる最善の道を使えば、お金を儲けることも、自分の知性を磨くことも、健康になることもずいぶんと楽になるだろう。
    だがそれはあくまで副産物である。統計リテラシーによって手に入る最も大きな価値は、自分の人生を自分がいつでも最善にコントロールできるという幸福な実感なのだ。

    著者について
    1981年生まれ。東京大学医学部卒(生物統計学専攻)。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバード がん研究センター客員研究員を経て、現在はデータに基いて社会にイノベーションを起こすための様々なプロジェクトにおいて調査、分析、システム開発および戦略立案をコンサルティングする。著書に『コトラーが教えてくれたこと』(ぱる出版)、『サラリーマンの悩みのほとんどにはすでに学問的な「答え」が出ている』(マイナビ新書)、『世界一やさしくわかる医療統計』(秀和システム)など

  • 統計学の予備知識の無い状態で読んだ感想としては、
    成り立ちから、現在どんなことに利用されているかまで
    詳しく書かれていて楽しく読めた。

    特に、マーフィーの法則のような「あるある」ネタは、
    大した根拠もないのに信じていたこともあり、
    先入観で都合よく解釈する人間の性質であるとの話に、
    思わず笑ってしまった。

著者プロフィール

1981年、兵庫県生まれ。統計家。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、2014年11月に株式会社データビークル創業。自身のノウハウを活かしたデータ分析支援ツール「Data Diver」などの開発・販売と、官民のデータ活用プロジェクト支援に従事。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)など。

「2017年 『ベストセラーコード』 で使われていた紹介文から引用しています。」

西内啓の作品

  • 話題の本に出会えて、蔵書管理を手軽にできる!ブクログのアプリ AppStoreからダウンロード GooglePlayで手に入れよう
ツイートする
×