統計学が最強の学問である

著者 :
  • ダイヤモンド社
3.49
  • (253)
  • (633)
  • (657)
  • (186)
  • (46)
本棚登録 : 6880
レビュー : 744
  • Amazon.co.jp ・本 (320ページ)
  • / ISBN・EAN: 9784478022214

作品紹介・あらすじ

あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。

どんな権威やロジックも吹き飛ばして正解を導き出す統計学の影響は、現代社会で強まる一方である。「ビッグデータ」などの言葉が流行ることもそうした状況の現れだが、はたしてどれだけの人が、その本当の魅力とパワフルさを知っているだろうか。本書では、最新の事例と研究結果をもとに、今までにない切り口から統計学の世界を案内する。

感想・レビュー・書評

並び替え
表示形式
表示件数
  • 目を引くタイトルにつられて読んでみました。
    統計やデータについての考え方が紹介されています。
    「なぜ統計学が最強の学問なのか?」という説明に始まり、実際の分析手法の概要や分野による統計についての考え方の違いにも言及しています。

    一般化線形モデル(=広義の回帰分析)を1枚の表にまとめている箇所は、後で役に立ちそうだなぁ…と頭のすみっこにメモメモ。
    検定やら分析やら、いろいろな名前はつけられていますが、基本的には同じ手法なのだと思っているだけで、統計とも少し気楽に向き合える気がします。

    「統計学は、最善への道を最も速く確実に示してくれる」と著者は述べています。
    しかし、学生時代にちょっと統計をかじったくらいの身には、「最善の道」を見極めることができるようになるまでの道も長そうです。
    より実践的な分析についての本も読んでみなければ…。

  • 難しくて、細かいことはわからなかった。
    しかし、統計学が最強の学問である、
    という著書の熱い気持ちが伝わってきた。
    データを読み解ければ、幸せな生活が開かれる、
    そんな気持ち。
    「全力」より「最善」。
    効率的な努力への、道筋となると思った。

  • 最近、なんだかお気に入りの統計学。昨日も阪急の紀伊国屋でおじさんが統計学の本を大量買いしてました。
    この本は、統計学とはなんぞや→統計学の威力→統計学の理論→まとめって感じで進みます。

    A高校とB高校の同じ学年の生徒に対して同じ模擬試験を受験させた。
    男子生徒同士で比べるとA高校の平均点はB高校よりも5点高い
    女子生徒同士で比べるとA高校の平均点はB高校よりも5点高い
    ではA高校とB高校の平均点を男女全体で比較するとどちらが高い?

    何も考えずに回答するとA高校が5点高い?でも、なんだか違和感があって違うような気もする。前提が記載されていないんです、この問題。
    ちょっと待てよ!と思えるようになることが、この本の主旨です。

  • 【ありかと】
    本来は根本原理を突き止めることが学問であるとわたしは思いますが、複雑すぎて原理を突きつめるのに、時間がかかりすぎるときに統計学は有効であると思います。

    統計的な手法であれば、直接原理を突きつめる必要はないのでスピード感がちがいます。原理を突き止めたほうが精度はよい(というか100%)のですが、そこまでの精度は望んでいない、しかしスピードは必要という場合には最適です。

    がん細胞の発生メカニズムがわかれば、何が要因かはわかるでしょうが、実際にはさまざまな要因が絡んでくるので複雑になります。
    タバコを吸うと発がんするメカニズムがわかれば、タバコは良くないと簡単に結論付けることができます。しかし、タバコとがんを直接むすびつける要因をみつけるために、何十年もの時間が必要であるとなれば、統計的な考え方が有効になってきます。直接、解を求めるには複雑すぎて時間がかかるが、厳密に解を求める必要はない、傾向をつかめれば問題ない場合には統計学は最適です。

    人の行動パターンも複雑です。これも統計学を用いれば傾向はつかめます。根本原理になると「このようなものが出てきた場合は、脳がこういう動きをして・・・」とひとつひとつ捉えていく必要があり、人間の短い人生では解明できそうにありません。

    わたしがかかわっている流体もひとつひとつ分子の動きを計算すれば、正確な解が出ます。
    コンピュータが高速になったおかげで、流体の流れ解析ができるようになってきました。しかし、これもひとつひとつの分子の流れを捉えているわけではなく、ある程度の大きさでモデル化されたものを解析します。したがって、ある程度の誤差は生じます。厳密に解を求めるとなると膨大な時間がかかってしまうので、費用対効果を考えると得策ではなくなります。

    流体ひとつひとつの動きを捉えて高速で解を導くことができれば、天気予報も100%当たるということになります。(こうなると予報ではないが・・・)

    それから「営業の訪問回数と受注は比例する」これを統計的に確認してみます。

  • かなり書き味ががらっぱちですが笑、理系かつ統計素人の方にお勧めしたい本です。
    昨今ネット記事が氾濫し、グラフがあるとなんとなく信憑性があるような気がしてしまうのですが、部分的な集団の傾向が複数同じであっても、母集団の性質を示すとは限らないシンプソンのパラドックス、心理統計においてアンケート回答者が躊躇したり「書き方」につられて正しい統計が出ないケース、傾向を示したグラフの「傾き」自体が誤差が大きかったら?(p値)など、統計を疑うための有用な知見がたくさん載っています。統計家はリテラシーが高いかもしれないけど、使う側にそれがなければ全然意味がないですね。
    また、技術者になじみ深い「特許の統計」にありがちですが、厳密さを追い求めてちゃんと利益があるのか?「厳密でない統計」を使った場合のリスクは十分に大きいものなのか?を使用する側がきちんと判断しないと、「真に厳密な統計」にはとんでもないレベルのデータが必要になります。
    *通常の業務でも、「リスクがある」という言葉だけで終わらせず、
    ・そのリスクは1%以下であっても、防がなければいけないものか?
    ・追い求めている厳密さ、確からしさは「成果」「利益」を生むのか?
    を考えなきゃいけないなと思いました。

    ちなみに、経営学者の入山章栄先生が著作でよく紹介している「メタ分析」はエビデンスの中でももっとも信憑性・汎用性の高いものだそうです。経営学・経済学が活用している最新の統計手法、技術者にも有用なツールだと思います。

  • 西内啓『統計学が最強の学問である』
    Hiromu Nishiuchi, "Statistics is the strongest study"

    A very good guidebook to basic statistics in order to prevent scams by bad big-data SIers. 分かりやすい解説と具体例と皮肉がこもった語り口で、とても面白かったです。

    因果関係が完全に解明されるのを待つのではなく、統計データに基づき「心臓病を減らしたければとりあえず血圧を下げろ。以上!」などとシンプルな判断を下す統計(統計の中の疫学という分野)の考え方は、日々変化する不確実な状況の中で判断を下す必要があるビジネスと親和性があると感じました。今後の参考に、データをビジネスに使うための3つの問いを書いておきます。
    1. 何かの要因が変化すれば利益は向上するのか?
    2.そうした変化を起こすような行動は実際に可能なのか?
    3.変化を起こす行動が可能だとしてそのコストは利益を上回るのか?

    以上!

  • 統計学が広く普及しているために、一筋縄ではいかぬことがわかった。でも、利用する目的がしっかりしていないとダメだなということもわかった。

    また回帰分析は人工知能が出てきても使えるということが分かったのもよかった。要するに、何が原因であるかを知ることが回帰分析のほうがわかりやすい、ということである。

    またランダムが最善であることもわかった。ランダムにできないときの工夫もあるんだなと思った。

  • ★あみだくじ8本中、一番当たる確率が高いのは当たりの真上で21%、その右隣では19.4%。最も低い右端では3.3%。★一見こちらのほうがよさそうだが実際のところよくわかっていない、という提案さえできれば、社会的意義の大きなランダム化比較実験に大きな予算と倫理的許可が下りる、というのは米という国から我々が見習うべき点の1つ。★喫煙によって余計にかかる医療費や失われる労働力等合わせ、GDPの1%以上となる毎年7兆円以上が日本経済の損失。ダバコ税収や経済効果ではこの半分も補填できない。★帰納:個別事例を集めて一般的法則を導こうというやり方。演繹:ある事実や家庭に基づいて、論理的推論により結論を導こうという方法。演繹の代表格としてニユートンの力学。★私が遠くを見ることができているのだとすれば、それは巨人の肩に立っていたからです。byニュートン。巨人=先人の知恵。

  • 【感想】
    統計学は確かに大切だが、真っ先にAIに乗っ取られる分野な気がしたのは自分だけだろうか?
    というのも、データに基づいた処理というのはイチ人間が行なうよりもAIにやらせた方が確実だろうし、スピードも正確度も段違いだと思うからだ。

    どちらにしても、読んでいるだけで鳥肌が立つくらい難しい本でした。
    分析などをするにあたって統計学は必須だけど、結局そういう細やかな分析は自分には向いていないんだなーと実感。


    【内容まとめ】
    1.なぜ統計学は最強の武器になるの?
    ⇒「どんな分野の議論においても、データを集めて分析することで、最速で最善の答えを出すことができるから」

    2.EBM
    Evidence Baced Medicine
    「科学的根拠に基づく医療」
    医師の経験や勘だけでなく、きちんとしたデータとその解析結果、すなわちエビデンスに基づくことで最も適切な判断をすべきというのが、現代医学において主流の考え方である。

    3.統計解析の3つの問い
    ①何かの要因が変化すれば利益は向上するのか?
    ②そうした変化を起こすような行動は実際に可能なのか?
    ③変化を起こす行動が可能として、そのコストは利益を上回るのか?


    【引用】
    ・なぜ統計学は最強の武器になるのだろうか?
    一言で言えば、「どんな分野の議論においても、データを集めて分析することで、最速で最善の答えを出すことができるから」だ。


    p11
    ・「疫学の父」ジョンスノウの活躍
    この外科医が行ったコレラ対策はごくシンプルだ。

    1.コレラで亡くなった人の家を訪れ、話を聞いたり付近の環境をよく観察する。
    2.同じような状況下でコレラにかかった人とかかっていない人の違いを比べる。
    3.仮説が得られたら、大規模にデータを集め、コレラの発症・非発症に関連していると考えられる「違い」について、どの程度確かであるかを検証する。

    スノウの提案した解決策は、「とりあえずしばらく水道会社Aの水を使うのをやめる。以上!」であった。
    彼の助言に従って、コレラに汚染された水の使用をやめた町では、パッタリとコレラの感染が止まった。


    p16
    ・EBM
    Evidence Baced Medicine
    「科学的根拠に基づく医療」
    医師の経験や勘だけでなく、きちんとしたデータとその解析結果、すなわちエビデンスに基づくことで最も適切な判断をすべきというのが、現代医学において主流の考え方である。


    p65
    ・統計解析の3つの問い
    1.何かの要因が変化すれば利益は向上するのか?
    2.そうした変化を起こすような行動は実際に可能なのか?
    3.変化を起こす行動が可能として、そのコストは利益を上回るのか?


    p71
    意味のない解析結果など何の役にも立たないばかりか、虚偽報告である。
    「十分なデータ」をもとに「適切な比較」を行う。
    これが統計的因果推論の基礎である。


    p87
    「どのようにデータを解析するか?」
    そもそも、「どのようなデータを収集し、解析するのか?」
    この答えは、ごく簡単である。
    「目指すゴールを達成したもの」と、「そうでないもの」の違いを比較しさえすればいい。


    p126
    ・ランダム化の限界
    月へのフライトに限らず、「1回こっきりのチャンス」あるいは、あったとしてもせいぜい数回程度しかチャンスの与えられないものを取り扱うことに対して、ランダム化しようがしまいが統計学は無力である。
    要するに、一世一代の決断はランダム化することができないということだ。

    他にもランダム化には、「倫理の壁」や「感情の壁」などが障害となる可能性が高い。


    p214
    ・「IQ」を生み出した心理統計学

  • ・日本語の書き方が美しい。読点の位置が論理的であり、日本語を書くときの参考になりそうだ。
    ・ビッグデータ解析はIT企業が新しく自社製品を売り込むための文句として流行っているのであり、統計学を理解していればサンプルをランダムに抽出したランダム解析で十分調べることができるため、ビッグデータの解析は不要という一文に面食らった。IT企業で働いていたので。そもそも全てを調べる必要がないという事実が衝撃的だった。
    ・データマイニング、回帰分析などのいくつかの統計的手法は、要素の相関は分析しても、因果関係を証明する手法ではないため(AとBの間に強い相関があったとしても、それはAならばBであることと同意ではないということ)、その点留意しなくてはならない。
    ・「最善」と「全力」は違うということは私も常に気をつけたい。

    正直、読んでいて眠くなったのは、私が頭悪いかもしれない。
    良い本だと思ったけれど、期待値を超えるほどの本ではなかったかな。。

全744件中 1 - 10件を表示

著者プロフィール

1981年、兵庫県生まれ。統計家。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、2014年11月に株式会社データビークル創業。自身のノウハウを活かしたデータ分析支援ツール「Data Diver」などの開発・販売と、官民のデータ活用プロジェクト支援に従事。著書に『統計学が最強の学問である』(ダイヤモンド社)、『1億人のための統計解析』(日経BP社)など。

「2017年 『ベストセラーコード』 で使われていた紹介文から引用しています。」

統計学が最強の学問であるのその他の作品

西内啓の作品

この本を読んでいる人は、こんな本も本棚に登録しています。

有効な左矢印 無効な左矢印
ウォルター・アイ...
佐々木 圭一
デール カーネギ...
クリス・アンダー...
有効な右矢印 無効な右矢印

統計学が最強の学問であるを本棚に登録しているひと

ツイートする