統計学が最強の学問である[実践編]――データ分析のための思想と方法
- ダイヤモンド社 (2014年10月24日発売)
- Amazon.co.jp ・本 (472ページ)
- / ISBN・EAN: 9784478028230
作品紹介・あらすじ
◎35万部突破の異例のベストセラーに[実践編]が登場!
平均値の知られざる本質から、代表的な6つの統計手法の使い方、現場での実際の分析手順まで――
[ビジネス×データ分析]の最前線で活躍する著者が、利益に繋がる因果関係を見抜く「洞察の統計学」のすべてを明らかにする。
感想・レビュー・書評
-
前半は良かったが、後半は難しすぎた。実践編ということで、本気でマーケティングなどに取り組んでいる人のための本だと思った。
詳細をみるコメント0件をすべて表示 -
2018年に読んだ本BEST10
第9位 :『統計学が最強の学問である[実践編]―データ分析のための思想と方法』
・数学者の先生が書いた、ビジネスで統計学を活用するための入門書 第二弾。数年前に読んだ前著『統計学が最強の学問である』は、統計学がどのように世の中の役に立っているのかという事例などが書かれた、入門の入門だったが、今回は、問題の種類ごとにどのようなデータ分析手法を用いるのか、が中心。
・自分のSEの業務の中でも、BIツール、機械学習などを扱っているのだけれど、それらと統計学の繋がりが少し分かった気がする。統計学の使用目的には、「(1)現状の把握」「(2)因果関係の洞察」 「(3)今後の予測」があり、(1)が ExcelやBIツールによる「データ抽出・可視化」、(3)が機械学習による「回帰予測」と「クラス分類」。そして、(2)が本著で扱う「洞察のための統計学」である、という点は腑に落ちた。
・紹介されている分析手法は、重回帰分析、ロジスティック回帰、クラスター分析など。数式ほとんど無しで概要のみの説明なので、読みやすいのだけれど、正直ほとんど理解は出来ていない。でも、説明変数(入力項目)とアウトカム(出力結果)の種類(質的か量的か)ごとに、どのデータ分析手法を使うか、という表は、今後もっと深く勉強していってから立ち戻ると、重宝しそう。
・「データ分析・機械学習の手法の選択」は、近い将来 SEの仕事が定型化・効率化・自動化されて減っていった時でも、機械に出来ない仕事の一つになりそうなので、今の内に統計学を勉強しておきたい。今後も、同分野の本を継続して読んでいくつもり。学生の頃、社会に出て数学が何の役に立つのか、と疑問だったが、今は必要性を実感している。 -
統計学って、全部しらべなくても、〇〇%の確率でよければ、〇〇個調べてねというものなので、手間を省くための重要な方法です。そんなにサンプルがおおくなれけば、実際にしらべて納得してもらえば、そのすごさがわかると思います。
-
◯1つの説明変数と1つのアウトカムとの間の関係性だけを分析してしまうと、見落としていた別の要因によって結果が歪められている、ということがしばしばある。(202p)
★終章のビジネスで用いる場合の分析の手順が本書のキモであると思う。 -
私も統計学信者のひとり。
-
前半は分かりやすい平均値や中央値の話から始まりどの程度分析結果が正しいのか見極める検定についての説明となり闇雲にデータをたくさん集めようとするビッグデータ処理に警鐘を鳴らす。後半では様々なアウトカム(成果指標)に対応した統計手法を紹介している。一度読んだだけではとても理解できたとは言えないが、統計学の凄さが垣間見えた気がする。
-
To err is human, to forgive divine.
過ちは人の常、許すは神の業(聖書より)
最善が何か、自分1人の頭で考えていても「がむしゃらに頑張る」といった程度のアイディアしか生まれないかもしれない。だが世の中にはいろいろな分野で「最善が何か」を明らかにすることだけに命をかけてる人たちがいる。
おそらく我々がすべきとこの多くは、すでに文献やデータの上では明らかなのである。だがそれを現実のものとして実行するまでのギャップが我々を「最善」から遠ざけているのではないかと思う。
統計学の素晴らしいところはこうした「最善」への道を最も速く確実に示してくれるところではないかと思う。
我々は今後何度も間違いを犯す。だがたとえ過ちが人の常だったとしても、最善を尽くし続けられる方法がこの世に存在してるというのは、人間に与えられたずいぶんありがたい許しだと私は思ってる。 -
【複雑系解法】
たまたま、ジェノサイドという小説を読んだところだったので思ったのですが、この小説には進化した人間が出てきて、現在で言われるところの複雑系(天気、火山の噴火、人の行動など)を瞬間的に解くことができます。
われわれは、今現在では解くことのできない(非線形)事象を複雑系として簡単に表現してしまっています。
人間の脳で解くことができない事象を、解けないので複雑系という言葉で解かなくてもよい状態をつくりあげています。
統計学は今現在の人間が解くことのできない、複雑すぎて直接解を導くことができない事象をある程度の精度でもとめる手法のように感じます。
もし、複雑系の事象を直接解くことができれば、統計学に頼る必要性はありません。
逆に、解く手法がない状況だから統計学が活きてくるともいえます。 -
統計を難しい数字や数学を使わずに解説したのはお見事。わたしの力量だと、標準偏差や分散の話までがやっとでした。巻末は、Σの使い方なんかが、前提でさっぱり分からず。
どうも、自分の力量不足を自覚してしまう一冊でした。でも、これが分かるようになると楽しいのだろうなと思いました。いつか成長した後に読み返したい一冊。 -
実地での統計的手法の活用方法の基本(アウトカムを高めたいときの施策の抽出に限り、平均値などの現状分析や株価の予測などに関する内容はあまり掲載されていない。)がよくわかった。
データを整理したら、まずは重回帰分析(アウトカムが量的)かロジスティクス分析(アウトカムが質的)で影響している説明変数を見抜き、当該変数を操作することでアウトカムを変えられるのかどうか(当該説明変数とアウトカムの関係が、因果関係なのか相関関係なのか)をランダム化比較実験で検証し、その検証にあたってはz検定やt検定を行うと。
結局、χ2乗検定や分散分析は実用上あまり出番はないということか。
帰無仮説平均と対立仮説平均の差と、有意水準と望む検出力を設定すれば、これを満たすために必要な標準誤差がわかり、元データの標準偏差から必要なサンプル数が導出できるというのは、ちゃんとした順序で考えたら普通にそうなるだけの話だが、実用的で勉強になった。 -
内容を理解するの何度も読む必要があり
-
いやー、挫折。
最初だけだった。理解できたの。
これはコチラの問題。
向いてないのかなぁ。
必要性は感じてるし、
考え方はとても共感できるんだけど。
いかんせんオツムがついていかない… -
「実践編」の看板に偽りなし。著者の「頭の良さ」みたいなものがなんだかヒシヒシ伝わってくる感じの本。仕事が数字を扱いながらもふつう統計をつかう分野でないので、どう実践に使えるか悩みつつ読んだ
ちょくちょく後戻りして理解を確かめながらでないと読めなかったので、電子書籍でなく紙の本向きだと思う -
前著は社会に対するアンチテーゼとして統計学の素晴らしさを発信していた本であり、今作は統計学の基礎理論をどのように活用するか?という観点で書かれている。頭を使う部分も多くなっているが、基礎理論の導入としてはとても面白く分かりやすい本だと思う。大学の参考書など読んでみたが、ここまで分かりやすい本は無いと思う。
後半の数学補論は正直言って日本の一般的な文系社会人では着いていけないレベルだと思う。(積分とか覚えてない…みたいな人はまず無理)
著者の言う通り、使い込んでナンボなので実務の中で課題検証に使えるよう取り組んでいきたい。 -
基本編に比べると具体的な内容も増えてきて楽しくもあり、難しくもあり。やはり触りを理解する意味では有効かなと思った
-
前著「統計学が最強の学問である」の続著で、ビジネスに統計学を応用するために必要な「把握」「予測」「洞察」を行うための具体的な考え方、適用の仕方、ビジネスに活かし方を解説してある。
数式は出てくるが全て巻末の補足に廻して読みにくくないようにしてある。 -
少し数字が読めて、因果関係を読み解けることの大切さがわかる良書。数学的すぎないという点では「いかにして問題を解くか」などと並んで良書だと思う。
-
標準誤差が見込まれる差の3分の1になるようにサンプル数を設定すれば、検出力は85%になる(有意水準5%の1.96+検出力85%の1.04)。
顧客の退会までの期間は、生存時間解析を用いることができる。
複数の時点のデータを個体差を捉える情報として扱う経時データ分析では、混合効果モデルが用いられる。
因子得点を回帰モデルの説明変数にするよりも、共分散構造分析(構造方程式モデリング)を使う方がよい。
因子分析の応用として、表面的な反応に対する潜在的な力を明らかにする項目反応理論がある。
傾向スコアを用いた代表的な手法として、周辺構造モデルがある。 -
「統計学が最強の学問である」と比べると、内容が一気にレベルアップしていて、初心者にとってはかなり難解な内容となっている。
かといってすごく高度な内容を取り扱うわけでもなく、読者層を選ぶという一冊。 -
#統計学が最強の学問である [実践編]
西内 啓さんの著書です。
ベストセラーになった『統計学が最強の学問である』の続編になります。
本書では、「ビジネスと統計学をつなぐ」をコンセプトに実際のビジネス現場で使える統計学をメインに扱っています。
扱うテーマは、「人間の行動の因果関係を洞察」するための統計学になります。
【本書で学べること・考えること】
・変数、指標
・最小二乗法(近似曲線)と平均値の関係
・分散、標準偏差、四分位点
・有意差、検出力、αエラー、βエラー、優位水準
・標準誤差、サンプルサイズ
・仮説検定、z検定、t検定、フィッシャーの正確検定
・回帰分析、重回帰分析、ロジスティック回帰
・オッズ
・検証、ランダム化比較実験
・因子分析、クラスター分析
読んでみての感想です。
本書では、基本的に数式をほとんど使わずに上記の項目を解説しています。
その分、数式に馴染みのない方にはハードルが低く感じられるかもしれません。
ただ、内容的には難しく、統計的な知識を持ち合わせていないと一度で理解するのは難しいです。
数式に馴染みのある方は、巻末の数式での解説を読んだ方が理解が早いです。
どのようなケースでどのような手法を用いれば良いかなどは、わかりやすい表にまとめられており、有用です。
著者が言うように本書を読んだ後であれば、EXCEL等でデータまとめをする場合に各関数を使ってみようという気になれます。
統計学を軽く使ってみたいと思っている方には良書になると思います。