- Amazon.co.jp ・電子書籍 (352ページ)
感想・レビュー・書評
-
どの分野においても、仮説を立てたときに
その仮説が正しいかどうか確かめるには
実際に実験して、その結果を分析する必要があります。
その時、少なからず統計学が必要です。
本日ご紹介する本は、
どの分野にも深く関係する統計学の
考え方を紹介した1冊。
ポイントは
「解析コストと利益判断」
何かの判断に、必ずしも最初からすべての解析を全データで行う必要はありません。
データ分析で重要なのは、解析にかけたコスト以上の利益の判断につながるものかどうか?
このような適切な判断をするためには、
20世紀に発達した現代的な統計学の手法を使う必要があります。
どんな分野でも、統計リテラシーは重要です。
「ランダム化」
高度な解析手法を用いれば、どの「原因」を制御すれば、
どれだけ「結果」を左右できるかが予測できます。
しかし、どうやっても解けない問題もあります。
正解がないのであればとりあえずランダムに決めてしまう、
という選択肢は何もしないより価値があります。
「回帰分析」
一方のデータから他方のデータを予測する数式を推定するのが回帰分析。
回帰分析で得られた「因果関係を”よく表す代替え物”」を回帰モデルと言います。
回帰分析で良い回帰モデルが得られれば
たまたま得られた誤差を含むデータから知りたいことが予測でき、
適切な判断が下せます。
統計学は今はやりのAIに欠かせない学問でもあります。
ぜひ、読んでみてください。
◆本から得た気づき◆
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
どんな分野の議論においても、データを集めて分析することで最速で最善の答えをだすことができる
科学的根拠のうち、重視されるものの一つが、統計データとその分析結果
ほとんどすべての学問に関わる学者は統計学を使わざるを得ない
「十分なデータ」をもとに「適切な比較」を行う
データのうち何が、どのような関係で利益とつながっているのか
いくら考えてもわかるわけがないことに対して、よく考えたり、話し合えばわかるようになると思うこと自体バカな思い上がり
数回程度しかチャンスがないものに対して、統計学は無力。
統計リテラシーがなければ、経験と勘だけの不毛な議論が尽きることはない
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
◆目次◆
第1章 なぜ統計学が最強の学問なのか?
第2章 サンプリングが情報コストを激減させる
第3章 誤差と因果関係が統計学のキモである
第4章 「ランダム化」という最強の武器
第5章 ランダム化ができなかったらどうするか?
第6章 統計家たちの仁義なき戦い
終 章 巨人の肩に立つ方法
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━詳細をみるコメント0件をすべて表示 -
▼本書を選んだ理由
私自身の目下の業務には今のところ絡んでいないのですが、個人的に最近、AI・機械学習のセミナーに参加しました。その講師の先生が「専門家以外の人がAIや機械学習を学ぶ場合でも、統計学の基本だけは押さえておくべき」と言っていたため、本書を手に取りました。
▼「なぜ統計学が最強の学問」と言えるのか?
その理由として・・・”統計学は、データを集め分析することで最速で最善の答えを出すことができる。このことは、どんな分野で議論をするにしても不可欠なプロセスとなるからだ” と本書では言っています。
また、統計学を知っているかどうか?が結果を分ける事例として、本書の中に「あみだくじで買い出し当番を決める」と言う筆者の研修者時代の経験が出てきます。あみだくじについて私はこれまで、選んだところによってたどり着く結果がどこになるかは、どれも等価だと思っていました。詳細は本書を見て欲しいのですが、実はあみだくじの結果はランダムではなく偏りがあるということを本書では明確に示しています。このことから、本書は、統計を知らないと(自分は運が悪いんじゃないか・・・)と間違った思い込みで済ましてしまう事にもなると話しており、私もこれを見てはっとすることが多々ありました。
▼どんなところが役に立ったか?
中盤からはビッグデータやデータサイエンスについての考え方についても書かれています。例えば、AI・機械学習を学ぶとまず最初に「回帰分析」の話が出てきます。そもそも回帰分析とは何か?何のために扱うのか?が分かっていないと参考書を見てもなかなか頭に入ってきません。その点本書の第5章には、回帰分析の考え方を数式を使わずに分かりやすく解説しています。私が機械学習の学習を進める上で大きな助けになりました。また、統計学にも、多くの分析手法があり、どれを使って分析すればいいか分からない。あるいは、分析結果を見てどう判断すればいいのかも分からない、といった初学者故の悩みもあります。そんな人のためにも分かりやすく解説してあったのも良かったです。
本書は全体的に、数式など難解な部分を上手に省いて説明しています。その意味で本書はあくまで統計の素養を会得するための「きっかけ」の1冊と言えます。 -
統計学というあらゆる学問を横断するツールを本格的に学びたいと思い始めたので、少し前にネットで話題になっていて本書を手に取った。評判のとおり、全体を俯瞰するにはちょうど良い一冊だった。小難しい数式もあまり出ないので初学者もアレルギーを起こさず通読できる。自分は「実験計画法」をまず学びたいので、フィッシャーのいろいろな功績とか背景が述べられているのは大変参考になった。統計学を学ぶと各種検定が出てきてどう使い分けるのかがイマイチよく分からないが、本書では「一般化線形モデルをまとめた1枚の表」というもので明瞭に示されていてパッと見通しが良くなった。
-
統計学
原因不明な問題に取り組もうとしたら、やるべきことら慎重かつ大規模なデータ収集と適切な統計解析
ランダムサンプリング
標準誤差の2倍の範囲に含まれる確率が95%
0.5%ならば、前後1%にほぼ収まる
クロス集計では、誤差を考えた試算をしなければ、差が優位なものなのか、誤差の範囲なのかわからない。
カイ二乗けんていでp値5%以下を目指す。
ランダム化、対象を無作為に選んで比較することで、条件を揃えた比較対象を作る難しさを払拭できる。一回こっきり、倫理感情の壁がなければ理論上なんでも分析できる
ランダム化されていないことで、捉えきれていない条件が存在する可能系は確かに否定できないが、大きな危険がわかっているものをあえて避けないことは愚かな判断といえる。
データの関係性を示す、一方のデータから他方のデータを予測する数式を推定するのが回帰分析
親と子の身長の関係は平凡への回帰を示す
一般化線形モデルという枠組み
演繹のけいりょうけいざいがくと帰納の統計学
エビデンスの4階層
1. メタアナリシス、系統的レビュー
2. ランダム化比較実験
3. 疫学・観察研究
4. 専門家の意見・基礎実験
-
統計学を勉強し直す
-
「統計的に物事を考えよう」という気持ちにさせてくれる本。語り口も軽妙で読みやすい。
統計学の詳細な知識は、この本だけでは全然足りないが(後半になると「第x章で学んだ〜〜」といった記述が度々あるが、正直半分も理解してなかった)、巷の似非統計学みたいなものに騙されないようにしよう、という心意気はできた。
データがあっても、それを使って何をしたいのか、を考えられる人間がいないと意味がないということも教えてくれる。統計学はあくまでも道具であり、道具に使われるような本末転倒な事態に陥ってはならない。
私はもっと詳しく統計学を知りたいので、統計検定の勉強でもしてみようかなと思ってます。 -
あえて断言しよう。あらゆる学問のなかで統計学が最強の学問であると。
挑戦的なカバーの文に恥じない内容だった。
統計学の重要性を、身近な例(あみだくじ)や過去の実例(コレラなど)をもとに分かりやすく説明。そもそもデータを分析する目的は何か、正しい分析手法を用いることが出来ているのか、どこまで精度を求めるのかなど見つめ直すべきポイントがクリアになった。内容的にはさらっと触れるものなので、初心者におすすめ。中級者は物足りないかも。
①何かの要因が変化すれば利益は向上するのか
②そうした変化を起こすような行動は実際に可能か
③変化を起こす行動が可能だとしてその利益はコストを上回るのか -
途中までは、わかりやすく統計学が最強の学問であることがわかったが、後半の具体的な理論の話は正直、予備知識がない人にはわからない。
-
何も残らない。