データドリブンを装う理論や研究成果も、十分に疑ってかかるべきということを、様々な類型と実例で示した書籍。
ランダムサンプリングしたつもりでも自己選択バイアス(ある選択をした者に共通する傾向。A大学とB大学の卒業率を比較する時、入学時の学生の特性そのものが異なるため慎重に比較検証すべき)や生存者バイアス(帰還した戦闘機から被弾箇所の傾向をみようとしない。致命的な場所に被弾した戦闘機は帰還しない)でデータはすでに偏っているかもしれない。
交絡因子(結果に影響する別の因子の偏り)が検証結果に影響を及ぼしているかも知れない(コーヒーを飲む者の癌になる確率は高いが、これは喫煙率が高いためで、コーヒーに発ガン性があるわけではない)。
自然選択の結果、人間はあらゆる事象に法則性を見いだしてしまう癖がついていることに由来する誤りもある。
平均への回帰はシンプルに確率の問題だが、何らかの意味があると勘違いしてしまう。
大数の法則の誤った解釈で、これまでの試行結果の偏りが次の独立した試行の結果に影響すると思い込んでしまう。単なるランダムな偏りにも人は法則性を見いだしてしまう。
これに加えて、研究者は新たな理論とその統計的に有意な検証を求める強いインセンティブがあり、都合の良いデータを求めてしまったり、データをこねくり回して何らかの(実際にはランダムな偏りの一つに過ぎない)法則性を見つけてしまったり、果ては捏造したりする。
受け手として留意すべきことは、不自然なデータの取り方は疑ってかかり、常識的におかしい説は疑い、理論を見つけたデータとは異なるランダムな新データで検証されたものを求めなければならない。
- 感想投稿日 : 2024年3月24日
- 読了日 : 2024年3月24日
- 本棚登録日 : 2024年3月12日
みんなの感想をみる