- Amazon.co.jp ・本 (510ページ)
- / ISBN・EAN: 9784794220011
作品紹介・あらすじ
現在、IT やリスクマネジメント、経済学、意志決定理論の各分野で非常に重要な役割を果たしているベイズ統計。しかし、その250 年あまりの歴史のほとんどにおいて、統計学界では異端視され、冷遇されてきた。それはなぜなのか? またそれにもかかわらず、死に絶えることなく生き残り、現在、広く利用されているのはなぜなのか? 今まで語られることのなかったベイズ統計の数奇な遍歴。
感想・レビュー・書評
-
ベイズ統計の手法については概念的にはわかりやすい。事前の予想に対して新たに得られたデーターを反映させ予想を修正する。実験であるパラメーターを変化させて得られた結果からパラメーターの最適値を推測するというのは自然科学でも社会科学でも違和感はないだろう。しかしこれを確率としてとらえ、式にあてはめると少し分かりにくい。18世紀の聖職者トーマス・ベイズが発見した後打ち捨てられ、数十年後に偉大な数学者ラプラスが独自に再発見し完成させたベイズ統計の式は次のように表される。
まずべイズ統計の原理だがこれだ。
P(C/E)=P(E/C)/ΣP(E/C’) Pは確率、Cは原因、Eは結果として
P(C/E):Eという得られて結果に対して原因がCである確率
P(E/C):原因がCの場合に結果がEとなる確率
ΣP(E/C’):原因C1、C2・・・に対しそれぞれ結果がEとなる確率の合計
例えばサイコロを何回か振って合計が5の場合に2回ふった確率は?
P(E/C)は4/36
ΣP(E/C’)は1/6+4/36+6/216+4/1296+1/7776
P(C/E)=36% 手計算だが合ってるのか?(笑)
ラプラスが完成させた一般式はこうなる。
P(C/E)=P(E/C)xP”(C)/ΣP(E/C’)xP”(C’)
このときに P”(C)は事前に見積もった原因Cが正しい確率(事前確率)としている。
これだけ見ても何のことやらなのだが実際の使用例を挙げると少し雰囲気が分かる。
マンモグラフの乳がん検査の確率が補遺にある。
P(C/E):マンモグラフ検査が陽性の際の乳がんの確率
P(E/C):がん患者のマンモグラフが陽性になる確率=80%
P”(C):乳がんの確率=約0.4%
ΣP(E/C’)xP”(C’):(理由はどうあれ)マンモグラフが陽性の確率
偽陽性の確率が10%あるため 99.6%x10%+0.4%x80%=10.28%
P(C/E)=80%x0.4%/10.28%=3.1%
マンモグラフは80%と比較的信頼性の高い検査なのだが、偽陽性も10%と高く出てしまうことと、元々乳がんの確率が0.4%と低いこともありマンモグラフを受けて陽性の場合に実際に乳がんである確率はわずか3%でしかなく、アメリカ政府の「乳がんスクリーニングに関する特別チーム」は2009年に40代の女性の大部分は1年に1回のマンモグラフは受けない方が良いと助言した。
ベイズの手法は実際には事前確率がはっきりしない場合にも適用されている。乳がんとは違い事前確率として有用なデーターがない場合には主観的な数字を入れて後から観測結果を元にデーターを更新するのがベイズ派のやり方だ。伝統的な頻度主義者(観測数/母数)の場合これまでに起こったことのない事故の確率を計算しろといわれてもお手上げだがベイズ派は例えばチャレンジャー号の事故について1/35という非常に高い事故確立を見積もっていた。エニグマの暗号解読にはじまり、保険業界が料率の決定にこの手法を取り入れ、資源保護、グーグルの機械翻訳などΣP(E/C’)のところの計算が非常に煩雑なため昔は役に立たなかった領域でもコンピューターの能力が上がりベイズ推定の使われる範囲はどんどん拡がっていった。
頻度主義であれば一定量のデーターがなければ統計的には信頼性が低いとするところをベイズの手法は漸近的な解を出すので意思決定をする際に少ないデーターで決断しなければならない場合に適用しやすい。例えばうなぎが減った原因は色々考えられるが稚魚の乱獲の確率をだし、漁獲量を制限した場合にどれだけ資源量が回復するかとか、原発の下の断層でこの先30年以内に大地震が起こる確率だとか。難しいのはその場合に事前確率をどう置くかで計算結果が変わってしまうところだ。反対派からはデーターを恣意的に選んでいるとの批判が出ることは簡単に予想できる。
1968年にアメリカの攻撃型原潜スコーピオン号が姿を消した際にはベイズの手法が力を発揮した。スコーピオン失踪の直前にある聴音装置が極めて深い海中でピンという不思議な音を観測していた。そこで海底の地形図、海流なども組み合わせ音の発生源をスタートにスコーピオン号がランダムに航行したというシミュレーションを繰り返して1万個の予想地点をプロットすると地図上の方眼に明らかに有望な場所とそうではない場所があらわれたのだ。当初探索が行われた場所からはなれた場所に不思議な金属片が見つかっており、このシミュレーションを元に探索結果を更新していくと発見予想地点はだんだんとこの金属片の場所に近づいていった。最終的にはシミュレーションの高確率セルと発見点は260ヤード離れていたが160平方マイルの探索域の中での260ヤードは上出来だ。このときに使われたランダム化手法のモンテカルロ法はコンピューター将棋などにも使われている。
人間は無意識にベイズのアプローチを使っているようだ。例えばパットの練習で全く同じ打ち方(といっても誤差がある)をしてホールからどれだけ離れているかを計算し方向と強さを合わせるという様なことは普通はしない。得られた結果を元に少しずつ方向と強さを調整し修正していっているはずでこれはベイズのアプローチと言える。方程式は理解していなくてもこのやり方が役に立つのはわかる。この本では正統的な統計学からは相手にされなかったベイズ統計が色々な現場で採用されていき、今では主流と言えるまでに拡がった様子が描かれている。詳細をみるコメント0件をすべて表示 -
①この本を読んでわかること
・頻度主義とベイズの違い
・ベイズだと何が嬉しいか
・ベイズの道具がどう生まれたか
②この本を読んでもわからないこと
・ベイズの理論的側面
・具体的なモデリングの方法
わかることわからないことあるわけですが、①が理解できることで見通しがよくなり②を理解しやすくなるところもあるかと思うので、ベイズ統計を勉強する早い段階で読むのはアリだと思いました。 -
昨今話題になっているベイズ統計学。
新しい理論かと思いきや その歴史は古いのだと知り、この本を読んでみようと思った。
最初の部分を読んだら、おもしろかったのだけれど 肝心のベイズ統計学の本を読むほうが優先度が高い。
今回は途中で中止。
2016/08/09 予約 8/24 借りて読み始める。10/7 途中で中止。
内容 :
現在、多分野で注目を集めるベイズ統計。
実は、その250年余の歴史の大半において、学界では異端視されてきた。
異端の理論はいかにして、先端の理論となったのか? ベイズ統計の数奇な遍歴を物語る。
著者 :
アメリカのサイエンスライター。
スワースモア・カレッジを卒業後、新聞記者を経て、社会問題と科学の進歩の関係を中心に執筆。
著書に「お母さん、ノーベル賞をもらう」など。
-
内容はベイズ統計学の歴史。読みどころは最後の2つの章だったが、ベイズ統計自体を理解してから読むべき本だった。
ベイズ自身は棚上げし、プライスは世に問うが無視され、独自に発見したラプラスは結局は頻度主義を好むようになり、軍はこの理論を隠し続けた。
20世紀前半から半ばにかけて、最初の確率を相対頻度に応じて決める経験ベイズが使われるようになった。また、計算が複雑になる関数の積分を漸近近似を利用して計算しやすくした。
リンドレーらが複雑な過程を階層と呼ぶ段階に分割してモデルを展開する手法を紹介すると、後に大変便利なツールとして重宝されることになった。1989年には、マルコフ連鎖モンテカルロ法がほぼすべての統計の問題に応用できることが示され、現実に即した事前確率や尤度関数を計算すること、事後確率を求めるために必要な計算をすることができるようになった。 -
ベイズ統計を巡る歴史。
理論、定理の内容よりも、それを巡る多くの人の功績、主張に焦点を当て、現代にどれほど活用されているかに至る。
思想、哲学としての学問、それ故の対立、それでも実用され発展していく流れ、コンピュータの発達による手段を経て、多分野での展開が一気に進む。
人類の営みの積み重ねを感じる。 -
2016年度best1
-
これを読んでようやくベイズと頻度論の違いがわかった。
でも、大きな疑問点が残っていると思う。ベイズに対する一番の批判点である事前確率の恣意性について、頻度論者がどう折り合いをつけたかだ。本書では主に以下の点が挙げられている。
- 観測によって事前確率は徐々に客観的な確率になるので、それほど問題ない
- 繰り返しの試行ができない事象について頻度論は無力でベイズを使うしかない
- コンピュータの発達により多くの分野でベイズが応用されている
ただ、これらの反論は数学とは真に客観的な分野であるべきという数学者一般の信念に対して直接答えていないと思う。特に20世紀の数学は公理化による厳密化を推し進めてきただけに、客観性は重要視されている。結局数学に主観を持ち込んでいいのか、持ち込んだ統計はもはや純粋数学たり得ないのかーーーこれらに対する考察が欲しかった。 -
病気の治療法を計れることが、個人的に好きな部分。日本がこれを扱えないのが残念。がん検診やワクチン禍についてまともな評価が出せるはずなのに…
-
ベイズ(確率)に関係する歴史についてがメインの書籍でした。
これから起きる可能性が過去の経験値からわからなくても、とりあえず、適当な値を設定して、事が起きた事実を使って、計算を繰り返すことで、答えに近づく手法。例としては、正方形のテーブルとボールの例が書かれており、その一投目がどこに落ちたか皆目見当がつかないけど、あるところだと仮定して、二投目からは一投目より右なのか左なのかを確認しながら繰り返すことで、だんだん一投目が落ちたところを狭めていくと。
「このような考え方では、決して正解にはたどり着かない。ただ、ある具体的な領域に落ちた可能性が最も高いといえるようになる。」
一投目の適当なことを言っちゃうところが科学的ではないということで、理論派(?頻度確率派)からいろいろ言われるも、最初から起きる可能性がわかっていない事象に対しては、ベイズの手法の方が実際効果が出てるという事例が多数紹介。
暗号解読、保険数理、たばこと肺がんの関係、核兵器事故、著者判別、大統領選、原発事故、潜水艦探索、金融市場予測、スパムメール除去等。
計算量が多くなることと、実際のデータを集めて何度も繰り返す処理がコンピューター向きで、かつ、新しいことを始めるにあたって、最初に主観データを設定して実データで確からしさを上げていくのは、走りながら考える必要があるビジネスの現場では、マッチするのだなと。
凄いアルゴリズムの発見からのブレークスルーではなく、ちょっとした計算を繰り返すことで、結果として意外なことをしちゃっているところが、凄い。
ただ、事例にあるようなことを具体的にどうやってやっているのか?他にももっといい手法などがあるのではないか?等々、本の文章量が多かっただけにもう少し深く書かれていて欲しかった。
ちなみに、Wikiでベイズ確率を探すと、この本で用語名は出てくるものの詳細が書かれていない物については、確認できる。
この領域は、もっと勉強が必要。。。 -
科学であっても、その時代背景によっては受け入れられないことがある。ガリレオだけではない。そして技術の進歩により、その有用性が初めて理解される場合もある。そんな流れが詳細に記述される好著。