ベイズ統計に挑戦してみる?

『数学の言葉で世界を見たら』 付録 - Caltech Hirosi Ooguri

 

「定期検診は受けたほうがいい」。私たちはどこかでそう思い込んでいます。ところが、米国政府の予防医学作業部会が出した勧告では、「40代の女性には、定期的な検診を行うことを推奨しない」とありました。これはどういうことでしょうか。乳がん検診にはマンモグラフィという装置を使うそうです。もし乳がんにかかっていれば、同装置で陽性と判断される確率が90%になると言います。ところが問題はここにあります。陽性と判断されても、実際のがんにかかっていたのはわずかに9%。 つまり、「陽性」と言われても、その大半はがんにかかっていないのですから、心配されるのは、心理的ショックであったり、負担の大きな再検査です。こんなことだったら、最初の検査を受けなかった方がよかったとなりかねません。ここでベイズ定理の出番です。

 

 

乳がん検査の信頼性を確かめるベイズ推論 - ログミー

https://i0.wp.com/img.logmi.jp/wp-content/uploads/2016/07/65d600b751cdf605f17f032b28ba75da.jpg

 

ベイズ推論は、ある仮説を証明あるいは反証しようと試みる際に、特定の情報(注:実験結果など)がどれだけ信頼に足るかを見極める方法論です。逆に言えば、ベイズのように考えないと、自分が導き出した事象の妥当性を途方もなく過大評価してしまう危険性があります。

 

実際に計算してみましょう。米国の40代女性が乳がんにかかる確率は「0.8%」と言われています。その乳がん患者が検査を受けると、「陽性」と出るのは「9割」です。したがって、2007年の乳がん発症者(17万8000人)から計算すると、陽性と出たはずの人数は16万200人。では、陽性の反応のあった方がもう一度検査を受けたらどうでしょうか(再検査の信頼度は同じとする)。ちなみに、乳がんのなかった被験者でも、陽性が出てしまったのは「7%」でした。これで計算してみましょう。乳がんになった「9%」の「9割」、乳がんにならない「91%」の「7%」が陽性と出ました。その双方を合わせると14.47%です。つまり検査を受ければ、陽性が出るのは約14%になるということです。

 

第1話 補遺 - Caltech Hirosi Ooguri

 

乳がんだった人の9%(=17万8000人)、その9割(=16万200人)がもう一度検査を受けても、理論上は14.47%の陽性反応が出るはずです。つまり、再検査をして再び「陽性」が出れば、約56%(=55.98%=(9%*90%)/14.47%)の確率で乳がんであると疑われます。これらはベイズの定理を使った推計ですが、再検査を前提にすれば、まあまあ意味はありそうです。

 

ちなみに、こんなベイズの定理について、以下のサイトや書籍が分かりやすく解説してくれています。

 

仕事の勝敗を分ける「黄金の数式と法則」【2】村上綾一 | プレジデントオンライン | PRESIDENT Online

ある夫婦の間に、女の子が2人続けて生まれました。3人目が女の子である確率は何%でしょうか。統計上、男女の比率はほぼ半々だから、3人目に女の子が生まれる確率も50%に違いないと考える人が多いかもしれません。しかし、ベイズ推定で考えると、3人目も女の子である確率は約75%。つまり俗にいう「2度あることは3度ある」は75%の確率で起き、逆に「3度目の正直」は25%になります。なぜなら、ベイズ推定では、これまで2人続けて女の子が生まれたのだから、その夫婦から女の子が生まれやすい何らかの理由があると考え、逆確率という方法で確率を導くからです。

 

米国では、統計学の主流はすでにベイズ統計に移行しているとも言われ、注目はますます集まっているようです。ベイズの理論の数学的な特徴は、確率の計算に「事前確率」という考え方を取り入れることを認めたことです。そこには、「個性」や「経験」、「勘」や「常識」を取り込むことができます。そして「共通性」(汎用的な部分)と「個差」(個性的な部分)に分けてとらえるのです。これゆえに、ベイズ統計は、ビッグデータ時代に向いているとも言われています。

 

kenyu.red

online.sbcr.jphttp://online.sbcr.jp/image/bayes2.jpg