「事前確率」理解の鍵となる「ベイズの定理」
ここでいったん立ち止まって、先ほどから僕が使っている「事前確率」とはどういうものなのか、もう少し詳しく説明してみたいと思います。話がいきなり飛んでしまって申し訳ないのですが、統計学の定理の1つに「ベイズの定理」というものがあります。18世紀の数学者トーマス・ベイズによって示された定理です。
なかなか難しい定理で、世に広く理解されるようになるまで100年以上かかりました。今でも理解できない人はたくさんいます。統計学の大御所ロナルド・フィッシャー(1890〜1962年)は20世紀に活躍した人ですが、彼でさえ「ベイズの定理は理解できなかったし、納得できなかった」と言っています。
事前確率は、このベイズの定理で示された概念です。したがって、事前確率とは何かという詳しい説明をするには、まずベイズの定理を説明しなければなりません。ベイズの定理とは何か。できるだけ単純に説明すると、「結果から原因を推定する方法」です。これはいろいろなことに応用ができて、たとえば「その人が新型コロナに感染しているかどうか」という推定にも用いることができます。数式で表すとこうなります。
【事前確率×尤度(ゆうど)=事後確率】
たいていの人は、この数式を見ても何のことやら、まるで分からないでしょう。
まずは言葉の説明をします。
事前確率とは「検査前の確率」です。検査を受ける前、その人が新型コロナに感染している確率はどれくらいなのか。その見積もりが事前確率です。
尤度とは「尤(もっと)もらしさ」を表す数値で、このケースではPCRの感度/特異度から算出します(計算式は複雑なので省略します)。
事後確率とは「検査後の確率」です。検査をしたあと、その人が新型コロナに感染している確率はどれくらいなのか。その見積もりが事後確率です。これでもたぶん何のことだか分からないでしょうから、具体的に例を挙げて説明してみましょう。
事前確率0.01%なら、陽性は90%以上の確率で間違い
2020年5月末から6月末までの1ヵ月間、僕が住んでいる神戸市では新型コロナの感染者は2人しか見つかりませんでした。
でも、もしかしたら神戸市には他にも感染者がいたかもしれません。本当は10人の感染者がいたけれども、見つかったのは2人だけだったのかもしれない。あるいは、本当は50人の感染者がいたかもしれない。
真実は誰にも分かりませんが、あえて多めに見積もってかりに150人の感染者が隠れていたと考えてみましょう。神戸市の人口は約150万人です。そのうちの150人が感染していると仮定すると、神戸市民の感染確率は1万分の1、つまり0.01パーセントです。
そんな状況のもと、神戸市在住の妊婦さんが病院に運ばれてきたとします。新型コロナが疑われるような症状は出ていませんが、「念のため」という理由でPCRを受けてもらいました。すると陽性という結果が出ました。この場合、「陽性という検査結果が正しい確率」はどれくらいなのか。まず、事前確率は0.01パーセントです。くり返しになりますが、これは多めに見積もった数字です。
PCRの感度/特異度については、医学論(Woloshin S, Patel N, Kesselheim AS. “False Negative Tests for SARS-CoV-2 Infection? Challenges and Implications.” The New England Journal of Medicine. 2020 Jun 5;0(0):null.)では「感度は70パーセント、特異度は95パーセント」と見積もっています。分科会の尾身茂先生は2020年7月6日の記者会見で、PCRの感度は70パーセント、特異度は99パーセントと仮定していました。
「PCRの精度がそんなに低いはずはない」という意見もあるでしょうから、ここでもあえてPCRを過大評価して、感度90パーセント、特異度99.9パーセントと仮定してみましょう。
事前確率0.01パーセント、PCRは感度90パーセント、特異度99.9パーセント。そう仮定して、ベイズの定理の数式に当てはめて事後確率を計算すると、どうなるか。
答えは8.3パーセントです。
つまり、陽性と判定されたその人が新型コロナである可能性は8.3パーセントしかありません。事前確率が0.01パーセントだったとき、陽性という結果は90パーセント以上の確率で間違っているわけです。
岩田 健太郎
神戸大学病院感染症内科 教授