豚バラ大根ノート

豚バラ大根をおいしく作る秘訣はここには書かれていません.

最新の岩手県のデータで「99%仮説」を検定してみる.

7月29日に岩手県で2人の陽性判定が出たことを受けて

 というような意見がある.統計的検定で何を知ることができるかのよい例なので,少し計算は複雑になるが,最新のデータを元に再び「特異度99%仮説」を検証してみる.なお,29日の時点での総検査数は1398,陽性判定者数は2である.

2人とも偽陽性だったと仮定した場合

ちょうど2人が陽性である確率:

1398人のうちから二人を選ぶ組み合わせの数は

1398*1397/2

で,それぞれの組み合わせについてその2人が偽陽性(0.01の確率),残り1396人が陰性判定(0.99の確率)となるので,ちょうど2人が陽性判定される確率は

1398*1397/2*0.012*0.991396=0.0000787...<0.0079%

となる.

ちょうど1人が陽性である確率:

 1398*0.01*0.991397=0.0000111...<0.0012%

陽性が1人も出ない確率:

0.991398=0.00000079...<0.000080%

これらを合わせると,仮説「特異度99%」の下で検査数1398で陽性判定者が2以下の確率は

0.0079%+0.0012%+0.000080%<0.0093%

となり,やはり「特異度99%」は棄却される.

1人,もしくは2人が本当に陽性だった場合

この場合,「特異度99%」仮説のもとで陽性判定者の数が2である確率はもっと低くなることが計算できるので(計算は省略),やはり「特異度99%」は棄却される.

結論

岩手県で2人の陽性判定者が出てもやはり仮説「特異度99%」は強く棄却される.すなわち,たとえ陽性と判定された2人が偽陽性であったとしても「特異度99%」は統計的に棄却される*1

補足

今後10人前後の陽性判定者が出てきた場合にはこの計算では「特異度99%」は否定できなくなるが,これまで0が続いてきたのに突然陽性判定が増えたことの半数以上が確率0.01で起きる偽陽性によるものだという仮説を立てると,やはりその仮説は却下されそうに見える(まだちゃんと計算はしてません).なので,やはり「特異度99%」仮説は筋がよろしくないのではなかろうか.

さらなる補足(2020年7月31日)

今回の計算は「2人出たところで「特異度99%」仮説は復活しない」という以上のことについてはそもそも蛇足気味で,何人かの方がtwitterで書いていたように*2,「1250人検査した時点で陽性判定者0人」というデータの存在自体が「特異度99%」仮説を強く棄却している,というので十分だったように思う*3.ただ,何度もしつこく書くが,この統計的検定では「特異度一定」「検査が独立」が近似的に成り立つことを前提としているので,そこが成り立ってなければ推論は正しいとは言えない.臨床の側でこれらの前提を否定する根拠があるならば是非ともそれを教えて欲しいと思う*4

*1:以前にも書いたが,岩手県の統計データからのみでは「特異度99.9%」は否定できない.「特異度99.99%」以上を推定するには日本医師会の文書で引用されていた論文などのより大規模な調査の結果が必要になる.

*2:例えば,口は悪いがnagaya氏のtweet https://twitter.com/nagaya2013/status/1288653039839019010 

*3:例えば,「特異度99%」の下では,陽性者が1人もいない状況で1250回の検査を1000セットやっても「陽性反応0」が一つも現れない確率は99.65%くらいである.

*4:ついでに言うと,「特異度99%(もしくはそれ以下)」を仮定するべきとする根拠を是非とも知りたいので,そのように主張する方はお手数ですがご教授いただけるととてもありがたいです.