豚バラ大根ノート

豚バラ大根をおいしく作る秘訣はここには書かれていません.

統計的検定とは

統計的検定?

「統計的検定(統計的仮説検定)」というとなんだか難しいことをやってるように聞こえますが,アイデアは単純で,実際に観測されたデータとそれに反してそうな怪しげな仮説があったとき,仮説の下でそのデータが実現される理論的な確率を計算して,確率が非常に低い場合,怪しげな仮説は却下するというものです.

具体例としてのPCR検査

今話題のPCR検査の特異度を例に取りましょう.手元にあるデータは岩手県(21日当時*1)の検査数1251,陽性判定0,「怪しげな主張」は「特異度99%」です.

観測されたデータ「1251人検査して陽性判定0」が,仮説「特異度99%(=陰性者は確率0.99で陰性と判定され,確率0.01で陽性と判定される)」の下で起きる確率がどれくらいかを計算してみましょう.今の場合,それぞれの検査が独立に行われる*2として,実は陽性者がいたのだけれど陰性と判定されている状況は無視すると*3,今の場合,検査ごとに0.99の確率で起こること(=陰性者が陰性と判定される)が観測される必要があり,それを1251回繰り返すことになるので,

0.99×0.99×0.99×…×0.99 (0.99を1251回かける)=0.991251=0.000003464<0.000035%

となります*4

見ての通り,0.000035%というのはとても低い確率なのでまず起きないと思うのが自然ですが,実際に岩手県ではそれは起きているので,だとするとそもそもの仮説「特異度99%」が変だったんじゃないの?ということで仮説「特異度99%」が棄却される,というわけです.

Let's 検定!

統計的検定はデータを扱う科学では至る所で使われています.例えばある新薬が効果があるかどうかも「効果がない」という仮説のもとで治験で得たような値が出る確率を計算し,それが十分に低いことを示すことで,仮説「効果がない」は正しくない=「効果がある」という結論を導きます.ここ説明した原理さえわかっていれば「有意水準」「棄却域」「p値」などの言葉も上の例を頭に入れて読めばそれほど難しくなく理解できると思います.この強力なアイデアが多くの人に知られることを願っています.

 

 

 

*1:残念ながら29日にとうとう岩手県でも陽性判定者が出てしまいました.

*2:一つの検査が別の検査に影響を及ぼさないという仮定.多くの統計的な状況ではこれが近似的に成り立つと思って話を進めます

*3:この場合もちゃんと計算すると結論に影響が出ないことがわかりますがここでは簡単のため省略します.

*4:これは1の目が1/6の確率で出るサイコロを2回振ってどちらも1である確率が1/6×1/6=1/36,3回振って全部1ならば1/6×1/6×1/6=1/216,となるように,1251回の検査で各回で0.99の確率のことが起き続けるならば,0.99を1251回かけたものが「1251回の検査が全て陰性判定=陽性判定が0」となる確率である,という計算です.