豚バラ大根ノート

豚バラ大根をおいしく作る秘訣はここには書かれていません.

ニュージーランドのデータ

データが大きくなれば統計的なブレは驚異的に減り,疑わしい仮説が棄却されることがより鮮明となる.前に計算した岩手県のデータの400倍くらいのスケールであるニュージーランドのデータで,そのことを確認してみよう.いつものように,以下の統計的考察は特異度は検査によらず一定で,各検査は独立という仮定が近似的に成り立っていることを前提としている.

ニュージーランドにおけるPCR検査

検査数:465,066(2020年7月30日まで)

陽性判定数:1210 (7月31日時点で判明しているもの)

多少の陽性判定数の変動は以下の考察にはほとんど影響がないので,この数字を使って「特異度99%」という仮説がどれくらい強く棄却されるかを見てみる.

計算

(多少ややこしい議論と数学を用いるので,面倒な人は読み飛ばして「計算結果まとめ」へ進んでください)

 まず状況を簡単にするために,465,066の検査のうち,少なくとも230,000は本当に陰性だったと仮定することにしよう*1

この230,000件のうち,ちょうど1210件が陽性判定される確率は,「特異度99%」の仮説の下では

230000!/(1210!・228790!)×0.011210×0.99228790 < 10-137

と計算できる*2.ちょうど1209件,1208件,‥0件の場合の確率は,ちょうど1210件の場合の確率よりも低くなるので*3,本当に陰性である230,000件から1210件「以下」しか陽性判定が出ない確率は,

1211×10-137 < 10-133

と評価できる.もし465,066件の検査で1210件以下しか陽性判定が出ていないとすれば,当然ながら本当に陰性である230,000件からも1210件以下しか陽性判定が出ていないはずなので,「特異度99%の仮定の下で465,066件の検査で1210件以下しか陽性判定が出ない確率」は10-133以下であると評価できたことになる.

では,465,066件の検査を何セットくらいしたら陽性判定が1210件以下というセットが現れるだろうか.例えば,宇宙の年齢を多めに見積もって1000億年として,PCR検査465,066件のデータセットが毎秒1つ得られたとしよう.その場合,

1011×365×24×60×60 = 3.15...×1018 < 1019

のデータセットが得られるが,それらが全てのセットについて陽性判定が1211件以上である確率は,

(1-10-133)(1019) > 1-10-113

と評価できる*4.したがって,465,066件のPCR検査の結果のデータセットが宇宙開闢以降毎秒1つ得られていたとしても,陽性判定が1210件以下であるデータセットがただ1つでも観測される確率は10-113以下となる.

計算結果まとめ

「465,066件の検査のうち少なくとも約半数の230,000件は本当に陰性だった(残りの235,066件が本当に陽性か陰性かはわからない)」というかなり慎重な仮定の下でも,「特異度99%」を仮定すると,

  • 465,066件の検査で1210件以下しか陽性判定が出ない確率は10-133以下
  • 465,066件の検査のデータセットが宇宙開闢以降毎秒1つ得られたとして,それらのうちのただ1つでも陽性判定数が1210以下となる確率は10-113以下

と計算されるので,「特異度99%」は統計的にかなり強く棄却される.

データセットの大きさ

「等確率で互いに独立」な状況では平均的な振る舞いから離れた状況が起きる確率は急速に小さくなっていくので,ニュージーランドのデータセットの大きさが岩手県のそれの400倍であるという状況が 強く効いてくることを上の結果はよく表している.「特異度99%」の下での単純な平均465,066×0.01=4650.66と1210の差はせいぜい4倍なので,誤差によって1210件になることもありうるかもという直感的な判断はかなり実際の確率とはかけ離れている.その意味で,確率的な物事を判断するときには直感に頼るのは危険だという実例にもなっている.

追記(2020年8月2日22:10)

Stirlingの公式の誤差評価を忘れてたので,修正しました(10-134→10-133).

*1:これは「偽陰性」を排除して計算を楽にするための仮定であるが,これが成り立たない=「本当の陽性が465,066-230,000=235,066以上いる」という仮定は,たとえ感度1%(=陽性者を陽性判定する確率が1%で残りの99%は陰性と判断されてスルー)としても以下の「偽陽性」に関するものと全く同じ計算で「陽性判定数1210」のデータにより強く棄却されるので,無理のない仮定だと思われる.

*2:そのまま計算するのはつらいのでlogを取って,Stirlingの公式(の誤差評価できるバージョン)を用いて評価した.

*3:「読者への演習問題とする」

*4:logを取り,0<t<0.1では-2t<log(1-t)<-tであることを用いた