2020年3月11日 星期三

統計學的應用

美國一項被稱為至今同類最大的新型冠狀病毒肺炎分析發現,患者潛伏期中位數超過5天,較一般流感和傷風長,亦極易傳播,因此現時各國普遍採取的14天隔離時限屬合適做法。研究亦顯示,八成患者的病徵輕微。
八成患者病徵輕微
約翰霍普金斯大學彭博公共衛生學院(Johns Hopkins University Bloomberg School of Public Health)流行病學家萊斯勒(Justin Lessler)領導的團隊分析了今年14日至224日全球181名在中國湖北省以外患者的病情進展。患者中73個來自中國大陸,其餘包括新加坡、日本、台灣等,香港則有8人。他們全都曾到過武漢,研究人員較能確定他們「中招」的時期。
研究顯示,這些患者絕大部分在感染4.55.8天之間開始出現病徵,潛伏期中位數為5.1天,大部分人在病發後兩星期恢復正常。約有97.5%是在感染後11.5天內出徵狀,而就算一直沒有徵狀者,仍會傳染他人。專家同時指出,從統計概率而言,14天監測和隔離期很可能會遺漏某些病例。他們估計每1萬名隔離了14天的人中,略多於100人會在解除隔離後才出現徵狀,比例約1%
解題:精准計算不同措施的綜合成本和各種情況的概率,從根本上看,傳染病其實是個隨機(RANDOM)事件,所以在防治疫情的過程中,我們需要運用更多統計學的概念,來幫助各方面理性對待各種隨機現象,從而避免過度恐慌,做出正確的判斷和決策。下面是我們舉出的例子:
有關潛伏期的計算
比如,上述數據,披露了針對181例新冠病毒感染者的回顧性研究成果。這篇論文對未來的疫情防治工作提供了重要的決策支援,但其中提到的潛伏期最長可達24天的結論,卻引起不少人的恐慌。
其實大可不必如此恐慌,幾乎所有涉及到群體生理乃至其他特徵的結論,都具有一定程度的不確定性。要更好地理解這些結論的意義,需要對統計學知識有個基本的瞭解。
在流行病學中,疾病的潛伏期通常可以用對數正態分佈(normal logarithmic distribution)來近似,這種近似的合理性往往可在病原體繁殖動力學上得到一定解釋。簡單來說,這相當於假設log(潛伏期)服從正態分佈。對數正態隨機分佈都存在一個長尾,儘管長尾部分的概率很小但不是零,如果樣本量足夠大,長尾部分的小概率事件還是有可能發生的。
論文中提到潛伏期的中位數為5.1天,這意味著log(潛伏期)的均值為1.6。在均值已經確定的前提下,log(潛伏期)的標準差越大,潛伏期的尾部概率也越大。根據論文有181例中潛伏期最長為24天。我們使用蒙特卡洛模擬方法可以推算出,當log(潛伏期)的標準差為0.641099例中最長的潛伏期的中位數為24天。這個對數正態分佈中,百分之九十以上的患者的潛伏期在14天以內。
我們可以模擬出,任意一個病例的潛伏期超過14天的概率為0.838%,超過24天的概率為0.062%。顯而易見的是,觀察到的病例越少,這些病例中的最長潛伏期也越短。如果我們只觀察83個病例,那麼其中最長潛伏期的中位數就只有14天。如上所述,當觀察病例達到181時,最長潛伏期的中位數就會達到24天。

1 則留言:

  1. Even the government have all the latest statistics at her fingertips, she still has to make use of some new apps to interpret the results, one of the best tools called SIR, it is explored by CityU and predict quite well about nCov-19.

    回覆刪除