侵權(quán)投訴
訂閱
糾錯
加入自媒體

辟謠:新型冠狀病毒死亡數(shù)據(jù)是根據(jù)公式造假?

從1月23日武漢開始封城以來,已經(jīng)歷時半個多月。目前,沿海各大城市返工也基本結(jié)束,但疫情的控制情況似乎與預期仍有一些差距,并沒有完全受到遏制,每日確診病例和疑似病例仍在大幅增加,新增的勢頭也是一波三折,沒有實現(xiàn)持續(xù)的下降。

民眾受經(jīng)濟停滯的影響,也越來越產(chǎn)生焦慮的心態(tài)。在這種焦慮的心態(tài)的作用下,一些無中生有看似合理的質(zhì)疑也就慢慢浮現(xiàn)在人們的視野之中。近期,就有一些略知統(tǒng)計學基本原理的人運用excel整理了一下從封城之后的每日統(tǒng)計新型冠狀病毒感染者死亡數(shù)據(jù),然后得出結(jié)論:每日的死亡人數(shù)非常準地吻合一個多項式公式,這幾乎不太可能是一個自然現(xiàn)象。于是陰謀論又來了:官方是用一個不至于造成人們心理恐慌的公式,每天算出應該公布的死亡人數(shù)進行公布。

我來給大家演示一下這個分析:

首先在excel或wps里面輸入從23號以來的每天公布的新型冠狀病毒感染者死亡人數(shù)。

然后依次編上序號。

選中某一個時間段的序號和死亡人數(shù),選擇插入散點圖(X,Y),在“圖表元素”中勾中“趨勢圖”并再勾中“多項式”“顯示公式”“顯示R平方值”,就可以得出一個擬合的曲線多項式和R平方值。R平方值代表這些統(tǒng)計的散點和擬合的曲線吻合度有多高,這個數(shù)值越大越好,但不能超過1。

比如如果我們把1月24日到2月5日的數(shù)據(jù)進行擬合,得出的R平方值為0.9998。

再用這個公式去推算2月6日和2月7日的死亡人數(shù),你還會驚奇地發(fā)現(xiàn),和實際的數(shù)據(jù)誤差不超過4人!

由于大多數(shù)人在生活中也不會用到統(tǒng)計學,因此即使是高中學過統(tǒng)計學的基礎(chǔ),基本上畢業(yè)以后大家也都還給老師了。一看到有人居然能用公式來預測每天的死亡人數(shù),也就將信將疑地認可了這種說法。

那么,事實上官方公布的死亡數(shù)字真的是用公式計算造假的嗎?

其實,用統(tǒng)計學質(zhì)疑官方數(shù)據(jù)造假早就不是什么新鮮的事了。在微博上搜索“淘寶雙11騙局”你也能找到一位名叫“尹立慶”的博主通過同樣的方式分析歷年天貓雙十一的銷售額數(shù)據(jù),得出一個公式,和現(xiàn)實數(shù)據(jù)擬合度高達99.94%,也引起了眾多網(wǎng)友質(zhì)疑淘寶數(shù)據(jù)造假的熱點。

在解釋這個問題時,我們先要理解一個現(xiàn)象:多項式函數(shù)的擬合度接近1是小概率事件嗎?

在數(shù)學上,關(guān)于擬合度的定義:

R的平方值= SSR / SST = 1 - SSE / SST

SSR叫歸平方和(Sum of Squares for Regression),它的定義是每一點的擬合值與平均值的差值的平方和;SSE叫殘差平方和(Sum of Squares for Error),它的定義是每一點的真實值與擬合值的差值的平方和;SST叫總離差平方和(Sum of Squares for Total),它的定義是每一點的真實值與平均值的差值的平方和,同時SST=SSE + SSR。如果一組數(shù)據(jù)有n個點,那么我們就有n個真實值和n個擬合值,而平均值總是只有一個。所以只要這組數(shù)據(jù)不是太畸形,那么在每一個點上,真實值跟擬合值的差別都可以做到比較小。這些差別的平方和就是殘差平方和SSE,顯然它比總離差平方和SST小得多,因此 1 - SSE / SST自然也就非常接近于1,不接近才不正常。

其次,一個病毒疫情死亡人數(shù)符合一個多項式函數(shù)屬于非自然現(xiàn)象嗎?

這個問題能夠成為一個讓大家感到意外的問題,只能說是我們大多數(shù)人的數(shù)學水平連高中數(shù)學教育水平都不如造成的結(jié)果,事實上生活中太多的現(xiàn)象可以用數(shù)學來“預測”了。如果讀者更有興趣,也可以去找來中國、美國的GDP歷年數(shù)據(jù),通過同樣的方式來進行擬合,你也會發(fā)現(xiàn)原來不僅社會主義的國家經(jīng)濟數(shù)據(jù)可能“造假”,資本主義國家的經(jīng)濟數(shù)據(jù)也是可以“神預測”的。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點。刊用本站稿件,務(wù)經(jīng)書面授權(quán)。未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復制、翻譯及建立鏡像,違者將依法追究法律責任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

醫(yī)療科技 獵頭職位 更多
文章糾錯
x
*文字標題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號