科普類文章_辛普森的統(tǒng)計(jì)悖論概述
矛盾的是表面上似乎矛盾的陳述或現(xiàn)象。悖論有助于揭示看似邪惡的表面之下的根本事實(shí)。在統(tǒng)計(jì)領(lǐng)域,Simpson's悖論證明了組合來自多個(gè)群體的數(shù)據(jù)會(huì)產(chǎn)生什么樣的問題。
有了所有數(shù)據(jù),我們需要謹(jǐn)慎行事。它來自哪里?它是如何獲得的?它真的在說什么?這些都是我們?cè)谔峁?shù)據(jù)時(shí)應(yīng)該提出的好問題。Simpson'悖論的非常令人驚訝的案例向我們表明,有時(shí)數(shù)據(jù)似乎在說什么并不是真的。
悖論概述
假設(shè)我們正在觀察幾個(gè)組,并為這些組中的每一個(gè)建立關(guān)系或關(guān)聯(lián)。辛普森的悖論說,當(dāng)我們將所有群體組合科普類文章在一起并以匯總形式查看數(shù)據(jù)時(shí),我們之前注意到的相關(guān)性可能會(huì)逆轉(zhuǎn)。這通常是由于尚未考慮的潛伏變量,但有時(shí)是由于數(shù)據(jù)的數(shù)值。
示例
為了更清楚地理解Simpson's悖論,讓's看看下面的例子。在某家醫(yī)院,有兩名外科醫(yī)生。外科醫(yī)生A對(duì)100名患者進(jìn)行手術(shù),95名患者存活。外科醫(yī)生B對(duì)80名患者進(jìn)行手術(shù),72名患者存活。我們正在考慮在這家醫(yī)院進(jìn)行手術(shù),并通過手術(shù)生活是非常重要的。我們想選擇兩位外科醫(yī)生中**的一位。
我們查看數(shù)據(jù)并用它來計(jì)算外科醫(yī)生A's患者在手術(shù)中存活的百分比,并將其與外科醫(yī)生B患者的***進(jìn)依科普行比較。
- 100名患者中有95名患者在外科醫(yī)生A中存活,因此95/100=95%存活。
- 80名患者中有72名患者在外科醫(yī)生B中存活,因此72/80=90%存活。
從這個(gè)分析中,我們應(yīng)該選擇哪個(gè)外科醫(yī)生來治療我們?看起來外科醫(yī)生A的**更安全。但這真的是真的嗎?
如果我們對(duì)數(shù)據(jù)做了一些進(jìn)一步的研究,發(fā)現(xiàn)最初醫(yī)院已經(jīng)考慮了兩種不同類型的手術(shù),但隨后將所有數(shù)據(jù)匯總在一起報(bào)告給每位外科醫(yī)生。并非所有的手術(shù)都是平等的,有些被認(rèn)為是高風(fēng)險(xiǎn)的緊急手術(shù),而另一些則是事先安排的更為常規(guī)的手術(shù)。
在外科醫(yī)生A治療的100名患者中,50名患有高風(fēng)險(xiǎn),其中3名死亡。其他50人被認(rèn)為是例行的,其中2人死亡。這意味著,對(duì)于常規(guī)手術(shù),由外科醫(yī)生a治療的患者具有48/50=96%的***。
現(xiàn)在我們更仔細(xì)地查看外科醫(yī)生B的數(shù)據(jù),發(fā)現(xiàn)80名患者中有40名患有高風(fēng)險(xiǎn),其中7名死亡。其他40人是例行的,只有一人死亡。這意味著患者對(duì)于外科醫(yī)生的常規(guī)手術(shù)具有39/40=97.5%的***B。
現(xiàn)在哪個(gè)外科醫(yī)生看起來更好?如果你的手術(shù)是常規(guī)手術(shù),那么外科醫(yī)生B實(shí)際上是更好的外科醫(yī)生。如果我們看一下外科醫(yī)生進(jìn)行的所有手術(shù),A會(huì)更好。這是非常違反直覺的。在這種情況下,手術(shù)類型的潛伏變量會(huì)影響外科醫(yī)生的綜合數(shù)據(jù)。
辛普森的歷史's悖論
辛普森的悖論以愛德華·辛普森(Edward Simpson)命名,愛德華·辛普森(Edward Simpson)在1951年的論文#34;列聯(lián)表中相互作用的解釋"皇家統(tǒng)計(jì)學(xué)會(huì)雜志。皮爾遜和尤爾每個(gè)人都比辛普森早半個(gè)世紀(jì)觀察到類似的悖論,所以辛普森的悖論有時(shí)也被稱為辛普森尤爾效應(yīng)。
悖論在sp等不同領(lǐng)域有許多廣泛的應(yīng)用ORT統(tǒng)計(jì)和失業(yè)數(shù)據(jù)。任何數(shù)據(jù)匯總的時(shí)候,請(qǐng)注意這個(gè)悖論的出現(xiàn)。