假設(shè)檢驗(yàn)中I型和II型錯(cuò)誤的區(qū)別
假設(shè)檢驗(yàn)的統(tǒng)計(jì)實(shí)踐不僅在統(tǒng)計(jì)學(xué)中廣泛存在,而且在整個(gè)自然科學(xué)和社會(huì)科學(xué)中都很普遍。當(dāng)我們進(jìn)行假設(shè)檢驗(yàn)時(shí),有幾件事情可能會(huì)出錯(cuò)。有兩種錯(cuò)誤,設(shè)計(jì)上無法避免,我們必須意識到存在這些錯(cuò)誤。這些錯(cuò)誤給出了I型和II型錯(cuò)誤的行人名稱。什么是I型和II型錯(cuò)誤,以及我們?nèi)绾螀^(qū)分它們?簡單地說:
- 類型I錯(cuò)誤發(fā)生在我們拒絕一個(gè)真正的零假設(shè)時(shí)
為了理解這些陳述,我們將探索這些類型錯(cuò)誤背后的更多背景。
假設(shè)檢驗(yàn)19 20
假設(shè)檢驗(yàn)的過程似乎因大量檢驗(yàn)統(tǒng)計(jì)數(shù)據(jù)而變化很大。但一般過程是一樣的。假設(shè)檢驗(yàn)涉及零假設(shè)的陳述和顯著性水平的選擇。零假設(shè)是真的或假的,代表治療或程序的默認(rèn)聲明。例如,在檢查藥物的有效性時(shí),零假設(shè)是藥物對疾病沒有影響。
在制定零假設(shè)并選擇顯著性水平后,我們通過觀察獲取數(shù)據(jù)。統(tǒng)計(jì)計(jì)算告訴我們是否應(yīng)該拒絕零假設(shè)。
在一個(gè)理想的世界中,當(dāng)假設(shè)是錯(cuò)誤的時(shí)候兒童科普手抄報(bào),我們總是拒絕零假設(shè),當(dāng)它確實(shí)是真的時(shí),我們不會(huì)拒絕零假設(shè)。但是還有另外兩種情況是可能的,每種情況都會(huì)導(dǎo)致錯(cuò)誤。
類型I錯(cuò)誤
第一種可能的錯(cuò)誤涉及拒絕實(shí)際上為真的零假設(shè)。這種錯(cuò)誤稱為I類錯(cuò)誤有時(shí)被稱為第一類錯(cuò)誤。
I型錯(cuò)誤相當(dāng)于誤報(bào)。讓我們回到一種用于治療疾病的藥物的例子。如果我們在這種情況下拒絕零假設(shè),那么我們的說法是該藥物實(shí)際上對疾病有一定影響。但是,如果零假設(shè)是真的,那么實(shí)際上,這種藥物根本不能對抗這種疾病。該藥被錯(cuò)誤地聲稱對疾病有積極作用。
可以控制類型I錯(cuò)誤。與我們選擇的顯著性水平相關(guān)的alpha值直接影響I型錯(cuò)誤。Alpha是我們有I型錯(cuò)誤的**概率。對于95%的置信水平,alpha的值為0.05。這意味著我們有5%的概率拒絕真正的零假設(shè)。從長遠(yuǎn)來看,我們在此級別執(zhí)行的每二十個(gè)假設(shè)檢驗(yàn)中就有一個(gè)會(huì)導(dǎo)致I型錯(cuò)誤。
類型II錯(cuò)誤
當(dāng)我們不拒絕錯(cuò)誤的零假設(shè)時(shí),可能會(huì)發(fā)生另一種錯(cuò)誤。這種錯(cuò)誤稱為II型錯(cuò)誤,也稱為第二類錯(cuò)誤。
II型錯(cuò)誤相當(dāng)于假陰性。如果我們再次回到我們正在測試藥物的情況,那么II型錯(cuò)誤會(huì)是什么樣子?如果我們接受該藥物對疾病沒有影響,就會(huì)發(fā)生II型錯(cuò)誤,但實(shí)際上確實(shí)如此。
希臘字母beta給出了II型錯(cuò)誤的概率。這個(gè)數(shù)字與假設(shè)檢驗(yàn)的功效或敏感性有關(guān),用1-beta表示。
如何避免錯(cuò)誤
I型和II型錯(cuò)誤是假設(shè)檢驗(yàn)過程的一部分。雖然無法完全消除錯(cuò)誤,但我們可以**限度地減少一種類型的錯(cuò)誤。
通常當(dāng)我們試圖降低概率時(shí)一種類型的錯(cuò)誤,另一種類型的概率增加。我們可以將α的值從0.05降低到0.01,相當(dāng)于99%的置信度。但是,如果其他一切保持不變,那么II型錯(cuò)誤的概率幾乎總是增加。
很多時(shí)候,我們假設(shè)檢驗(yàn)的實(shí)際應(yīng)用將決定我們是否更接受I型或II型錯(cuò)誤。這將在我們設(shè)計(jì)統(tǒng)計(jì)實(shí)驗(yàn)時(shí)使用。