統(tǒng)計中的第一類和第二類錯誤

統(tǒng)計中的I型錯誤發(fā)生在統(tǒng)計學家錯誤地拒絕零假設(shè)或無效陳述時,當零假設(shè)為真時,而II型錯誤發(fā)生在統(tǒng)計學家未能拒絕零假設(shè)和替代假設(shè)時,或者正在進行測試以提供支持證據(jù)的陳述是正確的。

類型I和類型II錯誤都內(nèi)置于假設(shè)檢驗的過程中,盡管似乎我們希望盡可能地使這兩個錯誤的概率盡可能小,但通常不可能降低概率。這些錯誤引出了一個問題:"兩個錯誤中哪一個更嚴重?"

這個問題的簡短答案是它確實取決于情況。在某些情況下,I型錯誤優(yōu)于II型錯誤,但在其他應用中,I型錯誤比II型錯誤更危險。為了確保對統(tǒng)計測試程序進行適當?shù)囊?guī)劃,在決定是否拒絕零假設(shè)時,必須仔細考慮這兩種類型錯誤的后果。我們將在下面看到這兩種情況的例子。

類型I和類型II錯誤

我們首先回顧I型錯誤和II型錯誤的定義。在大多數(shù)統(tǒng)計檢驗中,零假設(shè)是關(guān)于沒有特定影響的群體的普遍主張的陳述,而替代假設(shè)是我們希望在我們的假設(shè)檢驗中提供證據(jù)的陳述。對于顯著性檢驗,有四種可能的結(jié)果:

  1. 我們拒絕零假設(shè),零假設(shè)是真的。這就是所謂的I型錯誤。
  2. 我們拒絕零假設(shè),而替代假設(shè)是正確的。在這種情況下,已做出正確的決定。
  3. 我們無法拒絕null假設(shè)和零假設(shè)是正確的。在這種情況下,做出了正確的決定。
  4. 我們不能拒絕零假設(shè),而替代假設(shè)是正確的。這就是所謂的II型錯誤。

顯然,任何統(tǒng)計假設(shè)檢驗的**結(jié)果都是第二個或第三個,其中做出了正確的決定并且沒有發(fā)生錯誤,但更常見的是,在假設(shè)檢驗過程中出現(xiàn)錯誤,但是'程序的所有部分。盡管如此,知道如何正確執(zhí)行程序并避免"誤報"可以幫助減少I型和II型錯誤的數(shù)量。

I型和II型錯誤的核心差異

用更口語的話,我們可以將這兩種錯誤描述為與測試過程的某些結(jié)果相對應。對于I型錯誤,我們錯誤地拒絕了零假設(shè)-換句話說,我們的統(tǒng)計檢驗錯誤地為替代假設(shè)提供了積極的證據(jù)。因此,I型錯誤對應于“假陽性”測試結(jié)果。

另一方面,當替代假設(shè)為真且我們不拒絕零假設(shè)時,會發(fā)生II型錯誤。這樣,我們的測試錯誤地提供了反對替代假設(shè)的證據(jù)。因此,II型錯誤可以被認為是“假陰性”測試結(jié)果。

從本質(zhì)上講,這兩個錯誤是彼此相反的,這就是為什么它們涵蓋了統(tǒng)計測試中所犯的全部錯誤的原因,但是如果I型或II型錯誤仍未發(fā)現(xiàn)或未解決,它們的影響也會有所不同。

哪個錯誤更好

通過考慮假陽性和假陰性結(jié)果,我們更有能力考慮哪些錯誤更好II型似乎具有**含義,出于充分的原因。

假設(shè)你正在設(shè)計一個我疾病的醫(yī)學篩查。I型錯誤的假陽性可能會給患者帶來一些焦慮,但這將導致其他測試程序,最終顯示初始測試不正確。相反,來自II型錯誤的假陰性將給患者不正確的保證,即他或她實際上沒有疾病。由于這些不正確的信息,該疾病將不會得到治療。如果醫(yī)生可以在這兩種選擇之間做出選擇,那么假陽性比假陰性更可取。

現(xiàn)在假設(shè)有人因謀殺而受到審判。這里的零假設(shè)是這個人不有罪。如果該人被判有罪,他或她沒有犯下謀殺,將會發(fā)生I型錯誤,這對被告來說是非常嚴重的后果。另一方面,如果陪審團發(fā)現(xiàn)該人即使犯下謀殺罪也不會有罪,這對被告來說是一個很好的結(jié)果,但對整個社會來說卻不是。在這里,我們看到司法系統(tǒng)中的價值,旨在**限度地減少I型錯誤。

科普航天