卡方擬合優(yōu)度檢驗
卡方擬合優(yōu)度檢驗是更一般的卡方檢驗的變體。此測試的設(shè)置是一個可以包含多個級別的單個分類變量。通常在這種情況下,我們將為分類變量考慮一個理論模型。通過這個模型,我們預(yù)計一定比例的人口將進(jìn)入這些水平。擬合優(yōu)度檢驗決定了我們理論模型中的預(yù)期比例與現(xiàn)實(shí)的匹配程度。
Null and Alternative hypothesis
擬合優(yōu)度檢驗的零假設(shè)和替代假設(shè)看起來與我們其他一些假設(shè)檢驗不同。其中一個原因是卡方擬合優(yōu)度檢驗是一種非參數(shù)方法。這意味著我們的測試不涉及單個總體參數(shù)。因此,零假設(shè)并不表示單個參數(shù)具有某個值。
我們從n水平的分類變量開始,令p為i水平的人口比例。我們的理論模型對于每個比例具有q的值。零假設(shè)和替代假設(shè)的陳述如下:
健康小常識圖片
- H:p=q,p=q。p=q
- H:對于至少一個i,p不等于q。
實(shí)際和預(yù)期計數(shù)
卡方統(tǒng)計量的計算涉及我們簡單隨機(jī)樣本中數(shù)據(jù)的實(shí)際變量計數(shù)與這些變量的預(yù)期計數(shù)之間的比較。實(shí)際計數(shù)直接來自我們的樣本。計算預(yù)期計數(shù)的方式取決于我們使用的特定卡方檢驗。
對于擬合優(yōu)度測試,我們有一個理論模型來說明如何對我們的數(shù)據(jù)進(jìn)行比例化。我們只需將這些比例乘以樣本量n即可獲得預(yù)期計數(shù)。
計算測試統(tǒng)計量
擬合優(yōu)度檢驗的卡方統(tǒng)計量是通過比較我們分類變量每個級別的實(shí)際計數(shù)和預(yù)期計數(shù)來確定的。計算擬合優(yōu)度檢驗的卡方統(tǒng)計量的步驟如下:
- 對于每個級別,從預(yù)期計數(shù)中減去觀察到的計數(shù)。
- 將這些差異中的每一個平方。
- 將這些平方差異中的每一個除以相應(yīng)的預(yù)期值。
- 將前一步的所有數(shù)字加在一起。這是我們的卡方統(tǒng)計量。
如果我們的理論模型與觀測數(shù)據(jù)完全匹配,那么預(yù)期計數(shù)將顯示與我們變量的觀測計數(shù)沒有任何偏差。這意味著我們將具有零的卡方統(tǒng)計量。在任何其他情況下,卡方統(tǒng)計量將是一個正數(shù)。
自由度
自由度的數(shù)量不需要困難的計算。我們需要做的就是從分類變量的等級數(shù)量中減去一個。這個數(shù)字將告訴我們應(yīng)該使用哪種無限卡方分布。
87>88>卡方表和P值我們計算出的卡方統(tǒng)計量對應(yīng)于具有適當(dāng)自由度數(shù)的卡方分布上的特定位置。假設(shè)零假設(shè)為真,p值確定獲得此極端檢驗統(tǒng)計量的可能性。我們可以使用卡方分布的值表來確定我們假設(shè)檢驗的p值。如果我們有可用的統(tǒng)計軟件,那么這可以用來獲得更好的p值估計。
決策規(guī)則
我們根據(jù)預(yù)定的顯著性水平?jīng)Q定是否拒絕零假設(shè)。如果我們的p值是小于或等于此重要級別,則我們拒絕零假設(shè)。否則,我們不能拒絕零假設(shè)。