雙向表中變量獨(dú)立的自由度
兩個(gè)分類變量獨(dú)立的自由度數(shù)由一個(gè)簡(jiǎn)單的公式給出:(r-1)(c-1)。這里r是行數(shù),c是分類變量值的雙向表中的列數(shù)。繼續(xù)閱讀以了解有關(guān)此主題的更多信息并了解為什么此公式給出正確的數(shù)字。
Background
許多假設(shè)檢驗(yàn)過(guò)程中的一個(gè)步驟是確定自由度數(shù)。這個(gè)數(shù)字很重要,因?yàn)閷?duì)于涉及一系列分布的概率分布,例如卡方分布,自由度數(shù)確定了我們?cè)诩僭O(shè)檢驗(yàn)中應(yīng)使用的家庭的確切分布。
自由度代表我們?cè)谔囟ㄇ闆r下可以做出的自由選擇的數(shù)量。要求我們確定自由度的假設(shè)檢驗(yàn)之一是兩個(gè)分類變量的獨(dú)立性卡方檢驗(yàn)。
獨(dú)立性測(cè)試和雙向表
獨(dú)立性的卡方檢驗(yàn)要求我們構(gòu)建一個(gè)雙向表,也稱為列聯(lián)表。這種類型的表具有r行和c列,表示一個(gè)分類變量的r水平和另一個(gè)分類變量的c水平。因此,如果我們不計(jì)算記錄總數(shù)的行和列,則雙向表中總共有rc個(gè)單元格。
卡方檢驗(yàn)的獨(dú)立性使我們能夠檢驗(yàn)分類變量彼此獨(dú)立的假設(shè)。如上所述,表中的r行和c列給出我們(r-1)(c-1))自由度。但可能不清楚為什么這是正確的自由度數(shù)量。
De的數(shù)量自由之家
為了查看為什么(r-1)(c-1)是正確的數(shù)字,我們將更詳細(xì)地檢查這種情況。假設(shè)我們知道分類變量的每個(gè)級(jí)別的邊際總數(shù)。換句話說(shuō),我們知道每行的總數(shù)和每列的總數(shù)。對(duì)于第一行,我們表中有c列,因此有c個(gè)單元格。一旦我們知道這些單元中除了一個(gè)單元之外的所有單元的值,那么因?yàn)槲覀冎浪袉卧目倲?shù),所以確定剩余單元的值是一個(gè)簡(jiǎn)單的代數(shù)問(wèn)題。如果我們填寫表格中的這些單元格,我們可以自由輸入其中的c-1,但其余單元格由行的總數(shù)確定。因此,第一行有c-1個(gè)自由度。
我們?cè)谙乱恍欣^續(xù)以這種方式,再次有c-1個(gè)自由度。這個(gè)過(guò)程一直持續(xù)到我們倒數(shù)第二行。除**一行外,每行對(duì)總數(shù)貢獻(xiàn)c-1個(gè)自由度。到我們擁有**一行以外的所有內(nèi)容時(shí),因?yàn)槲覀冎懒锌偤停晕覀兛梢源_定**一行的所有條目。這給了我們r-1行,每行c-1自由度,總共(r-1)(c-1)自由度。
示例
我們通過(guò)以下示例看到這一點(diǎn)。假設(shè)我們有一個(gè)帶有兩個(gè)分類變量的雙向表。一個(gè)變量有三個(gè)級(jí)別,另一個(gè)變量有兩個(gè)級(jí)別。此外,假設(shè)我們知道該表的行和列總數(shù):
114 A級(jí)115116級(jí)B 117 | Total | ||
1級(jí) | 100 | ||
200 | |||
300 | |||
總計(jì) | 200 | 400 | 600 |
該公式預(yù)測(cè)有(3-1)(2-1)=2個(gè)自由度。我們看到如下。假設(shè)我們用數(shù)字80填充左上角的單元格。這將自動(dòng)確定整個(gè)第一行條目:
186 A級(jí)187188級(jí)B 189級(jí) | 總計(jì) | ||
80 | 198 20 199100 | ||
200 | |||
3級(jí) | 300 | ||
總計(jì) | 200 | 400 | 600 |
現(xiàn)在,如果我們知道第二行中的第一個(gè)條目是50,那么表格的其余部分將被填寫,因?yàn)槲覀冎烂啃泻土械目倲?shù):
258 A級(jí)259 | B級(jí) | 總計(jì) | |
Level 1 | 80 | 20 | 100 |
Level 2 | 50 | 150 | 200 |
70 | 230 | 300 | |
Total | 200 | 400 | 600 |
雖然我們通常不需要知道為什么有這么多的自由度,但很高興知道我們真的只是將自由度的概念應(yīng)用于新的情況。
科普星