如何在統(tǒng)計(jì)中找到自由度

許多統(tǒng)計(jì)推斷問題要求我們找到自由度的數(shù)量。自由度數(shù)從無限多中選擇單個概率分布。在置信區(qū)間的計(jì)算和假設(shè)檢驗(yàn)的工作中,這一步驟是一個經(jīng)常被忽視但至關(guān)重要的細(xì)節(jié)。

自由度數(shù)沒有一個通用公式。但是,在推論統(tǒng)計(jì)中,每種類型的過程都使用特定的公式。換句話說,我們正在進(jìn)行的設(shè)置將決定自由度的數(shù)量。接下來是一些最常見的推理過程的部分列表,以及每種情況下使用的自由度數(shù)。

Standard Normal Distribution

列出了涉及標(biāo)準(zhǔn)正態(tài)分布的程序的完整性并澄清了一些誤解。這些程序不要求我們找到自由度的數(shù)量。原因是存在單個標(biāo)準(zhǔn)正態(tài)分布。這些類型的程序包括已知人口標(biāo)準(zhǔn)偏差時涉及人口平均數(shù)的程序,以及涉及人口比例的程序。

One Sample T Procedures

有時統(tǒng)計(jì)實(shí)踐要求我們使用學(xué)生的t分布。對于這些程序,例如處理人口標(biāo)準(zhǔn)偏差未知的人口均值的程序,自由度數(shù)比樣本量少一個。因此,如果樣本大小為n,則存在n-1個自由度。

T程序與配對數(shù)據(jù)

很多時候?qū)?shù)據(jù)視為配對是有意義的。配對通常是由于我們對中第一個和第二個值之間的連接而執(zhí)行的。我們會在測量之前和之后配對很多次。我們的pai樣本紅色數(shù)據(jù)不是獨(dú)立的;但是,每對之間的差異是獨(dú)立的。因此,如果樣本具有總共n對數(shù)據(jù)點(diǎn)(總共2n值),則存在n-1個自由度。

兩個獨(dú)立人群的T程序

對于這些類型的問題,我們?nèi)栽谑褂胻分布。這次是我們每個人口的樣本。盡管**將這兩個樣本的大小相同,但對于我們的統(tǒng)計(jì)程序而言這并不是必需的。因此,我們可以有兩個大小分別為nn的樣本家庭安全小常識。有兩種方法可以確定自由度數(shù)。更準(zhǔn)確的方法是使用韋爾奇公式,這是一個計(jì)算繁瑣的公式,涉及樣本量和樣本標(biāo)準(zhǔn)偏差。另一種方法,稱為保守近似,可用于快速估計(jì)自由度。這只是兩個數(shù)字n-1和n-1中的較小者。

卡方獨(dú)立

卡方檢驗(yàn)的一個用途是查看兩個分類變量(每個變量都有幾個級別)是否表現(xiàn)出獨(dú)立性。關(guān)于這些變量的信息記錄在具有r行和c列的雙向表中。自由度數(shù)是乘積(r-1)(c-1)。

卡方擬合優(yōu)度

卡方擬合優(yōu)度從單個分類變量開始,總共n個級別。我們測試這個變量與預(yù)定模型匹配的假設(shè)。自由度的數(shù)量比等級的數(shù)量少一個。換句話說,有n-1個自由度。

單因素方差分析

單因素方差分析(ANOVA)允許我們在幾個群體之間進(jìn)行比較,消除了多重成對假設(shè)的需要是測試。由于測試要求我們測量幾個組之間的變化以及每個組內(nèi)的變化,因此我們最終得到兩個自由度。用于單因素方差分析的F統(tǒng)計(jì)量是一個分?jǐn)?shù)。分子和分母各自具有自由度。令c為組數(shù),n為數(shù)據(jù)值總數(shù)。分子的自由度數(shù)小于組數(shù),或c-1。分母的自由度數(shù)是數(shù)據(jù)值的總數(shù)減去組數(shù),或n-c。

很明顯,我們必須非常小心地知道我們正在使用哪種推理程序。這些知識將告訴我們正確的使用自由度數(shù)量。