統(tǒng)計(jì)和數(shù)學(xué)的自由度
在統(tǒng)計(jì)中,自由度用于定義可以分配給統(tǒng)計(jì)分布的獨(dú)立數(shù)量的數(shù)量。這個(gè)數(shù)字通常是指一個(gè)正數(shù),表示對(duì)一個(gè)人沒(méi)有限制'從統(tǒng)計(jì)問(wèn)題中計(jì)算缺失因子的能力。
自由度在統(tǒng)計(jì)量的最終計(jì)算中充當(dāng)變量,用于確定系統(tǒng)中不同場(chǎng)景的結(jié)果,數(shù)學(xué)自由度定義確定完整向量所需的域中的維度數(shù)量。
為了說(shuō)明自由度的概念,我們將查看有關(guān)樣本均值的基本計(jì)算,并找到數(shù)據(jù)列表的均值,我們添加所有數(shù)據(jù)并除以值的總數(shù)。
樣本均值
的插圖暫時(shí)假設(shè)我們知道數(shù)據(jù)集的平均值是25,并且該集中的值是20,10,50和一個(gè)未知數(shù)字。樣本均值的公式給出了方程(20+10+50+x)/4=25,其中x表示未知,使用一些基本代數(shù),可以然后確定缺失的數(shù)字x等于20。
讓's稍微改變這種情況。我們?cè)俅渭僭O(shè)我們知道數(shù)據(jù)集的平均值是25。但防溺水小知識(shí)是,這次數(shù)據(jù)集中的值是20,10和兩個(gè)未知值。這些未知數(shù)可能不同,所以我們使用兩個(gè)不同的變量x和y,來(lái)表示這一點(diǎn)。所得方程為(20+10+x+y)/4=25。通過(guò)一些代數(shù),我們得到y=70-x。該公式以這種形式編寫,以顯示一旦我們選擇x的值,y的值就完全確定。我們有一個(gè)選擇,這表明有一個(gè)自由度。
現(xiàn)在我們來(lái)看看一百分之一的樣本量d、 如果我們知道這個(gè)樣本數(shù)據(jù)的平均值是20,但不知道任何數(shù)據(jù)的值,那么就有99個(gè)自由度。所有值必須總計(jì)20 x 100=2000。一旦我們?cè)跀?shù)據(jù)集中有99個(gè)元素的值,那么**一個(gè)已經(jīng)確定。
學(xué)生t分?jǐn)?shù)和卡方分布
使用Studentt得分表時(shí),自由度起著重要作用。實(shí)際上有幾個(gè)t分?jǐn)?shù)分布。我們通過(guò)使用自由度來(lái)區(qū)分這些分布。
在這里,我們使用的概率分布取決于樣本的大小。如果我們的樣本量為n,則自由度數(shù)為n-1。例如,樣本量為22將要求我們使用具有21個(gè)自由度的t得分表的行。
卡方分布的使用還需要使用自由度。在此,以與t分?jǐn)?shù)分布相同的方式,樣本大小決定了使用哪個(gè)分布。如果樣本量n,則存在n-1自由度。
標(biāo)準(zhǔn)偏差和先進(jìn)技術(shù)
自由度出現(xiàn)的另一個(gè)地方是標(biāo)準(zhǔn)偏差的公式。這種情況并不那么明顯,但是如果我們知道在哪里看,我們可以看到它。為了找到標(biāo)準(zhǔn)偏差,我們正在尋找"平均值"與平均值的偏差。但是,在從每個(gè)數(shù)據(jù)值中減去平均值并將差異平方后,我們最終除以n-1,而不是像我們預(yù)期的那樣n。
n-1的存在來(lái)自自由度數(shù)。由于公式中使用了n數(shù)據(jù)值和樣本均值,因此存在n-1自由度。
更先進(jìn)的統(tǒng)計(jì)技術(shù)es使用更復(fù)雜的計(jì)算自由度的方法。當(dāng)計(jì)算具有n和n元素的獨(dú)立樣本的兩個(gè)均值的檢驗(yàn)統(tǒng)計(jì)量時(shí),自由度數(shù)具有相當(dāng)復(fù)雜的公式。它可以用108 n-1109和110 n-1111的較小值來(lái)估計(jì)
另一個(gè)計(jì)算自由度的不同方法的例子是F測(cè)試。在進(jìn)行118 F 119測(cè)試時(shí),我們有120 k 121個(gè)樣本,每個(gè)樣本的大小為122 n 123--分子的自由度為124 k 125-1,分母為126 k 127(128 n 129-1)。