雙樣本T檢驗(yàn)和置信區(qū)間的例子

有時(shí)在統(tǒng)計(jì)中,找出問(wèn)題的例子是有幫助的。這些例子可以幫助我們找出類似的問(wèn)題。在本文中,我們將詳細(xì)介紹對(duì)兩種人口均值進(jìn)行推論統(tǒng)計(jì)的過(guò)程。我們不僅會(huì)看到如何對(duì)兩種總體均值的差異進(jìn)行假設(shè)檢驗(yàn),我們還將為此差異構(gòu)建置信區(qū)間。我們使用的方法有時(shí)稱為雙樣本t檢驗(yàn)和雙樣本t置信區(qū)間。

問(wèn)題陳述

假設(shè)我們希望測(cè)試小學(xué)生的數(shù)學(xué)能力。我們可能有的一個(gè)問(wèn)題是,更高年級(jí)的平均考試成績(jī)是否更高。

對(duì)27名三年級(jí)學(xué)生的簡(jiǎn)單隨機(jī)樣本進(jìn)行數(shù)學(xué)測(cè)試,對(duì)他們的答案進(jìn)行評(píng)分,結(jié)果發(fā)現(xiàn)平均得分為75分,樣本標(biāo)準(zhǔn)差為3分。

對(duì)20名五年級(jí)學(xué)生的簡(jiǎn)單隨機(jī)樣本進(jìn)行相同的數(shù)學(xué)測(cè)試,并對(duì)他們的答案進(jìn)行評(píng)分。五年級(jí)學(xué)生的平均得分為84分,樣本標(biāo)準(zhǔn)差為5分。

在這種情況下,我們提出以下問(wèn)題:

  • 樣本數(shù)據(jù)小學(xué)生生活小常識(shí)是否為我們提供證據(jù)表明所有五年級(jí)學(xué)生的平均考試成績(jī)超過(guò)所有三年級(jí)學(xué)生的平均考試成績(jī)?
  • 三年級(jí)和五年級(jí)人群平均考試成績(jī)差異的95%置信區(qū)間是多少?

條件和程序

我們必須選擇使用哪個(gè)程序。在這樣做時(shí),我們必須確保并檢查是否滿足此程序的條件。我們被要求比較兩種人口手段??梢杂脕?lái)做到這一點(diǎn)的一組方法是雙樣本t程序的方法。

為了使用這些t-程序?qū)τ趦蓚€(gè)樣品,我們需要確保以下條件成立:

  • 我們從兩個(gè)感興趣的人群中獲得了兩個(gè)簡(jiǎn)單的隨機(jī)樣本。
  • 我們的簡(jiǎn)單隨機(jī)樣本不占總?cè)丝诘?%。
  • 這兩個(gè)樣本彼此獨(dú)立,
  • 變量是正態(tài)分布的。
  • 兩個(gè)總體的總體均值和標(biāo)準(zhǔn)差均未知。

我們看到大多數(shù)這些條件都得到了滿足。我們被告知我們有簡(jiǎn)單的隨機(jī)樣本。我們正在研究的人口很多,因?yàn)檫@些年級(jí)有數(shù)百萬(wàn)學(xué)生。

我們無(wú)法自動(dòng)假設(shè)的條件是測(cè)試分?jǐn)?shù)是否正態(tài)分布。由于我們的樣本量足夠大,因此通過(guò)t過(guò)程的魯棒性,我們不一定需要變量正態(tài)分布。

由于條件得到滿足,我們進(jìn)行了一些初步計(jì)算。

標(biāo)準(zhǔn)錯(cuò)誤

標(biāo)準(zhǔn)誤差是標(biāo)準(zhǔn)偏差的估計(jì)值。對(duì)于此統(tǒng)計(jì)信息,我們添加樣本的樣本方差,然后取平方根。這給出了公式:

s2/n+s2/n1/2

通過(guò)使用上面的值,我們可以看到標(biāo)準(zhǔn)錯(cuò)誤的值是

(32/27+52/20)1/2=(1/3+5/4)1/2=1.2583

自由度

我們可以對(duì)我們的自由度使用保守的近似值。這可能低估了自由度的數(shù)量,但計(jì)算比使用Welch's公式要容易得多。我們使用兩個(gè)樣本中較小的一個(gè),然后從這個(gè)數(shù)字中減去一個(gè)。

例如,兩個(gè)樣本中較小的一個(gè)是20。這意味著自由度數(shù)是20-1=19。

假設(shè)檢驗(yàn)127 128

我們希望檢驗(yàn)這樣的假設(shè):五年級(jí)學(xué)生的平均考試成績(jī)大于三年級(jí)學(xué)生的平均成績(jī)。設(shè)μ為所有五年級(jí)學(xué)生人口的平均分。同樣,我們讓?duì)淌撬腥昙?jí)學(xué)生人口的平均得分。

假設(shè)如下:

  • H:μ-μ=0
  • H:μ-μ>0

測(cè)試統(tǒng)計(jì)量是樣本均值之間的差值,然后除以標(biāo)準(zhǔn)誤差。由于我們使用樣本標(biāo)準(zhǔn)差來(lái)估計(jì)總體標(biāo)準(zhǔn)差,因此t分布的檢驗(yàn)統(tǒng)計(jì)量。

測(cè)試統(tǒng)計(jì)量的值是(84-75)/1.2583。這大約是7.15。

我們現(xiàn)在確定這個(gè)假設(shè)檢驗(yàn)的p值是多少。我們查看測(cè)試統(tǒng)計(jì)量的值,以及它位于具有19個(gè)自由度的t分布上的位置。對(duì)于此分布,我們有4.2 x 10-7作為p值。(確定這一點(diǎn)的一種方法是使用T。DIST.RT在Excel中的功能。)

由于我們的p值很小,因此我們拒絕零假設(shè)。結(jié)論是五年級(jí)學(xué)生的平均考試成績(jī)高于三年級(jí)學(xué)生的平均考試成績(jī)。

置信區(qū)間

由于我們已經(jīng)確定平均分?jǐn)?shù)之間存在差異,因此我們現(xiàn)在確定這兩種方法之間差異的置信區(qū)間。我們已經(jīng)有了我們需要的大部分。差異的置信區(qū)間需要同時(shí)具有估計(jì)值和誤差范圍。

兩種方法的差異的估計(jì)很容易計(jì)算。我們只是找到d樣本均值的差異。樣本均值的這種差異估計(jì)了總體均值的差異。

教育資源網(wǎng)_1

對(duì)于我們的數(shù)據(jù),樣本均值的差異為84–75=9。

誤差幅度稍難計(jì)算。為此,我們需要將適當(dāng)?shù)慕y(tǒng)計(jì)量乘以標(biāo)準(zhǔn)誤差。我們需要的統(tǒng)計(jì)數(shù)據(jù)是通過(guò)查閱表格或統(tǒng)計(jì)軟件找到的。

再次使用保守近似,我們有19個(gè)自由度。對(duì)于95%的置信區(qū)間,我們看到t*=2.09。我們可以使用Excel中的T.INV函數(shù)來(lái)計(jì)算這個(gè)值。

我們現(xiàn)在把所有事情放在一起,看看我們的誤差幅度是2.09 x 1.2583,大約是2.63。置信區(qū)間為9±2.63。在五年級(jí)和三年級(jí)學(xué)生選擇的測(cè)試中,間隔為6.37至11.63分。