什么是方差分析?
很多時(shí)候,當(dāng)我們研究一個(gè)群體時(shí),我們真的在比較兩個(gè)群體。根據(jù)我們感興趣的這個(gè)小組的參數(shù)和我們處理的條件,有幾種技術(shù)可用。涉及兩個(gè)種群比較的統(tǒng)計(jì)推斷程序通常不能應(yīng)用于三個(gè)或更多種群。為了一次研究兩個(gè)以上的人群,我們需要不同類型的統(tǒng)計(jì)工具。方差分析或ANOVA是一種來自統(tǒng)計(jì)干擾的技術(shù),它允許我們處理幾個(gè)種群。
均值比較
為了了解出現(xiàn)什么問題以及為什么我們需要方差分析,我們將考慮一個(gè)例子。假設(shè)我們試圖確定綠色,紅色,藍(lán)色和橙色M&M糖果的平均重量是否彼此不同。我們將分別說明每個(gè)群體的平均權(quán)重,μ,μ,μ和。我們可以多次使用適當(dāng)?shù)募僭O(shè)檢驗(yàn),并檢驗(yàn)C(4,2)或六個(gè)不同的零假設(shè):
- H:μ=μ檢查紅色念珠菌種群的平均重量是否不同于藍(lán)色念珠菌種群的平均重量。
- H:μ=μ檢查藍(lán)色念珠菌種群的平均重量是否不同于綠色念珠菌種群的平均重量。
- H:μ=μ檢查平均值綠色糖果種群的重量不同于橙色糖果種群的平均重量。
- H:μ=μ檢查橙色糖果種群的平均重量是否不同于紅色糖果種群的平均重量。
- H:μ=μ檢查紅色糖果不同于綠色糖果種群的平均重量。
- H:μ=μ檢查藍(lán)色糖果種群的平均重量是否不同于人口的平均重量橙色糖果。
這種分析存在許多問題。我們將有六個(gè)p-值。即使我們可以以95%的置信水平進(jìn)行測試,但我們對整個(gè)過程的信心也小于此,因?yàn)楦怕食艘裕?95 x.95 x.95 x.95 x.95大約是.74,或74%的信心水平。因此,I型錯誤的可能性增加了。
在更基本的層面上,我們無法通過一次比較兩個(gè)參數(shù)來比較這四個(gè)參數(shù)。紅色和藍(lán)色M&Ms的平均值可能很重要,紅色的平均重量相對大于藍(lán)色的平均重量。但是,當(dāng)我們考慮所有四種糖果的平均重量時(shí),可能沒有顯著差異。
方差分析
為了處理我們需要進(jìn)行多重比較的情況,我們使用ANOVA。該測試允許我們一次考慮幾個(gè)群體的參數(shù),而無需通過一次對兩個(gè)參數(shù)進(jìn)行假設(shè)檢驗(yàn)來解決我們面臨的一些問題。
為了用上面的M&M實(shí)施例進(jìn)行ANOVA,我們將測試零假設(shè)H:μ=μ=μ=μ。這表明紅色,藍(lán)色和綠色M&Ms的平均權(quán)重之間沒有差異。另一種假設(shè)是紅色,藍(lán)色,綠色和橙色M&Ms的平均權(quán)重之間存在一些差異。這個(gè)假設(shè)實(shí)際上是幾個(gè)陳述的組合H:
- 紅色念珠菌群體的平均重量不等于藍(lán)色念珠菌群體的平均重量,或
- 藍(lán)色念珠菌群體的平均重量不等于綠色念珠菌群體的平均重量,或
- 綠色糖果種群的平均重量不等于橙色糖果種群的平均重量,或
- 綠色糖果種群的平均重量不等于紅色念珠菌群體的平均重量,或
- 藍(lán)色念珠菌群體的平均重量不等于橙色念珠菌群體的平均重量,或
- 藍(lán)色念珠菌群體的平均重量不等于紅色念珠菌群體的平均重量。
在這個(gè)特定的例子中,為了獲得我們的p值,我們將利用稱為F分布的概率分布。涉及ANOVA F檢驗(yàn)的計(jì)算可以手工完成,但通常用統(tǒng)計(jì)軟件計(jì)算。
廣州科普
多重比較
將ANOVA與其他統(tǒng)計(jì)技術(shù)分開的是它用于進(jìn)行多重比較。這在整個(gè)統(tǒng)計(jì)數(shù)據(jù)中都很常見,因?yàn)橛泻芏鄷r(shí)候我們想比較兩組以上。通常,總體測試表明我們正在研究的參數(shù)之間存在某種差異。然后,我們通過其他一些分析來確定哪個(gè)參數(shù)不同。