置信區(qū)間:4個常見錯誤
置信區(qū)間是推論統(tǒng)計的關鍵部分。我們可以使用概率分布中的一些概率和信息來使用樣本來估計總體參數(shù)。置信區(qū)間的陳述以容易被誤解的方式進行。我們將研究置信區(qū)間的正確解釋,并調(diào)查有關這一統(tǒng)計領域的四個錯誤。
什么是置信區(qū)間?
置信區(qū)間可以表示為值的范圍或以下形式:
估計±Margin of Error
置信區(qū)間通常以置信水平表示。共同置信水平分別為90%,95%和99%。
我們將看看一個例子,我們想用一個樣本均值來推斷總體的平均值。假設這導致置信區(qū)間從25到30。如果我們說我們有95%的信心在這個區(qū)間內(nèi)包含未知的人口平均值,那么我們真的說我們使用一種方法找到了這個區(qū)間,這種方法在95%的時間內(nèi)成功地給出了正確的結果。從長遠來看,我們的方法在5%的時間內(nèi)不會成功。換句話說,我們將無法捕捉到每20次中只有一次的真實人口。
錯誤#1
現(xiàn)在,我們將研究在處理置信區(qū)間時可以犯的一系列不同的錯誤。通常在95%置信水平下對置信區(qū)間做出的一個錯誤陳述是置信區(qū)間包含總體真實平均值的可能性為95%。
這是一個錯誤的原因?qū)嶋H上非常微妙。關于置信區(qū)間的關鍵思想是,在確定置信區(qū)間時,所使用的概率用所使用的方法進入圖像,它指的是我那是用過的。
錯誤#2
第二個錯誤是將95%的置信區(qū)間解釋為人口中所有數(shù)據(jù)值的95%落在區(qū)間內(nèi)。再次,95%的人提到了測試方法。
為了解釋為什么上述說法不正確,我們可以考慮標準差為1,平均值為5的正常人群。具有兩個數(shù)據(jù)點的樣本,每個數(shù)據(jù)點的值為6,樣本平均值為6。人口平均值的95%置信區(qū)間為4.6至7.4。這顯然與95%的正態(tài)分布不重疊,因此它將不包含95%的人口。
錯誤#3
第三個錯誤是說95%的置信區(qū)間意味著所有可能的樣本均值的早餐小知識95%落在區(qū)間的范圍內(nèi)。重新考慮上一節(jié)中的示例。任何僅包含小于4.6的值的大小2的樣本將具有小于4.6的平均值。因此,這些樣本均值將超出此特定置信區(qū)間。符合此說明的樣品占總量的5%以上。所以說這個置信區(qū)間占所有樣本均值的95%是錯誤的。
錯誤#4
處理置信區(qū)間的第四個錯誤是認為它們是**的錯誤來源。雖然存在與置信區(qū)間相關的誤差幅度,但還有其他地方誤差可能會蠕變到統(tǒng)計分析中。這些錯誤的幾個例子可能來自實驗的不正確設計,采樣偏差或無法從某一群體子集獲得數(shù)據(jù)。