標準差的范圍規(guī)則
標準偏差和范圍都是數據集擴展的度量。每個數字都以自己的方式告訴我們數據的間隔方式,因為它們都是變化的度量。雖然范圍和標準偏差之間沒有明確的關系,有一個經驗法則可以將這兩個統(tǒng)計量聯(lián)系起來。這種關系有時被稱為標準差的范圍規(guī)則。
范圍規(guī)則告訴我們,樣本的標準偏差大約等于數據范圍的四分之一。換句話說,s=(**-最?。?4。這是一個非常直接的使用公式,只能用作標準偏差的非常粗略的估計。
一個例子
要查看范圍規(guī)則如何工作的示例,我們將查看以下示例。假設我們從12,12,14,15,16,18,18,20,20,25的數據值開始。這些值的平均值為17,標準偏差約為4.1。相反,如果我們首先將數據范圍計算為25–12=13,然后將該數字除以四,則我們對標準偏差的估計為13/4=3.25。這個數字相對接近真實的標準偏差,對粗略估計很好。
為什么有效?
似乎范圍規(guī)則有點奇怪。為什么它有效?將范圍劃分為四個似乎并不完全隨意?為什么我們不除以不同的數字?實際上在事后有一些數學理由。
回想一下鐘形曲線的屬性和標準正態(tài)分布的概率。一個特征與落在一定標準偏差范圍內的數據量有關:
- 大約68%的數據與平均值相差一個標準偏差(更高或更低)。
- 大約95%of數據與平均值相差兩個標準差(較高或較低)。
- 大約99%與平均值相差三個標準差(較高或較低)。
我們將使用的數字與95%有關。我們可以說95%從低于平均值的兩個標準偏差到高于平均值的兩個標準偏差,我們有95%的數據。因此,我們幾乎所有的正態(tài)分布都會延伸到總共四個標準偏差的線段上。
糖健康知識
并非所有數據都是正態(tài)分布且呈鐘形曲線。但是大多數數據的行為都足夠好,以至于偏離平均值兩個標準差幾乎可以捕獲所有數據。我們估計并說四個標準偏差大約是范圍的大小,因此范圍除以四是標準偏差的粗略近似值。
用于范圍規(guī)則
范圍規(guī)則在許多設置中都很有用。首先,它是對標準偏差的非??焖俚墓烙?。標準差要求我們首先找到平均值,然后從每個數據點中減去該平均值,將差異平方,加上這些,除以小于數據點數量的一個,然后(**)取平方根。另一方面,范圍規(guī)則只需要一次減法和一次除法。
范圍規(guī)則有幫助的其他地方是我們信息不完整的地方。確定樣本量的公式需要三條信息:所需的誤差范圍,置信水平和我們正在調查的人口的標準差。很多時候不可能知道人口標準差是什么。使用范圍規(guī)則,我們可以估計這個統(tǒng)計量,然后知道我們應該做多少樣本。