鐘形曲線簡(jiǎn)介
正態(tài)分布通常被稱為鐘形曲線。這種類型的曲線出現(xiàn)在整個(gè)統(tǒng)計(jì)和現(xiàn)實(shí)世界中。
例如,在我的任何課程中進(jìn)行測(cè)試之后,我想做的一件事就是繪制所有分?jǐn)?shù)的圖表。我通常寫下10分的范圍,如60-69,70-79和80-89,然后為該范圍內(nèi)的每個(gè)測(cè)試分?jǐn)?shù)加上計(jì)數(shù)標(biāo)記。幾乎每次我這樣做時(shí),都會(huì)出現(xiàn)一個(gè)熟悉的形狀。一些學(xué)生做得很好,一些做得很差。一系列分?jǐn)?shù)最終聚集在平均分?jǐn)?shù)周圍。不同的測(cè)試可能會(huì)導(dǎo)致不同的平均值和標(biāo)準(zhǔn)偏差,但圖形的形狀幾乎總是相同的。這種形狀通常被稱為鐘形曲線。
為什么稱之為鐘形曲線?鐘形曲線的名字很簡(jiǎn)單,因?yàn)樗男螤铑愃朴阽娦?。這些曲線出現(xiàn)在整個(gè)統(tǒng)計(jì)研究中,其重要性怎么強(qiáng)調(diào)都不為過。
什么是鐘形曲線?
作為技術(shù),我們?cè)诮y(tǒng)計(jì)中最關(guān)心的鐘形曲線的種類實(shí)際上被稱為正態(tài)概率分布。接下來(lái)我們將假設(shè)我們正在討論的鐘形曲線是正態(tài)概率分布。盡管名稱為“鐘形曲線”,但這些曲線并非由其形狀定義。相反,一個(gè)令人生畏的公式被用作鐘形曲線的正式定義。
但我們真的不需要太擔(dān)心公式。我們關(guān)心的**兩個(gè)數(shù)字是平均值和標(biāo)準(zhǔn)差。給定數(shù)據(jù)集的鐘形曲線的中心位于平均值處。這是曲線的**點(diǎn)或“鐘形頂部”所在的位置。數(shù)據(jù)集的標(biāo)準(zhǔn)偏差決定了我們的鐘形曲線的展開方式。標(biāo)準(zhǔn)偏差越大,曲線越分散。
鐘形曲線的重要特征有幾個(gè)f鐘形曲線的特征很重要,并將其與統(tǒng)計(jì)中的其他曲線區(qū)分開來(lái):
- 鐘形曲線有一種模式,與平均值和中位數(shù)一致。這是曲線**的中心。
- 鐘形曲線植物小知識(shí)是對(duì)稱的。如果平均值沿垂直線折疊,則兩半將完全匹配,因?yàn)樗鼈兪潜舜说溺R像。
- 鐘形曲線遵循68-95-99.7規(guī)則,這為進(jìn)行估計(jì)計(jì)算提供了一種方便的方法:大約68%的數(shù)據(jù)位于平均值的一個(gè)標(biāo)準(zhǔn)差之內(nèi)。大約95%的數(shù)據(jù)都在平均值的兩個(gè)標(biāo)準(zhǔn)差之內(nèi)。大約99.7%的數(shù)據(jù)在平均值的三個(gè)標(biāo)準(zhǔn)差之內(nèi)。45 46 47
示例
如果我們知道鐘形曲線對(duì)我們的數(shù)據(jù)建模,我們可以使用鐘形曲線的上述特征來(lái)表達(dá)相當(dāng)多的內(nèi)容?;氐綔y(cè)試示例,假設(shè)我們有100名學(xué)生參加了統(tǒng)計(jì)測(cè)試,平均得分為70,標(biāo)準(zhǔn)差為10。
標(biāo)準(zhǔn)偏差是10。減去平均值并加10。這給了我們60和80。根據(jù)68-95-99.7規(guī)則,我們預(yù)計(jì)100名學(xué)生中約有68%或68名學(xué)生在考試中得分在60到80之間。
標(biāo)準(zhǔn)偏差的兩倍是20。如果我們減去并加上20的平均值,我們有50和90。我們預(yù)計(jì)100名學(xué)生中約有95%或95名學(xué)生在考試中得分在50到90之間。
類似的計(jì)算告訴我們,實(shí)際上每個(gè)人在測(cè)試中得分在40到100之間。
71>72>使用鐘形曲線73>74>鐘形曲線有許多應(yīng)用。它們?cè)诮y(tǒng)計(jì)中很重要,因?yàn)樗鼈兛梢阅M各種真實(shí)世界的數(shù)據(jù)。如上所述,測(cè)試結(jié)果是它們彈出的一個(gè)地方。還有一些其他:
- 重復(fù)測(cè)量一塊of設(shè)備
- 生物學(xué)特征測(cè)量
- 近似機(jī)會(huì)事件,例如翻轉(zhuǎn)硬幣數(shù)次
- 學(xué)區(qū)特定年級(jí)學(xué)生的身高
何時(shí)不使用鐘形曲線
即使有無(wú)數(shù)的鐘形曲線應(yīng)用,也不適合在所有情況下使用。一些統(tǒng)計(jì)數(shù)據(jù)集,例如設(shè)備故障或收入分布,具有不同的形狀并且不對(duì)稱。其他時(shí)候可以有兩種或兩種以上的模式,比如當(dāng)幾個(gè)學(xué)生做得很好,幾個(gè)在考試中做得很差。這些應(yīng)用程序需要使用與鐘形曲線不同定義的其他曲線。關(guān)于如何獲得所討論的數(shù)據(jù)集的知識(shí)可以幫助確定是否應(yīng)該使用鐘形曲線來(lái)表示數(shù)據(jù)。