什么是標(biāo)準(zhǔn)正態(tài)分布?
鐘形曲線出現(xiàn)在整個(gè)統(tǒng)計(jì)數(shù)據(jù)中。各種測量,例如種子的直徑,魚鰭的長度,SAT上的分?jǐn)?shù)以及單個(gè)紙張的重量,在繪制它們時(shí)都形成鐘形曲線。所有這些曲線的一般形狀是相同的。但是所有這些曲線都是不同的,因?yàn)樗鼈冎械娜魏我粋€(gè)都不太可能具有相同的平均值或標(biāo)準(zhǔn)偏差。標(biāo)準(zhǔn)偏差較大的鐘形曲線較寬,標(biāo)準(zhǔn)偏差較小的鐘形曲線較細(xì)。具有較大平均值的鐘形曲線比具有較小平均值的鐘形曲線向右移動(dòng)更多
一個(gè)例子
為了讓這更具體一些,讓我們假裝我們測量了500粒玉米的直徑。然后我們記錄,分析和繪制這些數(shù)據(jù)。發(fā)現(xiàn)數(shù)據(jù)集的形狀像鐘形曲線,平均值為1.2厘米,標(biāo)準(zhǔn)偏差為0.4厘米?,F(xiàn)在假設(shè)我們用500個(gè)豆類做同樣的事情,我們發(fā)現(xiàn)它們的平均直徑為0.8厘米,標(biāo)準(zhǔn)偏差為0.04厘米。
上面繪制了這兩個(gè)數(shù)據(jù)集的鐘形曲線。紅色曲線對應(yīng)于玉米數(shù)據(jù),綠色曲線對應(yīng)于豆類數(shù)據(jù)。正如我們所看到的,這兩條曲線的中心和分布是不同的。
這些顯然是兩種不同的鐘形曲線。它們是不同的,因?yàn)樗鼈兊钠骄岛蜆?biāo)準(zhǔn)偏差不匹配。由于我們遇到的任何有趣的數(shù)據(jù)集都可以有任何正數(shù)作為標(biāo)準(zhǔn)偏差,任何數(shù)字都可以作為平均值,我們實(shí)際上只是在刮擦infinite個(gè)鐘形曲線的表面。這是很多曲線,太多了,無法處理。解決方案是什么?
一個(gè)非常特殊的鐘形曲線數(shù)學(xué)的一個(gè)目標(biāo)是盡可能概括事物。有時(shí)幾個(gè)單獨(dú)的問題是單個(gè)問題的特殊情況。這種情況涉及貝爾curves就是一個(gè)很好的例證。我們可以將它們?nèi)筷P(guān)聯(lián)到一條曲線,而不是處理無限數(shù)量的鐘形曲線。這種特殊的鐘形曲線稱為標(biāo)準(zhǔn)鐘形曲線或標(biāo)準(zhǔn)正態(tài)分布。
標(biāo)準(zhǔn)鐘形曲線的平均值為零,標(biāo)準(zhǔn)偏差為1。任何其他鐘形曲線都可以通過直接計(jì)算與此標(biāo)準(zhǔn)進(jìn)行比較。
標(biāo)準(zhǔn)正態(tài)分布的特征
任何鐘形曲線的所有屬性都適用于標(biāo)準(zhǔn)正態(tài)分布。
- 標(biāo)準(zhǔn)正態(tài)分布不僅具有零的平均值,而且具有零的中值和模式。這是曲線的中心。
- 標(biāo)準(zhǔn)正態(tài)分布在零處顯示鏡像對稱性。曲線的一半在零的左側(cè),一半的曲線在右側(cè)。如果曲線沿垂直線折疊為零,則兩半將完美匹配。
- 標(biāo)準(zhǔn)正態(tài)分布遵循68-95-99.7規(guī)則,這給我們一個(gè)簡單的方法來估計(jì)以下內(nèi)容:
- 大約68%的數(shù)據(jù)在-1和1之間。
- 大約95%的數(shù)據(jù)在-2和2之間。
- 大約99.7%的數(shù)據(jù)在-3和3之間。
為什么我們關(guān)心
在這一點(diǎn)上,我們可能會問,“為什么要打擾標(biāo)準(zhǔn)的鐘形曲線?“這似乎是一個(gè)不必要的復(fù)雜性,但隨著我們繼續(xù)統(tǒng)計(jì),標(biāo)準(zhǔn)鐘形曲線將是有益的。
我們會發(fā)現(xiàn)統(tǒng)計(jì)中的一種問題需要我們在遇到的任何鐘形曲線的部分下方找到區(qū)域。鐘形曲線對于區(qū)域來說不是一個(gè)很好的形狀。它不像矩形或右三角形那樣具有簡單的面積公式。找到鐘形曲線的一部分區(qū)域可能很棘手,實(shí)際上很難,我們需要使用一些微積分。如果我們不標(biāo)準(zhǔn)化我們的鐘形曲線,我們每次我們想要找到一個(gè)區(qū)域時(shí)都需要做一些計(jì)算。如果我們對曲線進(jìn)行標(biāo)準(zhǔn)化,所有計(jì)算面積的工作都是為我們完成的。
科普公眾號