如何對分布峰度進行分類
數(shù)據(jù)分布和概率分布并非都是相同的形狀。有些是不對稱的,偏向左側(cè)或右側(cè)。其他分布是雙峰的,有兩個峰值。談?wù)摲植紩r要考慮的另一個特征是最左側(cè)和最右側(cè)分布尾部的形狀。峰度是分布尾部厚度或沉重度的量度。分布的峰度分為三類:
- Mesokurtic
- Leptokurtic
- Platykurtic
我們將依次考慮這些分類中的每一個。如果我們使用峰度的技術(shù)數(shù)學(xué)定義,我們對這些類別的檢查將不如我們所能**。
Mesokurtic
峰度通常是相對于正態(tài)分布來測量的。具有與任何正態(tài)分布大致相同的尾部形狀的分布,而不僅僅是標(biāo)準(zhǔn)正態(tài)分布,被認(rèn)為是中孔分布。中峰度分布的峰度既不高也不低,而是被認(rèn)為是其他兩個分類的基線。
除正態(tài)分布外,p接近1/2的二項式分布被認(rèn)為是中孔分布。
Leptokurtic
leptokurtic分布是峰度大于中峰度分布的分布。Leptokurtic分布有時由薄而高的峰確定。這些分布的尾部,無論是右側(cè)還是左側(cè),都是厚實而沉重的。Leptokurtic分布由前綴#34;lepto"meaning"瘦。"
有許多l(xiāng)eptokurtic分布的例子。最著名的leptokurtic分布之一是Student's t分布。
Platykurtic
ku的第三種分類rtosis是platykurtic。斑駁的分布是那些尾巴細(xì)長的分布。很多時候它們的峰值低于中孔分布。這些類型的分布的名稱來自前綴"platy"meaning"broad。"
所有均勻分布都是扁桃體。除此之外,硬幣單次翻轉(zhuǎn)的離散概率分布是平庸的。
峰度的計算
這些峰度分類仍然有些主觀和定性。雖然我們可能會看到一個分布比正態(tài)分布有更厚的尾部,但如果我們沒有正態(tài)分布圖來比較呢?如果我們想說一種分布比另一種分布更細(xì),該怎么辦?
要回答這些問題,我們不僅需要定性描述峰度,還需要定量測量。使用的公式是μ/σ4,其中μ是關(guān)于平均值的皮爾遜第四時刻,西格瑪是標(biāo)準(zhǔn)偏差。
過度峰度
現(xiàn)在我們有一種計算峰度的方法,我們可以比較獲得的值而不是形狀。發(fā)現(xiàn)正態(tài)分布的峰度為三。這現(xiàn)在成為我們的mesokurtic分布的基礎(chǔ)。峰度大于3的分布是leptokurtic,峰度小于3的分布是platykurtic。
由于我們將中峰度分布視為其他分布的基線,因此我們可以從峰度的標(biāo)準(zhǔn)計算中減去三個。公式μ/σ4-3是過量峰度的公式。然后,我們可以從其過多的峰度對分布進行分類:
- 中峰度分布的峰度為零。
- 斑紋分布的峰度為負(fù)。
- Leptokurtic分布的峰度為正。
名稱
的注釋單詞"峰度"在第一次或第二次閱讀時看起來很奇怪。這實際上是有道理的,但我們需要認(rèn)識希臘人才能認(rèn)識到這一點。峰度來源于希臘語kurtos的易位。這個希臘詞的含義是"拱形"or"鼓脹,"使其成為對峰度概念的恰當(dāng)描述。
思科普壓縮機