什么是分類變量的雙向表?
統(tǒng)計的目標之一是以有意義的方式排列數(shù)據(jù)。雙向表是組織特定類型配對數(shù)據(jù)的重要方式。與統(tǒng)計中任何圖表或表格的構(gòu)建一樣,了解非常重要我們正在處理的變量類型。如果我們有定量數(shù)據(jù),則應(yīng)使用直方圖或莖葉圖等圖形。如果我們有分類數(shù)據(jù),那么條形圖或餅圖是合適的。
使用配對數(shù)據(jù)時,我們必須小心。配對定量數(shù)據(jù)存在散點圖,但配對分類數(shù)據(jù)有什么樣的圖?每當我們有兩個分類變量時,我們應(yīng)該使用一個雙向表。
雙向表的描述
首先,我們回想起分類數(shù)據(jù)與特征或類別有關(guān)。它不是定量的,也沒有數(shù)值。
雙向表涉及列出兩個分類變量的所有值或級別。其中一個變量的所有值都列在垂直列中。其他變量的值沿水平行列出。如果第一個變量具有m值而第二個變量具有n值,則表中總共有mn個條目。這些條目中的每一個對應(yīng)于兩個變量中的每一個的特定值。
沿著每一行和每一列,條目是總計的。這些總數(shù)在確定邊際分布和條件分布時很重要。當我們進行卡方檢驗獨立性時,這些總數(shù)也很重要。
雙向表的示例
例如,我們將考慮一種情況,在這種情況下,我們將查看大學統(tǒng)計課程的幾個部分。我們想要構(gòu)建一個雙向表格來確定課程中男性和女性之間存在哪些差異(如果有的話)。到為此,我們計算每個性別成員獲得的每個字母等級的數(shù)量。
我們注意到,第一個分類變量是性別變量,在男性和女性的研究中有兩個可能的值。第二個分類變量是字母等級的變量,A,B,C,D和F給出了五個值。這意味著我們將有一個雙向表,其中有2 x 5=10個條目,加上一個額外的行和一個額外的列,將需要列出行和列總數(shù)。
我們的調(diào)查顯示:
- 50名男性獲得A,60名女性獲得A.
- 60名男性獲得B,80名女性獲得B.
- 100名男性獲得C,50名女性獲得C.
- 40名男性獲得D,50名女性獲得D.
- 30名男性獲得F,20名女性獲得F.
此信息輸入下面的雙向表格。每行的總數(shù)告訴我們每種等級的收入是多少。列總數(shù)告訴我們男性人數(shù)和女性人數(shù)。
雙向表的重要性
當我們有兩個分類變量時,雙向表有助于組織我們的數(shù)據(jù)。該表可用于幫助我們比較數(shù)據(jù)中的兩個不同組。例如,我們可以考慮統(tǒng)計課程中男性的相對表現(xiàn)與課程中女性的表現(xiàn)。
下一步
在形成雙向表格后,下一步可能是統(tǒng)計分析數(shù)據(jù)。我們可能會問研究中的變量是否相互獨立。為了回答這個問題,我們可以使用卡方檢驗在雙向表格上。
年級和性別雙向表
Male | 女 | 總計 | |
50 | 60 | 120 110 121||
B | 60 | 80 | 140 |
100 | 50 | 140 150 141||
40 | 50 | 150 90 151||
30 | 20 | 50 | |
總計 | 280 | 260 | 540 |
科普小知識大全