線性回歸分析
線性回歸是一種統(tǒng)計(jì)技術(shù),用于更多地了解獨(dú)立(預(yù)測(cè))變量和依賴(標(biāo)準(zhǔn))變量之間的關(guān)系。當(dāng)您的分析中有多個(gè)自變量時(shí),這稱(chēng)為多元線性回歸。一般來(lái)說(shuō),回歸允許研究人員提出一個(gè)普遍的問(wèn)題:“什么是**的預(yù)測(cè)…?”
例如,假設(shè)我們正在研究通過(guò)體重指數(shù)(BMI)測(cè)量的肥胖原因。特別是,我們想看看以下變量是否是一個(gè)人BMI的重要預(yù)測(cè)因素:每周吃快餐的次數(shù),每周看電視的小時(shí)數(shù),每周鍛煉的分鐘數(shù)以及父母的BMI。線性回歸將是此分析的良好方法。
回歸方程
當(dāng)用一個(gè)自變量進(jìn)行回歸分析時(shí),回歸方程為Y=a+b*X其中Y是因變量,X是自變量,a是常數(shù)(或截距),b是回歸線的斜率。例如,假設(shè)GPA**通過(guò)回歸方程1+0.02*IQ預(yù)測(cè)。如果學(xué)生的智商為130,那么他或她的GPA將為3.6(1+0.02*130=3.6)。
當(dāng)您進(jìn)行回歸分析時(shí),其中有多個(gè)自變量,回歸方程為Y=a+b1*X1+b2*X2+…+bp*Xp。例如,如果我們想在GPA分析中包含更多變量,例如動(dòng)機(jī)和紀(jì)律的度量,我們將使用這個(gè)等式。
R-Square
R平方,也稱(chēng)為確定系數(shù),是評(píng)估回歸方程模型擬合的常用統(tǒng)計(jì)量。也就是說(shuō),所有自變量在預(yù)測(cè)因變量方面有多好?R平方的值范圍從0.0到1.0,可以乘以100以獲得解釋的方差百分比。例如,回到我們只有一個(gè)自變量(IQ)的GPA回歸方程……讓我們說(shuō)我們方程的R平方是0.4。我們可以將其解釋為意味著智商可以解釋GPA中40%的差異。如果我們?cè)偌由狭硗鈨蓚€(gè)變量(動(dòng)機(jī)和紀(jì)律)并且R平方增加到0.6,這意味著智商,動(dòng)機(jī)和紀(jì)律共同解釋了GPA分?jǐn)?shù)的60%的變化。
回歸分析通常使用統(tǒng)計(jì)軟件(如SPSS或SAS)完成,因此為您計(jì)算R平方。
解釋回歸系數(shù)(b)
上面等式中的b系數(shù)表示自變量和因變量之間關(guān)系的強(qiáng)度和方向。如果我們看GPA和IQ方程,1+0.02*130=3.6,0.02是變量IQ的回歸系數(shù)。這告訴我們,這種關(guān)系的方向是積極的,所以隨著智商的增加,GPA也會(huì)增加。如果等式為1-0.02*130=Y,則這意味著IQ和GPA之間的關(guān)系為負(fù)。
假設(shè)
為了進(jìn)行線性回歸分析,必須滿足幾個(gè)關(guān)于數(shù)據(jù)的假設(shè):
- 線性:假設(shè)自變量和因變量之間的關(guān)系是線性的。雖然這個(gè)假設(shè)永遠(yuǎn)無(wú)法完全證實(shí),但查看變量的散點(diǎn)圖可以幫助做出這個(gè)決定。如果存在關(guān)系中的曲率,則可以考慮轉(zhuǎn)換變量或顯式允許非線性分量。
- 正態(tài)性:假設(shè)變量的殘差是正態(tài)分布的。也就是說(shuō),預(yù)測(cè)Y(因變量)值的誤差)以接近正態(tài)曲線的方式分布。您可以查看直方圖或正態(tài)概率圖來(lái)檢查變量的分布及其殘值。
- 獨(dú)立性:假設(shè)Y值預(yù)測(cè)中的誤差都是彼此獨(dú)立的(不相關(guān))。
- 同方差:假設(shè)周?chē)姆讲钭宰兞康乃兄档幕貧w線都是相同的。