上海師范大學(xué)考研交流群(點(diǎn)擊進(jìn)群)686077717
上海應(yīng)用技術(shù)大學(xué)考研交流群(點(diǎn)擊進(jìn)群) 733853983
應(yīng)用統(tǒng)計(jì)專業(yè)可以培養(yǎng)良好的統(tǒng)計(jì)學(xué)背景,注重理論結(jié)合實(shí)際,今天上海高頓考研網(wǎng)為大家整理了應(yīng)用統(tǒng)計(jì)碩士考研的相關(guān)知識(shí)點(diǎn):方差分析,希望給考研的同學(xué)一些幫助。
應(yīng)用統(tǒng)計(jì)碩士考研知識(shí)點(diǎn)
方差分析
1.通過(guò)分析數(shù)據(jù)的誤差判斷各總體均值是否相等研究一個(gè)或多個(gè)分類型自變量對(duì)一個(gè)數(shù)值型因變量的影響
單因素方差分析:涉及一個(gè)分類的自變量
雙因素方差分析:涉及兩個(gè)分類的自變量
2.(1)僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異
這種差異也可能是由于抽樣的隨機(jī)性所造成的
需要有更準(zhǔn)確的方法來(lái)檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析
所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差
這個(gè)名字也表示:它是通過(guò)對(duì)數(shù)據(jù)誤差來(lái)源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來(lái)源
(2)隨機(jī)誤差
因素的同一水平(總體)下,樣本各觀察值之間的差異
比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)是不同的
這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差
系統(tǒng)誤差
因素的不同水平(不同總體)下,各觀察值之間的差異
比如,不同行業(yè)之間的被投訴次數(shù)之間的差異
這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差
(3)數(shù)據(jù)的誤差用平方和(sum of squares)表示
組內(nèi)平方和(within groups)
因素的同一水平(同一個(gè)總體)下樣本數(shù)據(jù)的平方和
比如,零售業(yè)被投訴次數(shù)的誤差平方和
組內(nèi)平方和只包含隨機(jī)誤差
組間平方和(between groups)
因素的不同水平(不同總體)下各樣本之間的平方和
比如,四個(gè)行業(yè)被投訴次數(shù)之間的誤差平方和
組間平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差
3.方差分析的基本假定
正態(tài)性:每個(gè)總體都應(yīng)服從正態(tài)分布
對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本
比如,每個(gè)行業(yè)被投訴的次數(shù)需服從正態(tài)分布
方差齊性:各個(gè)總體的方差須相同
各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的
比如,四個(gè)行業(yè)被投訴次數(shù)的方差都相等
獨(dú)立性:觀察值是獨(dú)立的(該假定不滿足對(duì)結(jié)果影響較大)
4.問(wèn)題的一般提法:(1)設(shè)因素有k個(gè)水平,每個(gè)水平的均值分別用m1,m2,¼,mk表示
(2)要檢驗(yàn)k個(gè)水平(總體)的均值是否相等,需要提出如下假設(shè):
H0:m1=m2=…=mk
H1:m1,m2,¼,mk不全相等
5.SST:全部觀察值xij與總平均值的離差平方和,反映全部觀察值的離散狀況
SSA:各組平均值xi與總平均值xij的離差平方和反映各總體的樣本均值之間的差異程度,又稱組間平方和該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差
SSE:每個(gè)水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個(gè)樣本各觀察值的離散狀況,又稱組內(nèi)平方和該平方和反映的是隨機(jī)誤差的大小
總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和(SSA)之間的關(guān)系:
SST=SSA+SSE
如果原假設(shè)成立,則表明沒(méi)有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會(huì)太大如果組間均方顯著地大于組內(nèi)均方,說(shuō)明各水平(總體)之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差
判斷因素的水平是否對(duì)其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小
6.均方
各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對(duì)誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差
計(jì)算方法是用誤差平方和除以相應(yīng)的自由度
三個(gè)平方和對(duì)應(yīng)的自由度分別是
SST的自由度為n-1,其中n為全部觀察值的個(gè)數(shù)
SSA的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù)
SSE的自由度為n-k
7.構(gòu)造檢驗(yàn)統(tǒng)計(jì)量
將MSA和MSE進(jìn)行對(duì)比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F
當(dāng)H0為真時(shí),二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布
將統(tǒng)計(jì)量的值F與給定的顯著性水平a的臨界值Fa進(jìn)行比較,作出對(duì)原假設(shè)H0的決策
²根據(jù)給定的顯著性水平a,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應(yīng)的臨界值Fa
²若F>Fa,則拒絕原假設(shè)H0,表明均值之間的差異是顯著的,所檢驗(yàn)的因素對(duì)觀察值有顯著影響
²若F
8.關(guān)系強(qiáng)度
變量間關(guān)系的強(qiáng)度用自變量平方和(SSA)及殘差平方和(SSE)占總平方和(SST)的比例大小來(lái)反映
自變量平方和占總平方和的比例記為R2,即
3、其平方根R就可以用來(lái)測(cè)量?jī)蓚€(gè)變量之間的關(guān)系強(qiáng)度
今天給大家介紹的相關(guān)知識(shí)點(diǎn),你掌握住了嗎?后續(xù)會(huì)為大家持續(xù)更新考研相關(guān)內(nèi)容,各位考生可以收藏練習(xí)。