亚洲精品中文字幕无乱码_久久亚洲精品无码AV大片_最新国产免费Av网址_国产精品3级片

考研備考 百文網(wǎng)手機站

考研統(tǒng)計學有哪些知識要點

時間:2021-12-04 15:30:13 考研備考 我要投稿

考研統(tǒng)計學有哪些知識要點

  考研的小伙伴們在選擇了統(tǒng)計學這個專業(yè)的時候,要掌握好它的知識要點,才能更好進行復習。小編為大家精心準備了考研統(tǒng)計學重要考點,歡迎大家前來閱讀。

考研統(tǒng)計學有哪些知識要點

  考研統(tǒng)計學知識點:簡單回歸

  1.相關分析:對兩個變量之間線性關系的描述與度量,它要解決的問題包括

  § 變量之間是否存在關系?

  § 如果存在關系,它們之間是什么樣的關系?

  § 變量之間的強度如何?

  § 樣本所反映的變量之間的關系能否代表總體變量之間的關系?

  2.回歸分析:從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學關系式;對這些關系式的可信程度進行各種統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著;利用所求的關系式,根據(jù)一個或幾個變量的取值來預測或控制另一個特定變量的取值,并給出這種預測或控制的精確程度

  3.回歸分析與相關分析的區(qū)別

  相關分析中,變量 x 變量 y 處于平等的地位;回歸分析中,變量 y 稱為因變量,處在被解釋的地位,x 稱為自變量,用于預測因變量的變化

  相關分析中所涉及的變量 x 和 y 都是隨機變量;回歸分析中,因變量 y 是隨機變量,自變量 x 可以是隨機變量,也可以是非隨機的確定變量

  相關分析主要是描述兩個變量之間線性關系的密切程度;回歸分析不僅可以揭示變量 x 對變量 y 的影響大小,還可以由回歸方程進行預測和控制

  4.一元線性回歸模型

  描述因變量 y 如何依賴于自變量 x 和誤差項e 的方程稱為回歸模型

  一元線性回歸模型可表示為

  y = b0 +b1 x + e

  y 是 x 的線性函數(shù)(部分)加上誤差項

  線性部分反映了由于 x 的變化而引起的 y 的變化

  誤差項 e 是隨機變量

  l 反映了除 x 和 y 之間的線性關系之外的隨機因素對 y 的影響

  l 是不能由 x 和 y 之間的線性關系所解釋的變異性

  b0 和 b1 稱為模型的參數(shù)

  5.利用回歸方程預測時應注意

  1. 在利用回歸方程進行估計或預測時,不要用樣本數(shù)據(jù)之外的x值去預測相對應的y值

  2. 因為在一元線性回歸分析中,總是假定因變量y與自變量x之間的關系用線性模型表達是正確的。但實際應用中,它們之間的關系可能是某種曲線

  3. 此時我們總是要假定這條曲線只有一小段位于x測量值的范圍之內。如果x的取值范圍是在xL和xU之間,那么可以用所求出的利用回歸方程對處于xL和xU之間的值來估計E(y)和預測y。如果用xL和xU之間以外的值得出的估計值和預測值就會很差

  6.離差平方和

  總平方和(SST)

  反映因變量的 n 個觀察值與其均值的總離差

  回歸平方和(SSR)

  反映自變量 x 的變化對因變量 y 取值變化的影響,或者說,是由于 x 與 y 之間的線性關系引起的 y 的取值變化,也稱為可解釋的平方和

  殘差平方和(SSE)

  反映除 x 以外的其他因素對 y 取值的影響,也稱為不可解釋的平方和或剩余平方和

  7.估計標準誤差

  實際觀察值與回歸估計值離差平方和的均方根(自由度n-2)

  反映實際觀察值在回歸直線周圍的分散狀況

  對誤差項e的標準差s的估計,是在排除了x對y的線性影響后,y隨機波動大小的一個估計量

  反映用估計的回歸方程預測y時預測誤差的大小。

  考研統(tǒng)計學要點:多元回歸

  1.多重共線性

  回歸模型中兩個或兩個以上的自變量彼此相關

  多重共線性帶來的問題有

  可能會使回歸的結果造成混亂,甚至會把分析引入歧途

  可能對參數(shù)估計值的正負號產生影響,特別是各回歸系數(shù)的正負號有可能同我們預期的正負號相反

  2.多重共線性的識別

  檢測多重共線性的最簡單的一種辦法是計算模型中各對自變量之間的相關系數(shù),并對各相關系數(shù)進行顯著性檢驗

  若有一個或多個相關系數(shù)顯著,就表示模型中所用的自變量之間相關,存在著多重共線性

  如果出現(xiàn)下列情況,暗示存在多重共線性

  模型中各對自變量之間顯著相關。

  當模型的線性關系檢驗(F檢驗)顯著時,幾乎所有回歸系數(shù)的t檢驗卻不顯著

  回歸系數(shù)的正負號與預期的相反。

  3.變量選則過程

  在建立回歸模型時,對自變量進行篩選

  選擇自變量的原則是對統(tǒng)計量進行顯著性檢驗

  將一個或一個以上的自變量引入到回歸模型中時,是否使得殘差平方和(SSE)有顯著地減少。如果增加一個自變量使SSE的'減少是顯著的,則說明有必要將這個自變量引入回歸模型,否則,就沒有必要將這個自變量引入回歸模型

  確定引入自變量是否使SSE有顯著減少的方法,就是使用F統(tǒng)計量的值作為一個標準,以此來確定是在模型中增加一個自變量,還是從模型中剔除一個自變量

  變量選擇的方法主要有:向前選擇、向后剔除、逐步回歸、最優(yōu)子集等

  4.向前選擇

  從模型中沒有自變量開始

  對k個自變量分別擬合對因變量的一元線性回歸模型,共有k個,然后找出F統(tǒng)計量的值最高的模型及其自變量(P值最小的),并將其首先引入模型

  分別擬合引入模型外的k-1個自變量的線性回歸模型

  如此反復進行,直至模型外的自變量均無統(tǒng)計顯著性為止

  5.向后剔除

  先對因變量擬合包括所有k個自變量的回歸模型。然后考察p(p

  考察p-1個再去掉一個自變量的模型(這些模型中每一個都有k-2個的自變量),使模型的SSE值減小最少的自變量被挑選出來并從模型中剔除

  如此反復進行,一直將自變量從模型中剔除,直至剔除一個自變量不會使SSE顯著減小為止

  6.逐步回歸

  將向前選擇和向后剔除兩種方法結合起來篩選自變量

  在增加了一個自變量后,它會對模型中所有的變量進行考察,看看有沒有可能剔除某個自變量。如果在增加了一個自變量后,前面增加的某個自變量對模型的貢獻變得不顯著,這個變量就會被剔除

  按照方法不停地增加變量并考慮剔除以前增加的變量的可能性,直至增加變量已經不能導致SSE顯著減少

  在前面步驟中增加的自變量在后面的步驟中有可能被剔除,而在前面步驟中剔除的自變量在后面的步驟中也可能重新進入到模型中

  7.虛擬自變量

  用數(shù)字代碼表示的定性自變量

  虛擬自變量可有不同的水平

  只有兩個水平的虛擬自變量。比如,性別(男,女)

  有兩個以上水平的虛擬自變量,貸款企業(yè)的類型(家電,醫(yī)藥,其他)

  虛擬變量的取值為0,1

  回歸模型中使用虛擬自變量時,稱為虛擬自變量的回歸

  當虛擬自變量只有兩個水平時,可在回歸中引入一個虛擬變量,比如,性別

  一般而言,如果定性自變量有k個水平,需要在回歸中模型中引進k-1個虛擬變量

  例:引進虛擬變量時,回歸方程可寫:

  E(y) =b0+ b1x1+ b2x2

  女( x2=0):E(y|女性) =b0 +b1x1

  男(x2=1):E(y|男性) =(b0 + b2 ) +b1x1

  b0的含義表示:女性職工的期望月工資收入

  (b0+ b2)的含義表示:男性職工的期望月工資收入

  b1含義表示:工作年限每增加1年,男性或女性工資的平均增加值

  b2含義表示:男性職工的期望月工資收入與女性職工的期望月工資收入之間的差值 (b0+ b2) - b0= b2

  考研統(tǒng)計學難點:主成分和因子分析

  1.(1)概念:在研究實際問題時,往往需要收集多個變量。但這樣會使多個變量間存在較強的相關關系,即這些變量間存在較多的信息重復,直接利用它們進行分析,不但模型復雜,還會因為變量間存在多重共線性而引起較大的誤差。為能夠充分利用數(shù)據(jù),通常希望用較少的新變量代替原來較多的舊變量,同時要求這些新變量盡可能反映原變量的信息。主成分分析和因子分子正是解決這類問題的有效方法。它們能夠提取信息,使變量簡化降維,從而使問題更加簡單直觀

  (2)主成分分析:研究如何通過少數(shù)幾個主成分(principal component)來解釋多個變量間的內部結構。即從原始變量中導出少數(shù)幾個主分量,使它們盡可能多地保留原始變量的信息,且彼此間互不相關

  主成分分析的目的:數(shù)據(jù)的壓縮;數(shù)據(jù)的解釋。常被用來尋找判斷事物或現(xiàn)象的綜合指標,并對綜合指標所包含的信息進行適當?shù)慕忉尅?主成分所代表的原始變量的信息用其方差來表示,一般要求所選主成分的方差總和占全部方差的80%以上就可以了。如果原來的變量之間的相關程度高,降維的效果就會好一些,所選的主成分就會少一些。特征根反映了主成分對原始變量的影響程度,表示引入該主成分后可以解釋原始變量的信息。特征根又叫方差,某個特征根占總特征根的比例稱為主成分方差貢獻率。一般情況下,當特征根小于1時,就不再選作主成分了,因為該主成分的解釋力度還不如直接用原始變量解的釋力度大。)

  (3)因子分析:與主成分分析類似,它們都是要找出少數(shù)幾個新的變量來代替原始變量。

  不同之處:主成分分析中的主成分個數(shù)與原始變量個數(shù)是一樣的,即有幾個變量就有幾個主成分,只不過最后我們確定了少數(shù)幾個主成分而已。而因子分析則需要事先確定要找?guī)讉成分,也稱為因子(factor),然后將原始變量綜合為少數(shù)的幾個因子,以再現(xiàn)原始變量與因子之間的關系,一般來說,因子的個數(shù)會遠遠少于原始變量的個數(shù)。

  因子分析可以看作是主成分分析的推廣和擴展,但它對問題的研究更深入、更細致一些。實際上,主成分分析可以看作是因子分析的一個特例

  簡言之,因子分析是通過對變量之間關系的研究,找出能綜合原始變量的少數(shù)幾個因子,使得少數(shù)因子能夠反映原始變量的絕大部分信息,然后根據(jù)相關性的大小將原始變量分組,使得組內的變量之間相關性較高,而不同組的變量之間相關性較低。因此,因子分析屬于多元統(tǒng)計中處理降維的一種統(tǒng)計方法,其目的就是要減少變量的個數(shù),用少數(shù)因子代表多個原始變量

  (4)因子數(shù)量的確定

  用公因子方差貢獻率提。号c主成分分析類似,一般累計方差貢獻率達到80%以上的前幾個因子可以作為最后的公因子

  用特征根提取:一般要求因子對應的特征根要大于1,因為特征根小于1說明該共因子的解釋力度太弱,還不如使用原始變量的解釋力度大

  實際應用中,因子的提取要結合具體問題而定,在某種程度上,取決于研究者自身的知識和經驗

  (5)主成分分析和因子分析都是多元分析中處理降維的兩種統(tǒng)計方法。只有當原始數(shù)據(jù)中的變量之間具有較強的相關關系時,降維的效果才會明顯,否則不適合進行主成分分析和因子分析

  主成分和因子的選擇標準應結合具體問題而定。在某種程度上取決于研究者的知識和經驗,而不是方法本身

  即使得到了滿意的主成分或因子,在運用它們對實際問題進行評價、排序等分析時,仍然要保持謹慎,因為主成分和因子畢竟是高度抽象的量,無論如何,它們的含義都不如原始變量清晰

  因子分析可以看作是主成分分析的推廣和擴展,而主成分分析則可以看作是因子分析的一個特例。目前因子分析在實際中被廣泛應用,而主成分分析通常只作為大型統(tǒng)計分析的中間步驟,幾乎不再單獨使用。


【考研統(tǒng)計學有哪些知識要點】相關文章:

學好統(tǒng)計學的方法有哪些11-13

java基礎要點有哪些09-26

科目二考試要點有哪些07-21

科目一考試要點有哪些04-15

雅思寫作試題有哪些檢查要點11-10

新手上路有哪些注意要點04-03

科目四考試復習要點有哪些10-01

科目二考試有哪些關鍵要點07-02

科目一理論考試要點有哪些10-29

考研英語常見短語有哪些08-19