統(tǒng)計學(xué)常見概念及解析
統(tǒng)計學(xué)是通過搜索、整理、分析、描述數(shù)據(jù)等手段,以達到推斷所測對象的本質(zhì),甚至預(yù)測對象未來的一門綜合性科學(xué)。統(tǒng)計學(xué)常見概念有哪些你知道嗎?下面是小編為大家?guī)淼慕y(tǒng)計學(xué)常見概念及解析。歡迎閱讀。
統(tǒng)計學(xué)常見概念及解析1
(1)自由度 d.f.
統(tǒng)計學(xué)上的自由度是指當以樣本的統(tǒng)計量來估計總體的參數(shù)時, 樣本中獨立或能自由變化的自變量的個數(shù),稱為該統(tǒng)計量的自由度。 統(tǒng)計學(xué)上的自由度包括兩方面的內(nèi)容:
首先,在估計總體的平均數(shù)時,由于樣本中的 n 個數(shù)都是相互獨立的,從其中抽出任何一個數(shù)都不影響其他數(shù)據(jù),所以其自由度為n。
在估計總體的方差時,使用的是離差平方和。只要n-1個數(shù)的離差平方和確定了,方差也就確定了;因為在均值確定后,如果知道了其中n-1個數(shù)的值,第n個數(shù)的值也就確定了。這里,均值就相當于一個限制條件,由于加了這個限制條件,估計總體方差的自由度為n-1。
例如,有一個有4個數(shù)據(jù)(n=4)的樣本,其平均值m等于5,即受到m=5的條件限制,在自由確定4、2、5三個數(shù)據(jù)后, 第四個數(shù)據(jù)只能是9,否則m≠5。因而這里的自由度υ=n-1=4-1=3。推而廣之,任何統(tǒng)計量的自由度υ=n-k(k為限制條件的個數(shù))。
其次,統(tǒng)計模型的自由度等于可自由取值的自變量的個數(shù)。如在回歸方程中,如果共有p個參數(shù)需要估計,則其中包括了p-1個自變量(與截距對應(yīng)的自變量是常量1)。因此該回歸方程的自由度為p-1。
(2)偏相關(guān)
Partial correlation coefficient
在多元回歸分析中,在消除其他變量影響的條件下,所計算的某兩變量之間的相關(guān)系數(shù)。
在多元相關(guān)分析中,簡單相關(guān)系數(shù)可能不能夠真實的反映出變量X和Y之間的相關(guān)性,因為變量之間的關(guān)系很復(fù)雜,它們可能受到不止一個變量的影響。這個時候偏相關(guān)系數(shù)是一個更好的選擇。
假設(shè)我們需要計算X和Y之間的相關(guān)性,Z代表其他所有的變量,X和Y的偏相關(guān)系數(shù)可以認為是X和Z線性回歸得到的殘差Rx與Y和Z線性回歸得到的殘差Ry之間的簡單相關(guān)系數(shù),即pearson相關(guān)系數(shù)。
(3)標準回歸系數(shù)
標準回歸系數(shù),是指消除了因變量y和自變量x1,x2,…xn所取單位的影響之后的回歸系數(shù),其絕對值的大小直接反映了xi對y的影響程度。
(4)Wald 檢驗
Wald 統(tǒng)計量我們先對無約束模型得到參數(shù)的估計值,再代入約束條件檢查約束條件是否成立;
wald 檢驗一般適用于檢驗非線性的約束條件(當然也可以檢驗線性的約束條件),通過對原方程(無約束模型)進行估計,構(gòu)造出檢驗統(tǒng)計量,該統(tǒng)計量在大樣本下服從卡方分布,自由度為約束條件。
wald檢驗的思想是:如果約束是有效的,那么在沒有約束情況下估計出來的估計量應(yīng)該漸進地滿足約束條件,因為MLE(極大似然估計)是一致的。
(5)顯著水平
顯著性水平是估計總體參數(shù)落在某一區(qū)間內(nèi),可能犯錯誤的概率為顯著性水平,用α表示。顯著性是對差異的程度而言的,程度不同說明引起變動的原因也有不同:一類是條件差異,一類是隨機差異。它是在進行假設(shè)檢驗時事先確定一個可允許的作為判斷界限的小概率標準。
拓展資料
1.主要術(shù)語
統(tǒng)計學(xué)(statistics):收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。
描述統(tǒng)計(descriptive statistics):研究數(shù)據(jù)收集、處理和描述的統(tǒng)計學(xué)方法。
推斷統(tǒng)計(inferential statistics):研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計學(xué)方法。
變量(variable):每次觀察會得到不同結(jié)果的某種特征。
分類變量(categorical variable):觀測結(jié)果表現(xiàn)為某種類別的變量。
順序變量(rank variable):又稱有序分類變量,觀測結(jié)果表現(xiàn)為某種有序類別的變量。
數(shù)值型變量(metric variable):又稱定量變量,觀測結(jié)果表現(xiàn)為數(shù)字的變量。
均值(mean):均值也就是平均數(shù),有時特指算術(shù)平均數(shù),這是相對其他方式計算的均值,求法是先將所有數(shù)字加起來,然后除以數(shù)字的個數(shù),這是測量集中趨勢,或者說平均數(shù)的一種方法。
中位數(shù)(median):也就是選取中間的數(shù),要找中位數(shù),首先需要從小到大排序,排序后,再看中間的數(shù)字是什么。
眾數(shù)(mode):眾數(shù)也就是數(shù)據(jù)集中出現(xiàn)頻率最多的數(shù)字。
2.相關(guān)觀念
為了將統(tǒng)計學(xué)應(yīng)用到科學(xué),工業(yè)以及社會問題上,我們由研究母體開始。這可能是一個國家的人民,石頭中的水晶,或者是某家特定工廠所生產(chǎn)的商品。一個母體甚至可能由許多次同樣的觀察程序所組成;由這種資料收集所組成的母體我們稱它叫時間序列。
為了實際的理由,我們選擇研究母體的子集代替研究母體的每一筆資料,這個子集稱做樣本。以某種經(jīng)驗設(shè)計實驗所搜集的樣本叫做資料。資料是統(tǒng)計分析的對象,并且被用做兩種相關(guān)的用途:描述和推論。描述統(tǒng)計學(xué)處理有關(guān)敘述的問題:資料是否可以被有效的摘要,不論是以數(shù)學(xué)或是圖片表現(xiàn),以用來代表母體的性質(zhì)?基礎(chǔ)的數(shù)學(xué)描述包括了平均數(shù)和標準差。圖像的摘要則包含了許多種的表和圖。
推論統(tǒng)計學(xué)被用來將資料中的數(shù)據(jù)模型化,計算它的機率并且做出對于母體的推論。這個推論可能以對/錯問題的答案所呈現(xiàn)(假設(shè)檢定),對于數(shù)字特征量的估計(估計),對于未來觀察的預(yù)測,關(guān)聯(lián)性的預(yù)測(相關(guān)性),或是將關(guān)系模型化(回歸)。其他的模型化技術(shù)包括變異數(shù)分析(ANOVA),時間序列,以及數(shù)據(jù)挖掘。
相關(guān)的觀念特別值得被拿出來討論。對于資料集合的統(tǒng)計分析可能顯示兩個變量(母體中的兩種性質(zhì))傾向于一起變動,好像它們是相連的.一樣。舉例來說,對于人收入和死亡年齡的研究期刊可能會發(fā)現(xiàn)窮人比起富人平均來說傾向擁有較短的生命。這兩個變量被稱做相關(guān)的。但是實際上,我們不能直接推論這兩個變量中有因果關(guān)系;參見相關(guān)性推論因果關(guān)系(邏輯謬誤)。
如果樣本足以代表母體的,那么由樣本所做的推論和結(jié)論可以被引申到整個母體之上。最大的問題在于決定樣本是否足以代表 整個母體。統(tǒng)計學(xué)提供了許多方法來估計和修正樣本和收集資料過程中的隨機性(誤差),如同上面所提到的透過經(jīng)驗所設(shè)計的實驗。參見實驗設(shè)計。
要了解隨機性或是機率必須具備基本的數(shù)學(xué)觀念。數(shù)理統(tǒng)計(通常又叫做統(tǒng)計理論)是應(yīng)用數(shù)學(xué)的分支,它使用機率論來分析并且驗證統(tǒng)計的理論基礎(chǔ)。
任何統(tǒng)計方法是有效的只有當這個系統(tǒng)或是所討論的母體滿足方法論的基本假設(shè)。誤用統(tǒng)計學(xué)可能會導(dǎo)致描述面或是推論面嚴重的錯誤,這個錯誤可能會影響社會政策,醫(yī)療實踐以及橋梁或是核能發(fā)電計劃結(jié)構(gòu)的可靠性。
即使統(tǒng)計學(xué)被正確的應(yīng)用,結(jié)果對于不是專家的人來說可能會難以陳述。舉例來說,統(tǒng)計資料中顯著的改變可能是由樣本的隨機變量所導(dǎo)致,但是這個顯著性可能與大眾的直覺相悖。人們需要一些統(tǒng)計的技巧(或懷疑)以面對每天日常生活中透過引用統(tǒng)計數(shù)據(jù)所獲得的資訊。
3.統(tǒng)計方法
測量的尺度
統(tǒng)計學(xué)一共有四種測量的尺度或是四種測量的方式。這四種測量(名目、順序、等距、等比)在統(tǒng)計過程中具有不等的實用性 。
等比尺度(Ratio measurements)擁有零值及資料間的距離是相等被定義的;
等距尺度(Interval measurements)資料間的距離是相等被定義的但是它的零值并非絕對的無而是自行定義的(如智力或溫度的測量);
順序尺度( Ordinal measurements)的意義并非表現(xiàn)在其值而是在其順序之上;
名目尺度(Nominal measurements)的測量值則不具量的意義。
統(tǒng)計技術(shù)
以下列出一些有名的統(tǒng)計檢定方法以及可供驗證實驗數(shù)據(jù)的程序
Fisher最小顯著差異法(Fisher's Least Significant Difference test )
學(xué)生t檢驗(Student's t-test)
曼-惠特尼 U 檢定(Mann-Whitney U)
回歸分析(regression analysis)
相關(guān)性(correlation)
皮爾森積矩相關(guān)系數(shù)(Pearson product-moment correlation coefficient)
史匹曼等級相關(guān)系數(shù)(Spearman's rank correlation coefficient )
卡方分布(chi-square )
4.創(chuàng)立時期
德國的斯勒茲曾說過:“統(tǒng)計是動態(tài)的歷史,歷史是靜態(tài)的統(tǒng)計”。可見統(tǒng)計學(xué)的產(chǎn)生與發(fā)展是和生產(chǎn)的發(fā)展、社會的進步緊密相聯(lián)的。
統(tǒng)計學(xué)的萌芽產(chǎn)生在歐洲,17世紀中葉至18世紀中葉是統(tǒng)計學(xué)的創(chuàng)立時期。在這一時期,統(tǒng)計學(xué)理論初步形成了一定的學(xué)術(shù)派別,主要有國勢學(xué)派和政治算術(shù)學(xué)派。
【統(tǒng)計學(xué)常見概念及解析】相關(guān)文章:
2016托福口語常見題目解析09-20
科目二常見不良動作解析07-12
2016托福閱讀常見錯誤解析09-29
2016年托福閱讀常見題型解析09-27
托福聽力五個常見套路解析09-18
科目二常見錯誤動作及解析07-11
注會報考常見問題解析08-23
托?荚嚦R娫~匯總結(jié)解析11-13
33道PHP常見面試題及解析08-21