【考研錦囊】首都經(jīng)濟(jì)貿(mào)易大學(xué)702統(tǒng)計(jì)學(xué)壓箱底的復(fù)習(xí)方法

首經(jīng)貿(mào)考研校 · 發(fā)表于 2022-12-2 15:41

本帖最后由首經(jīng)貿(mào)考研校于 2022-12-2 15:43 編輯

學(xué)姐介紹：

一諾學(xué)姐，考研初試總分400+，702專業(yè)135+，916公共管理綜合140+，初試復(fù)試排名前三，善于歸納總結(jié)抓住考試重點(diǎn)難點(diǎn)，為考生提供高效學(xué)習(xí)秘訣和應(yīng)試技巧，指導(dǎo)同學(xué)們精準(zhǔn)、高效有戰(zhàn)略的復(fù)習(xí)。

導(dǎo)論

1、統(tǒng)計(jì)學(xué)

舉例：市場研究，財(cái)務(wù)分析，經(jīng)濟(jì)預(yù)測

統(tǒng)計(jì)學(xué)是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。

2、描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)

（1）描述統(tǒng)計(jì)

第三章、第四章

描述統(tǒng)計(jì)研究的是數(shù)據(jù)收集、處理、匯總圖表、描述概括與分析等統(tǒng)計(jì)方法。

（2）推斷統(tǒng)計(jì)

第七章參數(shù)、估計(jì)、假設(shè)、檢驗(yàn)

推斷統(tǒng)計(jì)是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)方法，即抽出部分個(gè)體樣本推斷總體特征。

3、統(tǒng)計(jì)數(shù)據(jù)的類型

（1）分類數(shù)據(jù)

比如：性別男女

它是只能歸于某一類別的非數(shù)字型數(shù)據(jù)，數(shù)據(jù)表現(xiàn)是類別，是用文字來表述的。

（2）順序數(shù)據(jù)

比如：一等獎學(xué)金、二等獎學(xué)金、三等獎學(xué)金

它是某一有序類別的非數(shù)字型數(shù)據(jù)，順序數(shù)據(jù)也是類別，但類別是有序的。

（3）數(shù)值型數(shù)據(jù)

它是按數(shù)字尺度測量的觀察值，其結(jié)果表現(xiàn)為具體的數(shù)值。

分類數(shù)據(jù)和順序數(shù)據(jù)說明的是事物的品質(zhì)特征，通常用文字表述，其結(jié)果均表現(xiàn)為類別，因此也稱為定性數(shù)據(jù)或品質(zhì)數(shù)據(jù)；數(shù)值型數(shù)據(jù)說明的是現(xiàn)象的數(shù)量特征，通常是用數(shù)值來表現(xiàn)的，因此也稱為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。

（4）按搜集方法不同，分為觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)

①觀測數(shù)據(jù)

調(diào)查、觀測得到的，沒有人為控制條件。

②實(shí)驗(yàn)數(shù)據(jù)

實(shí)驗(yàn)組、控制組

（5）按時(shí)間不同，分為截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)

①截面數(shù)據(jù)

近似時(shí)間點(diǎn)：今天不同行業(yè)GDP

②時(shí)間序列數(shù)據(jù)

不同時(shí)間段：不同年份的GDP

4、統(tǒng)計(jì)學(xué)中幾個(gè)基本概念：

（1）總體：它是包含所研究的全部個(gè)體（數(shù)據(jù)）的集合，組成總體的每一個(gè)元素稱為個(gè)體。按照總體所包含元素?cái)?shù)目可分為有限總體和無限總體。

（2）個(gè)體：組成總體的每個(gè)元素。

（3）樣本和樣本量：樣本是指從總體中抽取一部分元素的集合，樣本也是總體的一個(gè)子集；樣本量是構(gòu)成樣本元素的數(shù)目。

（4）參數(shù)：它是描述總體特征的概括性數(shù)字度量，是研究者想要了解總體某種特征的數(shù)量表現(xiàn)。

（5）統(tǒng)計(jì)量：它是描述樣本特征的概括性數(shù)字度量，是根據(jù)樣本數(shù)據(jù)計(jì)算出來的一個(gè)量，是為了實(shí)現(xiàn)推斷統(tǒng)計(jì)，對原始數(shù)據(jù)進(jìn)行運(yùn)算，利用有用的樣本信息構(gòu)造的不含任何未知參數(shù)的樣本函數(shù)。統(tǒng)計(jì)量是隨機(jī)變量，是統(tǒng)計(jì)推斷的基礎(chǔ)。

比如：總體有500個(gè)，總體數(shù)量太多，不可能一一調(diào)查，隨機(jī)選擇30個(gè)，求出平均數(shù)，進(jìn)行估計(jì)計(jì)算。

（6）變量：它是描述現(xiàn)象某種特征的概念，特點(diǎn)是從一次觀測值到下一次觀測值呈現(xiàn)出的變化的差別。

①分類變量：描述事物的一個(gè)類別的一個(gè)名稱，取值是分類的一個(gè)數(shù)據(jù)。

②順序變量：事物有序類別的一個(gè)特征取值是順序數(shù)據(jù)。

數(shù)據(jù)的搜集

1、數(shù)據(jù)的來源？

數(shù)據(jù)的來源有兩個(gè)：直接來源和間接來源

①間接來源的數(shù)據(jù)稱為二手?jǐn)?shù)據(jù)，它是指研究對象的原信息已經(jīng)存在，對數(shù)據(jù)進(jìn)行重新整理、加工可以直接用于分析的數(shù)據(jù)。

優(yōu)點(diǎn)：

獲取方便，采集成本低，能夠很快得到并利用。

缺點(diǎn)：

針對性差、無法保證數(shù)據(jù)的準(zhǔn)確性和及時(shí)性。

在使用二手?jǐn)?shù)據(jù)之前要進(jìn)行評估，即二手?jǐn)?shù)據(jù)是誰搜集的、什么時(shí)候搜集的、為什么而收集的、用什么辦法收集的；還要注意數(shù)據(jù)的定義、計(jì)算口徑和方法，避免錯(cuò)用、濫用、誤用；還要注明數(shù)據(jù)來源，尊重他人勞動成果。

②直接來源的數(shù)據(jù)是經(jīng)過自己的調(diào)查或?qū)嶒?yàn)等直接實(shí)踐活動取得的一手?jǐn)?shù)據(jù)。

2、概率抽樣：

概率抽樣也稱為隨機(jī)抽樣，是指遵循隨機(jī)原則進(jìn)行的抽樣。

特點(diǎn)：

①抽樣采取隨機(jī)原則，每個(gè)單位都有一定的概率被抽中。

②每個(gè)單位被抽樣中的概率是已知的或者是可以計(jì)算的。

③在用樣本估計(jì)總體目標(biāo)量的時(shí)候要考慮每個(gè)單位被抽中的概率，估計(jì)量不僅與樣本單位的觀察值有關(guān)，而且與入樣概率有關(guān)，能夠用來估計(jì)總體參數(shù)。

3、常見的概率抽樣方式？

每一種抽樣優(yōu)缺點(diǎn)找課本補(bǔ)充背誦。

（1）簡單隨機(jī)抽樣：是從總體N個(gè)單位中隨機(jī)抽取n個(gè)單位作為樣本，每個(gè)單位以相等的概率入選，是最基本的抽樣方法，其他抽樣方法的基礎(chǔ)。

優(yōu)點(diǎn)：簡單直觀，抽樣框比較完整，可以直接從總體中抽取樣本。

缺點(diǎn)：如果抽取的總體比較大，則構(gòu)造相應(yīng)的抽樣框是不容易的。抽取的單位比較分散，也會加大調(diào)查的難度。沒有其他的一個(gè)輔助信息，提高效率。

（2）分層抽樣：是將總體單位按照不同的特征或規(guī)則劃分不同的層，然后從每層中獨(dú)立、隨機(jī)地抽取一定數(shù)量的單位組成樣本。

優(yōu)點(diǎn)：樣本的結(jié)構(gòu)和總體結(jié)構(gòu)是比較相近的。為組織實(shí)施調(diào)查提供了方便。對總體參數(shù)進(jìn)行估計(jì)時(shí)，可以用各層的目標(biāo)量進(jìn)行估計(jì)。

（3）整群抽樣：是先將總體中部分單位合并為組，即稱為群，然后以群為單位直接抽取樣本，在對入選群中的所有單位實(shí)施調(diào)查。

優(yōu)點(diǎn)：抽樣只需按照群，構(gòu)造抽樣框，簡化了工作量。調(diào)查地點(diǎn)相對比較集中，節(jié)省了相應(yīng)的調(diào)查費(fèi)用。

缺點(diǎn)：估計(jì)誤差比較大。

（4）系統(tǒng)抽樣：是先將總體各單位按照一定的順序進(jìn)行排序，在一定范圍內(nèi)隨機(jī)抽取一個(gè)單位定為初始單位，再按照一定規(guī)則選取其他單位組成樣本。

優(yōu)點(diǎn)：操作比較簡便，有效的提高估計(jì)精度。

缺點(diǎn)：對方差的估計(jì)比較困難的。

（5）多階段抽樣：先抽取群，但不是直接調(diào)查群內(nèi)所有的單位，而是在每個(gè)群中抽取樣本單位。因接受調(diào)查的單位需經(jīng)兩個(gè)步驟產(chǎn)生而命名二階段抽樣，將該方法延續(xù)，使抽樣的段數(shù)增多，就成為多階段抽樣。

優(yōu)點(diǎn)：保證樣本相對集中，節(jié)約了調(diào)查費(fèi)用。不包含基階段的抽樣框，可以在更廣的范圍內(nèi)展開。

4、常見的非概率抽樣方式：

不是根據(jù)隨機(jī)的原則，只是根據(jù)對數(shù)據(jù)的一個(gè)需求，進(jìn)行的一種方式。

優(yōu)點(diǎn)：就成本比較低，容易實(shí)施。

缺點(diǎn)：沒有辦法對總體進(jìn)行估計(jì)。

（1）方便抽樣：調(diào)查過程中由調(diào)查員依據(jù)方便的原則，自行確定入抽樣本的單位。

（2）判斷抽樣：指研究人員根據(jù)經(jīng)驗(yàn)、判斷和對研究對象的了解，有目的地選擇一些單位作為樣本。

（3）自愿抽樣：指被調(diào)查者自愿參加，成為樣本中的一分子，向調(diào)查人員提供有關(guān)信息。

缺點(diǎn)：結(jié)果是有偏的。

（4）滾雪球抽樣：往往使用于對稀少群體的調(diào)査中。在滾雪球抽樣中，首先選擇一組調(diào)査單位，對其實(shí)施調(diào)査之后，再請他們提供另外一些屬于研究總體的調(diào)查對象，調(diào)查人員根據(jù)所提供的線索，進(jìn)行此后的調(diào)查。

（5）配額抽樣：類似于概率抽樣中的分層抽樣，它是首先將總體中的所有單位按一定的標(biāo)志(變量)分為若干類，然后在每個(gè)類中采用方便抽樣或判斷抽樣的方式選取樣本單位。

5、概率抽樣和非概率抽樣的區(qū)別？

（1）非概率抽樣適合探索性的研究和市場調(diào)査中的概念測試，其特點(diǎn)是操作簡便、時(shí)效快、成本低，而且對于抽樣中的統(tǒng)計(jì)學(xué)專業(yè)技術(shù)要求不是很高。

如果調(diào)查的目的是用樣本的調(diào)查結(jié)果對總體相應(yīng)的參數(shù)進(jìn)行估計(jì)，并計(jì)算估計(jì)的誤差，得到總體參數(shù)的置信區(qū)間，就應(yīng)當(dāng)使用概率抽樣的方法。

（2）概率抽樣是依據(jù)隨機(jī)原則抽選樣本，此時(shí)樣本統(tǒng)計(jì)量的理論分布是存在的。概率抽樣的技術(shù)含量更高，無論抽選樣本和對調(diào)查數(shù)據(jù)進(jìn)行分析，都要求有較高的統(tǒng)計(jì)學(xué)專業(yè)知識，調(diào)查的成本也比非概率抽樣的調(diào)査成本高。有時(shí)在一項(xiàng)研究性項(xiàng)目中，可以把概率抽樣和非概率抽樣相結(jié)合，發(fā)揮各自的特點(diǎn)，滿足研究中的不同需求。

6、搜集數(shù)據(jù)的基本方法？

區(qū)分搜集數(shù)據(jù)和調(diào)查方法。

（1）自填式問卷調(diào)查：在無調(diào)查員協(xié)助的情況下由被調(diào)查者自己完成調(diào)查問卷。

（2）面訪式問卷調(diào)查：調(diào)查員與被調(diào)查者面對面提問、被調(diào)查者回答。

（3）電話式調(diào)查問卷：通過各種電訊工具向被調(diào)查者實(shí)施調(diào)查。

（4）觀察式調(diào)查：調(diào)查員通過直接觀察的方式獲取信息。

調(diào)查方式：普查、統(tǒng)計(jì)報(bào)表、抽樣調(diào)查、重點(diǎn)調(diào)查、典型調(diào)查、代表抽樣。

7、數(shù)據(jù)的誤差

數(shù)據(jù)的誤差泛指通過調(diào)查得到的數(shù)據(jù)與研究對象真實(shí)結(jié)果之間的差異，數(shù)據(jù)的誤差有抽樣誤差和非抽樣誤差兩種。

（1）抽樣誤差：由于抽樣的隨機(jī)性引起的樣本結(jié)果與總體真值之間的誤差。它描述的是所有樣本可能的結(jié)果與總體真值之間的平均性差異。并且是一種隨機(jī)性誤差，只存在于概率抽樣中。

抽樣誤差的影響因素：

①樣本單位數(shù)目，數(shù)目越大，誤差越小

②總體差異程度，差異越大，誤差越大

③抽樣方法：采取不重復(fù)抽樣

④抽樣組織形式，不同組織形式抽樣誤差大小不同

（2）非抽樣誤差：指除抽樣誤差之外的，由于其他原因引起的樣本觀察結(jié)果與總體真值之間的差異。無論是概率抽樣、非概率抽樣，或是在全面性調(diào)查中，都有可能產(chǎn)生非抽樣誤差。

8、誤差的幾種表現(xiàn)及產(chǎn)生原因？

（1）抽樣框誤差：統(tǒng)計(jì)推論的錯(cuò)誤是由于抽樣框的不完善造成的，把這種誤差稱為抽樣框誤差。

（2）回答誤差：指被調(diào)查者在接受調(diào)查時(shí)給出的回答與真實(shí)情況不符。

而導(dǎo)致回答誤差的原因有多種，主要有：

①理解誤差；

②記憶誤差；

③有意識誤差。

（3）無回答誤差：被調(diào)査者拒絕接受調(diào)査，調(diào)查人員得到的是一份空白的答卷。

無回答誤差有時(shí)是隨機(jī)的，有時(shí)是系統(tǒng)性的。

解決無回答的系統(tǒng)性誤差的途徑主要有：

①預(yù)防，即在調(diào)查進(jìn)行前做好各方面的準(zhǔn)備工作，盡量把無回答降到最低程度；

②當(dāng)無回答出現(xiàn)后，分析無回答產(chǎn)生的原因，采取一些補(bǔ)救措施。

(4)調(diào)査員誤差：由于調(diào)查員的原因產(chǎn)生的誤差。

(5)測量誤差：由于測量工具不同產(chǎn)生的誤差。

數(shù)據(jù)的整理與展示

1.數(shù)據(jù)的預(yù)處理？

它是在對數(shù)據(jù)分類或分組之前所做的必要處理，包括數(shù)據(jù)的審核、篩選、排序等。

（1）數(shù)據(jù)審核是檢查數(shù)據(jù)中是否有錯(cuò)誤，對于通過調(diào)查取得的原始數(shù)據(jù)主要從完整性和準(zhǔn)確性兩個(gè)方面去審核，而對于通過其他渠道獲得的二手?jǐn)?shù)據(jù)應(yīng)著重審核數(shù)據(jù)的適用性和時(shí)效性。

（2）數(shù)據(jù)篩選是根據(jù)需要找出符合特定條件的某類數(shù)據(jù)。

（3）數(shù)據(jù)排序是按一定順序?qū)?shù)據(jù)排列，以便研究者通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特征或趨勢，找到解決問題的線索。

2.分類數(shù)據(jù)的整理和圖示？

（1）整理

①頻數(shù)：是落在某一特定類別或組中的數(shù)據(jù)個(gè)數(shù)。

②頻數(shù)分布表：將各個(gè)類別及落在其中的相應(yīng)頻數(shù)全部列出，并用表格的形式表現(xiàn)出來。

③比例：是一個(gè)樣本（或總體）中各個(gè)部分的數(shù)據(jù)與全部數(shù)據(jù)之比，通常用于反映樣本（或總體）的構(gòu)成或結(jié)構(gòu)。

④百分比：將比例乘以100得到的數(shù)值。

⑤比率：是樣本（或總體）中不同類別數(shù)據(jù)之間的比值。

（2）分類數(shù)據(jù)的圖示

①條形圖

②帕累托圖

③餅圖

④環(huán)形圖

3.順序數(shù)據(jù)的整理？

向上累積：10%+20%=30%

向下累積：100%-30%=70%

①累積頻數(shù)：將各有序類別或組的頻數(shù)逐級累加起來得到的頻數(shù)，有向上累積和向下累積。

②累積頻率：將各有序類別或組的百分比逐級累積起來，也有向上累積和向下累積。

4.數(shù)值型數(shù)據(jù)的分組？

分組有單變量值分組（適用于數(shù)據(jù)較少的離散型變量）和組距分組（適用于數(shù)據(jù)多的連續(xù)型變量）。

（1）分組步驟：

①確定組數(shù)：一般來說組數(shù)k區(qū)間為5≤k≤15，確定組數(shù)的公式為k=1+lgn≒lg2。

②確定組距：組距是一組上限和下限的差，計(jì)算方法是數(shù)據(jù)最大值減去最小值除以組數(shù)（要采用5或10的倍數(shù)）。

③根據(jù)分組整理成頻數(shù)分布表。

（2）組距分組的注意事項(xiàng)

①組距分組需要遵循“不重不漏"的原則即：

“不重”是指一項(xiàng)數(shù)據(jù)只能分在其中的某一組，不能在其他組中重復(fù)出現(xiàn)；“不漏"是指組別能夠窮盡，即在所分的全部組別中每項(xiàng)數(shù)據(jù)都能分在其中的某一組，不能遺漏。

為解決“不重”的問題，統(tǒng)計(jì)分組時(shí)習(xí)慣上規(guī)定“上組限不在內(nèi)”，即當(dāng)相鄰兩組的上下限重疊時(shí)，恰好等于某一組上限的變量值不算在本組內(nèi)，而計(jì)算在下一組內(nèi)。

比如：一組：70—80；二組：80—90

80屬于二組

5.數(shù)值型數(shù)據(jù)的圖示？

①直方圖（分組數(shù)據(jù)）

②莖葉圖（未分組數(shù)據(jù)）side width=10，則數(shù)據(jù)組11、12、13

③箱線圖（未分組數(shù)據(jù)）重點(diǎn)復(fù)習(xí)一下

6.直方圖與條形圖的聯(lián)系與區(qū)別？

聯(lián)系：都是用矩形來表示數(shù)據(jù)的分布情況，當(dāng)矩形寬度相等時(shí)都是用高度來表示數(shù)據(jù)分布情況。

區(qū)別：

①直方圖的高度寬度均有意義，高度表示每一組的頻數(shù)或頻率，寬度表示各組組距，面積表示各組頻數(shù)的多少；條形圖的寬度是固定的，高度表示頻數(shù)多少。

②直方圖的各矩形是連續(xù)排列的，而條形圖是分開排列的。

③直方圖是用來展示數(shù)值型數(shù)據(jù)，條形圖用來展示分類型數(shù)據(jù)。

7.鑒別圖形優(yōu)劣的準(zhǔn)則？

①能夠在短時(shí)間內(nèi)給讀者提供大量的信息

②能夠反應(yīng)數(shù)據(jù)的真實(shí)情況

③應(yīng)該是多維的

④能夠洞察問題的實(shí)質(zhì)

⑤能夠?qū)?fù)雜的問題簡明、明確、高效闡述出來

數(shù)據(jù)的概括性度量

1.集中趨勢的度量？

集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的程度，它反映了一組數(shù)據(jù)中心點(diǎn)的位置所在。

集中趨勢的度量有眾數(shù)、中位數(shù)、分位數(shù)、平均數(shù)，通常不同類型的數(shù)據(jù)采用不同的集中趨勢測度值，低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù)，而高層次數(shù)據(jù)的測度值不適用于低層次的測量數(shù)據(jù)。

2.眾數(shù)、中位數(shù)、平均數(shù)的關(guān)系和應(yīng)用場合？

（1）關(guān)系：從分布的角度看，眾數(shù)始終是一組數(shù)據(jù)分布的最高峰值，中位數(shù)是處于一組數(shù)據(jù)中間位置上的值，平均數(shù)是全部數(shù)據(jù)的算術(shù)平均。

①若數(shù)據(jù)分布為對稱分布

②若數(shù)據(jù)分布為左偏分布

③若數(shù)據(jù)分布為右偏分布

（2）眾數(shù)、中位數(shù)和平均數(shù)的特點(diǎn)與應(yīng)用場合

①眾數(shù)是一組數(shù)據(jù)分布的峰值，不受極端值的影響。其缺點(diǎn)是具有不唯一性，眾數(shù)只有在數(shù)據(jù)量較多時(shí)才有意義，當(dāng)數(shù)據(jù)量較少時(shí)，不宜使用眾數(shù)。眾數(shù)主要適合作為分類數(shù)據(jù)的集中趨勢測度值。眾數(shù)不唯一。

②中位數(shù)是一組數(shù)據(jù)中間位置上的代表值，不受數(shù)據(jù)極端值的影響。中位數(shù)主要適合作為順序數(shù)據(jù)的集中趨勢測度值。

③平均數(shù)是對數(shù)值型數(shù)據(jù)計(jì)算的，而且利用了全部數(shù)據(jù)信息，它是實(shí)際中應(yīng)用最廣泛的集中趨勢測度值。

當(dāng)數(shù)據(jù)呈對稱分布或接近對稱分布時(shí)，3個(gè)代表值相等或接近相等，這時(shí)則應(yīng)選擇平均數(shù)作為集中趨勢的代值。但平均數(shù)的主要缺點(diǎn)是易受數(shù)據(jù)極端值的影響，對于偏態(tài)分布的數(shù)據(jù)，平均數(shù)的代表性較差。因此，當(dāng)數(shù)據(jù)為偏態(tài)分布，特別是當(dāng)偏斜程度較大時(shí)，可以考慮選擇眾數(shù)或中位數(shù)。

3.離散程度的度量？

數(shù)據(jù)的離散程度，它反映的是各變量值遠(yuǎn)離其中心值的程度。數(shù)據(jù)的離散程度越大，集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差；反之，離散程度越小則代表性就越好。

離散程度的度量有異眾比率、四分位差、極差、平均差、標(biāo)準(zhǔn)差、方差、離散系數(shù)。

（1）異眾比率是指非眾數(shù)組的頻數(shù)占總頻數(shù)的比例，用表示

異眾比率主要用于衡量眾數(shù)對一組數(shù)據(jù)的代表程度。異眾比率越大，說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大，眾數(shù)的代表性越差；反之，代表性越好。異眾比率主要適合測度分類數(shù)據(jù)的離散程度，對于順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)也可以計(jì)算異眾比率。

（2）四分位差是上四分位數(shù)與下四分位數(shù)之差，用Qd=Qu-Ql表示。（先排序再計(jì)算）

四分位差反映了中間50%數(shù)據(jù)的離散程度，其數(shù)值越小，說明中間的數(shù)據(jù)越集中；其數(shù)值越大，說明中間的數(shù)據(jù)越分散。四分位差不受極端值的影響。

極差：一組數(shù)據(jù)的最大值與最小值之差稱為極差，也稱全距，用R表示。

其計(jì)算公式為：

平均差：也稱平均絕對離差，它是各變量值與其平均數(shù)離差絕對值的平均數(shù)。

方差：各變量值與其平均數(shù)離差平方的平均數(shù)。

標(biāo)準(zhǔn)差：方差的平方根。

4.相對位置度量的經(jīng)驗(yàn)法則？

（全面背誦）

當(dāng)數(shù)據(jù)對稱分布時(shí)，經(jīng)驗(yàn)法則表明：約有68%的數(shù)據(jù)在平均數(shù) +1個(gè)標(biāo)準(zhǔn)差范圍內(nèi)；約有95%的數(shù)據(jù)在平均數(shù) +2個(gè)標(biāo)準(zhǔn)差范圍內(nèi)；約有99%的數(shù)據(jù)在平均數(shù) +3個(gè)標(biāo)準(zhǔn)差范圍內(nèi)。

當(dāng)不是對稱分布，則運(yùn)用切比雪夫不等式（至少有

的數(shù)據(jù)落在 k 個(gè)標(biāo)準(zhǔn)差之內(nèi)），則至少有75%的數(shù)據(jù)在平均數(shù)2個(gè)標(biāo)準(zhǔn)差范圍內(nèi)；至少有89%的數(shù)據(jù)在平均數(shù)3的標(biāo)準(zhǔn)差范圍內(nèi)；至少有94%的數(shù)據(jù)在平均數(shù)4個(gè)標(biāo)準(zhǔn)差范圍內(nèi)。

+1個(gè)標(biāo)準(zhǔn)差范圍內(nèi)：29 30 31

+3個(gè)標(biāo)準(zhǔn)差范圍內(nèi)：27 30 33

5.相對離散程度：

離散系數(shù)是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比。

計(jì)算公式為：

離散系數(shù)是測度數(shù)據(jù)離散程度的相對統(tǒng)計(jì)量，主要是用于比較不同樣本數(shù)據(jù)的離散程度。離散系數(shù)大，說明數(shù)據(jù)的離散程度也大；離散系數(shù)小，說明數(shù)據(jù)的離散程度也小。

6.偏態(tài)與峰態(tài)的度量

（考前兩個(gè)周背誦公式）

偏態(tài)及其測度：它是對數(shù)據(jù)分布對稱性的測度。測度偏態(tài)的統(tǒng)計(jì)量是偏態(tài)系數(shù)，記作SK。

（1）未分組數(shù)據(jù)：

如果一組數(shù)據(jù)的分布是對稱的，則偏態(tài)系數(shù)等于0；如果偏態(tài)系數(shù)明顯不等于0,表明分布是非對稱的。若偏態(tài)系數(shù)大于1或小于一1,被稱為高度偏態(tài)分布；若偏態(tài)系數(shù)在0.5?1或-1～0.5之間，被認(rèn)為是中等偏態(tài)分布；偏態(tài)系數(shù)越接近0,偏斜程度就越低。

抽樣與抽樣分布

（統(tǒng)計(jì)量概念找課本）

1.次序統(tǒng)計(jì)量：

設(shè)X1 X2 X3...Xn為總體X中抽取的樣本，稱為第i個(gè)次序統(tǒng)計(jì)量，它是樣本X1 X2 X3...Xn滿足以下條件的函數(shù)：每當(dāng)樣本得到一組觀測值X1 X2 X3...Xn時(shí)，將其從小到大排序，第i個(gè)值就作為次序統(tǒng)計(jì)量的觀測值，而X1 X2 X3...Xn稱為次序統(tǒng)計(jì)量。

2.充分統(tǒng)計(jì)量：

統(tǒng)計(jì)量加工過程中一點(diǎn)信息都不損失的統(tǒng)計(jì)量。

3.抽樣分布：

抽樣分布是從容量為N的總體中抽取容量為n的樣本時(shí)，所有可能的樣本統(tǒng)計(jì)值所形成的分布。假設(shè)從容量為N的有限總體中最多可以抽取m個(gè)容量為n的不同樣本，那么把所有m個(gè)樣本統(tǒng)計(jì)值形成頻率分布，就是抽樣分布。抽樣分布是研究樣本分布與總體分布之間關(guān)系的橋梁。

4.中心極限定理：設(shè)從均值為μ，方差為σ^2（有限）的任意一個(gè)總體中抽取樣本量為n的樣本，當(dāng)n充分大時(shí)，樣本均值X的抽樣分布近似于服從均值為μ、方差為σ^2/n的正態(tài)分布。基于此，中心極限定理就是，隨著樣本量n的增大（n≥30），不論原來的總體是否服從正態(tài)分布，樣本均值的抽樣分布都將趨于正態(tài)分布，其分布的數(shù)學(xué)期望為總體均值μ，方差為總體方差的1/n。

（公式要進(jìn)行背誦）

參數(shù)估計(jì)

（公式背誦并理解）

1.參數(shù)估計(jì)的基本原理？

參數(shù)估計(jì)就是用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù)，在參數(shù)估計(jì)中，用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量稱為估計(jì)量，根據(jù)一個(gè)具體的樣本計(jì)算出來的估計(jì)量的數(shù)值稱為估計(jì)值。參數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。

2.點(diǎn)估計(jì)和區(qū)間估計(jì)

（1）點(diǎn)估計(jì)：是用樣本統(tǒng)計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值。

（2）區(qū)間估計(jì)：是在點(diǎn)估計(jì)的基礎(chǔ)上，給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍，該區(qū)間通常由樣本統(tǒng)計(jì)量加減估計(jì)誤差得到。

3.置信區(qū)間和置信水平

（1）置信區(qū)間：由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間，其中區(qū)間的最小值稱為置信下限，最大值稱為置信上限。

（2）置信水平（置信度/置信系數(shù)）：置信區(qū)間中包含總體參數(shù)真值的次數(shù)所占的比例。

4.評價(jià)估計(jì)量的標(biāo)準(zhǔn)？

評價(jià)估計(jì)量的標(biāo)準(zhǔn)有三個(gè)：無偏性、有效性、一致性。

①無偏性，指估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。

②有效性，指對同一總體參數(shù)的兩個(gè)無偏估計(jì)量（有效估計(jì)量一定是無偏估計(jì)量），有更小標(biāo)準(zhǔn)差的估計(jì)量更有效。

③一致性，指隨著樣本量的增大，點(diǎn)估計(jì)量的值越來越接近被估計(jì)總體的參數(shù)，即一個(gè)大樣本給出的估計(jì)量要比一個(gè)小樣本給出的估計(jì)量更接近總體的參數(shù)。

5.對置信區(qū)間的理解需要注意的地方？

（1）如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包括總體參數(shù)的真值，5%的區(qū)間不包括總體參數(shù)的真值，那么用該方法構(gòu)造的區(qū)間稱為置信水平為95%的置信區(qū)間。（其他置信水平的區(qū)間也可這樣表示）

（2）總體參數(shù)的真值是固定的、未知的，而用樣本構(gòu)造的區(qū)間則是不固定的。置信區(qū)間是一個(gè)隨機(jī)區(qū)間，若抽取不同的樣本，用該方法可以得到不同的區(qū)間。

（3）在實(shí)際問題中，進(jìn)行估計(jì)時(shí)往往只抽取一個(gè)樣本，此時(shí)所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平（例如95%）下的置信區(qū)間。由于用該樣本構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間，而不再是隨機(jī)區(qū)間，所以無法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值。我們只能希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè)，但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)。

假設(shè)檢驗(yàn)

（計(jì)算題考的概率比較大）

1.假設(shè)檢驗(yàn)和參數(shù)估計(jì)的區(qū)別

參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分，它們都是利用樣本對總體進(jìn)行某種推斷，但推斷的角度不同。參數(shù)估計(jì)討論的是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法，總體參數(shù)在估計(jì)前是未知的。而在假設(shè)檢驗(yàn)中，則是先對的值提出一個(gè)假設(shè)，然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。

2.假設(shè)檢驗(yàn)的基本原理？

回答相關(guān)問題都要回答這一部分。

假設(shè)檢驗(yàn)是指利用樣本信息判斷假設(shè)是否成立的過程，它是先對總體參數(shù)提出某種假設(shè)，然后利用樣本信息判斷假設(shè)是否成立的過程。

（1）原假設(shè)是研究者想收集證據(jù)予以反對的假設(shè)。

（2）備擇假設(shè)通常是研究者想要收集證據(jù)予以支持的假設(shè)。

（3）假設(shè)檢驗(yàn)的目的主要是收集證據(jù)拒絕原假設(shè)。

3.兩類錯(cuò)誤：

當(dāng)原假設(shè)為真時(shí)拒絕了假設(shè)稱為第一類錯(cuò)誤，也稱棄真錯(cuò)誤，概率用α表示；當(dāng)原假設(shè)為假時(shí)沒有拒絕原假設(shè)稱為第二類錯(cuò)誤，也稱取偽錯(cuò)誤，概率用β表示。

4.P值的含義與決策步驟?

P值就是當(dāng)原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)構(gòu)出現(xiàn)的概率。用P值進(jìn)行決策的準(zhǔn)則是

值<α，拒絕H0；P值 >α，不拒絕H。

如果P值很小，說明這種情況發(fā)生的概率很小，而如果出現(xiàn)了，依據(jù)小概率原理，就有理由拒絕原假設(shè)。P值越小，拒絕H0的理由越充分。

5.假設(shè)檢驗(yàn)的基本步驟?假設(shè)檢驗(yàn)的基本原理+P值+假設(shè)檢驗(yàn)的基本步驟？

（1）根據(jù)問題的要求給出原假設(shè)H0，同時(shí)給出備擇假設(shè)H1。

（2）在H0成立的前提下，選擇合適的檢驗(yàn)統(tǒng)計(jì)量，這個(gè)統(tǒng)計(jì)量應(yīng)包括要檢驗(yàn)的參數(shù)，同時(shí)它的分布已知。

（3）根據(jù)顯著性水平α，按照備擇假設(shè)H1和檢驗(yàn)統(tǒng)計(jì)量的分布，寫出小概率事件及其概率表達(dá)式。

（4）由樣本值計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的數(shù)值，并查出對應(yīng)的臨界值。

（5）依據(jù)計(jì)算結(jié)果作出拒絕H0或接受H0的決策。

		自動登錄	找回密碼
密碼			注冊

[交流] 【考研錦囊】首都經(jīng)濟(jì)貿(mào)易大學(xué)702統(tǒng)計(jì)學(xué)壓箱底的復(fù)習(xí)方法

NEW最新資料推薦