精品日本亚洲一区二区三区,99久久精品免费观看国产,99久久免费精品,亚洲精品国产一区二区成人,日本亚洲精品一区二区三区四区,国产亚洲精品成人久久网站,久久亚洲男人第一AV网站,精品国产高清一区二区广区,久久精品五月天很黄很艳女TV

考研論壇

 
查看: 2709|回復(fù): 0
打印 上一主題 下一主題

[交流] 【考研錦囊】首都經(jīng)濟(jì)貿(mào)易大學(xué)702統(tǒng)計(jì)學(xué)壓箱底的復(fù)習(xí)方法

[復(fù)制鏈接]

692

主題

720

帖子

3951

積分

入駐機(jī)構(gòu)

精華
0
威望
2
K幣
3949 元
注冊時(shí)間
2021-3-17
跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2022-12-2 15:41 | 只看該作者 回帖獎勵(lì) |倒序?yàn)g覽 |閱讀模式
本帖最后由 首經(jīng)貿(mào)考研校 于 2022-12-2 15:43 編輯

學(xué)姐介紹:

一諾學(xué)姐,考研初試總分400+,702專業(yè)135+,916公共管理綜合140+,初試復(fù)試排名前三,善于歸納總結(jié)抓住考試重點(diǎn)難點(diǎn),為考生提供高效學(xué)習(xí)秘訣和應(yīng)試技巧,指導(dǎo)同學(xué)們精準(zhǔn)、高效有戰(zhàn)略的復(fù)習(xí)。

導(dǎo)論
1、統(tǒng)計(jì)學(xué)

舉例:市場研究,財(cái)務(wù)分析,經(jīng)濟(jì)預(yù)測

統(tǒng)計(jì)學(xué)是收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得出結(jié)論的科學(xué)。

2、描述統(tǒng)計(jì)與推斷統(tǒng)計(jì)

(1)描述統(tǒng)計(jì)

第三章、第四章

描述統(tǒng)計(jì)研究的是數(shù)據(jù)收集、處理、匯總圖表、描述概括與分析等統(tǒng)計(jì)方法。

(2)推斷統(tǒng)計(jì)

第七章參數(shù)、估計(jì)、假設(shè)、檢驗(yàn)

推斷統(tǒng)計(jì)是研究如何利用樣本數(shù)據(jù)來推斷總體特征的統(tǒng)計(jì)方法,即抽出部分個(gè)體樣本推斷總體特征。

3、統(tǒng)計(jì)數(shù)據(jù)的類型

(1)分類數(shù)據(jù)

比如:性別男女

它是只能歸于某一類別的非數(shù)字型數(shù)據(jù),數(shù)據(jù)表現(xiàn)是類別,是用文字來表述的。

(2)順序數(shù)據(jù)

比如:一等獎學(xué)金、二等獎學(xué)金、三等獎學(xué)金

它是某一有序類別的非數(shù)字型數(shù)據(jù),順序數(shù)據(jù)也是類別,但類別是有序的。

(3)數(shù)值型數(shù)據(jù)

它是按數(shù)字尺度測量的觀察值,其結(jié)果表現(xiàn)為具體的數(shù)值。

分類數(shù)據(jù)和順序數(shù)據(jù)說明的是事物的品質(zhì)特征,通常用文字表述,其結(jié)果均表現(xiàn)為類別,因此也稱為定性數(shù)據(jù)或品質(zhì)數(shù)據(jù);數(shù)值型數(shù)據(jù)說明的是現(xiàn)象的數(shù)量特征,通常是用數(shù)值來表現(xiàn)的,因此也稱為定量數(shù)據(jù)或數(shù)量數(shù)據(jù)。

(4)按搜集方法不同,分為觀測數(shù)據(jù)和實(shí)驗(yàn)數(shù)據(jù)

①觀測數(shù)據(jù)

調(diào)查、觀測得到的,沒有人為控制條件。

②實(shí)驗(yàn)數(shù)據(jù)

實(shí)驗(yàn)組、控制組

(5)按時(shí)間不同,分為截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)

①截面數(shù)據(jù)

近似時(shí)間點(diǎn):今天不同行業(yè)GDP

②時(shí)間序列數(shù)據(jù)

不同時(shí)間段:不同年份的GDP

4、統(tǒng)計(jì)學(xué)中幾個(gè)基本概念:

(1)總體:它是包含所研究的全部個(gè)體(數(shù)據(jù))的集合,組成總體的每一個(gè)元素稱為個(gè)體。按照總體所包含元素?cái)?shù)目可分為有限總體和無限總體。

(2)個(gè)體:組成總體的每個(gè)元素。

(3)樣本和樣本量:樣本是指從總體中抽取一部分元素的集合,樣本也是總體的一個(gè)子集;樣本量是構(gòu)成樣本元素的數(shù)目。

(4)參數(shù):它是描述總體特征的概括性數(shù)字度量,是研究者想要了解總體某種特征的數(shù)量表現(xiàn)。

(5)統(tǒng)計(jì)量:它是描述樣本特征的概括性數(shù)字度量,是根據(jù)樣本數(shù)據(jù)計(jì)算出來的一個(gè)量,是為了實(shí)現(xiàn)推斷統(tǒng)計(jì),對原始數(shù)據(jù)進(jìn)行運(yùn)算,利用有用的樣本信息構(gòu)造的不含任何未知參數(shù)的樣本函數(shù)。統(tǒng)計(jì)量是隨機(jī)變量,是統(tǒng)計(jì)推斷的基礎(chǔ)。

比如:總體有500個(gè),總體數(shù)量太多,不可能一一調(diào)查,隨機(jī)選擇30個(gè),求出平均數(shù),進(jìn)行估計(jì)計(jì)算。

(6)變量:它是描述現(xiàn)象某種特征的概念,特點(diǎn)是從一次觀測值到下一次觀測值呈現(xiàn)出的變化的差別。

①分類變量:描述事物的一個(gè)類別的一個(gè)名稱,取值是分類的一個(gè)數(shù)據(jù)。

②順序變量:事物有序類別的一個(gè)特征取值是順序數(shù)據(jù)。

數(shù)據(jù)的搜集
1、數(shù)據(jù)的來源?

數(shù)據(jù)的來源有兩個(gè):直接來源和間接來源

①間接來源的數(shù)據(jù)稱為二手?jǐn)?shù)據(jù),它是指研究對象的原信息已經(jīng)存在,對數(shù)據(jù)進(jìn)行重新整理、加工可以直接用于分析的數(shù)據(jù)。

優(yōu)點(diǎn):

獲取方便,采集成本低,能夠很快得到并利用。

缺點(diǎn):

針對性差、無法保證數(shù)據(jù)的準(zhǔn)確性和及時(shí)性。

在使用二手?jǐn)?shù)據(jù)之前要進(jìn)行評估,即二手?jǐn)?shù)據(jù)是誰搜集的、什么時(shí)候搜集的、為什么而收集的、用什么辦法收集的;還要注意數(shù)據(jù)的定義、計(jì)算口徑和方法,避免錯(cuò)用、濫用、誤用;還要注明數(shù)據(jù)來源,尊重他人勞動成果。

②直接來源的數(shù)據(jù)是經(jīng)過自己的調(diào)查或?qū)嶒?yàn)等直接實(shí)踐活動取得的一手?jǐn)?shù)據(jù)。

2、概率抽樣:

概率抽樣也稱為隨機(jī)抽樣,是指遵循隨機(jī)原則進(jìn)行的抽樣。

特點(diǎn):

①抽樣采取隨機(jī)原則,每個(gè)單位都有一定的概率被抽中。

②每個(gè)單位被抽樣中的概率是已知的或者是可以計(jì)算的。

③在用樣本估計(jì)總體目標(biāo)量的時(shí)候要考慮每個(gè)單位被抽中的概率,估計(jì)量不僅與樣本單位的觀察值有關(guān),而且與入樣概率有關(guān),能夠用來估計(jì)總體參數(shù)。

3、常見的概率抽樣方式?

每一種抽樣優(yōu)缺點(diǎn)找課本補(bǔ)充背誦。

(1)簡單隨機(jī)抽樣:是從總體N個(gè)單位中隨機(jī)抽取n個(gè)單位作為樣本,每個(gè)單位以相等的概率入選,是最基本的抽樣方法,其他抽樣方法的基礎(chǔ)。

優(yōu)點(diǎn):簡單直觀,抽樣框比較完整,可以直接從總體中抽取樣本。

缺點(diǎn):如果抽取的總體比較大,則構(gòu)造相應(yīng)的抽樣框是不容易的。抽取的單位比較分散,也會加大調(diào)查的難度。沒有其他的一個(gè)輔助信息,提高效率。

(2)分層抽樣:是將總體單位按照不同的特征或規(guī)則劃分不同的層,然后從每層中獨(dú)立、隨機(jī)地抽取一定數(shù)量的單位組成樣本。

優(yōu)點(diǎn):樣本的結(jié)構(gòu)和總體結(jié)構(gòu)是比較相近的。為組織實(shí)施調(diào)查提供了方便。對總體參數(shù)進(jìn)行估計(jì)時(shí),可以用各層的目標(biāo)量進(jìn)行估計(jì)。

(3)整群抽樣:是先將總體中部分單位合并為組,即稱為群,然后以群為單位直接抽取樣本,在對入選群中的所有單位實(shí)施調(diào)查。

優(yōu)點(diǎn):抽樣只需按照群,構(gòu)造抽樣框,簡化了工作量。調(diào)查地點(diǎn)相對比較集中,節(jié)省了相應(yīng)的調(diào)查費(fèi)用。

缺點(diǎn):估計(jì)誤差比較大。

(4)系統(tǒng)抽樣:是先將總體各單位按照一定的順序進(jìn)行排序,在一定范圍內(nèi)隨機(jī)抽取一個(gè)單位定為初始單位,再按照一定規(guī)則選取其他單位組成樣本。

優(yōu)點(diǎn):操作比較簡便,有效的提高估計(jì)精度。

缺點(diǎn):對方差的估計(jì)比較困難的。

(5)多階段抽樣:先抽取群,但不是直接調(diào)查群內(nèi)所有的單位,而是在每個(gè)群中抽取樣本單位。因接受調(diào)查的單位需經(jīng)兩個(gè)步驟產(chǎn)生而命名二階段抽樣,將該方法延續(xù),使抽樣的段數(shù)增多,就成為多階段抽樣。

優(yōu)點(diǎn):保證樣本相對集中,節(jié)約了調(diào)查費(fèi)用。不包含基階段的抽樣框,可以在更廣的范圍內(nèi)展開。

4、常見的非概率抽樣方式:

不是根據(jù)隨機(jī)的原則,只是根據(jù)對數(shù)據(jù)的一個(gè)需求,進(jìn)行的一種方式。

優(yōu)點(diǎn):就成本比較低,容易實(shí)施。

缺點(diǎn):沒有辦法對總體進(jìn)行估計(jì)。

(1)方便抽樣:調(diào)查過程中由調(diào)查員依據(jù)方便的原則,自行確定入抽樣本的單位。

(2)判斷抽樣:指研究人員根據(jù)經(jīng)驗(yàn)、判斷和對研究對象的了解,有目的地選擇一些單位作為樣本。

(3)自愿抽樣:指被調(diào)查者自愿參加,成為樣本中的一分子,向調(diào)查人員提供有關(guān)信息。

缺點(diǎn):結(jié)果是有偏的。

(4)滾雪球抽樣:往往使用于對稀少群體的調(diào)査中。在滾雪球抽樣中,首先選擇一組調(diào)査單位,對其實(shí)施調(diào)査之后,再請他們提供另外一些屬于研究總體的調(diào)查對象,調(diào)查人員根據(jù)所提供的線索,進(jìn)行此后的調(diào)查。

(5)配額抽樣:類似于概率抽樣中的分層抽樣,它是首先將總體中的所有單位按一定的標(biāo)志(變量)分為若干類,然后在每個(gè)類中采用方便抽樣或判斷抽樣的方式選取樣本單位。

5、概率抽樣和非概率抽樣的區(qū)別?

(1)非概率抽樣適合探索性的研究和市場調(diào)査中的概念測試,其特點(diǎn)是操作簡便、時(shí)效快、成本低,而且對于抽樣中的統(tǒng)計(jì)學(xué)專業(yè)技術(shù)要求不是很高。

如果調(diào)查的目的是用樣本的調(diào)查結(jié)果對總體相應(yīng)的參數(shù)進(jìn)行估計(jì),并計(jì)算估計(jì)的誤差,得到總體參數(shù)的置信區(qū)間,就應(yīng)當(dāng)使用概率抽樣的方法。

(2)概率抽樣是依據(jù)隨機(jī)原則抽選樣本,此時(shí)樣本統(tǒng)計(jì)量的理論分布是存在的。概率抽樣的技術(shù)含量更高,無論抽選樣本和對調(diào)查數(shù)據(jù)進(jìn)行分析,都要求有較高的統(tǒng)計(jì)學(xué)專業(yè)知識,調(diào)查的成本也比非概率抽樣的調(diào)査成本高。有時(shí)在一項(xiàng)研究性項(xiàng)目中,可以把概率抽樣和非概率抽樣相結(jié)合,發(fā)揮各自的特點(diǎn),滿足研究中的不同需求。

6、搜集數(shù)據(jù)的基本方法?

區(qū)分搜集數(shù)據(jù)和調(diào)查方法。

(1)自填式問卷調(diào)查:在無調(diào)查員協(xié)助的情況下由被調(diào)查者自己完成調(diào)查問卷。

(2)面訪式問卷調(diào)查:調(diào)查員與被調(diào)查者面對面提問、被調(diào)查者回答。

(3)電話式調(diào)查問卷:通過各種電訊工具向被調(diào)查者實(shí)施調(diào)查。

(4)觀察式調(diào)查:調(diào)查員通過直接觀察的方式獲取信息。

調(diào)查方式:普查、統(tǒng)計(jì)報(bào)表、抽樣調(diào)查、重點(diǎn)調(diào)查、典型調(diào)查、代表抽樣。

7、數(shù)據(jù)的誤差

數(shù)據(jù)的誤差泛指通過調(diào)查得到的數(shù)據(jù)與研究對象真實(shí)結(jié)果之間的差異,數(shù)據(jù)的誤差有抽樣誤差和非抽樣誤差兩種。

(1)抽樣誤差:由于抽樣的隨機(jī)性引起的樣本結(jié)果與總體真值之間的誤差。它描述的是所有樣本可能的結(jié)果與總體真值 之間的平均性差異。并且是一種隨機(jī)性誤差,只存在于概率抽樣中。

抽樣誤差的影響因素:

①樣本單位數(shù)目,數(shù)目越大,誤差越小
②總體差異程度,差異越大,誤差越大
③抽樣方法:采取不重復(fù)抽樣
④抽樣組織形式,不同組織形式抽樣誤差大小不同

(2)非抽樣誤差:指除抽樣誤差之外的,由于其他原因引起的樣本觀察結(jié)果與總體真值之間的差異。無論是概率抽樣、非概率抽樣,或是在全面性調(diào)查中,都有可能產(chǎn)生非抽樣誤差。

8、誤差的幾種表現(xiàn)及產(chǎn)生原因?

(1)抽樣框誤差:統(tǒng)計(jì)推論的錯(cuò)誤是由于抽樣框的不完善造成的,把這種誤差稱為抽樣框誤差。

(2)回答誤差:指被調(diào)查者在接受調(diào)查時(shí)給出的回答與真實(shí)情況不符。

而導(dǎo)致回答誤差的原因有多種,主要有:

①理解誤差;
②記憶誤差;
③有意識誤差。

(3)無回答誤差:被調(diào)査者拒絕接受調(diào)査,調(diào)查人員得到的是一份空白的答卷。

無回答誤差有時(shí)是隨機(jī)的,有時(shí)是系統(tǒng)性的。

解決無回答的系統(tǒng)性誤差的途徑主要有:

①預(yù)防,即在調(diào)查進(jìn)行前做好各方面的準(zhǔn)備工作,盡量把無回答降到最低程度;

②當(dāng)無回答出現(xiàn)后,分析無回答產(chǎn)生的原因,采取一些補(bǔ)救措施。

(4)調(diào)査員誤差:由于調(diào)查員的原因產(chǎn)生的誤差。

(5)測量誤差:由于測量工具不同產(chǎn)生的誤差。

數(shù)據(jù)的整理與展示
1.數(shù)據(jù)的預(yù)處理?

它是在對數(shù)據(jù)分類或分組之前所做的必要處理,包括數(shù)據(jù)的審核、篩選、排序等。

(1)數(shù)據(jù)審核是檢查數(shù)據(jù)中是否有錯(cuò)誤,對于通過調(diào)查取得的原始數(shù)據(jù)主要從完整性和準(zhǔn)確性兩個(gè)方面去審核,而對于通過其他渠道獲得的二手?jǐn)?shù)據(jù)應(yīng)著重審核數(shù)據(jù)的適用性和時(shí)效性。

(2)數(shù)據(jù)篩選是根據(jù)需要找出符合特定條件的某類數(shù)據(jù)。

(3)數(shù)據(jù)排序是按一定順序?qū)?shù)據(jù)排列,以便研究者通過瀏覽數(shù)據(jù)發(fā)現(xiàn)一些明顯的特征或趨勢,找到解決問題的線索。

2.分類數(shù)據(jù)的整理和圖示?

(1)整理

①頻數(shù):是落在某一特定類別或組中的數(shù)據(jù)個(gè)數(shù)。

②頻數(shù)分布表:將各個(gè)類別及落在其中的相應(yīng)頻數(shù)全部列出,并用表格的形式表現(xiàn)出來。

③比例:是一個(gè)樣本(或總體)中各個(gè)部分的數(shù)據(jù)與全部數(shù)據(jù)之比,通常用于反映樣本(或總體)的構(gòu)成或結(jié)構(gòu)。

④百分比:將比例乘以100得到的數(shù)值。

⑤比率:是樣本(或總體)中不同類別數(shù)據(jù)之間的比值。

(2)分類數(shù)據(jù)的圖示

①條形圖
②帕累托圖
③餅圖
④環(huán)形圖

3.順序數(shù)據(jù)的整理?

向上累積:10%+20%=30%
向下累積:100%-30%=70%

①累積頻數(shù):將各有序類別或組的頻數(shù)逐級累加起來得到的頻數(shù),有向上累積和向下累積。

②累積頻率:將各有序類別或組的百分比逐級累積起來,也有向上累積和向下累積。

4.數(shù)值型數(shù)據(jù)的分組?

分組有單變量值分組(適用于數(shù)據(jù)較少的離散型變量)和組距分組(適用于數(shù)據(jù)多的連續(xù)型變量)。

(1)分組步驟:

①確定組數(shù):一般來說組數(shù)k區(qū)間為5≤k≤15,確定組數(shù)的公式為k=1+lgn≒lg2。

②確定組距:組距是一組上限和下限的差,計(jì)算方法是數(shù)據(jù)最大值減去最小值除以組數(shù)(要采用5或10的倍數(shù))。

③根據(jù)分組整理成頻數(shù)分布表。

(2)組距分組的注意事項(xiàng)

①組距分組需要遵循“不重不漏"的原則即:

“不重”是指一項(xiàng)數(shù)據(jù)只能分在其中的某一組,不能在其他組中重復(fù)出現(xiàn);“不漏"是指組別能夠窮盡,即在所分的全部組別中每項(xiàng)數(shù)據(jù)都能分在其中的某一組,不能遺漏。

為解決“不重”的問題,統(tǒng)計(jì)分組時(shí)習(xí)慣上規(guī)定“上組限不在內(nèi)”,即當(dāng)相鄰兩組的上下限重疊時(shí),恰好等于某一組上限的變量值不算在本組內(nèi),而計(jì)算在下一組內(nèi)。

比如:一組:70—80;二組:80—90

80屬于二組

5.數(shù)值型數(shù)據(jù)的圖示?

①直方圖(分組數(shù)據(jù))

②莖葉圖(未分組數(shù)據(jù))side width=10,則數(shù)據(jù)組11、12、13

③箱線圖(未分組數(shù)據(jù))重點(diǎn)復(fù)習(xí)一下

6.直方圖與條形圖的聯(lián)系與區(qū)別?

聯(lián)系:都是用矩形來表示數(shù)據(jù)的分布情況,當(dāng)矩形寬度相等時(shí)都是用高度來表示數(shù)據(jù)分布情況。

區(qū)別:

①直方圖的高度寬度均有意義,高度表示每一組的頻數(shù)或頻率,寬度表示各組組距,面積表示各組頻數(shù)的多少;條形圖的寬度是固定的,高度表示頻數(shù)多少。

②直方圖的各矩形是連續(xù)排列的,而條形圖是分開排列的。

③直方圖是用來展示數(shù)值型數(shù)據(jù),條形圖用來展示分類型數(shù)據(jù)。

7.鑒別圖形優(yōu)劣的準(zhǔn)則?

①能夠在短時(shí)間內(nèi)給讀者提供大量的信息
②能夠反應(yīng)數(shù)據(jù)的真實(shí)情況
③應(yīng)該是多維的
④能夠洞察問題的實(shí)質(zhì)
⑤能夠?qū)?fù)雜的問題簡明、明確、高效闡述出來

數(shù)據(jù)的概括性度量
1.集中趨勢的度量?

集中趨勢是指一組數(shù)據(jù)向某一中心值靠攏的程度,它反映了一組數(shù)據(jù)中心點(diǎn)的位置所在。

集中趨勢的度量有眾數(shù)、中位數(shù)、分位數(shù)、平均數(shù),通常不同類型的數(shù)據(jù)采用不同的集中趨勢測度值,低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),而高層次數(shù)據(jù)的測度值不適用于低層次的測量數(shù)據(jù)。

2.眾數(shù)、中位數(shù)、平均數(shù)的關(guān)系和應(yīng)用場合?

(1)關(guān)系:從分布的角度看,眾數(shù)始終是一組數(shù)據(jù)分布的最高峰值,中位數(shù)是處于一組數(shù)據(jù)中間位置上的值,平均數(shù)是全部數(shù)據(jù)的算術(shù)平均。

①若數(shù)據(jù)分布為對稱分布
②若數(shù)據(jù)分布為左偏分布
③若數(shù)據(jù)分布為右偏分布





(2)眾數(shù)、中位數(shù)和平均數(shù)的特點(diǎn)與應(yīng)用場合

①眾數(shù)是一組數(shù)據(jù)分布的峰值,不受極端值的影響。其缺點(diǎn)是具有不唯一性,眾數(shù)只有在數(shù)據(jù)量較多時(shí)才有意義,當(dāng)數(shù)據(jù)量較少時(shí),不宜使用眾數(shù)。眾數(shù)主要適合作為分類數(shù)據(jù)的集中趨勢測度值。眾數(shù)不唯一。

②中位數(shù)是一組數(shù)據(jù)中間位置上的代表值,不受數(shù)據(jù)極端值的影響。中位數(shù)主要適合作為順序數(shù)據(jù)的集中趨勢測度值。

③平均數(shù)是對數(shù)值型數(shù)據(jù)計(jì)算的,而且利用了全部數(shù)據(jù)信息,它是實(shí)際中應(yīng)用最廣泛的集中趨勢測度值。

當(dāng)數(shù)據(jù)呈對稱分布或接近對稱分布時(shí),3個(gè)代表值相等或接近相等,這時(shí)則應(yīng)選擇平均數(shù)作為集中趨勢的代值。但平均數(shù)的主要缺點(diǎn)是易受數(shù)據(jù)極端值的影響,對于偏態(tài)分布的數(shù)據(jù),平均數(shù)的代表性較差。因此,當(dāng)數(shù)據(jù)為偏態(tài)分布,特別是當(dāng)偏斜程度較大時(shí),可以考慮選擇眾數(shù)或中位數(shù)。

3.離散程度的度量?

數(shù)據(jù)的離散程度,它反映的是各變量值遠(yuǎn)離其中心值的程度。數(shù)據(jù)的離散程度越大,集中趨勢的測度值對該組數(shù)據(jù)的代表性就越差;反之,離散程度越小則代表性就越好。

離散程度的度量有異眾比率、四分位差、極差、平均差、標(biāo)準(zhǔn)差、方差、離散系數(shù)。

(1)異眾比率是指非眾數(shù)組的頻數(shù)占總頻數(shù)的比例,用表示



異眾比率主要用于衡量眾數(shù)對一組數(shù)據(jù)的代表程度。異眾比率越大,說明非眾數(shù)組的頻數(shù)占總頻數(shù)的比重越大,眾數(shù)的代表性越差;反之,代表性越好。異眾比率主要適合測度分類數(shù)據(jù)的離散程度,對于順序數(shù)據(jù)以及數(shù)值型數(shù)據(jù)也可以計(jì)算異眾比率。

(2)四分位差是上四分位數(shù)與下四分位數(shù)之差,用Qd=Qu-Ql表示。(先排序再計(jì)算)

四分位差反映了中間50%數(shù)據(jù)的離散程度,其數(shù)值越小,說明中間的數(shù)據(jù)越集中;其數(shù)值越大,說明中間的數(shù)據(jù)越分散。四分位差不受極端值的影響。

極差:一組數(shù)據(jù)的最大值與最小值之差稱為極差,也稱全距,用R表示。

其計(jì)算公式為:



平均差:也稱平均絕對離差,它是各變量值與其平均數(shù)離差絕對值的平均數(shù)。

方差:各變量值與其平均數(shù)離差平方的平均數(shù)。

標(biāo)準(zhǔn)差:方差的平方根。

4.相對位置度量的經(jīng)驗(yàn)法則?

(全面背誦)

當(dāng)數(shù)據(jù)對稱分布時(shí),經(jīng)驗(yàn)法則表明:約有68%的數(shù)據(jù)在平均數(shù) +1個(gè)標(biāo)準(zhǔn)差范圍內(nèi);約有95%的數(shù)據(jù)在平均數(shù) +2個(gè)標(biāo)準(zhǔn)差范圍內(nèi);約有99%的數(shù)據(jù)在平均數(shù) +3個(gè)標(biāo)準(zhǔn)差范圍內(nèi)。

當(dāng)不是對稱分布,則運(yùn)用切比雪夫不等式(至少有



的數(shù)據(jù)落在 k 個(gè)標(biāo)準(zhǔn)差之內(nèi)),則至少有75%的數(shù)據(jù)在平均數(shù)2個(gè)標(biāo)準(zhǔn)差范圍內(nèi);至少有89%的數(shù)據(jù)在平均數(shù)3的標(biāo)準(zhǔn)差范圍內(nèi);至少有94%的數(shù)據(jù)在平均數(shù)4個(gè)標(biāo)準(zhǔn)差范圍內(nèi)。

+1個(gè)標(biāo)準(zhǔn)差范圍內(nèi):29 30 31
+3個(gè)標(biāo)準(zhǔn)差范圍內(nèi):27 30 33

5.相對離散程度:

離散系數(shù)是一組數(shù)據(jù)的標(biāo)準(zhǔn)差與其相應(yīng)的平均數(shù)之比。

計(jì)算公式為:



離散系數(shù)是測度數(shù)據(jù)離散程度的相對統(tǒng)計(jì)量,主要是用于比較不同樣本數(shù)據(jù)的離散程度。離散系數(shù)大,說明數(shù)據(jù)的離散程度也大;離散系數(shù)小,說明數(shù)據(jù)的離散程度也小。

6.偏態(tài)與峰態(tài)的度量

(考前兩個(gè)周背誦公式)

偏態(tài)及其測度:它是對數(shù)據(jù)分布對稱性的測度。測度偏態(tài)的統(tǒng)計(jì)量是偏態(tài)系數(shù),記作SK。

(1)未分組數(shù)據(jù):

如果一組數(shù)據(jù)的分布是對稱的,則偏態(tài)系數(shù)等于0;如果偏態(tài)系數(shù)明顯不等于0,表明分布是非對稱的。若 偏態(tài)系數(shù)大于1或小于一1,被稱為高度偏態(tài)分布;若偏態(tài)系數(shù)在0.5?1或-1~0.5之間,被認(rèn)為是中等偏態(tài)分布;偏態(tài)系數(shù)越接近0,偏斜程度就越低。




抽樣與抽樣分布
(統(tǒng)計(jì)量概念找課本)

1.次序統(tǒng)計(jì)量:

設(shè)X1 X2 X3...Xn為總體X中抽取的樣本, 稱為第i個(gè)次序統(tǒng)計(jì)量,它是樣本X1 X2 X3...Xn滿足以下條件的函數(shù):每當(dāng)樣本得到一組觀測值X1 X2 X3...Xn時(shí),將其從小到大排序,第i個(gè)值 就作為次序統(tǒng)計(jì)量 的觀測值,而X1 X2 X3...Xn稱為次序統(tǒng)計(jì)量。

2.充分統(tǒng)計(jì)量:

統(tǒng)計(jì)量加工過程中一點(diǎn)信息都不損失的統(tǒng)計(jì)量。

3.抽樣分布:

抽樣分布是從容量為N的總體中抽取容量為n的樣本時(shí),所有可能的樣本統(tǒng)計(jì)值所形成的分布。假設(shè)從容量為N的有限總體中最多可以抽取m個(gè)容量為n的不同樣本,那么把所有m個(gè)樣本統(tǒng)計(jì)值形成頻率分布,就是抽樣分布。抽樣分布是研究樣本分布與總體分布之間關(guān)系的橋梁。

4.中心極限定理:設(shè)從均值為μ,方差為σ^2(有限)的任意一個(gè)總體中抽取樣本量為n的樣本,當(dāng)n充分大時(shí),樣本均值X的抽樣分布近似于服從均值為μ、方差為σ^2/n的正態(tài)分布。基于此,中心極限定理就是,隨著樣本量n的增大(n≥30),不論原來的總體是否服從正態(tài)分布,樣本均值的抽樣分布都將趨于正態(tài)分布,其分布的數(shù)學(xué)期望為總體均值μ,方差為總體方差的1/n。

(公式要進(jìn)行背誦)

參數(shù)估計(jì)
(公式背誦并理解)

1.參數(shù)估計(jì)的基本原理?

參數(shù)估計(jì)就是用樣本統(tǒng)計(jì)量去估計(jì)總體參數(shù),在參數(shù)估計(jì)中,用來估計(jì)總體參數(shù)的統(tǒng)計(jì)量稱為估計(jì)量,根據(jù)一個(gè)具體的樣本計(jì)算出來的估計(jì)量的數(shù)值稱為估計(jì)值。參數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。

2.點(diǎn)估計(jì)和區(qū)間估計(jì)

(1)點(diǎn)估計(jì):是用樣本統(tǒng)計(jì)量的某個(gè)取值直接作為總體參數(shù)的估計(jì)值。

(2)區(qū)間估計(jì):是在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間通常由樣本統(tǒng)計(jì)量加減估計(jì)誤差得到。

3.置信區(qū)間和置信水平

(1)置信區(qū)間:由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間,其中區(qū)間的最小值稱為置信下限,最大值稱為置信上限。

(2)置信水平(置信度/置信系數(shù)):置信區(qū)間中包含總體參數(shù)真值的次數(shù)所占的比例。

4.評價(jià)估計(jì)量的標(biāo)準(zhǔn)?

評價(jià)估計(jì)量的標(biāo)準(zhǔn)有三個(gè):無偏性、有效性、一致性。

①無偏性,指估計(jì)量抽樣分布的數(shù)學(xué)期望等于被估計(jì)的總體參數(shù)。

②有效性,指對同一總體參數(shù)的兩個(gè)無偏估計(jì)量(有效估計(jì)量一定是無偏估計(jì)量),有更小標(biāo)準(zhǔn)差的估計(jì)量更有效。

③一致性,指隨著樣本量的增大,點(diǎn)估計(jì)量的值越來越接近被估計(jì)總體的參數(shù),即一個(gè)大樣本給出的估計(jì)量要比一個(gè)小樣本給出的估計(jì)量更接近總體的參數(shù)。

5.對置信區(qū)間的理解需要注意的地方?

(1)如果用某種方法構(gòu)造的所有區(qū)間中有95%的區(qū)間包括總體參數(shù)的真值,5%的區(qū)間不包括總體參數(shù)的真值,那么用該方法構(gòu)造的區(qū)間稱為置信水平為95%的置信區(qū)間。(其他置信水平的區(qū)間也可這樣表示)

(2)總體參數(shù)的真值是固定的、未知的,而用樣本構(gòu)造的區(qū)間則是不固定的。置信區(qū)間是一個(gè)隨機(jī)區(qū)間,若抽取不同的樣本,用該方法可以得到不同的區(qū)間。

(3)在實(shí)際問題中,進(jìn)行估計(jì)時(shí)往往只抽取一個(gè)樣本,此時(shí)所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(例如95%)下的置信區(qū)間。由于用該樣本構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,而不再是隨機(jī)區(qū)間,所以無法知道這個(gè)樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值。我們只能希望這個(gè)區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個(gè),但它也可能是少數(shù)幾個(gè)不包含參數(shù)真值的區(qū)間中的一個(gè)。

假設(shè)檢驗(yàn)
(計(jì)算題考的概率比較大)

1.假設(shè)檢驗(yàn)和參數(shù)估計(jì)的區(qū)別

參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,它們都是利用樣本對總體進(jìn)行某種推斷,但推斷的角度不同。參數(shù)估計(jì)討論的是用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的方法,總體參數(shù)在估計(jì)前是未知的。而在假設(shè)檢驗(yàn)中,則是先對的值提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。

2.假設(shè)檢驗(yàn)的基本原理?

回答相關(guān)問題都要回答這一部分。

假設(shè)檢驗(yàn)是指利用樣本信息判斷假設(shè)是否成立的過程,它是先對總體參數(shù)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過程。

(1)原假設(shè)是研究者想收集證據(jù)予以反對的假設(shè)。

(2)備擇假設(shè)通常是研究者想要收集證據(jù)予以支持的假設(shè)。

(3)假設(shè)檢驗(yàn)的目的主要是收集證據(jù)拒絕原假設(shè)。

3.兩類錯(cuò)誤:

當(dāng)原假設(shè)為真時(shí)拒絕了假設(shè)稱為第一類錯(cuò)誤,也稱棄真錯(cuò)誤,概率用α表示;當(dāng)原假設(shè)為假時(shí)沒有拒絕原假設(shè)稱為第二類錯(cuò)誤,也稱取偽錯(cuò)誤,概率用β表示。

4.P值的含義與決策步驟?

P值就是當(dāng)原假設(shè)為真時(shí)所得到的樣本觀察結(jié)果或更極端結(jié)構(gòu)出現(xiàn)的概率。用P值進(jìn)行決策的準(zhǔn)則是值<α,拒絕H0;P值 >α,不拒絕H。

如果P值很小,說明這種情況發(fā)生的概率很小,而如果出現(xiàn)了,依據(jù)小概率原理,就有理由拒絕原假設(shè)。P值越小,拒絕H0的理由越充分。

5.假設(shè)檢驗(yàn)的基本步驟?假設(shè)檢驗(yàn)的基本原理+P值+假設(shè)檢驗(yàn)的基本步驟?

(1)根據(jù)問題的要求給出原假設(shè)H0,同時(shí)給出備擇假設(shè)H1。

(2)在H0成立的前提下,選擇合適的檢驗(yàn)統(tǒng)計(jì)量,這個(gè)統(tǒng)計(jì)量應(yīng)包括要檢驗(yàn)的參數(shù),同時(shí)它的分布已知。

(3)根據(jù)顯著性水平α,按照備擇假設(shè)H1和檢驗(yàn)統(tǒng)計(jì)量的分布,寫出小概率事件及其概率表達(dá)式。

(4)由樣本值計(jì)算出檢驗(yàn)統(tǒng)計(jì)量的數(shù)值,并查出對應(yīng)的臨界值。

(5)依據(jù)計(jì)算結(jié)果作出拒絕H0或接受H0的決策。



    回復(fù)

    使用道具 舉報(bào)

    您需要登錄后才可以回帖 登錄 | 注冊 人人連接登陸

    本版積分規(guī)則   

    關(guān)閉

    您還剩5次免費(fèi)下載資料的機(jī)會哦~

    掃描二維碼下載資料

    使用手機(jī)端考研幫,進(jìn)入掃一掃
    在“我”中打開掃一掃,
    掃描二維碼下載資料

    關(guān)于我們|商務(wù)合作|小黑屋|手機(jī)版|聯(lián)系我們|服務(wù)條款|隱私保護(hù)|幫學(xué)堂| 網(wǎng)站地圖|院校地圖|漏洞提交|考研幫

    GMT+8, 2026-4-30 22:00 , Processed in 0.091510 second(s), Total 9, Slave 8(Usage:7M, Links:[2]1,1_1) queries , Redis On.

    Powered by Discuz!

    © 2001-2017 考研 Inc.

    快速回復(fù) 返回頂部 返回列表
    × 關(guān)閉