精華3
威望31
K幣310 元
注冊時間2012-5-18
在線時間60 小時
最后登錄2014-9-22
一般戰友

- 精華
- 3
- 威望
- 31
- K幣
- 310 元
- 注冊時間
- 2012-5-18
|
|
★啟用前機密★ 北京大學碩士研究生入學考試試題考試科目:社會學研究方法和分支學科研究方法考試時間:2011年1月10日下午14:00-17:00 招生專業:社會學 研究方向:社會學各方向
1992年社會學方法五、統計計算題(一般考生答第1、2題,單獨考試考生答第3、4題,共35分)1、①在實際調查中研究樣本容量時應考慮哪些因素?②欲在某大城市進行一項抽樣調查以了解某幾類殘疾患者占總人口之比例,根據所掌握的資料和專家判斷,可斷定這幾類殘疾患者的比例最高不會超過5%。問在概率為95.45%的情況下,若采用簡單隨機抽樣,樣本容量應為多大?(提示:由正態分布概率表可知φ(t)=95.45%,t=2)2、據研究認為某高校教職工月平均工資高于110元。從該校隨機抽取100名職工進行調查,結果樣本職工月平均工資 元,標準差s=43.89元,試問該校職工月平均工資是否高于110元?(顯著性水平α=0.05)(15分)(提示:Z =1.65,Z =1.96)六、問答及計算(共35分)1、試用分布理論簡述算術平均數、中位數和眾數三者之間的關系。(15分)2、《中國社會統計資料》(1990年版)公布我國近年來離婚率如下:年份 | 1984 | 1985 | 1986 | 1987 | 1988 | 離婚率(‰) | 0.88 | 0.88 | 0.95 | 1.08 | 1.20 | 試依據以上資料,選擇適當的計算方程式,對1992年的離婚率作出預測。(20分) 1993年社會學方法四、計算題(16分)為了研究生育率與婦女平均受教育程度之間的關系,隨機抽查了某省16個縣,以下是按等級統計的結果:縣名 | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | 生育率等級 | 1 | 2.5 | 2.5 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11.5 | 11.5 | 13.5 | 13.5 | 15 | 16 | 婦女受教育程度等級 | 5.5 | 5.5 | 1 | 2 | 3 | 9.5 | 5.5 | 13.5 | 9.5 | 16 | 5.5 | 11.5 | 8 | 15 | 11.5 | 13.5 |
問:婦女生育率與平均受教育程度間是否有關?(α=0.05)【注:采用Z檢驗與t檢驗均可,Z =1.96,t =2.306】 1994年社會學方法四、計算題1、某村共有5000人,根據統計,村民的月收入為正態分布N(200,50 )。問:若某村民月收入為300元,那么,比他收入高的村民應有多少人?(10分)2、根據某項調查,有如下列聯表: | 男 | 女 | 同意 | 30() | 10() | 不同意 | 20() | 40() | 未表態 | 10() | 10() | 問:①寫出期望列聯表。②期望列聯表是根據什么假設寫出來的? (10分)3、設家庭社會經濟地位分上、中、下三等,以下是它與子女受教育情況的統計: | 上 | 中 | 下 | 小學 | 10 | 10 | 30 | 中學 | 20 | 20 | 30 | 大學 | 30 | 20 | 10 | 試選擇一恰當的關聯系數并計算它的數值。(10分)4、根據統計,子輩受教育程度與父輩受教育程度存在著線性相關性。設:父輩受教育年限的平均值為 ,標準差為S =1年,子輩受教育年限的平均值為 ,標準差為S =2年,x和y的相關系數為r =0.5。問:若已知某人受教育年限為7年,則預測其子輩受教育年限點估計值是多少?(10分) 1995年社會學方法二、為研究承包制后職工平均收入是否已超過原有的300元,作100人的抽樣調查,結果有: (平均收入)=314元, s(標準差)=80元。問:上述看法是否得以證實?(α=0.05)【已知φ(1.65)=0.95,φ(1.96)=0.975】(20分)三、關于社會角色與人們的精神健康之間的關系,眾說紛紜。有人說社會角色擁有量可以增進健康,有人持相反觀點。為此,某研究人員作了共214人的調查:社會角色擁有量精神健康 | 過多 | 中度 | 較少 | 良好 | 20 | 13 | 35 | 一般 | 35 | 20 | 20 | 較差 | 43 | 18 | 10 |
試選擇一恰當的系數,描述二者之間的關系,并解釋該系數的涵義。(20分) 1996年社會學方法三、設某村民小組共有10戶,他們的家庭人口數分別為:4,10,4,4,5,5,4,5,4,5。問:①家庭平均人口數是多少?②標準差是多少?③如果從中作簡單隨機抽樣(有效回收),每次抽4戶,那么標準誤差(樣本平均值的標準差)是多少?(10分)四、有兩名學生A和B,分別在自己的班上都考得80分。但學術A的班級平均分為70分,標準差為10分;學生B的班級平均分為65分,標準差為18分。問:兩名學生(A和B)誰在班上的成績更好些?(10分)五、根據抽樣調查結果,得出收入(y)與受教育年限(x)的回歸方程為:=300+20x。問:①若受教育年限為15年,則收入的回歸預測值是什么?②有人為了檢驗所得的回歸預測值是否正確,調查2名受教育年限為15年的職工,結果他們的收入都不等于回歸的預測值。這是為什么?(假定回歸方程的計算是無誤的)六、根據人口普查,某的嬰兒死亡率為40‰。為了檢驗普查數據的可靠性,對該地又作了一次抽樣調查。結果是100名新生嬰兒的死亡率為30‰。問:①根據題意檢驗的要求,確定顯著性水平。②寫出原假設和備擇假設。③對人口普查數據的可靠性做出判斷。(Z =1.65,Z =1.96,Z =2.58) 1997年社會學方法四、為了解某地今年人民的生活比去年是否有所改善,隨機抽查8戶人家。結果有7戶生活有改善,1戶生活下降了。試用符號檢驗法,推論該地人民的生活是否比去年有所提高(α=0.05)(20分)寫出:①原假設 ______②備擇假設 ③檢驗過程 ④推論結果(α=0.05) 五、若根據列聯表1: 計算出用于檢驗的統計量:那么,根據列聯表2: 計算出用于檢驗的統計量 應等于什么?(20分)(注意:表2中所有格值都是表1相應格值的K倍) 1998年社會學方法三、問答題(5分×2)1、設總體X服從正態分布N(μ, ),其中μ已知, 未知。設 、 、 是取自總體X的一個樣本,試指出:(1) + + (2) +2μ (3) (4)max{ , , }(5) (6)μ (7) (8) (9) +哪些是統計量?哪些不是統計量?為什么?2、為調查某地高校畢業生對求職的意向,從中抽取了200名應屆畢業生。問總體、個體、樣本、樣本容量各指什么?五、計算題(10分+20分)1、為研究體制改革前后企業生產效益的變化,隨機抽查了6家企業。結果表明它們中有4家效益增加了,其余為下降。試用一檢驗方法指出上述抽樣結果能否推論到總體,認為改革后企業效益增加了。(α=0.05)2、設有以下兩個二元重復情況下的方差分析:AB | | | | | 12 | 78 | 1314 | | 34 | 910 | 1516 | | 56 | 1112 | 1718 | AB | | | | | 12 | 1314 | 78 | | 34 | 910 | 1516 | | 56 | 1112 | 1718 | 問:①兩表中哪些離差平方和相同?②兩表中哪些離差平方和不同? 1999年社會學方法四、統計題1、設某企業職工收入都在1000元以下。下面是它的收入分布直方圖(圖略):【題意大致如下:0-100,100-200,200-300,300-400,400-500元的均占0.05;500-600,600-700,700-800元的所占比例均相等;800-900的占0.2;900-1000元的占0.1】試問收入在500-800元之間直方圖的高度應是多少?(10分)2、設某單位共有10名員工。根據上級指示,年終獎金可供選擇發放的標準有三檔:100元,200元和300元。問:①如果平均獎金為200元,標準差為0元,那么該單位選擇的獎金是哪幾檔?每檔獎金各有幾人?②如果平均獎金為200元,標準差為100元,那么該單位選擇的獎金是哪幾檔?每檔獎金各有幾人?③如果平均獎金為200元,能否設計是標準差超過100元的獎金方案?每檔獎金各有幾人?(10分)3、設根據職業(A)與地區(B)來分析收入差別。其中職業分5類,地區分5類。得如下方差分析分析表:方差來源 | 變量A | 變量B | 剩余 | 總平方和 | 平方和 | | | | | 自由度 | | | | | 平均平方和 | | | | | F值 | | | | | 臨界值 | | | | |
已知: =247.22, =42.50, =39.47。求表中其它各值:① = ② = ③ = ④ = ⑤ = ⑥ = ⑦ = ⑧ = ⑨ =⑩若α=0.01, =4.77, =4.77,將對變量A和變量B作何結論?(α=0.01)(20分) 2000年社會學方法四、選擇題(4分×5)1.如果有兩個估計量同時滿足參數估計“無偏”的評價標準,但我們選擇了方差小的估計量,這是因為在置信區間相同的情況下,參數估計的: a)置信區間小 b)置信區間大 c)可靠性好 d)顯著性小 e)把握大2.當樣本容量增加時: a)總體方差增加 b)樣本方差增加 c)樣本方差減少 d)樣本標準誤減少 e)樣本標準誤增加3.如果拒絕了原假設,犯第一類錯誤(以假當真)的概率是: a)1 b)1/2 c)0 d)∞ e)說不定4.為了解某村改革開放近10年來的變化,對該村10年前隨機抽樣所得的樣本又進行了重訪調查。這樣的比較研究屬于: a)獨立樣本 b)個案樣本 c)隨機樣本 d)典型樣本 e)配對樣本5.研究人員為了說明調查結果的眾值具有很好的代表性,他應指出: a)較大的異眾比例 b)較小的異眾比例 c)較小的極差 d)較大的方差 e)較小的方差五、填空題(10分)以下是5個單元測量X和Y變量的等級值,問:同序對為:___________異序對為:___________X同序對為:_________Y同序對為:_________X、Y同分對為:______六、計算題(10分) 根據已有資料,缺碘兒童占某村兒童綜述的50%。經過補碘,隨即抽查400名,缺碘兒童為168名。問補碘是否收到成效?(顯著水平:α=0.05) 寫出:(1)原假設及備擇假設 (2)樣本統計量及其觀察值 (3)樣本統計量的臨界值(α=0.05) (4)檢驗過程及其結論 2001年社會學方法四、判斷題(1分×20)(每一選項都必須做正誤判斷,在右側橫線處用√表示正確,用×表示錯誤)①可以根據定序變量的取值,來進行(a)計算平均值 ____ (b)對案例進行分類 (c)比較等級差別 ____ (d)比較確切差距 ②根據下面所提供的相關系數,判斷相應的回歸方程是否正確。(a)r=0.7, (b) r=0.7, ___ (c) r=-0.5, (d) r=-0.5, ___ __③要保證更大的置信度,可以通過以下方式:(a)縮小置信區間 (b)減少偏差 _____(c)擴大樣本規模 (d)提高精度 ______④一個自變量的回歸系數的統計性很顯著,說明(a)該自變量對因變量有很大的實際影響 (b)該自變量對因變量很可能有影響 __(c)該自變量對因變量很可能沒有影響 (d)該自變量對因變量根本沒有影響 ___⑤無偏估計,指的是(a)樣本規模越大,抽取一個樣本的統計值越接近總體參數 (b)所抽某個樣本的統計值正好等于總體參數 (c)所有可能樣本的估計的平均數等于總體參數 (d)處于總體參數兩側一定區間之內的樣本估計 五、在下表劃線處計算填空,并判斷 檢驗的結論(共20分)隨機樣本的觀察頻數分布為:期望頻數分布為:;其自由度df= (請填空);對應這一自由度的臨界值 。請判斷以下每項結論的正確與否:以上統計結果說明① 檢驗在α=0.05水平統計顯著 ② 檢驗在α=0.01水平統計顯著 ③ 檢驗在α=0.05水平統計不顯著 如果擴大樣本規模2倍,那么①得到新的 統計值大約是現在的2倍 ②得到新的 檢驗的自由度是現在的2倍 ③得到新的統計顯著水平α大約是現在的2倍 2002年社會學方法四、判斷題(1分×20,每一選項都必須做正誤判斷,在右側橫線處用√表示正確,用×表示錯誤)①增多觀測樣本規模n,(a)有時是為了保證抽樣分布可以近似看作正態分布 (b)有時是為了提高估計精度 (c)在所有條件下都能減少估計的誤差 (d)在所以條件下都能減少估計的偏差 (e)在所有條件下都能取得精度上的邊際收益 ②已知兩個非標準化的定距變量y和x之間的相關系數等于-0.5,用y作為因變量對x做簡單回歸時,(a)決定系數肯定等于0.25 (b)回歸系數肯定為正值 (c)標準化回歸系數肯定為正值 (d)標準化回歸系數值與回歸系數值肯定不相同 (e)如果相關系數統計性顯著則回歸的統計性肯定也顯著 ③當檢驗兩個變量之間的相關性是否顯著時,如采用 檢驗時,通常表明:(a)兩個變量都是定類變量 (b)兩個變量都是定序變量 (c)兩個變量都是定距變量 (d)一個是定類變量,另一個是定距變量 (e)一個是定類變量,另一個是定序變量 ④在估計總體參數時,說某種估計具有一致性是指:(a)這種估計的抽樣分布與總體分布的類型相同 (b)這種估計的期望值等于總體參數 (c)這種估計的標準誤小于總體的標準差 (d)當觀察頻數增加時,這種估計的偏差會越來越小 (e)當觀察頻數無限增加時,這種估計的標準誤等于0 五、統計計算與分析題(共20分,將下表抄錄于答題紙上,根據提供的信息,計算MSS指標和F指標)二元方差分析表Dependent Variable:初中入學率Source | SS | Df | MSS | F | Sig. | 民族 | 316.75 | 2 | | | 0.002 | 居住地類型 | 266.67 | 1 | | | 0.001 | Error | 348.58 | 20 | | | | Total | 932.00 | 23 | | | |
2003年社會學方法五、統計學判斷選擇題(3分×10)①標準誤(a)的大小與樣本規模呈反向變化 (b)是樣本方差的平方根(c)是總體方差的1/n(注:n為樣本規模) (d)是置信區間誤差范圍的1/2②中心極限定理說明不管總體是什么分布,隨著樣本規模增大,其統計量的抽樣分布將越來越接近于(a)總體分布 (b)標準正態分布 (c)正態分布 (d)t分布③在回歸分析中,如果改變的自變量的測量單位,(a)回歸系數將不發生變化 (b)回歸系數的顯著性將發生變化(c)標準化回歸系數將發生變化 (d)確定系數將不發生變化④ 檢驗很顯著說明列聯表(a)變量之間的相關強度很高 (b)的變量關聯不太可能是出于抽樣誤差(c)的條件分布與邊緣分布很近似 (d)的觀測頻數與相應期望頻數差異很小⑤在多元回歸中,整體檢驗顯著但單個自變量檢驗都不顯著,說明(a)各自變量對因變量都沒有顯著影響 (b)各自變量與因變量為非線性關系(c)需要對各自變量先進行標準化 (d)各自變量之間存在高度線性相關⑥方差分析通常應用于(a)兩個類別的樣本平均值之間的差異 (b)兩個類別的總體平均值之間的差異(c)多個類別的樣本平均值之間的差異 (d)多個類別的總體平均值之間的差異⑦第一類統計檢驗錯誤(a)指在 不真實情況下接受了 (b)的標準概率在社會學中通常設為0.01(c)在希望接受 時應受到特別關注 (d)的概率很小表示差異的統計性很顯著⑧兩個變量之間的偏相關系數為負值意味著(a)兩者之間的偏回歸系數也是負值 (b)兩者的相關系數存在著正偏差(c)兩者的簡單相關系數的絕對值更大 (d)兩者的相關系數存在著負偏差⑨說某一樣本統計量是總體參數的無偏估計是指(a)抽出的某樣本的統計量等于總體參數 (b)其抽樣分布的平均值等于總體參數(c)其抽樣分布的標準誤小于某一范圍(d)當樣本規模增大時其抽樣分布的平均值越來越接近總體參數⑩95%概率的接受區間(a)是以樣本統計量為中心的一個值域 (b)指總體參數有95%概率落入其間(c)的值域寬度與95%置信度寬度相等 (d)如包容樣本統計量在內便拒絕六、統計計算與統計分析1、對隨機抽樣樣本中的城鄉家庭是否擁有電視機的觀測頻數列交互表如下:觀測頻數( ) | 居住地區 | 合計 | 農村 | 城市 | | 是否有電視機 | 無 | 10 | 2 | 12 | 有 | 6 | 12 | 18 | 合計 | 16 | 14 | 30 |
①將下表格式抄錄答題紙上并計算 檢驗所需要的期望頻數。(共4分,每空1分) ②該 檢驗的自由度d.f.=?(3分)③請推測這一分析背后的備選假設是什么,并做簡要文字表達?(3分)④該交互表的 =7.232,相應的Sig.=0.007這一統計結果的意義是什么?(5分)2、對同一數據研究“收入”,建立了兩個多元回歸分析模型。設:收入, =受教育年限, ={0=城市,1=農村}得以下結果:第一模型:第二模型:①分析第一模型所揭示的自變量的作用,指出城鄉差異所在。(5分)②寫出第二模型中的城鄉各自的回歸線方程并畫出相應的簡單圖示。(5分)③比較分析兩個模型關于收入與教育的關系假設在城鄉之間有何不同。(5分)總的來說,出題思路有一定變化,多元回歸以前從來沒考過,選擇中也有, 所以大家統計一定要全面復習,基本原理很重要,選擇題出的很有水準,有些很迷惑。今年的理論比去年簡單,人口和勞動沒考,沒有偏題,方法強調基本原理的理解,不用記太多公式。 2004年社會學方法 七、統計分析題 1、假設檢驗題:成數檢驗,拒絕時犯第一種錯誤的概率 2、回歸分析題,照搬了去年的最后一題,改了一下問題 2005年社會學方法五、統計選擇題10道,關于標準誤的,卡方分析的,回歸自變量的單位變化的,顯著度含義的(這幾個好象近來每年都考),消減誤差比例的,t檢驗的,自由度問題的,還有三道不記得了。 七、計算題1.方差分析題20分,能計算三個方差和,自由度,和F值,能知道過程和結果的含義就可以了。2.回歸分析題10分,整體檢驗顯著,單個自變量檢驗不顯著的問題.總的來說,方法今年有所變化,開始比較注重實際運用;統計沒明顯變化,不注重計算,只注重理解和邏輯. 2006年社會學方法
六、統計
1.方差分析
2.回歸分析 定類-定類雙邊量分析 03年的原題,城鄉電視的那個 2007年社會學方法六、統計選擇題(3分×10)
1回歸方程中兩變量簡單相關系數為正,偏相關系數為負。下面說法哪個正確?
A 兩變量負相關 B
C兩變量還受其它因素的影響 D
2 X可以解釋Y的81%的變動,則
A 決定系數為0.81 B
C r為0.9 D 共變差為81%
3 如果使用方差分析,則一般情況下表明兩變量
A都是定類變量 B一個是定類變量,一個是定距變量
C 一個是定序變量,一個是定距變量 D兩個都是定距變量
4 對一個分布進行線性調整,則
A 斜率不變 B 顯著度會發生變化
C截距不變 D 解釋力下降
5 顯著度α
A 表示正確拒絕H0的概率 B表示α是否定域占總面積的比例
C 錯誤地接受H0的概率 D6 中心極限定理表示
A當n→∞時,樣本觀測值的分布是正態分布
B 當n→∞時,樣本觀測值等于總體均值7抽樣分布的含義是
A 是總體值的理論分布 B 是樣本觀測值的實際分布
C 總體中觀測值的概率分布 D 樣本中觀測值的概率分布8接受區間
A 是以總體假設值為中心的 B 就是置信區間
9如果一個量的估計值等于其總體均值,那么,這個值叫做
A無偏估計 B七、計算題:(15分×2)1、根據居民樓100戶的抽樣調查,居民用于食品的支出平均占家庭總支出的比例為75%,標準差為20%.問:
(1)有關食品支出占家庭總支出的比例,平均為70%的說法是否成立?寫出具體計算過程(α=0.05)
(2)如果拒絕了食品支出占家庭總支出的比例為70%的說法,則可能犯錯誤的概率為多少? 2、對同一數據研究“收入”,建立了兩個多元回歸分析模型.設y=收入,x1=受教育年限,
當x2=0時表示城市,當x2=1時,表示農村.得到以下結果:
第一模型: y=40+6x1-5x2
第二模型:y=36+7x1+4x2—2x1x2
1) 分析第一模型所揭示的兩變量的作用,指出城鄉差異所在;并說明兩個模型的理論假設有什么不同。2)寫出第二模型中的城鄉各自的回歸線方程并畫出相應的簡單圖示
3)比較分析兩個模型關于收入與教育的關系假設在城鄉之間有何不同 2008年社會學方法
六、統計學選擇題(3分×10)
1、無偏估計:基本定義
2、下列那些不具有消除誤差比例的性質: A判定系數,B相關系數, CD
3、列聯表中卡方檢驗顯著說明: A不太可能是處于變量的偶然性因素BCD
4、t檢驗
5、極限與樣本規模
6 在多元回歸中,整體檢驗顯著但單個自變量檢驗都不顯著,可能是因為:
A變量之間有高度的線性相關BCD
7、正態分布與雙尾檢驗
8、回歸分析
9、XY相關
10、t分布的性質七、計算題(15分×2)
1、樣本均值、區間估計、單正態總體均值檢驗 2、方差分析(需將表格抄于答題紙上)
下面是有關一些民族地區與經濟發展水平的方差分析表: | 自由度 | F值 | 顯著度 | 組間 | | 16 | 0.030 | 組內 | 220 | | | 總的 | 1640 | 29 | |
1)除了填出表中的括號,還需要補充其他需要填的內容(6分)2) 1.指出題目中原假設是什么
2.指出分析中的因變量是什么3.自變量的作用是什么
4.可能犯那一種錯誤5.犯錯的概率是多少6.樣本規模是多大
7. 忘記了(共9分)
方法基本上不是很難,在復習時要把袁方的書狠過,巴比的書也很重要,把兩本書對比著看,最好把筆記落實在紙上。統計也簡單,主要是盧淑華的社會統計學和郭的量化方法,盧的書是基本的,郭的書主要得看懂多元部分就可以,不要被抽樣那幾章嚇倒。 2009年社會學方法六、統計單選題(3分×10)1 置信區間用于: A 參數估計 B假設檢驗 C D2下列關于非參數檢驗說法正確的是: A非參數檢驗一般用于定類-定序變量 B卡方檢驗是一種非參數檢驗 C非參數檢驗的靈敏度比相關參數檢驗高3方差分析用于:
A一般自變量為定類變量 因變量為定距變量
B一般自變量為定距變量因變量為定類變量 CD4 估計量的有效性是指: A抽樣分布的標準差小BCD5下列那些不具有消除誤差比例的性質:
A相關系數r B斯皮爾曼等級相關系數 C列聯相關的系數 D忘記6 如果X與Y 為相關關系,則: A、X是自變量 Y是因變量 B、X是因變量 Y是自變量 C、X與Y的關系有可能是其它變量所引起 D、以上三種都有的情況是可能的7 極限定理說明
A 隨著樣本規模的增加抽樣分布的標準誤減小
B 隨著樣本規模的增加抽樣分布越來越接近總體分布 CD七、統計計算題(第1題20分,第2題 10分)1、平均家庭規模Famisize 受兩個變量影響 一個是城鄉屬性urban(城市=1,鄉村=0)另一個是少兒人口比 children 平均家庭規模 Famisize標準差為0.5 以上三個變量的多元回歸方程為:Famisize=3.8-0.28urban + 0.05 children ,標準偏回歸系數(β) 0.00[url=]0.4 [/url] 0.3
問:1)如果以上數據均統計顯著,請對以上回歸方程做全面的分析(16分)
2)根據以上數據求出少兒人口比的標準差(寫出計算過程)(4分)2、專家說大學生的平均智商為120,現有一隨機抽樣數據得觀測值為123,抽樣規模為100
問:1)對專家的說法進行檢驗(α=0.05)(5分)
2)如果我們否定專家的說法,犯錯誤的概率是多少(5分)
|
評分
-
查看全部評分
|