文档库 最新最全的文档下载
当前位置:文档库 › 社会统计学复习题

社会统计学复习题

社会统计学复习题
社会统计学复习题

《社会统计学》复习题

考试题型:

一、填空(1*20=20)

二、单选(1*10=10)

三、多选(2*5=10)

四、判断(2*5=10)

五、计算题(5*8=40)

六、分析题(1*10=10)

一、填空题

1、大量观察法之所以称为统计上特有的方法,是与()的作用分不开的。

2、大数定律的一般意义是:在综合大量社会现象的数量特征时,个别单位偶然的数量差异会(),使大量社会现象的数量特征借助于()形式,接近用确定的数值显示出必然的规律性。

3、要了解有个班级学生的学习情况,则总体是(),总体单位是()。

4、凡是相邻的两个变量值之间可以连续不断分割的变量,称为()。凡是各变量值之间是以整数断开的变量,称为()。

5、统计按其内容主要包括两个方面:描述统计和()。

6、推论统计有两个基本内容:参数估计和()。

7、通过抽样得到的用以推断总体特征的那个“部分”,在统计学上称为()。样本中所含的单位数,在统计学上称为样本大小,也叫做()。

8、()是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。()是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。

9、()误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。()误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。

10、统计调查从调查范围上分,可分为()和()。

11.()误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。

12基尼系数为(),表示收入绝对不平均;基尼系数为(),表示收入绝对平均。

13、统计表通常有一定格式,统计表各部位的名称分别是()、横行标题、纵栏标题、()。

14、实际收入分配情况则由洛仑兹曲线表示,一般表现为一条下凹的弧线,下凹程度愈大,收入分配(),反之,则收入分配()。

相关:洛仑兹曲线是一种用来反映社会收入分配平均程度的累计百分数曲线。洛仑兹曲线的特点是在纵轴和横轴两个方向上都进行累计。

20世纪初意大利经济学家基尼(Gini)根据洛仑兹曲线提出了一种判断社会收入分配平均程度的指标,用G表示。设实际收入分配曲线和收入分配绝对平均线之间的面积为A,实际收入分配曲线右下方的面积为B,并以A除以A+B的商表示不平均程度,这个数值被称为基尼系数。

15、对于连续变量,恰是某一组限的数据应按照()的原则归入相应的组别。

16、某班级中男生人数所占比重是66.7%,则男生和女生的比例关系是()。

17、在频数分布图中,()标示为曲线的最高点所对应的变量值。

18、在频数呈偏态分布时,()必居于X和M0之中。

19、对于未分组资料,如总体单位数是偶数,则中间位置的两个值的算术平均数就是()。

20、对收集来的数据,数值最大者和最小者之差叫作(),又称之为()。

21、指出下列变量可能需要采用的测量尺度:

(1)年龄(2)学历(3)社会等级(4)利润率

(5)雇员所在岗位

22、假设检验思想中,无论在作出接受或拒绝假设时,都不可能做到百分之百的正确性,通常会犯两类错误:和,假设检验中的显著性水平是指允许犯________错误的概率。

23、数据的离散程度可以通过以下描述性统计量来测量:、、、。

24、定理是研究在什么条件下,随机变量之和的分布可以近似为正态分布。

25.统计按其内容划分,主要包括________统计和________统计两个方面。

26.相关关系按方向不同,可分为____ ______和_____ _____。

27、在数据的各种计量尺度中,有绝对零点的计量尺度是。

28、一元一次回归方程Y=a+bx中的a表示。

29、以样本统计量估计总体参数,要求估计量的数学期望等于被估计的总体参数,这一数学性质称为。

30、参数的点估计必须满足、和。

31、中位值适用于、和。

二、判断题

1、在区间估计中,置信度和精度是相互制约的。 ( )

2、中位值适用于定类、定序和定距变量。()

3、不论是相关分析还是回归分析,都必须确定自变量和因变量。 ( )

4、在进行方差分析之前必须先对因变量的分布进行等方差性检验。()

5、列联表分析是针对表格中的相对频数进行的。()

6、统计分析内容主要分两部分:统计描述和统计推论。()

7、数据的离散程度可以通过方差、极值和众数等描述性统计量来测量。()

8、假设检验思想中,无论在作出接受或拒绝假设时,都不可能做到百分之百的正确性。()

9、在进行方差分析之前必须先对因变量的分布进行等方差性检验。()

10、列联表分析是针对表格中的相对频数进行的。()

二、单选题

1、要了解400个学生的学习情况,则总体单位是( ) 。

A 400个学生

B 每一个学生

C 400个学生的成绩

D 每一个学生的成绩

2、下列属于定距变量的是 ( ) 。

A 职工的工龄

B 职工的性别

C 职工的籍贯

D 职工的政治面貌

3对某市高等学校的科研所进行调查,则统计总体是()。

A 某市所有的高等学校

B 某一高等学校的科研所

C 某一高等学校

D 某市所有高等学校的科研所

4将总体按与研究有关的标志进行分层,然后再随机地从各层中抽选单位组成样本。这种抽样方式叫()。

A 简单随机抽样

B 分层抽样

C 等距抽样

D 整群抽样。

5.下面能进行除法运算的测量尺度是()。

A 定比尺度

B 定类尺度

C 定距尺度

D 定序尺度

6.教育程度是()的测量。

A 定比尺度

B 定类尺度

C 定距尺度

D 定序尺度

7.智商是()的测量。

A 定比尺度

B 定类尺度

C 定距尺度

D 定序尺度

8.籍贯是()的测量。

A 定比尺度

B 定类尺度

C 定距尺度

D 定序尺度

9.某城市男性青年27岁结婚的人最多,该城市男性青年结婚年龄为26.2岁,则该城市男性青年结婚的年龄分布为()。

A.右偏 B.左偏

C.对称 D.不能作出结论

10.下面四个平均数中,只有()是位置平均数。

A 算术平均数

B 中位数

C 调和平均数

D 几何平均数

11.关于算术平均数的性质,不正确的描述是()。

A 各变量值对算术平均数的偏差和为零;

B 算术平均数受抽样变动影响微小;

C 算术平均数受极端值的影响微小;

D 各变量值对算术平均数的偏差的平方和,小于它们对任何其它数偏差的平方和。

12.在社会统计学中,()是反映集中趋势最常用、最基本的平均指标。

A 中位数 B算术平均数C 众数 D几何平均数

13.下面资料中哪个厂子的平均工资代表性意义最大(),哪个厂子最小()。

平均工资(元)职工人数工资标准差(元)

A 甲厂 108 346 9.80

B 乙厂 96 530 11.40

C 丙厂 128 210 12.10

D 丁厂 84 175 9.60

14.某企业1994年职工平均工资为5200元,标准差为110元,1998年职工平均工资增长了40%,标准差扩大到150元。职工平均工资的相对变异( )。 A 增大 B 减小 C 不变 D 不能比较

15.已知离散性随机变量x 服从参数为λ=2的泊松分布,则概率P (3;λ)=( )。

A 4/3e2

B 3/3e2

C 4/3e3

D 3/3e3

16.当群体的规模逐渐增大,以至于不回置抽样可以作为回置抽样来处理时,( )分布可以用二项分布来近似。

A t 分布

B F 分布

C 2χ分布

D 超几何分布

17、只与一个自由度有关的是( )

A 2

χ分布 B 超几何分布 C 泊松分布 D F 分布

18.关于t 分布,下面哪种说法不正确( )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本

D 可用样本标准差S 代替总体标准差σ 19.二项分布的数学期望为( )。

A n(1-n)p

B np(1- p)

C np

D n(1- p)。

20.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为( )。 A 大于0.5 B -0.5 C 1 D 0.5。 21.在统计检验中,那些不大可能的结果称为( D A 检验统计量 B 显著性水平 C 零假设 D 否定域

22.对于大样本双侧检验,如果根据显著性水平查正态分布表得Z α/2=1.96,则当零假设被否定时,犯第一类错误的概率是( )。 A 20% B 10% C 5% D .1%

23.设离散型随机变量X ~),2(p B ,若数学期望4.2)(=X E ,方差

44.1)(=X D ,则参数p n ,的值为( )

A 4=n ,p =0.6

B 6=n ,p =0.4

C 8=n ,p =0.3

D 12=n ,p =0.2

24.如果统计量的抽样分布的均值恰好等于被估计的参数之值,那么这一估计便可以认为是( )估计。

A 有效

B 一致

C 无偏

D 精确

25.虽然随机样本和总体之间存在一定的误差,但当样本容量逐渐增加时,统计量越来越接近总体参数,满足这种情况,我们就说该统计量对总体参数是一个( )的估计量。 A 有效 B 一致 C 无偏 D 精确

26.估计量的( )指统计量的抽样分布集中在真实参数周围的程度。 A 有效性 B 一致性 C 无偏性 D 精确性

27.抽自两个独立正态总体样本均值差(1X ―2X )的抽样分布是( )。

A N(μ1―μ2,121n σ―222n σ)

B N(μ1―μ2,121n σ+222n σ)

C N(μ1+μ2,121n σ―222n σ)

D N(μ1+μ2,121n σ+222n σ)

28.两个大样本成数之差的分布是( )。

A N(∧

1p -∧

2p ,

111n q p ―

222n q p ) B N(∧1p -∧

2p ,

111n q p +

222n q p )

C N(∧

1p +∧

2p ,

1

11n q p ―

2

22n q p ) D N(∧

1p +∧

2p ,

1

11n q p +2

22n q p )

29.为了检验两个总体的方差是否相等,所使用的变量抽样分布是( )。

A F 分布

B Z 分布

C t 分布

D 2χ分布

30.配对小样本的均值d 的抽样分布是( )。

A Z 分布

B 自由度为n 的t 分布

C 自由度为(n —1)的t 分布

D 自由度为(n —1)的2

χ分布

31.在σ12和σ22未知,但可假定它们相等的情况下,σ的无偏估计量∧

S 是( )。

A 2

212

2211-++n n nS S n B 2

212

2211-++n n nS S n ?

2

121n n n n +

C 2

12

1n n n n +σ D

2

22

1

2

1n n σσ+

五、计算题 (一)

1.某工厂50名职工每周工资数分配情况如下表,试求: 1)平均差;2)第1及第3四分位数;

工资数(元) 人数 60-62 3 63-65 10 66-68 20 69-71 13 72-74 4 合计

50

1.平均差2.316;第一四分位数 65.35 第三四分位数 69.54 (二)

1.根据统计,北京市初婚年龄服从正态分布,其均值为25岁,标准差为5岁,问25岁到30岁之间结婚的人,其百分数为多少?

2.共有5000个同龄人参加人寿保险,设死亡率为0.1%。参加保险的人在年初应交纳保险费10元,死亡时家属可领2000元。求保险公司一年内从这些保险的人中,获利不少于30000元的概率。

3.为了验证统计报表的正确性,作了共50人的抽样调查,人均收入的结果有:

,871元=X 元,21=S 问能否证明统计报表中人均收入μ=880元是正确的(显著性水平

α=0.05)。

4.某单位统计报表显示,人均月收入为3030元,为了验证该统计报表的正确性,作了共100人的抽样调查,样本人均月收入为3060元,标准差为80元,问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α=0.05)。

5.已知初婚年龄服从正态分布,根据9个人的抽样调查有:5.23=X (岁),

3=S (岁)。问是否可以认为该地区平均初婚年龄已超过20岁(α=0.05)?

6.某地区成人中吸烟者占75%,经过戒烟宣传之后,进行了抽样调查,发现了100名被调查的成人中,有63人是吸烟者,问戒烟宣传是否收到了成效?(α=0.05)

7.据原有资料,某城市居民彩电的拥有率为60%,现根据最新100户的抽样调查,彩电的拥有率为62%。问能否认为彩电拥有率有所增长?(α=0.05)

8.一个社会心理学家试图通过实验来表明采取某种手段有助于增加群体的凝聚力。但有16个小组,将它们配对成一个实验组和控制组,实验组和控制组各有8个小组,问怎样用二项分布去检验无效力的零假设,列出检验所需的零假设,计算抽样分布,用显著水平0.05,请指出否定域。

1.【84.13%】 【34.13%】

已知μ=25,σ=5,z 1=

σ

μ

-1x =

5

25

25-=0 z 2=

σ

μ

-2x =

5

25

30-=1 P (z 1≤Z ≤z 2)=P (0≤Z ≤1)=0.3413

2.【98.75%】

3.不能,因为Z=-3.03<-1.96,所以否定原假设μ=880

4. 可以,因为Z=3.75〉1.96,所以可以拒绝原假设μ=3030,即可以认为统计报表有误

5.可以,因为t=3.2998〉1.8595,所以可以拒绝原假设μ=20,可以认为平均初婚年龄已超过20岁。

6. 1H 0.75,H 0.75?=<。=0.05,Z 1.65αα=。0.630.75

Z 0.75*0.25*/100

-==-2.77<-1.65.所以拒绝原假设,接受备择假设。

7.不能,因为Z=0.408<1.65,所以接受原假设p=60%,不能认为彩电拥有率有所增长 8.在社会研究的实验法中,此为“双组实验设计”,其步骤是:1)用匹配或随机指派的方法将实验对象一半分到控制组一半分到实验组;2)对实验组实施实验刺激但不对控制组实施这种刺激;3)然后同时对控制组和实验组进行测量,即后测;4)在比较和分析

两个组后测结果之间的差别,得出实验刺激的影响。由此,我们先将16个组两两匹配,得到8个配对组(要使每个配对组在除实验变量之外的其他方面尽量相似)。然后在每个配对组中任取一组安排于实验组,另一组安排于控制组。接着,在4-8年的时间内,让分到实验组的8组人接受某种手段,如共同游戏,而控制组的8组人则没有这样做。而后对每个配对组分别进行后度测量,并用“+”号表示实验组比控制组好的那些配对组,用“-”表示实验组比控制组差的那些配对组。除非度量方法很粗燥,每配对组应该都能判断出差异。这样便可以用二项分布做实验无效的检验了。

0H :p=0.5,1H :p>0.5,选用0.1的显著性水平。()()78P P 0.03910.1+=<,

()()()678P P P 0.1836>0.1++=,所以否定域由7个“+”和8个“+”组成,即对每配对组

进行后测度量,如出现7个“+”和或8个“+”时,在0.1的显著性水平上,我们将否定零假设,说明实验有效。否则就不能否定零假设,也就是说实验无效

(三)

1.某社区要选派8名积极申请参加公益活动的居民从事一项宣传活动。申请者为12名女性居民和8名男性居民。社区宣传活动的组织者把他们的名字完全混合后放在一个盒子里,并从中抽取8个。试问,抽出4名女性居民的概率是多少?

2.有16名二年级学生和14名三年级学生选修了社区管理课。假设所有学生都会来教室上课,而且是随机进入教室的。试问,当一名学生进入教室时,恰逢已在教室就坐的5位都是三年级的概率是多少?

1.0.275 2.0.0140 (四)

1.已知初婚年龄服从正态分布,根据21个人的抽样调查有:5.23=X (岁),

3=S (岁),求置信水平为95%的初婚年龄的置信区间。(已知t 0。05(21) =1.721、

t 0。05(20) =1.725、t 0。025(21) =2.080、t 0,025(20) =2.086)。

2.某工厂妇女从事家务劳动时间服从正态分布N (μ,2

66.0)。根据36人的随机抽样调查,每天平均从事家务劳动时间X 为:X =2.65小时。求μ的双侧置信区间(置

信度取0.95和0.99两种)。

3.根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地区拥有电冰箱成数P 的置信区间(置信度为0.95)。

1. 【2

2.10,24.90】

已知α=0.05,t 0,025(20) =2.086,

1-n S =1

213-=0.67 X ±2

/αt 1

-n S

=23.5±2.086?0.67=23.5±1.39762 置信区间为22.10和24.90之间

2. 【2.4344,2.8656】、【2.3662,2.9338】 已知α=0.05,2/αz =1.96,X -2

/αZ n S ≤μ≤X +2/αZ n

S ,2.65±1.96?

36

66.0=【2.4344,2.8656】

已知α=0.01,2/αz =2.58,X -2

/αZ n S ≤μ≤X +2/αZ n

S ,2.65±2.58?36

66.0=【2.3662,2.9338】

3. 【0.5040,0.6960】

已知α=0.05,2/αz =1.96,置信区间为 (∧

p -2/αZ n pq ,∧

p +2/αZ n pq

)0.6±1.96?100

4

.0*6.0=【0.5040,0.6960】

(五)

1.独立随机样本取自均值未知,标准差已知的两个正态总体。如果第一个总体的标准差为0.73,抽出的样本容量为25,样本均值为6.9;第二个总体的标准差为0.89,抽出的样本容量为20,样本均值为6.7。试问,两个总体的均值是否显著相等(α=0.05)?

2.对两所学校学生组织的社会活动获奖情况进行调查,发现甲校共组织60次,有18次获奖;乙校共组织40次,有14次获奖。据此,能否认为乙校获奖次数的比例高于甲校

(α=0.05)?

3.为研究睡眠对记忆的影响,在两种条件下对人群进行了试验。(1)在早7点放电影,被测者晚上睡眠正常,第二天晚上就电影的50项内容进行测试;(2)在早7点放电影,被测者白天情况正常,同一天晚7点就电影的50项内容进行测试。样本是独立的,每组人数15人,测试结果为:1X =37.2个正确, S 1=3.33,n 1=15;2X =35.6个正确, S 2=3.24,n 2=15。假定两种条件下总体均服从正态分布,且方差相等,是否认为睡眠对记忆有显著影响(α=0.05)?

1.Z=0.81<1.96, 接受H 0:μ1―μ2=0 2.Z= —0.5253<1.96, 接受H 0:μ1―μ2=0

3.)(21X X -∧

σ=0.6618,t=2.4176>2.048,拒绝H 0:μ1―μ2=0 ,认为平均的睡眠组的得分较高。 (六)

1.对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。 对于民族音乐的 态度(Y )

年岁(X )

Σ

老 中 青 喜 欢 不喜欢 38 38 30 15 33 46

Σ

2.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。 身高(cm ) 171 167 177 154 169 体重(kg ) 53 56 64 49 55 身高(cm )

175

163

152

172

162

体重(kg ) 66 52 47 58 50

1.①相对频数的联合分布列联表 对于民族音乐的 态度(Y )

年岁(X )

Σ

老 中 青 喜 欢 不喜欢 0.19 0.19 0.15 0.075 0.165 0.23

Σ

②转化为相对频数的条件分布列联表 对于民族音乐的 态度(Y )

年岁(X )

Σ

老 中 青 喜 欢 不喜欢 0.53 0.54 0.39 0.47 0.46 0.61

Σ

③民族音乐的态度与被调查者的年岁有关系 2. 编号

(cm )x

体重 (kg )y

xy

1 171 53 29241 2809 9063

2 167 56 27889 3136 9352

3 177 6

4 31329 4096 11328 4 154 49 23716 2401 7546

5 169 55 28561 3025 9295

6 175 66 30625 4356 11550

7 163 52 26569 2704 8476

8 152 47 23104 220

9 7144 9 172 58 29584 3364 9976 10

162

50 26244 2500 8100 合计 1662

550

276862

30600

91830

2

x 2

y

2

2

2

2

n xy x y r 0.89n x (x)

n y (y)

-=

=--∑∑∑∑∑∑∑

22

n xy x y b 0.659

n x (x)y x a=b 54.479n n

y=a+bx=-54.479+0.659x

-=

=--=-∑∑∑∑∑∑∑

斯皮尔曼相关系数

2s 2

6d r 1-

0.94

n(n -1)

==∑

【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X 】

3.为了研究职业与家庭子女数之间的关系,随机地抽出了41户家庭进行了调查,调查三种职业家庭的子女数的资料如下:

工人:1,3,4,4,6,2,3,4,3,5,2,4;

干部:3,5,0,5,4,4,2,3,1,3,2,3,3,2,4,2,6,1; 知识分子:6,4,2,2,3,0,5,3,1,2,1。 要求:(1)求三种职业家庭户均子女数; (2)求总变差、组内变差和组间平方和; (3)编制方差分析表;

(4)检验不同职业的生育观是否有显著的不同。 (5)计算职业与子女数量之间的相关比率。

3、 (1)、(2)略;(3)见下表;(4)由于F o =0.72<F 0.05 (2,38)=3.24,接受H 0:不同职业的生育观没有显著的不同;(5)0.0381

SS 自由度 MS 统计量 临界值 显著性

组间组内总3.5934 2 1.7967 0.72 3.24 94.4066 38 2.4843

98.000 40

(七)

1、一个学生数学期末成绩是84,该门功课成绩的平均分是76,标准差是10,他物理期末成绩是90,该门功课成绩的平均分是82,标准差是16,她在哪门功课中的名次更前?

84-76/10=0.8

90-82/16=0.5

数学成绩更靠前

2、为了研究某地居民用于请客送礼的费用,我们调查了该地区225户家庭,平均每个家庭每月支出43元,标准差为10.5,对该地区家庭平均每月请客送礼的花费进行区间估计。(显著性水平为0.05)[41.63,44.37]

3、现要考查某学校大一学生的英语水平,随机抽取120名学生的期末英语成绩作为样本,均值是56,样本标准差是18.5,是否可以认为该校学生英语成绩不及格(即小于60分)?(显著性水平为0.05)

4、已知某炼铁厂的含碳量服从正态分布N(4.55, 0.108),现在测定了9炉铁水,其平均含碳量为 4.484。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为 4.55 ( =0.05) 。

5、为了了解男性和女性对体育运动的偏好,某民意测量机构专门做了一次调查,得到如下的一组资料:

性别最喜爱的运动项目

篮球足球羽毛球高尔夫球

男14 24 13 19 女10 11 13 16

取0.05的显著性水平,试检验男性与女性对体育运动项目的偏好是否存在显著的差异?

2

χ(3)=7.815

0.05

2

χ=2.41,不存在显著差异。

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

2021年自考《社会统计学》习题及答案(卷二)

2021年自考《社会统计学》习题及答案(卷二) 一、填空 1.( )是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。( )是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。 2.如果考虑到资料的时间过程,凡某一特定时刻的资料称为( );凡某时期内变动累计的资料称为( )。 3.( )调查就是根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选择有代表性的单位,做周密细致的调查。 4.( )误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。( )误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5. 统计误差有( )和( )两类,其中( )在全面调查和非全面调查中都可能发生。 6.对在全国钢产量中占很大比重的十大钢铁企业进行钢产量生产调查,这种调查方式属于( )。 7.统计调查从调查范围上分,可分为( )和( )。 8.统计调查按调查登记时间是否连续,可分为( )和( )。 9.统计调查从调查目的上,可分为( )和专项调查。 10.( )误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。

二、单项选择 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫( )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 2.搞好重点调查的关键是( ) 。 A 力求统一要求和统一行动 B 选择好重点单位 C 选择最有代表性的单位 D 遵循随机原则。 3.下列资料,属于静态资料的是( ) 。 A 某厂89年职工工资总额为76万元; B 某乡89年粮食总产量为1亿3千万公斤; C 某市89年末人口为36.3万人; D 某市89年征用土地125亩。 4.关于统计调查的组织形式,下面正确的描述有( )。 A 普查是一种专门组织的一次性调查; B 满足一定条件,重点调查的结果可以用来推断总体; C 抽样调查是一种全面调查; D 典型调查是在研究现象的总体中,选择其中的重点单位进行调查。 5.应用( )方式抽取样本时,必须避免抽样间隔和现象本身的节奏性或循环周期相重合。 A 随机抽样 B 系统抽样 C 整群抽样 D 分层抽样 6.下面能进行除法运算的测量尺度是( )。

(完整版)社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) χ分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P I=( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

社会统计学自考真题

浙江省2006年4月高等教育自学考试 社会统计学试题 课程代码:00278 一、填空题(本大题共8小题,每空1分,共10分) 请在每小题的空格中填上正确答案。错填、不填均无分。 1.统计资料整理阶段的基本方法是________。 2.调查人员从记录社会现象的各种载体中获取所需信息的调查方法,称为________。 3.若采用异距分组,________用来反映单位组距内分布的频数。 4.将所有变量值按大小顺序排列,中位数就是________的变量值。 5.已知各期的环比发展速度,应采用________法计算平均发展速度。 6.时间数列的两个基本构成要素是________和________。 7.推论统计的两个基本内容是________和________。 8.在数据的各种测量尺度中,既可进行加减运算,也可进行乘除运算的测量尺度是________。 二、单项选择题(本大题共30小题,每小题1分,共30分) 在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号内。错选、多选或未选均无分。 1.一个总体单位( ) A.只能有一个标志 B.只能有一个指标 C.可以有多个标志 D.可以有多个指标 2.政治算术学派的代表人物是( ) A.康令 B.格朗特 C.凯特勒 D.恩格尔 3.要了解某企业员工的收入,则总体单位是( ) A.该企业的全部员工 B.该企业每个员工的收入水平 C.该企业的每一个员工 D.该企业全部员工的平均收入水平 4.下列属于品质标志的是( ) A.工人年龄 B.工人性别 C.工人体重 D.工人工资等级 5.实际工作中,最常用的分类抽样是( ) A.定额分配 B.等额分配 C.定比分配 D.异比分配 6.抽样调查应遵循的原则是( ) A.灵活性 B.准确性 C.可靠性 D.随机性

《社会统计学》作业(共享含部份答案)

社会统计学作业 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是( A ) A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C )A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是( D ) A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( B ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A ) A. 39.19

B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( A ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( B ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( D ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( D ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( D ) A. 相关系数 B. 离散系数 C. 回归系数 D. 判定系数

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

社会统计学习题 卢淑华

1、P58习题十五 人数户数 0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21 (1)试作频率统计表,直方图和折线图 (2)试求均值和标准差 2、P59习题十六 设以下是七十二名离婚者的婚龄的统计(见下表)。 (1)试作频率统计表、直方图和折线图 (2)试求众值、中位值和均值,并做简单讨论。 (3)试求四分互差和标准差。 婚龄人数 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 1 3、P59习题十七 设以下是1209名抽烟者年龄的统计(见下表) 年龄人数 21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89 (1)试作频率统计表、直方图和折线图 (2)试求四分互差。 4、P72例10 某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?

5、P73例12 根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少? 6、P75例13 为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少? 7、P75例14 某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少? 8、P76例16 根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少? 9、P77例17 某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少? 10、P78例18 某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20 设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少? 12、P83例22 10人抓阄,其中共有2张球票,问第2个人抓到球票的概率? 13、P85例23 设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。设上海厂得正品率为90%;北京厂的正品率为95%,天津厂的正品率为97%。问(1)任抽一件为正品的概率是多少?(2)在抽得产品是正品的情况下,是上海厂的概率是多少? 14、P99例27 已知随机变量的概率分布为 ξ13.4 13.5 13.6 13.7 13.8 P(ξ=Xi)0.05 0.15 0.60 0.15 0.05 求σ2=? 15、P106习题三 某班对全班订报纸情况进行了统计,中订《人民日报》的有45%;订《北京晚报》的有80%;两种报纸都订的有30%,试求以下事件的概率。 (1)只定人民日报的 (2)至少订以上一种报纸的 (3)只订以上一种报纸的 (4)以上两种报纸都不订的 16、P107习题6 根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4,问现年60岁的人活到70岁的概率为多少?

2008年中山大学823社会研究方法和社会统计学考研真题【圣才出品】

2008年中山大学823社会研究方法和社会统计学考研真题 中山大学 2008年攻读学位研究生入学考试试题 科目代码:823 科目名称:社会研究方法和社会统计学 社会研究方法部分(75分) 一、名词解释(每小题3分,共18分) 1.社会研究(social research) 2.双盲实验(double—blind experiment) 3.探索性研究(exploration research) 4.封闭式问题(closed—ended questions) 5.同期群研究(cohort studies) 6.语义差异量表(semantic differential scale) 二、简答题(每题7分,共21分) 1.在问卷调查中,一般都是采取由样本“自我报告”或“自我陈述”的方式进行测量。请问:有哪些因素干扰这种测量方式的可靠性? 2.请解释“经典实验设计”(the classical experiment design,也称双组前后测模式)

的基本含义及其基本要素。 3.在抽样中,影响样本规模(sample size)确定的因素主要有哪些? 三、分析:请从下列各小题中任意选择三小题予以回答,多选无效(每题12分,共36分) 1.请简单解释社会研究中的“创新原则”的基本意义,并列举研究中的创新都有哪些方式。 2.对问卷调查的批评之一是认为在测量中将会受到“研究者的主观预设”的影响从而妨碍资料及其研究的真实可靠性,请谈谈你的看法。 3.常有人说可以在一个实证研究项目中结合使用“定量研究方法”和“定性研究方法”,你认为这种结合有没有可能性,如果有,可以采取什么样的具体方式? 4.简述“理论检验”的程序并试举一例说明(不要求在每一步都举例)。 社会统计学部分(75分) 一、选择题(在ABCD四项答案中选择一项最合适的答案写在答题纸上,每题2分,共20分) 1.下列哪种基本技术最适合描述职业的分布() A.折线图 B.直方图 C.箱线图 D.环形图

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

2018年春社会统计学期末复习训练题 (4)

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

社会统计学_1_试题卷

山东工商学院 2020学年第一学期社会统计学课程试题 A卷 (考试时间:120分钟,满分100分) 特别提醒:1、所有答案均须填写在960数字加起来827参考答案207上,写在试题纸上无效。 2、每份答卷上均须准确填写函授站、专业、年级、学号、姓名、课程名称。 一单选题 (共20题,总分值40分 ) 1. 标准差的大小取决与()(2 分) A. 平均水平的高低 B. 各标志值与平均水平离差的大小 C. 标志值水平的高低 D. 各标志值与平均水平离差的大小和平均水平的高低 2. 当变量X的值减少时,变量Y的值也随之减少,则变量X与变量Y之间存在()(2 分) A. 直线相关关系 B. 曲线相关关系 C. 正相关关系 D. 负相关关系 3. 抽样调查和典型调查都是非全面调查,二者的根本区别在于()。(2 分) A. 灵活程度不同 B. 作用不同 C. 组织方式不同 D. 选取调查单位的方法不同 4. 统计报表大多数属于()。(2 分) A. 一次性全面调查 B. 经常性全面调查 C. 经常性非全面调查 D. 一次性非全面调查 5. 分配数列中,当标志值较小的一组权数较大时,计算出来的算术平均数()。(2 分) A. 接近标志值大的一方 B. 接近标志值小的一方 C. 不受权数的影响 D. 不能确定其移动方向 6. 在一定的抽样平均误差条件下,()(2 分)

A. 扩大极限误差范围,可以提高推断的可靠程度 B. 扩大极限误差范围,会降低推断的可靠程度 C. 缩小极限误差范围,可以提高推断的可靠程度 D. 缩小极限误差范围,不改变推断的可靠程度 7. 对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算各自的()来比较。(2 分) A. 标准差系数 B. 平均差 C. 全距 D. 均方差 8. 反映样本指标与总体指标之间的平均误差程度的指标是()(2 分) A. 抽样误差系数 B. 概率度 C. 抽样平均误差 D. 抽样极限误差 9. 下列相对指标中,可以用有名数表示的有()。(2 分) A. 计划完成相对指标 B. 结构相对指标 C. 动态相对指标 D. 强度相对指标 10. 在销售量综合指数中,表示()(2 分) A. 商品价格变动引起销售额变动的绝对额 B. 价格不变的情况下,销售量变动引起销售额变动的绝对额 C. 价格不变的情况下,销售量变动的绝对额 D. 销售量和价格变动引起销售额变动的绝对额 11. 下列调查中,调查单位与填报单位一致的是()(2 分) A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 12. 已知某企业总产值2001年比1998年增长187.5%,2000年比1998年增长150%,则2001年比2000年增长()(2 分) A. 37.5% B. 125% C. 115% D. 15% 13. 如果两变量之间的相关系数为-1,说明两变量之间存在()(2 分)

社会统计学期末复习题与答案整理

社会统计学期末复习训练 一、单项选择题(20=2×10) 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样 本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是.样本 2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查, 以推断所有家庭的年均收入水平。这项研究的总体是 332.1户家庭的年均收入 3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查, 以推断所有学生的每月生活费用水平。这项研究的总体是 22000名学生的每月生活费用 4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级 6.下列变量属于数值型变量的是工资收入 7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的 机会入选样本,这样的抽样方式称为.简单随机抽样 8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从 女生中抽取8名学生进行调查。这种调查方法属于分层抽样 9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽 样的方式抽取子样本,这样的抽样方式称为分层抽样 10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前 十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于系统抽样 11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率 12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率 13.在频数分布表中,频率是指各组频数与总频数之比 14.在频数分布表中,比率是指不同小组的频数之比 15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图 17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图 18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 89 20.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分 别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.2 22.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那 么该班考试成绩的中位数是88 23.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值 近似为5.5小时

11级本科社会统计学试题A

2011—2012学年第二学期期末考试 2011级社会工作本科专业《社会统计学》试题A (本试卷满分100分,考试时间110分钟) 特殊说明:本考试允许使用计算器。 一、填空题(每小题1分,共10分) 1.凡不能用数量的多少来表示而只能文字表述的标志,称为________。 2. 变量数列中各组标志值出现的次数称,各组单位数占单位总数的比重称_____。 3. 在位置平均数中,出现频率最高的变量值称为__________。 4. 各变量值对其算术平均数离差的平方的算术平均数,称之为________。 5.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于________分布。 6.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越________,原假设为真而被拒绝的概率越________. 7.参数估计,即由样本的指标数值推断总体的相应的指标数值,它包括点估计和_______。8.如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应增大到____倍. 9.符号检验的零假设就是配对观察结果的差平均起来等于________。 10.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是________变量。 二、判断题(每小题1分,共10分) ( )1. 重点调查的单位是有意识的从总体中挑选出来的,通常是那些地位较特殊的单位。( )2. 将收集到得的数据分组,组数越少,丧失的信息越多。 ( )3.根据组距式数列计算得到的算术平均数只能是一个近似值。 ( )4.标准差的数值越小,则其平均数的代表性越大,说明该组变量值分布越集中。( )5. 把随机现象的全部结果及其概率,或者把随机现象的或几个结果及其概率列举出来,就可以称作概率分布。 ( )6.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。 ( )7.泊松分布的数学期望和方差是相等的。 ( )8.样本均值是总体均值的一个无偏估计量。 ( )9.在参数估计中,概率度的大小由显著性水平 所决定,它可以认为是决定区间估计信度的关键因素。 ( )10.配对样本均值差的区间估计是两个的单样本区间估计。 三、单项选择题(每小题2分,共20分) 1.按变量的连续性,可把变量分为( ) 。 A 连续变量和随机变量 B 离散变量和确定性定量

社会统计学综合练习题资料

社会统计学期末复习训练 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是()A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业

7月份利润额均值为( ) A. 39.19 B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( ) A. 相关系数

社会统计学作业四

社会统计学试题[七] 一、选择题[对的O,错的×;每小题1分,共10分] 1.定序层次变量的数学运算特征有[ A ] A.=、≠; B。>、<; C。+ 、-; D。×、÷ 2.反映随机变量如何围绕均值变化的有[ D ] A.极差B。四分位差C。方差D。标准差 3.在正态分布曲线中,当均值不变,方差变小时,则对应曲线[ C] A.右移B。左移C。变尖D。变矮胖 4.在不同总体间,定距测量层次的个案取值进行比较,采用以下哪一个指标较合理[ D ] A.绝对值B。标准分C。原始数据D。均值 5.在参数估计中,衡量估计值好坏的标准是[ AB D ] A.无偏性B。有效性C。分散性D。一致性 6.样本容量一定,则置信度越大,置信区间[ B ] A.愈窄B。愈宽C。不变D。不确定 7.在小样本正态总体均值假设检验中,若总体方差未知,则可用 作检验的为[ B ] A.Z检验B。T检验C。F检验D。卡方检验 8.若真实状况并非如原假设所示,但接受了原假设,则出现了[A] A.弃真错误B。纳伪错误C。甲种误差 D.乙种误差 9.两个定类变项的χ2检验是通过[ D ]进行的? A.相对频次 B.绝对频次 C.二者皆是 D. 以上都不是 10.社会统计学中,大样本是指样本容量大于或等于[ D ] A.10 B。20 C。30 D。50 二、判断题[每小题1分,共5分] 1.在消减误差比例公式中,E1表示在知道X的情况下,预测Y所 产生的全部误差。[ ×] 2.向下累加频次是指在统计表中由下向上累加所得的频次[ ×] 3.英语考试成绩的标准分为零,则表示他的成绩正好等 正好等于平均分数若某同学。[ √] 4.在单元中,如果是以同序对为主,则表示变量X和变量Y呈正相关。[ √] 5.相关关系是研究变量间的一种函数关系的。[ √] 三、计算题[共85分] 试求:①均值②方差③标准差④中位值⑤四分位差 ①众值[本题满分15分]

相关文档
相关文档 最新文档