1.当正态总体方差未知时,在大样本条件下,估计总体均值使用的分布是( )。 A 、z 分布 B 、t 分布 C 、F 分布
D 、2
χ分布
2.数据筛选的主要目的是( )。
A 、发现数据的错误
B 、对数据进行排序
C 、找出所需要的某类数据
D 、纠正数据中的错误
3.为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名进行调查,这种调查方式是( )
A 、简单随机抽样
B 、分层抽样
C 、系统抽样
D 、整群抽样
4.如果一组数据标准分数是(-2),表明该数据( )。
A 、比平均数高出2个标准差
B 、比平均数低2个标准差
C 、等于2倍的平均数
D 、等于2倍的标准差
5.峰态通常是与标准正态分布相比较而言的。如果一组数据服从标准正态分布,则峰态系数的值( )。
A 、=3
B 、>3,
C 、<3
D 、=0
6.若相关系数r=0,则表明两个变量之间( )。 A 、相关程度很低 B 、不存在线性相关关系 C 、不存在任何关系
D 、存在非线性相关关系
7.如果所有变量值的频数都减少为原来的1/3,而变量值仍然不变,那么算术平均数
( )。 A 、不变
B 、扩大到原来的3倍
C 、减少为原来的1/3
D 、不能预测其变化
8.某贫困地区所估计营养不良的人高达15%,然而有人认为这个比例实际上还要高,要检验该说法是否正确,则假设形式为( )。 A 、15.015.00=≠ππ;:H B 、15.015.00≠=ππ;:H C 、15.015.00<≥ππ;:H
D 、15.015.00>≤ππ;:H
9.若甲单位的平均数比乙单位的平均数小,但甲单位的标准差比乙单位的标准差大,则( )。
A 、甲单位的平均数代表性比较大
B 、两单位的平均数一样大
C 、甲单位的平均数代表性比较小
D 、无法判断 10.某组的向上累计次数表明( ) A 、大于该组上限的次数是多少
B 、小于该组下限的次数是多少
C 、小于该组上限的次数是多少
D、大于该组下限的次数是多少
11.某组数据分布的偏度系数为负时,该数据的众数、中位数、均值的大小关系是( )。
A、众数>中位数>均值
B、均值>中位数>众数
C.中位数>众数>均值D、中位数>均值>众数
12.某连续变量数列,其末组为开口组,下限为500,相邻组的组中值为480,则末组的组中值为( )。
A、540
B、510
C、500
D、520
13.在回归分析中,F检验主要用来检验()
A、相关系数的显著性
B、回归系数的显著性
C、线性关系的显著性
D、估计标准误差的显著性
14.第一组工人的平均工龄为5年,第二组为7年,第三组为10年,第一组工人数占总数的20%,第二组占60%,则三组工人的平均工龄为( )
A、8年
B、7.2年
C、5年
D、7.8年
15.若今年比去年的环比发展速度为112%,去年比前年的环比增长率为3%,那么今年比前年的平均增长率为( )。
A、9.0%
B、7.4%
C、7.5%
D、15.4%
16.在其他条件不变的情况下,要使置信区间宽度缩小一半,样本量应增加()
A、一半
B、一倍
C、三倍
D、四倍
17.进行假设检验时,其他条件不变的情况下,增加样本容量,检验结论犯两类错误的概率会()
A、都增大
B、都减少
C.都不变D、一增一减
18.某银行投资额2010年比2009年增长了10%,2011年比2009年增长了15%,2011年比2010年增长了()
A、15%÷10%+1
B、115%÷110%-1
C、115%×110%-1
D、115%×110%+1
19.某种股票周二上涨10%,周三上涨5%,两天累计涨幅达()
A、15%
B、15.5%
C、4.8%
D、5%
20.经验法则表明:当一组数据对称分布时,在均值加减一个标准差的范围内大约有()
A、68%的数据
B、95%的数据
C、99%的数据
D、90%的数据
二、填空题(每空1分,计10分)
1.非众数组的频数占总频数的比率称为 。
2.一组数据的离散系数为0.4,标准差为20.则平均数为 __________。
3.不同年份的产品成本配合的直线方程为=y 100-1.5x ,回归系数=β-1.5表示 。
4.抽样误差的大小和样本__ 的大小____ _的差异性和抽样方式等因素有关。 5.采用组距分组时,需要遵循“_________”的原则,对于组限习惯上规定“ ” 。 6.中位数就是将一组数据 后,处于 的变量值。
7、某企业职工工资总额,今年比去年减少2%,而平均工资上升5%,则职工人数减少 %。
三、判断题(20分,每小题2分)
1.在假设检验中,原假设和被择假设都有可能成立。( )
2.最近发表的一份报告称:“由150部新车组成的一个样本表明,外国新车的价格明显高于本国生产的新车。”这一结论属于对总体的推断。( ) 3.回归系数为(-0.96),表示弱相关。( )
4.比较两组数据差异大小,最合适的的统计量是标准差。( )
5.在某公司进行的计算机水平测试中,新员工的平均得分是85分,标准差是6分,中位数是90分,则新员工得分的分布形状是右偏的。( ) 6.产品质量分为1、2、3级品,这是数值型变量( )
7.顺序数据不仅可以区分数据的大小、高低和优劣等,也可以计算数据之间的标准差( ) 8.是直线趋势的时间数列,其各期环比发展速度大致相同( )
9.某企业2009年产值是100万元,到2011年累计增加产值60万元,则每年平均增长速度约为26%( )
10.只有当相关系数接近+1时,才能说明两变量之间存在着高度相关关系( )
A 、企业产值
B 、劳动生产率
C 、企业职工人数
D 、投资报酬率
E 、平均工资
2、下列各项中,属于非全面调查的有( ) A 、普查 B 、抽样调查 C 、重点调查 D 、典型调查 E 、统计报表
3、变量数列中频率应满足的条件是( ) A 、各组频率大于1 B 、各组频率为非负数 C 、各组频率之和等于1 D 、各组频率之和小于1 E 、各组频率之和大于1
4、大样本情况下,总体均值检验的统计量可能为( ) A 、n
x z σ
μ
-=
B 、n S x z μ
-=
C 、n p t )
1(πππ
--=
D 、n
S x t μ
-=
E 、n
p p p z )1(--=π
5、单位成本(元)依产量(千件)变化的回归方程为y =78-3x ,表示( ) A . 产量为1000件时,单位成本75元 B . 产量为1000件时,单位成本78元
C . 产量每增加1000件时,单位成本下降3元
D . 产量每增加1000件时,单位成本下降78元
E . 当单位成本为72元时,产量为2000件
五、计算分析题(35
分)
1、(8分)某居民小区为研究职工上班距离,抽取了16人构成组成一个随机样本,它们到单位的距离(公里)如下(计算结果保留3位小数):
10、3、14、8、6、9、12、11、7、5、10、15、9、16、13、2
求:所有职工上班距离95%的置信区间(131.2)116(2
05.0=-t ;96.12
05.0=z )。
2、(10分)某种感冒冲剂生产线规定每包重量为12克。过去资料知:σ=0.6克,质检员每2小时抽取25包冲剂称重检验,并做出是否停工的决策。假设产品重量服从正态分布。(/2z α=1.96)
(1)建立原假设和备择假设。
(2)在 =0.05时,该检验决策准则是什么?
(3)如果x=12.25克,质检员将采取什么行动?
(4)如果x=11.95克,质检员将采取什么行动?
3、(7分)某公司各年销售额(万元)资料如下表:
要求(计算结果保留一位小数):
(1)用最小平方法拟合直线方程
(1)计算并填列列表中所缺数字。
(2)计算该地区2007-2011年间的平均国民生产总值。
(3)计算2008-2011年间国民生产总值的平均发展速度和平均增长速度。
3、用EXCEL软件对9组数据输出回归结果如下:
回归统计
Multiple R 0.99372
R Square 0.98748
Adjusted R Square 0.98569
标准误差0.99373
观测值9
方差分析
df SS MS
回归分析 1 545.0875 545.087
5
残差7 6.912517 0.9875 总计8 552
Coefficie
nts
标准误差t Stat
Intercept -0.0197 1.347466 -0.0146
5
X Variable 1 0.60565 0.025779 23.4943
8
解答:
3、(1)利用EXCEL的CORREL函数计算相关系数r=0.9937.相关系数接近于1,表明农业总产值与农村购买力之间有较强的正线性相关关系。
(2)用EXCEL软件输出回归结果如下:
回归统计
Multiple R 0.99372
R Square 0.98748
Adjusted R
Square
0.98569
标准误差0.99373
观测值9
方差分析
df SS MS F
回归分析 1 545.087
5
545.087
5
551.986
残差7 6.91251
7
0.98750
2
总计8 552
Coefficie
nts 标准误
差
t Stat P-value
Intercept -0.0197 1.34746
6
-0.0146
5
0.988721
X Variable 1 0.60565 0.02577
9
23.4943
8
6.43E-08
回归方程为:,回归系数表示农业总产值每增加1万元,农村购买力增加0.60565万元。
(3)可决系数0.98748,表明在农村购买力的变差中,
有98.748%是由农业总产值决定的。
(4)假设:
由于Significance F=6.42685E-08<0.05,拒绝原假设,说明农业总产值与农村购买力之间线性关系显著。
(5)42.4(万元)
(6)当0.05时,0.99373。【置信区间参照教材P239】
统计学题库参考答案
一、ACCBA;BADCC;ADCBB;CBBBA
二、异众比率;50;时间每增加1年产品平均成本下降1.5个单位;容量;总
体(或样本);不重不漏;下限在内;排序;中间位置;6.67。
三、 1×;2√;3×;4×;5×;6×;7×;8√;9√;10× 四、
五、
已知总体服从正态分布,但总体标准差未知且n=16为小样本, 根据样本计算375.9=x ,113.4=S 则:191.2375.92
±=±n
S
t x α
即(7.18,11.57)
2(1)120=u H :;
121≠u H :
(2)检验统计量:n
x /σμ
-Z=
在α=0.05时,临界值z α/2=1.96,故拒绝域为|z|>1.96。 (3) 当x =12.25克时,=
Z=
n
x /σμ
-25
/0.61212.25-=2.08
由于|z|=2.08>1.96,拒绝H 0:μ=120;应该对生产线停产检查。 (4) 当x =11.95克时,=
Z=
n
x /0
σμ-25
/0.61211.95-=-0.42。
由于|z|=-0.42<1.96,不能拒绝H0:μ=120;不应该对生产线停产检查。
3.解:(1)由Excel :y=3.1x+24.3 ;
(2)y=3.1*7+24.3=46(万元)
4、(1)计算并填列列表中所缺数字如下:
=++++5
89
.61585.6811.459.4054.88亿元
(3)计算2008-2011年间国民生产总值的平均发展速度和平均增长速度。
平均发展速度=
R 4
%34.151=110.92%;
平均增长速度=-%100R 10.92%