文档库 最新最全的文档下载
当前位置:文档库 › 应用统计学 课后习题

应用统计学 课后习题

应用统计学 课后习题
应用统计学 课后习题

《应用统计学》课后习题

第一章概率论基础知识 P26

1.试述以下基本概念:

随机实验;基本事件;样本空间;随机事件;相容事件与不相容事件;独立事件;概率;概率运算的主要性质;条件概率;乘法定律与全概率公式;贝叶斯公式;相互独立的随即事件的概率公式;离散型随机变量的概率;离散型随机变量的累积概率;连续性随机变量的概率;连续性随机变量的累积概率;连续性随机变量的概率密度;离散分布与连续分布的区别与对应关系;

两个随机变量的联合概率分布;边缘分布;条件分布;均匀分布。

2.某大公司有南方和北方两大生产基地。2004年某产品的产量为20万件,其

中60%是由南方基地生产的,南方基地的非正品率为0.1%,北方基地的正品率为99.6%。

问:在市场中抽查到一件次品,是北方基地生产的概率是多少,是南方基地生产的概率是多少?试用条件概率表来计算。

3.检查下面的函数以决定它是否是一个概率函数,并画出它的直方图。

P(x)=(X2+5),x=1,2,3,4 (注意:X2表示X的平方)

4.

5.两点分布(0—1)与二项分布的关系是什么?

6.某超市经理保证,他的一打一盒的蛋中,不会有多于一个的坏的蛋。如果有

多于一个坏的蛋,他将赔一整盒(一打)的鸡蛋,并允许顾客保有原来的那盒蛋。如果一个蛋是坏的概率是0.01,那么经理必须赔送鸡蛋的概率是多少7.某篮球运动员在比赛时发球得分的概率是0.8,他在下5个罚球中将失去3

个的概率是多少?

8.在任意一天,某港口的到船数X是一个随机变量。X的概率分布如下表,求

在指定的一天中:①恰有14艘船到达的概率;②至少有12艘船到达的概率;

9. 某公司的决策都由一个3人委员会作出,问:①如果每个成员独立做决策的

正确的概率为p,委员会按照简单多数的原则正确作出决策的概率是多少?

②若p=0.1,委员会作出正确决策的概率是多少?

③若p=0.8,委员会作出正确决策的概率是多少?

④当p取什么值时,委员会按照简单多数规则决策,比总经理一个人决策(假

设其正确决策的概率也是p)的正确率高?

10. 举出实际生活中服从泊松分布的例子。

11.正太分布是最常见的分布之一,试画出正态分布的密度函数的示意图。

第二章数据与数据的获得P63

1. 试述以下基本概念:

总体(或母体);个体;变量(或指标);变量值(指标值);数据;便利抽样;

滚雪球抽样;简单随机抽样;量表;连续量表;分项量表;Likert量表;测量信度;复本信度;测量效度;表面效度;内容效度

2. 数据测度分为几个类别?试举例说明。

3. 不同测度的数据的应用范围的主要区别是什么?

4. 企业质量管理员在生产线上某环节随机地抽取被加工的部件,并检验记录所

抽取的部件的下列信息::①有无缺陷;②加工此部件工人的工号;③部件的重量。

问:①被研究对象的总体是什么;②此总体是有限总体还是无限总体;③样本是什么;④上述三个变量是属性变量还是数值变量?

5. 学生上学时所带书本的重量,是什么测度类型的变量?

6. 研究用某群体中个体的网瘾严重程度时,把严重程度的测度标准设为:无、

轻度、重度、严重、非常严重。试:①给关心的变量命名;②判别这个变量的测度类型。

7. 在刚入学的某专业的新生中随机的抽取10名学生,并收集如下三个变量的数

据:X:选课课程的门数;Y:课本总费用;Z:被抽取学生的性别。

问:①总体是什么;②此总体是有限总体还是无限总体;③样本是什么;④上述三个变量的测度类型是什么?

8. 观察数据与实验数据的主要区别是什么?

9. 普查与抽样调查的区别是什么?

10.试述百丽抽样与非概率抽样的区别。

11.某研究者从四位数的随机数字表示,按照顺序取出500个数字,凡是电话号

码后4位的数字在那500个数字范围内,都欧式被调查对象。

问:这位研究者所得到的是不是一个随机样本?为什么?

12.分层抽样(分类抽样)的做法和适用条件是什么?

13.如何确定分层抽样(分类抽样)各层的样本个数?

14.在分层抽样中,决定各层样本数的方差分配法(最优分配法)的方差如何合

理得获得?

15.整群抽样的做法和适用条件是什么?

16.试述系统抽样(等距抽样)的做法。

17.某研究组在网站上发了一个调查问题,“在您的开销中,通过网络购买的比例

是多少?”请问:①这是何种抽样方法;②其结果能够代表消费者网上消费的比例吗?为什么?

18.在基于问卷的研究中,为什么说问卷的深度决定了研究的深度?

19.构成问卷的问题的主要类型有哪些?

20.如下问卷问题是否恰当?如不恰当,存在什么问题?

1)您多久上一次网?

A.1个月

B.2—3个月

C.半年

D.半年以上

2)国家队政府官员以权谋私打击,是(选一)

A.非常坚决的

B.有一定的效果

C.效果甚微

D.。。。。。。

3)领导干部的家属经商,与领导干部的关系是(选一)

A.无关

B.领导自律不严

C.领导纵然包庇

D.权钱交易

E.。。。。。。

4)您是烟民吗?

A.是

B.不是

5)如果您没有手机的话,您准备购买吗?

A.肯定会

B.可能会

C.不会

D.不确定

6)您每月上西餐馆的状况是?

A.从不

B.偶尔

C.有时

D.经常

21.试述设立问卷问题的4个思考角度。

22.对变量(特征)之间的相互关系的猜想,对设计问卷的影响是什么?

23.为什么说文献阅读是设立问卷问题的最重要的来源之一?

24.事先考虑数据处理方法对设计问卷的影响是什么?

25.如何判断一个问题可能得到诚实回答(或不诚实回答)?

26.应当如何处置“不能获得诚实回答”和“怀疑的不到诚实回答”的问题?

27.当选问题的备选答案应当满足什么条件?

28.多选题的备选答案如果有交集,会带来什么后果?

29.备选答案的多重含义对问题的分析产生什么影响?

30.试判断如下陈述的正误:

1)备选答案如果分布在一个维度(例如资金维度)上,可以多选

2)备选答案必须分布在两个或两个以上的维度才可以多选

3)备选答案只要是互斥的就可以作为单选问题

4)备选答案只要分布在一个维度上就可以作为单选问题

5)多选问题的备选答案是必须是互斥的(即不能有交集)

6)多选问题的备选答案对于应答者而言必须是相容的(可以有交集)

7)设置被排序的对象,不必考虑对象的个数

8)问卷长一些好,可以获得较多的信息

31.为什么说问卷设计一定要通过小规模访谈来修改?

32.测量“重测信度”的要点是什么?

33.拆半信度的适用条件是什么?

34.有内在效度的测量工具,就一定有外在效度吗?

35.有信度就一定有效度吗?

36.如何改进信度与效度?

37.获得数据的实验方法主要适用于哪三种特殊类型的数据?

38.获得数据的实验方法主要有哪三类手段?

39.什么是获得数据的实验的外部因素?应当如何处理外部因素?

40.什么是获得数据的实验的内部因素?应当如何处理外部因素?

41.什么是获得数据的实验的混合因素?应当如何处理外部因素?

42.在什么情况下随机分组较为恰当?什么情况下交替交错分组较为恰当?

第三章样本数据特征的初步分析P96

1.对于一个数据集合(样本值集合)而言,除了关心样本值本身以外,我们还关心样本值(数据值)出现的_________和_________

2.对于一个数据集合而言,什么是样本值(变量值)的频次?什么是样本值(变量值)的频率?

3.哪些测度等级的数据集合,适合于做频次与频率的饼图?

4.哪些测度等级的数据集合,适合于做频次与频率的条形图?

5.频次与频率的饼图有差异吗?为什么?

6. 频次与频率的条形图有差异吗?为什么?

7.对于一个数据集合而言,什么是累计频率?

8.能够用饼图来表示一个数据集合的累积频率吗?

9.哪些测度等级的数据集合才能计算累积频率?

10.除了表格法以外,还可以用_________图来表示一个数据集合的累积频率分布状况?

11.什么是一个数据集合的茎叶图?

12.对于一个数据集合而言,什么是茎叶?什么是茎叶的宽度?什么是叶?如何依据数据集合来确定茎节和叶?

13.什么是茎节得长度?举例说明茎节的宽度和茎节得长度的区别。

14.在如右茎叶图中:①茎宽=0.1是什么意思?②在这张茎叶图上显示了多少个数据?

16.什么是直方图?

17.直方图与条形图的区别是什么?

18.什么测度级别的数据,适宜做直方图?

19.作直方图时,一般是先确定区间长度还是先确定区间个数?哪个更好一些?

20.做直方图时,在区间长度确定后,如何确定区间个数?

21.做直方图时,如何确定最左端区间的中心位置?

22.依据如下直方图,判断亵渎Skewness的正负号

23.什么是组频次?什么是组频率?

24.什么是数据集合的众数?

25.什么是单一众数?什么是复众数?

26.什么测度级别的数据集合可以求众数?

27.某国对该国博士的子女数量做了一项调查,结果如下表,请计算子女数的样

本均值、方差和标准差。

28.从学院学生中随机的挑选15名学生,问他们昨晚睡眠的小时数。得到的样本

数据是:5,6,6,8,7,7,9,5,4,8,11,6,7,8,7,。请求出以下各值:①均值②中位数③众数④方差⑤标准差。

29.为什么刻度级的数据集合通常依托直方图确定众数(区间)?

30.什么是数据集合的中位数?如何确定一个数据集合的中位数?

31.什么测度级别的数据集合适合于确定中位数?

32.略

33.什么是样本均值?如何计算一个数据集合的样本均值?在样本均值的计算公式中,什么量与母体均值公式中的P k对应?

34.什么测度级别的数据集合适合于计算样本均值?

35.什么是数据集合的极大值和极小值?

36.什么是数据集合的下四分点和上四分点?

37.如何计算下四分点的值和上四分点的值?

38.如果计算出上四分点的数据在15和13.6之间,且上四分点的位置是12.25,

求上四分点的值?

39.什么测度级诶别的数据集合可以计算四分点的值?

40.什么是百分位点?举例说明?

41.什么是极差?什么是四分位距?

42.什么是样本离差、离差平方和?什么是方差?这三者之间的关系是什么?

43.什么是变异系数?变异系数的优点是什么?

44.众数、中位数、样本均值各反映了样本数据集合的什么特征?

45.极值、四分店,百分位点、极差、四分位距、离差、离差平方和、方差各反

映了样本数据集合的什么特征?

46.以下是一组儿童首次牙科检查的年龄的样本,求:①对这些儿童首次牙科检

47.下面的数据是某一天20位工人收割麻黄草的数量,求:①收获量的上四分位

数和下四分位数;②中位数③以下的百分位数:P15,P33,P90。

48.某大学某学年某年级的学生选课学时数如下表,试:①用SPSS画此数据的直

方图②求集中趋势的如下度量:众数,中位数,均值③求Q1和Q3④求P15和P12⑤求离散趋势的三种度量(极差,标准差,方差)

49.箱形图给出了一个数据集合的哪几个量?

50.修正箱形图是如何构造的?它对想形图的哪个部分作了修正?

第四章 SPSS的简单应用 P143

1.如何在SPSS中定义变量

2.填写变量标签的主要意义是什么?

3.填写变量值标签的主要意义是什么

4.SPSS中变量值标签的用途是(选出正确答案):

A.注明变量的含义,例如:注明X是“农民家庭收入”;

B.注明变量的取值范围,超出该范围的值将被作为缺省值处理

C.注明变量值的含义

D.注明变量值得单位

5.通过变量值标签的限定,把顺序级得变量定义为数字型有什么好处?

6.在调查表得栏目很多(也就是变量个数很多)时,如何巧妙得设计变量名?

7.把回收的有效调查表的编号作为一个变量,定义在SPSS的数据文件中有什么好处?

8.用SPSS主要可以读入哪些格式的数据?

9.按照回收的调查表输入数据,是按照行输入好咳是按照列输入好?为什么?

10.为什么说增加case(在数据窗口的下端加入新的数据)的并表方式特别重

要?怎样分头输入数据,才能有效地并表?

11.请选用数据盘中的恰当数据文件,用SPSS做如下计算练习:①给变量值排序,

给变量值排名次,统计数据的频次、频率、累积频率与累积频次;②计算众数、中位数、样本均值等;③计算极值、四分点、百分位点、极差、四分位距、离差、离差平方和、方差及标准化数据等;④绘制饼图、条形图、直方图、茎叶图、想形图与修整想形图。

12.下面的数额是某文具店出售文件夹的40个交易的收入(元),试:①用SPSS

13.某牙科诊所费用开支比例如下表所示,试:①用SPSS作一张饼图;②用SPSS

14.某医院眼科门诊看病者的年龄如下,试:①用SPSS制作这些年龄的一张不分

组的频数分布表;②用SPSS制作这些数据的一张不分组的频率分布表;③用SPSS制作这些数据的一张不分组的频率条形图;④用SPSS制作同一组数据

15.略

16.什么是数据分布的斜度?SPSS是如何规定数据集合的负斜度、0斜度、正斜

度的?

17.什么是数据分布的峰度?SPSS是如何规定数据集合的负峰度、0峰度、正峰

度的?

18.什么是均值的标准误差?

19.某样本集合的均值是50,标准差是4.0。求下列每个样本观察值x值得标准

化值z:①x=54;②x=50;③x=59;④x=45。

第五章总体分布、样本分部与参数估计 P173

1.试述以下基本概念:

总体分布;随机样本;简单随机样本;样本观察值;样本分布;样本(累积)分布函数Fn(x);点估计;矩估计法;无偏估计量;有效估计量;渐进无偏估计量;一致估计量。

2.试述格利文科定理。格利文科定理的主要意义是什么?

3.什么是统计量?什么是统计量的值?

4.基于标准正态分布N(0,1)的随机样本,如何构成了分布、t分布或F分布?

5.略

6.若随机变量X的均值为,标准差为,分布形式任意。从总体得到一组随机样本X1、X2……Xn,问统计量的分布函数的均值与标准差各是多少?

7.网箱养鱼户在某年出售某类鱼的平均价格是每斤4.33元。假定售鱼价格的标准差是每斤0.75元。随机选择150户养殖该类鱼的养殖户,那么这150养鱼户的售价均值构成了一个统计量,这个统计量的分布是一个抽样分布。问:①这个抽样分布的平均值是多少;②这个抽样分布的标准差是多少?③描述这个抽样分布的形状。

8.0—1分布(即B(1,p)分布),状态1出现时,随机变量X=1,状态2出现

时,X=2。设P(X=1)=p,问:①X的均值、方差各是什么;②的均值,方差各是什么?

9.设随机变量X的均值为,方差为平方,X1、X2……Xn,为X得样本,则当n充分大时,近似地服从什么分布?一般而言,n大于等于多少才算充分大

10.某市场调查员在研究消费者购物习惯的时候,询问了进入超市的第20名顾

客,问他每周购买几次食品,并将答案记录为T。问:T=3是什么?从下列备选答案中选择正确答案:

A.样本观察值

B.变量

C.统计量

D.参数

11.什么是极大似然估计法?极大似然估计法的基本思想是什么?

12.什么是估计量的最小方差性?

13.什么是估计量的渐进有效性?

14.什么是区间估计?举例说明?

15.抽取18袋袋装香米,重量的样本均值是9.87公斤,样本标准差是0.27公斤,

假设袋装香米的重量服从正态分布。求::①这种袋装香米没带的真实平均重量为95%的置信区间。②这种袋装香米没带的真实平均重量为99%的置信区间。③置信水平的增加对置信区间的宽度有什么影响?

16.某小学5年级抽出100个学生的身高的均值是139厘米,标准差为5厘米,

近似服从正态分布。试计算该小学五年级学生的平均身高以90%的概率落在什么区间?

17.三个电视剧的第一名将由观众投票产生。某机构在正式投票前做了一次民意

调查,预测第一名的得主,并且希望预测的误差不超过3%。在正式民意调查前,小规模抽样调查对三个电视剧的支持的调查样本方差近似于0.36,试计算在95%的置信水平上本次调查所需要的样本量。

18.请选用数据盘中的恰当数据文件,用SPSS的如下模块计算数据集合的样本均

值、样本方差,或做区间估计:①频次分析模块;②统计模块;③探索模块。

19.依据数据文件“CH4茎叶箱方差工资性别岗位300余”,计算不同工作性质

的人员数占总体人数的比例(需要改造数据文件“CH4茎叶箱方差工资性别岗位300余”中的“工作性质”变量的数据表达方式)。

20.略

21.用SPSS完成如下计算:①已知X服从N(0,1)分布,求P(X≤1.975)值;②已

知X服从(18)分布,求P(X≤9.390);③已知X服从F(6,8)分布,求P(X ≤2.67);④已知X服从T(18)分布,求P(X≤2.1009)值;⑤已知X服从二项分布B(10,0.25)分布,分别求P(X=0),P(X≤,1);P(X=1)值.

第六章参数假设检验 P213

1.试述以下基本概念:

参数检验;非参数检验

2.什么是“弃真”错误?什么是“存伪”错误?在假设检验中,通常把什么错误控制的比较小?

3.以问题“已知方差,检验假设:=0”为例,说明假设检验的基本思路。

4.假设检验的三个关键点是什么?

5.在判断是接受还是拒绝零假设H0时,有两种方法:

①用的统计值的p值(即,统计值得显著性概率,或称为统计值的外侧概率),与显著性水平比较;②用统计值自身,与临界统计值或/2比较。

哪个更好一些?为什么?

6.对下面灭个检验计算z统计值的显著性概率p的值:

① H0:=10,H1:>10,z=1.48

② H0:=105,H1:<105,z=-0.85

③ H0:=13.4,H1:≠13,z=-0.85

④ H0:=8.56,H1:<8.56,z=-2.11

⑤ H0:=110,H1:≠110,z=-0.93

7.对下面每个检验计算统计量的值

① H0:=35,H1:>35,p=0.0582

② H0:=35,H1:<35,z=0.0166

③ H0:=35,H1:≠35,z=0.0042

8.关于一个正态分布总体的参数检验的统计量问题:

①检验均值(=0否),当已知时,用什么统计量?当未知时,用什

么统计量?②检验方差(=0?未知)用什么统计量?

9.举出若干需要“检验均值与方差是否改变”的例子。

10.检验零假设:初中男生平均身高160厘米。完备假设:初中男生平均身高超

11.有一家企业生产某产品,按照产品标准,成分A的含量应当在10%以上,该

企业有一批产品,抽出64瓶,化验结果是=10.19%,样本标准差是0.8,这批产品在1%的显著性水平上是否合格?

12.从一批灯泡中随机抽取25个,算得样本平均使用寿命=1950小时,标准

差为500小时,规定最大显著水平=0.01,问这批灯泡是否满足平均使用寿命为2000小时的设计标准?

13.下表是32个地区体重超重比例在15%-25%的人群中有心脏病比率数据。试用

SPSS检验零假设在该超重范围内有心脏病的比率均值=18%,对备择假设≠18%,取=0.05

14.检验B(1,p)分布(即0-1分布)的参数p与预定值是否相等,用什么统计

量?

15.当n很大时,如何检验一个B(1,p)总体的大样本比例值p?

16.关于两国正态分布总体的参数检验的统计量问题:

①检验方差(1=2?未知12),用什么统计量?

②检验方差(1>2?未知12),用什么统计量?

③检验均值(1=2?未知其方差值,但知1=2),用什么统计量?(只

需知道统计量的名称及统计量的大致结构)

④检验均值(1=2?未知其方差值,但知1≠2),用什么统计量?(只

需知道统计量的名称及统计量的大致结构)

17.大样本下,检验两个任意总体的均值是否相等,用什么统计量?

18.大样本下,检验两个0-1总体的比例值(即均值)是否相等,用什么统计量?

19.用例子说明假设检验的意义。

20.请选用数据盘中的恰当数据文件,用SPSS的单样本T检验模块,检验一个数

据集合的均值和预定值,是否相等

21.试述SPSS的单样本T检验模块输出的置信区间与探索模块输出的置信区间有

何不同?

22.例6.6.2给出的单样本的均值是,与0的差值大(5.385秒),而例6.6.3

给出的单样本均值是,与0的差距小(1.40秒),显著性检验结果却是所对应的1与0没有显著性差异,而所对应的2与0有显著性差异。试从单样本T检验的计算公式解释这个“怪异”的结论。

23.试述两组独立样本与配对样本在性质方面的区别。

24.在SPSS中,两组独立样本与配对样本的数据存放方式有何不同。

25.某汽车销售商设计了一种促进汽车销售的方案,在10城市做了降价测试实

验,记录了促销方案实施前一个月得销售量及促销方案实施后一个月的销售

)?

26.请选用数据盘中的恰当数据文件,用SPSS的独立样本T检验模块,做两均值

是否相同的假设检验。

27.在用SPSS的独立样本T检验模块,做两均值是否相同的假设检验时,为什么

一定要选择levene检验?

28.配对样本T检验与单样本T检验由什么关系?

29.有人设计了一种提高记忆力的训练方法,为了评估这种训练方法的有效性,

随机抽取了20余名学生,在做记忆力测试后,留下记忆力差异不大的10名学生参加实验(剔除了记忆力处于强弱两段的学生)。训练完成后,再对两

个组做记忆力测试。训练前后的记忆力数据如下表,问:在=0.01的显著

30.从某市上年所得税报表得知服装企业经理的平均收入为15万元,标准差为

0.975万元。今年从服装行业随机抽取168个人的样本,计算出平均收入为

14.5万元。问:今年服装行业经理的平均收入与上年有显著差异吗?

31.五年前某行业公司的平均雇员规模(人数)为268.8人,以后。随着需求的

增长,感觉许多公司的规模都在扩大,于是,随机选取了36个公司,计算出平均雇员规模为330.6人。标准差为45.6人。问:该行业公司的平均规模明显增大了吗?

32.某电视台调查某栏目受欢迎的程度,有65%的男士和55%的女士对该栏目表示

欢迎。问:①如果这些统计值是来自100名男士和100名女士的样本,两个

受欢迎的程度有显著性吗?②如果这些统计值是来自200名男士和200名女士的样本,差别显性吗?

第七章方差分析 P213

1.方差分析是用来检验不同数据组的均值差异的,还是方差差异的?

2.试列出管理领域中单因素方差分析的主要用途和用法?

3.通过“单因素模型构成表”,掌握单因素模型。

4.已知单因素方差分析的数据

实验效果

方案1 X11 X12 …X1n1

方案2 X21 X22 …X2n2

︰︰︰︰︰

方案s X s1 X s2 …X sn s

表中,n i表示方案t的实验个数

试述单因素方差分析的基本做法。

5.如果单因素方差分析的结果是:不同方案的效果均值有显著性差异,是否意味着两方案之间的均值,都有显著性差异。

6.某公司想知道某地方报纸上3种类型广告中那一种是最有效的。在过去的几周内随即得对三种类型的广告的响应人数(对广告关键词有印象的人数)做了调

查统计,结果如下表。问:若显著性水平=0.01,取零假设“三类广告的效

7.

差分析,特别注意键的使用。

8.在用SPSS的单因素方差分析时,为什么要选择Homogeneity of variances

复选项(进行方差齐次性检验)?

9.在用SPSS的单因素方差分析时,键的作用是什么?

10.

三种品牌的洗衣粉中的磷含量有显著性差异吗?取=0.01。

11.选出交通统计,便利条件,客流量和规模相近的三个商店,按照如下三种方

式发放赠券(分别在三个不同的店实施):A店每100元发5元赠券,B店每500元发放35元赠券,C店每1000元发放100元赠券。实验6天,所得日销

问:这三种赠券方式的促销效果是否有显著差别?

12.用“无交互影响的双因素模型构成表”,掌握无重复双因素方差分析模型。

13.无重复双因素方差分析检验有什么问题?

14.已知无重复、双因素方差分析的数据

因素B1因素B2…因素Bn

因素A1X11 X12 (1)

因素A2X21 X22 (2)

︰︰︰︰︰

因素As X s1 X s2 …X sn

注:X ij表示A i和因素B j下的实验效果的观察值

列出无重复双因素方差分析的主要做法。

试做无重复双因素的方差分析。

16.有重复双因素的方差分析,与无重复双因素的方差分析的主要区别是什么?

检验的项目有何差异?

17.用“有交互影响的双因素模型构成表”,掌握有重复双因素方差分析模型。

18.已知有重复、双因素方差分析的数据

因素因素B1因素B2…因素Bn

因素A1X111X112…X11t X121X122…X12t…X1n1X1n2…X1nt

因素A2X211X212…X21t X221X222…X22t…X2n1X2n2…X2nt ︰︰︰︰︰

因素As X s11X s12…X s1t X s21X s22…X s2t…X sn1X sn2…X snt

注:Xijk表示Ai和因素Bj下的第k次实验效果的观察值

列出有重复双因素方差分析的主要做法。

19.为检验店内“广告投入”(因素A,两个水平)和店内“购物赠券”(因素B,

三个水平)对促销的影响,选取交通,便利,客流和规模相近的6个同类商店,做了双因素的每种组合重复3次(每次6天)的实验,所得数据日销售额(千元)的如下:

20.请选用数据盘中的恰当数据文件,用SPSS的多因素方差分析模块作双因素方

差分析。

第八章相关分析P275

1. 两个随机变量的总体(简单)相关系数与样本pearson相关系数,如何计算?

两者的关系是什么?

2.请给出样本pearson相关系数的几何解释。

①计算两个变量之间的相关系数

②在0.05显著水平下检验相关性并得出你的结论。

4.10个商店去年的销售额和流通费用率资料如下表,选用适当曲线,计算销售

5.某公司为雇佣到合格的熟练工人,设计了一套能力测验。下表是对10名现有熟练工人的能力测验的得分分数,以及他们完成所需任务的时间(分钟),请计算并回答下列问题:完成任务时间与能力测验分数之间的相关系数是否显

6.K.pearson 收集大量父亲身高x (寸)与儿子身高y (寸)的资料,其中10对数据如下表(此著名实验,故没有改变单位,1寸=2.54cm

)计算父亲身高与儿子山高的相关系数,并检验显著性。 7.请写出spearman 等级相关系数(又称秩相关、名次相关)的公式 8.两组独立样本适合于计算相关系数吗?

9.pearson 与spearman 相关系数显著异于0的显著性检验的统计量是什么? 10.篇相关系数显著异于0的显著性检验的统计量是什么? 11.相关系数的显著性检验的意义是什么?

12.某高校抽样得到10名短跑运动员,测出100米成绩的名次和跳高的名次如下,

问这两个名次相关吗?

13.篇相关系数在经济与管理中的应用的意义是什么?

15.抽样调查了16个企业,上年获得了专利数、上三年R&D 投入总和及高级工程

17.抽样获得癌症患者抽烟与否的数据如下,计算∮相关系数,并做显著性检验。

第九章线性回归分析 P317

1.线性回归是研究变量之间的确定性的函数关系的还是不确定型的函数关系?

2.线性回归分析对变量的测度级别有什么要求?

3.在线性回归分析中,普通最小二乘法与极大似然法有何异同?

4.多元线性回归的搞死假设是什么?

5.多元线性回归的计算的公式是什么?

6.高斯—马尔科夫定理是什么?

7.多元回归的几何解释是什么?

8.复相关系数的平方怎样反映出总体回归效果?

9.检验回归效果的F统计量的定义式是什么?

10.回归系数的t的检验的统计量的定义式是什么?

11.20名计算机科训练班的学生的上机考试成绩x和笔试成绩y如下表。求线性

12.抽样获得16个保单推销员上年的保单推销个数和他们保单的年数资料如下

表,求:①计算保单推销数对保单推销纪念馆里(年数)的拟合回归方程。

②检验回归系数是否显著大于零(在5%的显著水平)。

③保单推销数众有多大比例用保单推销年数之外的因素来解释?

13.某公司为雇佣到合格的熟练工人,设计了一套能力测验。下表是对10名现有

熟练工人的能力测验的得分分数,以及他们完成所需任务的时间(分钟)。求:

①用“完成任务时间”对“能力测验得分”进行回归分析②依据回归分析的

结果,判断这两个变量是否呈正相关。③计算两个变量的相关系数,并说明

对数据如下表(此著名实验,故没有改变单位,1寸=2.54cm)。试①求经验回归方程=0+1x;②检验假设H0:1=0,H1:1≠0,(=0.05)③若回归效果显著,求1的置信度为0.95的置信区间。

15.抽样调查10个商店去年的销售额流通费用率资料如下表。请选用y=a+b/x

作曲线回归。

16.从回归骄傲度解释篇相关系数。

17.篇相关系数的集合解释是什么?

18.负相关系数的几何解释是什么?

19.标准回归系数是指什么?

20.抽样调查了16个企业,上年获得了专利数、上三年R&D投入总和及高级工程

师数的数据如下表。试:①拟合出“上年专利数”对“上三年R&D投入”和“高级工程师数”的线性回归方程,并估计标准误差。②解释回归系数的经

21.检验系数j与0是否有显著性的统计量Fj的构成是什么?

22.偏解释变差(偏回归平方和)的几何解释是什么?

23.逐步回归的基本做法是什么?

24.某研究者怀疑售车员得业绩与售车人的年龄和销售经验有关,随机抽取了12

个推销商的数据如下表,①请以逐步回归方法估计回归方程;②阐释回归系数的经济含义;③在销售量的变化中有多大比例可以用解释变量来解释?

25.略

26.在维尼纶缩醛化的试验中,固定其他因素后,考虑甲醛浓度X1,反应时间X2

27.略

应用统计学试题及答案解析

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%

6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

应用统计学试题及答案

应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为分;乙班平均分为75分,标准差为分。由此可知两个班考试成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() 公斤公斤公斤公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% % % % 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显着性 D.规范性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归 方程可能是正确的() A.y=125-10x =-50+8x =150-20x =-15-6x 三、多项选择题(每题2分,共10分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B.抽选出的单位有典型意义 C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算 2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是 () A.单位成本计划完成程度为80% B. 单位成本计划完成程度为% C.没完成单位成本计划 D.完成了单位成本计划 E.单位成本实际比计划少降低了1个百分点 3.数据离散程度的测度值中,不受极端数值影响的是() A.极差 B.异众比率 C.四分位差 D.标准差 E.离散系数

应用统计学习题及答案

应用统计学习题及答案 简答题 1.简述普查和抽样调查的特点。 答: 普查是指为某一特定目的而专门组织的全面调查,它具有以下几个特点: <1)普查通常具有周期性。 <2)普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏,保证普查结果的准确性。 <3)普查的数据一般比较准确,规划程度也较高。 <4)普查的使用范围比较窄。 抽样调查指从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。它具有以下几个特点:b5E2RGbCAP <1)经济性。这是抽样调查最显著的一个特点。 <2)时效性强。抽样调查可以迅速、及时地获得所需要的信息。<3)适应面广。它适用于对各个领域、各种问题的调查。 <4)准确性高。 2.为什么要计算离散系数? 答: 离散系数是指一组数据的标准差与其相应得均值之比,也称为变异系数。 对于平均水平不同或计量单位不同的不同组别的变量值,是不能用方差和标准差比较离散程度的。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。离散系数的作用主要是用于比较不同总体或样本数据的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。p1EanqFDPw

3、加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。DXDiTa9E3d 答: 加权算术平均数受各组平均数喝次数结构<权数)两因素的影响。若报告期与基期相比各组平均数没变,则总平均数的变动受次数结构<权数)变动的影响,可能不变、上升、下降。如果各组次数结构不变,则总平均数;如果组平均数高的组次数比例上升,组平均数低的组次数比例下降,则总平均数上升;如果组平均数低的组次数比例上升,组平均数高的组次数比例下降,则总平均数下降。RTCrpUDGiT 4.解释相关关系的含义,说明相关关系的特点。 答: 变量之间存在的不确定的数量关系为相关关系。 相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个;变量之间的相关关系不能用函数关系进行描述,但也不是无任何规律可循。通常对大量数据的观察与研究,可以发现变量之间存在一定的客观规律。 5PCzVD7HxA 5.解释抽样推断的含义。 答: 简单说,就是用样本中的信息来推断总体的信息。总体的信息通常无法获得或者没有必要获得,这时我们就通过抽取总体中的一部分单位进行调查,利用调查的结果来推断总体的数量特征。jLBHrnAILg 6.回归分析与相关分析的区别是什么? 答: <1)相关分析所研究的两个变量是对等关系,而回归分析所研究的两个变量不是对等关系;<2)对于两个变量X和Y来说,相关分析

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

应用统计学试题和答案

《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的置 信区间_________________。(Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值围是 。 7、设总体X ~) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号。每小题1分,共14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( ) ①、x > e M >o M ②、x o M >e M

应用统计学练习题及答案(精简版)

应用统计学练习题 第一章?绪论 一、填空题 1.统计工作与统计学得关系就是__统计实践____与___统计理论__得关系。 2.总体就是由许多具有_共同性质_得个别事物组成得整体;总体单位就是__总体_得组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、与__大量性__。 4.要了解一个企业得产品质量情况,总体就是_企业全部产品__,个体就是__每一件产品__。 5.样本就是从__总体__中抽出来得,作为代表_这一总体_得部分单位组成得集合体。 6.标志就是说明单体单位特征得名称,按表现形式不同分为__数量标志_与_品质标志_两种。 7.性别就是_品质标志_标志,标志表现则具体体现为__男__或__女_两种结果。 二、单项选择题 1.统计总体得同质性就是指(A )。 A、总体各单位具有某一共同得品质标志或数量标志 B、总体各单位具有某一共同得品质标志属性或数量标志值 C、总体各单位具有若干互不相同得品质标志或数量标志 D、总体各单位具有若干互不相同得品质标志属性或数量标志值 2.设某地区有800家独立核算得工业企业,要研究这些企业得产品生产情况,总体就是( D )。 A、全部工业企业????B、800家工业企业 C、每一件产品????? D、800家工业企业得全部工业产品 3.有200家公司每位职工得工资资料,如果要调查这200家公司得工资水平情况,则统计总体为( A )。

A、200家公司得全部职工??B、200家公司 C、200家公司职工得全部工资?D、200家公司每个职工得工资 4.一个统计总体(D )。 A、只能有一个标志? B、可以有多个标志 C、只能有一个指标?? D、可以有多个指标 5.以产品等级来反映某种产品得质量,则该产品等级就是( C)。 A、数量标志??? B、数量指标 C、品质标志????D、质量指标 6.某工人月工资为1550元,工资就是( B )。 A、品质标志???????B、数量标志 C、变量值??? D、指标 测 7.统计学自身得发展,沿着两个不同得方向,形成(C)。 A、描述统计学与理论统计学?? B、理论统计学与推断统计学 C、理论统计学与应用统计学???? D、描述统计学与推断统计学 三、多项选择题 1.统计得含义包括( ACD)。 A、统计资料?B、统计指标???C、统计工作 D、统计学?E、统计调查 2.统计研究运用各种专门得方法,包括( ABCDE )。 A、大量观察法??B、统计分组法??C、综合指标法 D、统计模型法? E、统计推断法 3.下列各项中,哪些属于统计指标?( ACDE ) A、我国2005年国民生产总值 B、某同学该学期平均成绩 C、某地区出生人口总数 D、某企业全部工人生产某种产品得人均产量 E、某市工业劳动生产率 4.统计指标得表现形式有(BCE )。

应用统计学试题

2009年天津大学工程硕士应用统计学试卷 姓名 学号 班级 一、简答题(30分,每题5分) 1.统计学表示变异(分散)程度的特征数有哪些? 2.服从两点分布设总体X ),1(p b ,其中p 是未知参数,521,,X X X 是来自X 的简单随机样本。是指出21X X +,i i X 5 1min ≤≤,p X 25+之中哪些是统计量,哪些不是统计量,为什么? 3. 若)9,4(~F F ,则F /1服从什么分布? 4. 假设检验的基本依据是什么? 5. 假设检验中的两类错误是指哪两类错误? 6. 回归分析适合研究哪类问题? 二、(15分).,,5)4,12(51X X N 的样本中随机抽一容量为 在总体 的概率;值之差的绝对值大于 )求样本均值与总体均 (11 {}.15),,,,max(254321>X X X X X P )求概率( 三、(15分)一种新型减肥方法自称其参加者在第一个星期平均能减去至少8斤体重。由40名使用了该种方法的个人组成一个随机样本,其减去体重的样本均值为7斤,样本标准差为3.2。 a .α=0.05时,拒绝规则是什么? b .你对该减肥说明方法的结论是什么? c .p 值为多少? 四、(15分)正态总体),(2σμN 的密度函数为 2 2 2) (21),;(σ μσ πσμ--= x e x f 从该总体抽取随机样本n X X X ,,21 。 (1)求σμ,的极大似然估计量σμ ?,?; (2)证明所求的μ ?是总体均值的最佳无偏估计量。 五、(15分)为了检验三家工厂生产的机器加工一批原料所需的平均时间是否相同,某化学公司得到了关于加工原料所需时间的数据如下表所示。利用这些数据检验三家工厂加工一批原料所需平均时间是否相同。(α=0.05,26.4)9,2(05.0=F )

应用统计学试题及答案1

北京工业大学经济与管理学院2007-2008 年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1C2B3A4C5B6B7A8A9C10C 一.单选题(每题 2 分,共 20 分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A50B8C0.02D4 3.某连续变量数列,其末组为“ 500 以上”。又知其邻组的组中值为 480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、 9%,则最后一期的定基增长速度为 A .5%× 7%× 9% B. 105% × 107%× 109% C.(105%× 107%× 109%)- 1 D. 3 105%107%109%1 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品 ,则物价增 (减 )变化的百分比为 A. –5% B. –4.76% C. –33.3% 6.对不同年份的产品成本配合的直线方程为 D. 3.85% ? y 280 1.75x ,回归系数b=-1.75表示 A.时间每增加一个单位,产品成本平均增加 1.75 个单位 B.时间每增加一个单位,产品成本平均下降 1.75 个单位 C. 产品成本每变动一个单位,平均需要 1.75 年时间 D. 时间每减少一个单位,产品成本平均下降 1.75 个单位 7.某乡播种早稻5000 亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8. 甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间 : x =70 件,=5.6 件乙车间 :x =90件,=6.3 件 哪个车间日加工零件的离散程度较大: A 甲车间 B.乙车间 C.两个车间相同 D.无法作比较 9.根据各年的环比增长速度计算年平均增长速度的方法是

《应用统计学》期末考试试题++a+)+卷

一、单项选择题(每题 2分,共30分) △ 1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、9.3 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组, 请指出哪项是正确的( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 80.1—90% 90.1—100% 100.1—110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C ) 。 A. 5 B. 45 C. 56.5 D. 7.5 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108 斤、102斤、105斤、102斤、110斤、105斤、102斤,据此计 算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数

6.甲数列的标准差为7.07,平均数为70,乙数列的标准差为3.41, 平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折 账号的顺序,每50本存折抽出一本登记其余额。这样的抽样组 织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关 C 、表明相关程度很弱 D 、不能说明相关的方向和程度 △10.已知某工厂甲产品产量和生产成本有直线关系,在这条直 线上,当产量为1000时,其生产成本为30000元,其中不随产量 变化的成本为6000元,则成本总额对产量的回归方程是( A ) A 、x y 246000?+= B 、x y 24.06?+= C 、x y 624000?+= D 、x y 600024?+= 11.速度和环比发展速度的关系是( A )。 A 、两个相邻时期的定基发展速度之商等于相应的环比发展速度 B 、两个相邻时期的定基发展速度之差等于相应的环比发展速度

应用统计学期末考试试题A卷

一 、单项选择题(每题2分,共30分) △1.在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距取( B )。 A 、 B 、9 C 、6 D 、10 2.某商业局对其所属商店的销售计划完成百分比采用如下分组,请指出哪项是正确的 ( C )。 A 、80—89% 90—99% 100—109% 110%以上 B 、80%以下 —90% —100% —110% C 、90%以下 90—100% 100—110% 110%以上 D 、85%以下 85—95% 95—105% 105—115% 3.以下是根据8位销售员一个月销售某产品的数量制作的茎叶图 3 02 6785 5654 则销售的中位数为( C )。 A. 5 B. 45 C. D. 4.按使用寿命分组的产品损坏率一般表现为( D )分布。 A 、钟型 B 、对称 C 、J 型 D 、U 型 5.某11位举重运动员体重分别为:101斤、102斤、103斤、108斤、102斤、105斤、 102斤、110斤、105斤、102斤,据此计算平均数,结果满足( D )。 A 、算术平均数=中位数=众数 B 、众数>中位数>算术平均数 C 、中位数>算术平均数>众数 D 、算术平均数>中位数>众数 6.甲数列的标准差为,平均数为70,乙数列的标准差为,平均数为7,则( D )。 A 、甲数列平均数代表性高; B 、乙数列平均数代表性高; C 、两数列的平均数代表性相同; D 、甲数列离散程度大; 7.某银行想知道平均每户活期存款余额和估计其总量,根据存折账号的顺序,每50本 存折抽出一本登记其余额。这样的抽样组织形式是( C ) A 、类型抽样 B 、整群抽样 C 、机械抽样 D 、纯随机抽样 8.在方差分析中,检验统计量F 是( B )。 A 、组间平方和除以组内平方和 B 、组间均方和除以组内均方 C 、组间平方和除以总平方和 D 、组内均方和除以组间均方 9. 回归方程中,若回归系数为正,则( A )。 A 、表明现象正相关 B 、表明现象负相关

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数:

22 212 2 ()0.56710800.884392.8 () x x R y y β-?= ==-∑∑ 4、某家具公司生产三种产品的有关数据如下: 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数 = 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷( 二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下: 257、276、297、252、238、310、240、236、265,则其下四分位数5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% 。 7、对回归系数的显著性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p

应用统计学试题和答案

《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的置 信区间_________________。= 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值范围是 。 7、设总体X ~ ) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则 n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。每小题1分,共 14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、 ②、33 ③、 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为,2001~2002年两年平均为,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( )

应用统计学试题及答案

二、单项选择题(每题1 分,共1 0 分) 1.重点调查中的重点单位是指() A.处于较好状态的单位 B. 体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B ?各组的组中值必须相等 C.各组数据在各组中均匀分布D?各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70 分,标准差为分;乙班平均分为 75分,标准差为分。由此可知两个班考试成绩的离散程度() A. 甲班较大 B. 乙班较大 C. 两班相同 D. 无法作比较 4.某乡播种早稻 5000亩,其中 20%使用改良品种,亩产为 600 公斤,其余亩产为 500 公斤,则该乡全部早稻平均亩产为() 公斤公斤公斤公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% % % % 6?用最小平方法给时间数列配合直线趋势方程y=a+bt,当b v 0时,说明现象的发展趋势是() A. 上升趋势 B. 下降趋势 C. 水平态势 D. 不能确定 7.某地区今年和去年相比商品零售价格提高 12%,则用同样多的货币今年比去年少购买()的商品。 8.置信概率表达了区间估计的() A. 精确性 B. 可靠性 C. 显着性 D. 规范性 9. H b:卩=卩。,选用Z统计量进行检验,接受原假设 H0的标准是() A.|Z| A 乙 B.|Z|-Z a 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归 方程可能是正确的?() A.y=125-10x =-50+8x =150-20x =-15-6x 三、多项选择题(每题2 分,共10 分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B?抽选出的单位有典型意义 C .抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E通常会产生偶然的代表性误差,但这类误差事先可以控制或计算 2. 某种产品单位成本计划比上年降低5%,实际降低了 4%,则下列说法正确的是 () A.单位成本计划完成程度为 80% B.单位成本计划完成程度为 % C.没完成单位成本计划 D. 完成了单位成本计划 E.单位成本实际比计划少降低了 1个百分点

应用统计学试题1

《 应用统计学》 测试试题A 卷 一、单项选题(15×1=15分) 1.对在全国茶叶产量中占较大比重的几个大茶场进行茶叶生产 调查,这种调查方式属于 ( ) A .普查 B. 重点调查 C. 抽样调查 D. 典型调查 2.红花建筑企业增加值的平均增长速度:2001-2003年为13%, 2004-2005年为9%,则这5年的平均增长速度为( ) A 、52309.013.0? B 、52309.113.1? C 、109.013.0523-? D 、 109.113.1523-? 3.区分简单分组和复合分组的依据是 ( ) A .总体单位数的多少 B. 组数的多少 C .分组标志的多少 D. 现象的复杂程序 4.单项数列中,若某组的向上累计频数是80,它表示总体中标 志值 ( ) A .低于该组标志值的单位有80个 B .等于和低于该组标志值 的单位有80个 C .高于该组标志值的单位有80个 D .等于和高于该组标志值 的单位有80个 5.标志变异指标中易受极端值的影响有( )。 A 、标准差 B 、平均数 C 、全距 D 、标准差系数 6、定基发展速度和环比发展速度之间的数量关系是( )。 A 、定基发展速度和环比发展速度的基期是一致的。

B、定基发展速度等于相应的各个环比发展速度之差 C、定基发展速度等于相应的各环比发展速度之和 D、两个相邻定基发展速度之商等于相应的环比发展速度 7.下列现象属于相关关系的是()。 A、圆的半径越长则面积越大 B、家庭收入越多则消费也 增长 C、产量越高总成本越多 D、体积随温度升高而膨胀,随 压力加大而缩小。 8.计算平均差时对每个离差取绝对值是因为( ) A.计算方法方便 B.离差有正有负 C.便于数学推导 D.各变量值与算术平均数离差之和为零 9、下列指标中属于动态相对指标的是()。 A、2005年国内生产总值为1995年的236.3% B、2005年国内生产总值中,第一、二、三产业分别为28.3% 、 44.3%、27.3% C、2001年到2006年我国人口平均增长1.48% D、2005年国民收入实际为计划的164.3% 10.某地农业增长值2004年在2000年的基础上增加到6000万元,增长1.5倍,则累计增长额为() A.2000 B.3600 C.4000 D.6000 11、下列指标属于结构相对指标的有() A.劳动生产率 B.积累和消费的比率 C.产品合格率D.中国与日本钢产量之比 12.由时点数列计算序时平均数,其假设条件是研究现象在相邻两个时点之间的变动为()

应用统计学试题及答案2

二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为 7.5分;乙班平均分为75分,标准差为7.5分。由此可知两个班考试 成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() A.520公斤 B.530公斤 C.540公斤 D.550公斤5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% B.400% C.120% D.1200% 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 A.10.71% B.21.95% C.12% D.13.64% 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显著性 D.规性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如 下,你认为哪个回归方程可能是正确的?() A.y=125-10x B.y=-50+8x C.y=150-20x D.y=-15-6x 三、多项选择题(每题2分,共10分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B.抽选出的单位有典型意义 C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算

应用统计学_第一阶段练习74363

江南大学网络教育第一阶段练习题 考试科目:《应用统计学》第章至第章(总分100分) __________学习中心(教学点)批次:层次: 专业:学号:身份证号: 姓名:得分: 一单选题 (共20题,总分值20分,下列选项中有且仅有一个选项符合题目要求,请在答题卡上正确填涂。) 1. 根据样本调查数据,制作统计数据分布直方图属于:(1 分)A A. 描述统计 B. 推断统计 C. 科学统计 D. 经验统计 2. 将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组,这样的分组方法称 为( ) (1 分)B A. 单变量值分组 B. 组距分组 C. 等距分组 D. 连续分组 3. 一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元, 他们选择在网上购物的主要原因是“价格便宜”。这里的参数是: (1 分)C A. 1000个消费者 B. 所有在网上购物的消费者 C. 所有在网上购物的消费者的平均消费额 D. 1000个消费者的平均消费额 4. 运用样本数据的统计量来推断总体的特征、变量的关系属于:(1 分)B A. 描述统计 B. 推断统计 C. 科学统计 D. 经验统计 5. 抽样调查与重点调查的主要区别是(1 分)D A. 作用不同 B. 组织方式不同 C. 灵活程度不同 D. 选取调查单位的方法不同 6. 由一组数据的最大值最小值中位数和两个四分位数5个特征值绘制而成的,反映原始数据分 布的图形,称为( ) (1 分)D A. 环形图 B. 茎叶图 C. 直方图 D. 箱线图

7. 要反映我国工业企业的整体业绩水平,总体单位是: (1 分)B A. 我国每一家工业企业 B. 我国所有工业企业 C. 我国工业企业总数 D. 我国工业企业的利润总额 8. 为了反映商品价格与需求之间的关系,在统计中应采用( ) (1 分)C A. 划分经济类型的分组 B. 说明现象结构的分组 C. 分析现象间依存关系的分组 D. 上述都不正确 9. 一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。他注意到, 雇员要么从家里带饭,要么在公司餐厅就餐,要么在外面的餐馆就餐。他收集数据的方法属于: (1 分)D A. 访问调查 B. 邮寄调查 C. 个别深度访问 D. 观察调查 10. 一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的 人均收入数据属于: (1 分)C A. 分类数据 B. 顺序数据 C. 截面数据 D. 时间序列数据 11. 下面的哪一个图形最适合描述结构性问题( ) (1 分)B A. 条形图 B. 饼图 C. 对比条形图 D. 直方图 12. 一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的 月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。这里的“月收入” 是: (1 分)C A. 分类变量 B. 顺序变量 C. 数值型变量 D. 离散变量 13. 统计整理阶段最关键的问题是( ) (1 分)B A. 对调查资料的审核 B. 统计分组 C. 统计汇总 D. 编制统计表 14. 下面哪一项属于连续性变量(1 分)C A. 学生的籍贯 B. 保险公司雇员数 C. 奶牛24小时的产奶量 D. 某杂货店一天销售的牛奶件数(箱) 15. 调查时限是指( ) (1 分)B A. 调查资料所属的时间 B. 进行调查工作的期限 C. 调查工作登记的时间 D. 调查资料的报送时间 16. 调查项目( ) (1 分)A A. 是依附于调查单位的基本标志 B. 与填报单位是一致的 C. 与调查单位是一致的 D. 是依附于调查对象的基本指标

相关文档
相关文档 最新文档