当前位置：文档库 › (完整版)统计学练习题和答案

(完整版)统计学练习题和答案

第一章导论

一、填空题

1.1.1 统计工作是人们对客观事物数量方面进行调查研究的认识活动。

1.1.2 调查得到的经过整理具有信息价值的各种统计数据、图表和文字资料都是统计资料。

1.1.3 统计学是一门收集、整理和分析统计数据的方法论科学，其目的是探索数据的内在数量规律性，以达到对客观事物的科学认识。

1.1.4 统计数据按其采用的计量尺度不同可以分为分类数据、顺序数据、数值型数据。

1.1.5 分类数据是指只能归入某一类别的非数字型数据。

1.1.6 分类数据是按品质属性对事物进行分类的结果，反映各个类型的数量结果。

1.1.7 顺序数据是指归于某一有序类别的非数字型数据。

1.1.8 数值型数据是指按数字尺度测量的观察值，也就是直接反映事物数量特征的数据。

1.1.9 统计数据按其收集方法不同，可以分为观测数据和实验数据。

1.1.10 观测数据是指通过调查或观测而收集到的数据。

1.1.11 实验数据是指在实验中控制实验对象而收集到的数据。

1.1.12 统计数据按被描述的对象和时间的关系不同分为截面数据、时间序列数据和混合数据。

1.1.13 截面数据是指对不同单位在同一个时间点上收集的数据。

1.1.14 时间序列数据是指对同一个单位的一个或多个变量在不同时间上收集到的数据。

1.1.15 混合数据是指在数据集中含有时间序列和截面数据成分的数据。

1.1.17 从统计方法的构成看，统计学可以分为描述统计学和推断统计学。

1.1.18 从统计方法研究和统计方法的应用角度来看，统计学可以分为理论统计学、应用统计学。

1.1.19 根据一定目的确定的所要研究事物的全体称为统计总体。

1.1.27 变量按其数值形式不同，可以分为离散型变量和连续型变量。

1.1.28 根据总体中包含的单位数是否有限，总体可以分为有限总体和无限总体。

1.1.29 统计学研究的对象是客观现象的数量方面。

二、单项选择题（在每小题的3个备选答案中选出1个正确答案，并将其字母填在题干后面的括号内）

1.2.1 人们对客观事物数量方面进行调查研究的认识活动是指（A ）

A．统计工作B．统计学C．统计资料

1.2.2 统计学是一门收集、整理和分析统计数据的（A ）

A．方法论科学B．实质性科学C．实证科学

1.2.3 统计数据分为分类数据、顺序数据、数值型数据的依据是（C ）

A．价值单位B．计量单位C．计量尺度

1.2.7 变量可以分为离散型变量和连续型变量，其依据是（A ）

A．数值形式B．计量单位C．计量尺度

1.2.9 如果要研究某市30万在校高等学校大学生的月消费支出情况，总体单位是（B ）

A．30万个大学生B．每一位在校大学生C．每一所大学

1.2.11 如果要研究某市2万户贫困家庭的生活状况，总体是（B ）

A．每一户贫困家庭B．2万户贫困家庭C．所有贫困人口

1.2.12 如果对连续生产线上的产品进行质量检验，那么研究对象是（A ）

A．无限总体B．有限总体C．抽样总体

1.2.14 当研究对象为某班50名学生时，张三同学的年龄20岁是一个（B ）

A．变量B．变量值C．统计指标

三、多项选择题（在下列4个备选答案中，至少有二个是正确的，请将其全部选出，并把字母填在题干后面的括号内）

1.3.1 当人们谈及什么是统计时，通常可以理解为（ACD ）

A．统计工作B．统计整理C．统计资料D．统计学

1.3.2 调查得到的经过整理具有信息价值的统计资料包括（ABD ）

A．统计数据B．统计图标C．统计软件D．统计年鉴

1.3.3 以下关于统计学的描述，正确的有（ACD ）

A．统计学是一门收集、整理和分析统计数据的方法论科学

B．统计学是一门收集、整理和分析统计数据的实质性科学

C．统计学的研究目的是探索数据的内在数量规律性

D．统计学提供了探索数据内在规律的一套方法

1.3.4 统计数据按其采用的计量尺度不同可以分为（ABC ）

A．分类数据B．顺序数据C．数值型数据D．截面数据

1.3.5 统计数据按其收集方法不同，可以分为（AB ）

A．观测数据B．实验数据C．时序数据D．混合数据

1.3.6 统计数据按被描述的对象和时间的关系不同分为（ABD ）

A．截面数据B．时间序列数据C．观测数据D．混合数据

1.3.8 从统计方法的构成看，统计学可以分为（AD ）

A．描述统计学B．理论统计学C．应用统计学D．推断统计学

1.3.9 作为一个统计总体，必须具有以下特征（ABD ）

A．同质性B．变异性C．统一性D．大量性

四、判断改错题

1.4.1 统计资料是统计工作的成果，包括调查得到的经过整理具有信息价值的各种统计数据、图表和文字资料。（√）

1.4.2 统计学是一门收集、整理和分析统计数据的实质性科学。（×，方法论科学）

1.4.3 分类数据是指只能归入某一类别的非数字型数据。（√）

1.4.4 顺序数据是按数量属性对事物进行分类的结果。（×，品质属性）

1.4.5 分类数据和顺序数据相似之处在于两者都是非数字型数据。（√）

1.4.6 统计数据按其描述的对象不同，可以分为观测数据和实验数据。（×，收集方法）

1.4.7 时间序列数据是指对不同单位在同一个时间点上收集的数据。（×，截面数据）

1.4.8 从统计方法的构成看，统计学可以分为描述统计学和推断统计学。（√）

1.4.9 总体的数量特征都是从每个总体单位的特征加以逐级汇总而体现出来的。（√）

1.4.10 同质性是指构成总体的个别事物在某个方面必须具有相同的性质。（√）

1.4.11 若总体中所包含的统计指标数是有限的，则称为有限总体。（×，总体单位数）

1.4.16 变量按其所受影响因素不同，可分为离散型变量和连续型变量。

（×，确定性变量和随机变量）

1.4.17 甲企业职工人数1248人，这是一个连续变量。（×，离散变量）

1.4.18 某地区2007年人均国内生产总值为13600元，这是一个离散变量。（×，连续变量）

五、简答题

1.5.1 如何理解统计学的性质？

答：为了更好地理解统计学的性质，我们应明确以下三个方面的问题。其一，统计学研究的对象是客观现象的数量方面；其二，统计学研究的是群体现象的数量特征与规律性；其三，统计学是一门方法论的科学。

1.5.2 统计数据有哪些基本分类？

答：统计数据有三种基本分类。一是按其采用的计量尺度不同，统计数据可以分为分类数据、顺序数据、数值型数据；二是按其收集方法不同，统计数据可以分为观测数据和实验数据；三是按被描述的对象和时间的关系不同，统计数据可以分为截面数据、时间序列数据和混合数据。

1.5.3 什么是描述统计学和推断统计学？

答：描述统计学（Descriptive Statistics）研究如何取得反映客观现象的数据，并通过图表形式对所收集的数据进行加工处理和显示，进而通过综合、概括与分析得出反映客观现象的规律性数量特征。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。

推断统计学（Inferential Statistics）则是研究如何根据样本数据去推断总体数量特征的方法，它是在对样本数据进行描述的基础上，对统计总体的未知数量特征作出以概率形式表述的推断。

1.5.4 什么是统计总体？它具有何特点？

答：统计总体就是根据一定目的确定的所要研究事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体，简称为总体。总体具有以下三个特点：其一，同质性，是指构成总体的个别事物在某个方面（或某一点上）必须具有相同的性质，这是构成总体的必要条件。其二，变异性，是指构成总体的个别事物除了至少在某一个方面具有相同的性质以外，其他方面应该存在差异，这是进行统计研究的前提。其三，大量性，是指构成总体的个别事物要求足够的多，这是探究客观事物规律性的基础。

1.5.5 什么是样本？它具有何特点？

答：从全及总体中抽取出来，作为代表这一总体的部分单位组成的集合体称为样本。

样本有以下显著的特点：其一，构成样本的单位必须取自全及总体内部，不允许总体外部的单位参加抽样过程；其二，从一个全及总体中可以抽取许多个样本；其三，样本具有代表性；其四，样本具有客观性。从全部总体中抽取样本，必须排除主观因素的影响。

第二章统计数据的收集、整理与显示

一、填空题

2.1.1 一切数据最初都来源于调查与实验。

2.1.2 自己进行调查与实验得到的数据称为一手数据（或者直接数据）。

2.1.3 抽样调查是按照随机原则从总体中抽取部分单位进行观察用以推算总体数量特征的一种统计调查方式。

2.1.13 数据数列分组的关键在于分组变量的选择和各组界限的划分。

2.1.14 某开口组的上限为30，相邻组组距是5，则其假定下限为25 ，组中值为27.5 。

2.1.15 某开口组的下限为280，相邻组组距是10，则其假定上限为290 ，组中值为285 。

2.1.16 在组距数列中，表示各组界限的变量值称为组限，各组上限与下限之间中点位置值称为组中值。

二、单项选择题（在每小题的3个备选答案中选出1个正确答案，并将其字母填在题干后面的括号内）

2.2.1 主要用来调查时点现象总体特征的一次性全面调查称为（C ）

A．抽样调查B．统计报表调查C．普查

2.2.2 按照随机原则抽取样本，并对总体的特征做出推断的调查方式是（A ）

A．抽样调查B．普查C．统计报表调查

2.2.3 采用事先设计好的问卷进行调查的方法称为（B ）

A．小组座谈法B．问卷调查法C．电话调查法

2.2.4 调查人员到现场对调查单位直接观察得到结果的方法称为（A ）

A．观察法B．实验法C．电话调查法

2.2.5 在分类的基础上，将总体的所有单位按类进行整理，形成总体单位在各组间的分布，称为（C ）A．频数B．次数C．频数分布

2.2.6 在问卷中没有提供答案，由被调查者自由地选择回答形式的问题称为（B ）

A．封闭性问题B．开放性问题C．复杂性问题

2.2.7 上四分位数

Q位置的计算公式是（A ）

A．3(1)

B．

C．

2.2.8 行标题通常用来表示横向变量的名称，一般在统计表的（B ）

A．中间B．左边C．右边

2.2.9 一组数15，18，19，20，22，24，26，27，28，29，32的上四分位数值和下四分位数值分别是（A ）A．28，19 B．29，20 C．28，20

2.2.10 一组数25，27，29，30，32，34的中位数值是（B ）

A．29 B．29.5 C．30

2.2.11 在分组时，凡遇到某单位的标志值刚好等于相邻两组上下限数值时，一般是（C ）

A．此值归入两组均可B．将此值归入上限所在组C．将此值归入下限所在组

2.2.12人口普查的调查单位是（C ）

A．全部人口B．每户家庭C．每个人

2.2.13 数据审核时，主要从及时性、准确性和完整性方面进行审核的数据是（A）

A．一手数据B．二手数据C．时间序列数据

三、多项选择题（在下列4个备选答案中，至少有二个是正确的，请将其全部选出，并把字母填在题干后面的括号内）

2.3.1 常用的统计调查方式有（ACD ）

A．普查B．科学试验C．统计报表调查D．抽样调查

2.3.2 属于数据收集方法的有（ABCD ）

A．访问调查法B．电话调查法C．小组座谈法D．实验法

2.3.3 设计调查表时是采用一览表还是单一表，取决于（AD ）

A．调查单位与报告单位的关系B．方便性C．经费的多少D．调查项目的多少

2.3.4 选择回答型的设计方法包括两项选择法及（ABCD ）

A．多项选择法B．顺序选择法C．评定尺度法D．双向列联法

2.3.5 对封闭性问题的设计，答案要遵循的原则是（CD ）

A．完备性B．系统性C．穷尽性D．互斥性

2.3.6 在分组汇总之前，要对原始资料的哪些方面进行审核（ABC ）

A．及时性B．准确性C．完整性D．互斥性

2.3.7分类数据的图示方法主要包括（ACD ）

A．条形图B．直方图C．对比条形图D．饼图

2.3.8 数据分组根据分组变量的多少可以分为（CD ）

A．单层分组B．多层分组C．简单分组D．复合分组。

2.3.9 从外形看，统计表都由哪些部分组成？（ABCD ）

A．表头B．行标题C．列标题D．数字资料

2.3.10 属于数值型数据图示方法的有（ABCD ）

A．直方图B．箱线图C．雷达图D．茎叶图

四、判断改错题

2.4.5 实验法具有方法科学、反映客观、过程容易控制等优点。（√）

2.4.6 小组座谈法有匿名性、定量化和轮回反馈式等特点。

（×，德尔菲法有匿名性、定量化和轮回反馈式等特点）

2.4.7 网络调查是指利用国际互联网搜集数据方法。（√）

2.4.8 开放性问题一般放在问卷的前面。（×，开放性问题一般放在问卷的最后）

2.4.9 组织普查时要规定统一的时间。（×，组织普查时要规定统一的标准时点）

2.4.11抽样调查属于全面调查方式。

（×，普查属于全面调查方式，抽样调查属于非全面调查方式）

五、简答题

2.5.1 在选择二手数据时应该注意什么？

答：（1）应根据研究目的选择二手数据；（2）注意二手数据变量名称的含义是否发生变化；

（3）注意二手数据的计算口径和计算方法是否一致；（4）注意尊重二手数据所有者的权益。

2.5.2 什么是普查？组织普查时，应该注意什么问题？

答：普查是国家为了详细地了解某项重要的国情国力而专门组织的一次性全面调查，主要用来调查属于一定时点上现象的总体特征。组织普查时，应该注意（1）要规定统一的标准时点；（2）严格设定必需的调查项目；（3）尽可能地缩短普查登记期限；（4）按一定的周期进行同类普查。

2.5.3 抽样调查具有什么特点？

答：（1）从总体中随机抽取样本单位；（2）抽样调查的目的是根据样本的数量特征推断总体的数量特征；（3）抽样误差可以事先计算并且加以控制。

2.5.4 统计数据的具体收集方法有哪些？

答：有访问调查法、问卷调查法、德尔菲法、电话调查法、电脑辅助调查法、小组座谈法、观察法、实验法、网络调查法等。

2.5.5 什么是访问调查法？访问调查法的特点是什么？

答：访问调查法是调查者通过与被调查者的当面交谈而得到所需资料的调查方法。在访问调查中，调查人员可以直接了解被调查者对调查问题的态度、观点、举止和调查现场的环境等，为判断调查资料的准确程度提供一定的依据。与其他调查法相比，访问调查法的特点有：回答率较高、数据比较准确、可使用较复杂的问卷、调查成本高等。

2.5.6 什么是德尔菲法？德尔菲法的特点是什么？

答：德尔菲法是指按照规定的程序，采用邮寄或电子邮件的方式，反复多次地收集各地专家的看法，使不同意见趋于一致的调查方法。德尔菲法有匿名性、定量化和轮回反馈式等特点。

2.5.7 一份完整的调查方案，应该包括哪些内容？

答：（1）调查目的；（2）调查对象、调查单位和报告单位；（3）调查项目与调查表；

（4）调查时间、调查方式与方法；（5）调查的组织工作。

2.5.8 为了保证原始统计资料的准确性，在确定调查项目时应该注意什么问题？

答：（1）调查项目的含义必须明确，不能模棱两可；（2）考虑取得资料的可行性，有些调查项目虽然需要，但在现有条件下难以取得资料的则不应列入；（3）调查项目的答案应满足完备性和互斥性。如果要求选择回答，则必须列出所有可能的答案，以免出现重复或遗漏；（4）确定不同时期同类调查的调查项目时，前后时期的调查项目应互相衔接，以便进行动态比较分析。

2.5.9 设计问卷的提问项目时一般应注意遵循哪些规则？

答：（1）问题的顺序安排应注意逻辑性；（2）问题的顺序安排应注意兴趣；

（3）问题的顺序安排应注意先易后难；（4）开放性问题一般放在最后。

2.5.10 什么是问卷中的封闭性问题？封闭性问题答案的设计有哪些类型可供选择？

答：封闭性问题是指调查者已经设计好若干个答案，被调查者只需从中选择一个或一个以上答案的问题。其答案的设计有两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法等可供选择。

2.5.11 分类数据和顺序数据的图示方法各有哪些？

答：分类数据的图示方法包括条形图、Pareto图、对比条形图和饼图；顺序数据的图示方法包括累计频数分布图和环形图。

2.5.12 数据分组应注意什么？

答：（1）保持组内单位的同质性和组间单位的差异性；

（2）统计分组要符合穷举性原则；（3）统计分组要符合互斥性原则。

2.5.13 数值型数据的图示方法有哪些？

答：数值型数据的图示方法包括直方图、茎叶图、箱线图、线图、二维或三维散点图、气泡图、雷达图等。

2.5.14 统计表由哪几个部分组成？

答：统计表有多种具体形式，但不论哪种形式的统计表，从外形看都由表头、行标题、列标题和数字资料四个部分组成。

2.5.15 简述统计表的设计规则。

答：（1）合理安排统计表的结构；（2）统计表的总标题、行标题、列标题都要能简明扼要地

说明有关内容；（3）统计表的左右两端一律不封口；表的上下两端一般用粗线，其他的中间线都用细线隔开；（4）表中数据一般采用右对齐形式，有小数点时以小数点对齐，同栏数据要具有同一精确度；不要求填写或不可能有答案的表格单元，一般用“—”表示，在数字资料区不能出现“同上”、“同左”等文字；（5）若使用的是次级资料，应在表的下方注明资料来源，既显示对原作者的尊重，又便于读者查对。有时还需要在表的下方附上简明的指标解释。

2.5.16 试设计一份调查大学生对本科教学计划意见的问卷，进行调查并将调查结果制成统计表和统计图。

答：略

2.5.17 调查本班同学的来源地（按省或按市），制作频数分布表、条形图、柱形图和Pareto 图。

答：略

六、作图与计算题

2.6.1 为了解某大型居民小区的物业管理质量，随机抽取了由100个家庭组成的样本。质量等级的含义分别为：A．差；B．较差；C．一般；D．较好；E．好。有关资料如下：

C A B B

D A D D C B

D C A

E C A B C D D

B C E B A B C D B B

B C B A D B B C B A

B C D E B C C C C B

D D B A

E A B C E A

D C A B C C D A C E

C B C A B C E B

D A

E C D D B A A C C A

C B A C

D B B B C D

分布。

解：（1）顺序数据。

（2

等级户数向上累积（%）

A1818

B2846

C2874

D1892

E8100

合计100—

（3）条形图

0510********

2.6.2 某生产车间30名工人日加工零件数（件）如下：

30 26 42 41 36 44 40 37 37 25 45 29 43 31 36

49 34 47 33 43 38 42 32 34 38 46 43 39 35 36

试根据以上资料分成如下几组：25—30，30—35，35—40，40—45，45—50，编制频数分布表，并绘制直方图。

解：

零件数（件）频率百分比（%）

25-30 4 13.33

30-35 6 20

35-40 9 30

40-45 8 26.67

45-50 3 10

合计30 100

直方图：

2.6.3 某调查公司对省内各市2007年度评选的“三八”红旗手的状况进行了调查，得到如下的百分比信息：

（1）所从事的行业：服务业41%，制造业35%，政府机关8%，个体户3%，其他13%；

（2）学历状况：高中30%，本科45%，硕士15%，博士4%，其他6%；

（3）婚姻状况：有配偶85%，未婚6%，其他9%。

要求：试利用上述信息对这些先进人物作出描述。

解：在所选的选的“三八”红旗手中，服务业和制造业占绝大多数，分别为41%和35%。

行业

服务业

41%

制造业

35%

政府机关

个体户

其它

13%

服务业

制造业

政府机关

个体户

其它

在学历中以高中生和本科生居多，分别占30%和45%。

对于配偶情况，有配偶的占85%，未婚的占8%。

2.6.4 为了解某特定商品房型的价格变动情况，某市调查机构随机抽取了25个样本，得销售价格资料如下：

销售价格（单位：元）

5660 5595 6060 5500 5630

5899 6295 5749 5820 5843

5710 5950 5720 5575 5760

6090 5770 5682 6016 5650

5425 5367 6380 5945 6120

要求：试根据上表资料绘制茎叶图。

解：

2.6.5 D超市30天的销售额资料如下（单位：万元）：

596335419263

40 67 65 46 45 84

56 42 64 57 43 64

36 56 69 63 54 72

536431705178要求：试根据上表资料进行数据分组，并绘制这组数据的频数直方图。

解：将数据分为7组，组距为10。

频数分布表

按销售额分组（万元）频率百分比（%）

30-40413.3

40-50516.7

50-60723.3

60-70930.0

70-80310.0

80-901 3.3

90-1001 3.3

合计30100.0

直方图：

2.6.6

解：

对比柱形图

（系列1为世界十大富豪，系列2为中国内地十大富豪）环形图：

2.6.7 试通过对次级资料的收集，绘制1990—2006年我国国内生产总值（GDP）的线图，（按当年价格计算，单位：亿元）。

解：

1990—2006年我国国内生产总值（GDP）的线图

：

解：

如图所示，华东地区的平均销售额最高，其次是华北地区，较低的是华中地区，排最后的是华南地区；从销售额分布的离散程度来说，华中地区（有两个离异点）和华南地区的销售额较为集中，，华北和华东地区的销售额则比较分散。

第三章数据分布特征的描述

一、填空题

3.1.1 集中趋势是指一组数据向其中心值靠拢的倾向。 3.1.2 加权算术平均数受两个重要因素的影响，一个是各组变量值；另一个是各组变量值出现的频数或频率。

3.1.3 计算比率的平均数时，如果已知比率及其基本计算式的分母资料，则采用加权算术平均法。

3.1.4 计算比率的平均数时，如果已知比率及其基本计算式的分子资料，则采用加权调和平均法。

3.1.5 几何平均法是计算平均比率或平均发展速度最适用的一种方法。 3.1.6 众数是指一组数据中出现次数最多的变量值。

3.1.7 四分位数是指将按大小顺序排列的一组数据划分为4等分的3个变量值。 3.1.8 十分位数是指将按大小顺序排列的一组数据划分为10等分的9个变量值。 3.1.11 上四分位数与下四分位数之差的简单算术平均数称为四分位差。 3.1.12 各个变量值与其算术平均数离差的绝对值的平均数称为平均差。

3.1.13 总体方差是各个数据与其算术平均数的离差平方的平均数，通常以2σ表示。

二、单项选择题（在每小题的3个备选答案中选出1个正确答案，并将其字母填在题干后面的括号内）

3.2.1 先将一组数据的变量值按一定顺序排列，然后取某一位置的变量值来反映这些数据的一般水平，把这个特殊位置上的数值看作是平均数，称为（ B ）

A ．数值平均数

B ．位置平均数

C ．离散系数

3.2.2 算术平均数反映的是数据分布的什么特征（ A ） A ．集中趋势 B ．离散趋势 C ．偏态趋势 3.2.3 根据算术平均数的性质，下列表达式正确的是（ A ）

A ．0)(=∑-f x x

B ．

0x x f -=? C ．2()0x x f -=?

3.2.4 如果分布数列中各变量值呈几何级数变化或频率分布极不对称，计算平均数的常用方法是（ B ）

A ．算术平均法

B ．几何平均法

C ．调和平均法

3.2.5 用各组的组中值代表其实际数据计算算术平均数时，通常假定（ A ） A ．各组数据在组内是均匀分布的 B ．各组次数相等 C ．各组数据之间没有差异

3.2.6 当数据分布为右偏分布时，算术平均数与中位数、众数的关系表现为（ A ） A ．o e M M x << B ．e o x M M << C ．o e x M M <<

3.2.7 离散程度测度指标中，受极端值影响最大的是（ C ） A ．平均差 B ．标准差 C ．全距

3.2.8 平均差与标准差的主要区别在于（ B ） A ．说明问题的角度不同 B ．对离差的数学处理方法不同 C ．计算对象不同

3.2.9 标准差系数消除了（ B ） A ．总体单位数多少的影响 B ．平均数大小和计量单位的影响 C ．离散程度的影响 3.2.10 直接使用标准差比较分析两个同类总体平均数的代表性，其前提条件是（ B ） A ．两个总体的标准差应该相等 B ．两个总体的平均数应该相等 C ．两个总体的离差平方和应该相等

3.2.11 下列指标中，实际应用最广泛的离散程度测度指标是（ B ） A ．平均差 B ．标准差 C ．离散系数

3.2.12 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布的（ A ） A ．偏斜程度 B ．离散程度 C ．集中程度

三、多项选择题（在下列4个备选答案中，至少有二个是正确的，请将其全部选出，并把字母填在题干后面的括号内）

3.3. 1 描述数据分布集中趋势的指标有（ ABCD ） A ．算术平均数 B ．调和平均数 C ．众数 D ．中位数

3.3.2 描述数据分布离散趋势的指标有（ ABCD ） A ．全距 B ．平均差 C ．标准差 D ．离散系数

3.3.3 算术平均数所具有的数学性质有（ AC ） A ．各个变量值与其平均数离差之和等于零

B ．各个变量值与其平均数离差的绝对值之和等于零

C ．各个变量值与其平均数离差的平方和为最小值

D ．各个变量值与其平均数离差的平方和为最大值

3.3.4 下列不适于计算算术平均数的数据类型有（ AB ） A ．分类数据 B ．顺序数据 C ．数值型数据 D ．截面数据

3.3.5 加权算术平均数中，各个变量值的权数要起作用必须具备两个条件（ AD ） A ．各个变量值之间有差异 B ．各个变量值的权数相等 C ．各个变量值相等 D ．各个变量值的权数有差异

3.3.6 下列对众数的解释说明中，正确的有（ ABCD ） A ．众数是指一组数据中出现次数最多的变量值 B ．一组数据中可能有多个众数，也可能没有众数 C ．众数不受极端值的影响 D ．众数缺乏灵敏性

3.3.7 下列对中位数的解释说明中，正确的有（ ACD ） A ．中位数不受分布数列的极大或极小值影响 B ．中位数是指一组数据中出现次数最多的变量值 C ．中位数缺乏灵敏性

D ．当次数分布偏态时，中位数的代表性会受到影响

3.3.8 以p SK 表示根据皮尔逊测度法计算的偏态系数，下列陈述中正确的是（ ABCD ） A ．经验证明，在适度偏态的情况下，33p SK -≤≤ B ．当,0o p x M SK ==时，数据分布呈对称分布 C ．当,0o p x M SK >>时，数据分布呈右（正）偏分布 D ．当,0o p x M SK <<时，数据分布呈左（负）偏分布

3.3.9 下列关于四分位差的解释说明中，正确的有（ ABCD ） A ．四分位差就是上四分位数与下四分位数之差的简单算术平均数 B ．四分位差越小，表明中位数的代表性越好 C ．四分位差越大，表明中位数的代表性越差 D ．四分位差可以避免受极端值的影响

3.3.10 比较不同总体平均数的代表性时，应该使用离散系数，因为（ AB ） A ．离散系数可以消除平均数大小的影响 B ．离散系数可以消除计量单位的影响

C ．离散系数可以消除总体单位数多少的影响

D ．离散系数可以消除变量值之间差异程度的影响

四、判断改错题

3.4.1 算术平均数既适用于数值型数据，也适用于分类数据和顺序数据。

（ ×，不适用于分类数据和顺序数据）

3.4.2 根据分组数据计算的平均数只是实际平均数的近似值。（ √ ） 3.4.3 简单算术平均数的大小只与变量值的大小有关，与权数无关。（ √ ） 3.4.4 各变量值与其算术平均数的离差平方和为最小值。（ √ ） 3.4.5 众数可直观地说明分布的离散趋势，可用它反映变量值一般水平的代表值。（ ×，集中趋势）

3.4.6 对于一组数据，可能存在一个或多个众数，也可能不存在众数。（ √ ） 3.4.7 四分位数是将按大小顺序排列的一组数据划分为三等分的四个变量值。（×，四等分的三个变量值）

3.4.8 十分位数是指将按大小顺序排列的一组数据划分为10等分的10个变量值。（ ×，9个变量值）

3.4.9 在左偏态分布中，众数最小，中位数适中，算术平均数最大，即e M o M x <<。（ ×，右偏态分布）

3.4.10 数据的离散程度越大，集中趋势的测度值对该组数据的代表性就越差。（ √ ） 3.4.11 在实际工作中，全距常用来检查产品质量的稳定性和进行质量控制。（ √ ） 3.4.12 偏态和峰态是对分布集中程度的测度。（ ×，分布形状） 3.4.13 凡频率分布中各变量值对众数的相对位置都较正态曲线更为分散，其曲线较为平缓，则为低峰度。（ √ ）

3.4.14 如果以β表示峰度系数，当0>β时，分布曲线为低峰曲线，表明变量值的差异程度大，平均数代表性差。（ ×，0<β ）

五、简答题

3.5.1 什么是集中趋势？测度集中趋势的主要指标有哪些？答：集中趋势是指一组数据向其中心值靠拢的倾向，测度集中趋势也就是寻找数据一般水平的代表值或中心值。

取得集中趋势代表值的方法通常有两种：一是从一组数据（即各个变量值）中抽象出具有一般水平的量，这个量不是某一个具体变量值，但又要反映这些数据的一般水平，这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数、几何平均数等形式。二是先将一组数据的变量值按一定顺序排列，然后取某一位置的变量值来反映这些数据的一般水平，把这个特殊位置上的数值看作是平均数，称作位置平均数。位置平均数有众数、中位数等形式。

3.5.2 什么是调和平均数？调和平均数与算术平均数有何关系？答：调和平均数也称“倒数平均数”，它是对变量的倒数求平均，然后再取倒数而得到的平均数。

从数学定义角度看算术平均数与调和平均数是不一样的，但在社会经济应用领域，调和平均数实际上只是算术平均数的另一种表现形式，二者本质上是一致的，惟一的区别是计算时使用了不同的数据。

3.5.3 什么是几何平均数？其应用场合是什么？

答：几何平均数也称几何均值，它是n 个变量值乘积的n 次方根。几何平均法是计算平均比率或平均发展速度最适用的一种方法。如果分布数列中各变量值呈几何级数变化或频率分布极不对称，也常采用几何平均法来计算平均数。如果被平均的变量值中有一个为零，则不能计算几何平均数；如果变量值为负数，开奇次根会形成虚根，失去意义。

3.5.4 什么是离散趋势？测度离散趋势的主要指标有哪些？

答：离散趋势是指各个变量值远离其中心值的程度，是数据分布的另一个重要特征。

描述数据离散程度常用的测度值有全距、异众比率、四分位差、平均差、标准差以及离散系数，其中标准差最重要。

3.5.5 什么是偏度和峰度？如何根据偏态系数和峰度系数判断数据分布的形态？答：偏度是描述数据分布对称性的特征值。

峰度是统计学中描述数据分布平坦或尖峭的程度的特征值。

根据皮尔逊测度法测算的偏态系数p SK ，经验证明，在适度偏态的情况下，33p SK -≤≤。当,0o p x M SK ==时，数据分布呈对称分布；当,0o p x M SK >>时，数据分布呈右（正）偏分布；当,0o p x M SK <<时，数据分布呈左（负）偏分布。

根据中心矩法计算的偏态系数α，当0α=时，数据分布呈对称分布形态；0α<，数据分布呈负（左）偏态；0α>，数据分布呈正（右）偏态；α值越接近于0，数据分布越趋于对称，α的绝对值越大，数据分布越偏斜。

根据峰度系数β，当0β=时，分布曲线为正态曲线；当0>β时，分布曲线为高峰曲线，表明变量值的差异程度小，平均数代表性好；当0<β时，分布曲线为低峰曲线，表明变量值的差异程度大，平均数代表性差。

六、计算题

3.6.1 2007

要求：试计算20名工人日产量的算术平均数、众数和中位数。解：

（1）20名工人日产量的算数平均数：

282294307315322601

30.052020

xf x f ∑?+?+?+?+?====∑（件/人）

。（2）从该企业的产量资料表可以看出，20名工人日产量的众数为30件；（3）20名工人日产量的中位数：工人总数的二分之一是10人，从小到大累计人数首次超过10的组所对应的日产量为30件，则中位数为30件。

要求：试计算该管理局工人的月平均工资。解：

根据已知资料，列表计算如下：

某管理局工人的月平均工资计算表

该管理局工人的月平均工资为： 150015150035250032350018203000

203010020

f x x f

=?+?+?+?==

==∑∑（元/人）。

要求：试计算该工业局工人平均劳动生产率。解：

根据已知资料，列表计算如下：

该工业局工人平均劳动生产率计算表

该工业局工人平均劳动生产率为：

552400651600751200851200951100532500

7175007500xf x f ∑?+?+?+?+?====∑（吨/人）

。

3.6.4 某企业生产A 种产品需要经过三个连续作业的车间才能完成。2008年1月第一车间

粗加工产品的合格率为98%，第二车间精加工产品的合格率为95%，第三车间最后装配的合格率为92%。

要求：试计算该产品的企业平均合格率。解：

该产品的企业平均合格率为：

94.97%m G =

。

3.6.5 根据抽样调查结果，2008年2月某市居民通讯支出额的众数为120元，算术平均数为150元。

要求：试根据算术平均数、中位数及众数之间的关系，计算中位数的近似值，并说明该市居民通讯支出额分布的态势。

解：

（1）该市居民通讯支出额的中位数近似值为：

21202150

14033o e M x M ++?===（元）

。（2）由120<140<150显然有e M o M x <<，即该市居民通讯支出额呈尾巴拖在右边的正偏态分布，也即右偏分布。

3.6.6

要求：试计算1996～2007年的平均年利率。解：

1996～2007年的平均年利率为：

100%100%9.14%G x =

3.6.7 根据500户抽样调查结果，2007年某市城市居民家庭按月人均可支配收入分组的资料如下：

要求：根据上述资料计算2007年该市居民家庭月人均可支配收入及其平均差和标准差。解：

（1）2007年该市居民家庭月人均可支配收入为：

5001515002825003235001845007

2240100

i f x x f

=?+?+?+?+?==

=∑∑（元/人）。

（2）相关计算过程如下：

2007年该市居民家庭月人均可支配收入计算表

人均可支配收入的平均差为： 17401522607100x x f AD f

-?++?=

∑∑L =93640

100

=936.40(元)

（3）标准差为：

14.1129499

500

10012724000049950010072260151740499500)

(221

=?=??++?=?-=

∑

∑=Λi i

i i f f x x S (元)

3.6.8 2006年某校学生会为了解在校大学生的消费支出情况，从全校本科学生中按性别随机各抽取要求：根据表中资料

（1）分别计算男女学生的平均月消费支出；

应用统计学试题及答案解析

北京工业大学经济与管理学院2007－2008年度第一学期期末应用统计学主考教师专业：学号：姓名：成绩： 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一．单选题（每题2分，共20分） 1．在对工业企业的生产设备进行普查时，调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2．一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3．某连续变量数列，其末组为“500以上”。又知其邻组的组中值为480，则末组的组中值为 A 520 B 510 C 530 D 540 4．已知一个数列的各环比增长速度依次为5%、7％、9％，则最后一期的定基增长速度为 A ．5％×7％×9％ B. 105%×107％×109％ C ．（105％×107％×109％）－1 D. 1%109%107%1053 5．某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –4.76% C. –33.3% D. 3.85%

6．对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= －1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7．某乡播种早稻5000亩，其中20％使用改良品种，亩产为600 公斤，其余亩产为500 公斤，则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件乙车间: x =90件, σ=6.3件哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

统计学模拟试卷和答案 (1)

北京语言大学网络教育学院《统计学》模拟试卷一注意： 1.试卷保密，考生不得将试卷带出考场或撕页，否则成绩作废。请监考老师负责监督。 2.请各位考生注意考试纪律，考试作弊全部成绩以零分计算。 3.本试卷满分100分，答题时间为90分钟。 4.本试卷分为试题卷和答题卷，所有答案必须答在答题卷上，答在试题卷上不给分。一、【单项选择题】(本大题共10小题，每小题2分，共20分)在每小题列出的四个选项中只有一个选项是符合题目要求的，请将正确选项前的字母填在答题卷相应题号处。 1.若正态总体，方差2σ已知，则总体均值μ的区间估计所采用的统计量为（）。 2.利用最小二乘法配合趋势线方程的条件是：（）。 3.有10位学生，其中8位男生，2位女生。从中一次随机抽选4人，则恰巧其中有2位女生的概率为（）。 4.假设检验中的显着性水平越高，对同一问题（）。 [A] 临界点就越小 [B] 所需样本量就越大 [C] 就越有可能接受H [D] 就越小 5.各实际观测值i y 与回归值?i y 的离差平方和称为（）。 [A] 回归平方和 [B] 剩余平方和 x x x x [A] ?()0i i y y -=∑ [B] 2 ?()i i y y -∑最小 [C] 0t =∑ [D] A 且B [A] 4221028()()10 10 C [B] 2228()()10 10 [C] 224 8210/C C C [D]

[C] 总离差平方和 [D] 估计标准误差 6.在对一个4×4列联表进行2χ检验时，2χ 分布的自由度是（）。 7.我国目前的零售价格指数的特点是( )。 [A] 对所选商品使用的价格是该商品的市价 [B] 对所选商品使用的价格是该商品的议价 [C] 是根据全部零售商品计算而得 [D] 是采用加权算术平均形式计算的 8.在回归分析中，F 检验主要是用来进行( )检验。 [A] 回归方程的显着性 [B] 相关系数的显着性 [C] 回归系数的显着性 [D] 估计标准误差的显着性 9.样本方差和总体方差在计算上的区别是( )。 [A] 只有样本方差才使用了全部数据 [B] 样本方差是用数据个数去除离差平方和 [C] 只有总体方差才使用了全部数据 [D] 总体方差是用数据个数去除离差平方和 10.2~(,12)X N μ，则(||36)P x μ-≤=( )。二、【多项选择题】(本大题共 10小题，每小题3分，共30分)在每小题列出的四个选项中至少有两个选项是符合题目要求的，请将正确选项前的字母填在答题卷相应题号处。多选、少选、错选均无分。 11.研究促销方式对销售量的影响，促销方式共有三个水平，则这种方差分析是（）。 [A] 单因素方差分析 [B] 双因素方差分析 [A] 16 [B] 12 [C] 9 [D] 2 [A] [B] [C] [D]

统计学简答题参考答案讲解学习

统计学简答题参考答案

（1）按照统计研究的目的，将数据按分组标志进行分组。按品质标志进行分组时，可将其每个具体的表现作为一个组，或者几个表现合并成一个组，这取决于分组的粗细。按数量标志进行分组，可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组；组距式分组将变量的取值范围（区间）作为一个组。统计分组应遵循“不重不漏”原则（2）将数据分配到各个组，统计各组的次数，编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度？答：数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位？答：均值是对所有数据平均后计算的一般水平的代表值，数据信息提取得最充分，具有良好的数学性质，是数据误差相互抵消后的客观事物必然性数量特征的一种反映，在统计推断中显示出优良特性，由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和应用场合。答：众数、中位数和均值是分布集中趋势的三个主要测度，众数和中位数是从数据分布形状及位置角度来考虑的，而均值是对所有数据计算后得到的。众数容易计算，但不是总是存在，应用场合较少；中位数直观，不受极端数据的影

医学统计学试题和答案解析

第一套试卷及参考答案一、选择题 (4０分） 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式Ｂ负偏态分布 C 正偏态分布Ｄ正态分布与近似正态分布 3、要评价某市一名５岁男孩得身高就是否偏高或偏矮，其统计方法就是( A ） A 用该市五岁男孩得身高得９5%或９9%正常值范围来评价Ｂ用身高差别得假设检验来评价Ｃ用身高均数得9５％或９９%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用（ A ) Ａ变异系数 B 方差Ｃ标准差 D 四分位间距５、产生均数有抽样误差得根本原因就是（ A ) A、个体差异Ｂ、群体差异Ｃ、样本均数不同Ｄ、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为（ A ）（A)相对比（B) 构成比（C)定基比 (D)率 7、统计推断得内容为（ D ) A、用样本指标估计相应得总体指标Ｂ、检验统计上得“检验假设”C、A与Ｂ均不就是Ｄ、Ａ与Ｂ均就是 8、两样本均数比较用t检验，其目得就是检验（ C ) Ａ两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本，样本含量分别为n1与n２，在进行成组设计资料得ｔ检验时,自由度就是（ D ） (A） n1+ n2 (B) n1+ n2–１（C) n1＋ n2 +1 (D）n1+ ｎ2-２ 10、标准误反映（ A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得（Ｃ） A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小Ｄ纵向距离最小１2、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为ｔr,对回归系数检验得ｔ值为ｔb,二者之间具有什么关系？（Ｃ) A t r>t b B t r〈t b C t r= tｂ D二者大小关系不能肯定 13、设配对资料得变量值为x１与x2,则配对资料得秩与检验（D ) A分别按ｘ1与x2从小到大编秩Ｂ把x１与x2综合从小到大编秩Ｃ把x１与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、０5，ν可认为( A ) Ａ各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同Ｄ各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原，其中甲年级调查3５人，阳性人数4人；乙年级调查40人,阳性人数８人。该资料宜选用得统计方法为（ A ） A.四格表检验 B、四格表校正检验 C t检验 D U检验 1６、为调查我国城市女婴出生体重：北方n1=5385，均数为3、０8kg,标准差为0、５3kｇ；南方n２=4８96,均数为3、1０ｋg,标准差为０、34kｇ,经统计学检验，p=0、０034〈0、０1,这意味着( D )

应用统计学试题和答案分析

六、计算题：（要求写出计算公式、过程，结果保留两位小数，共4题，每题10分） 1、某快餐店对顾客的平均花费进行抽样调查，随机抽取了49名顾客构成一个简单随机样本，调查结果为：样本平均花费为元，标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间；（φ（2）=）49=n 是大样本，由中心极限定理知，样本均值的极限分布为正态分布，故可用正态分布对总体均值进行区间估计。已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据，得该快餐店顾客的总体平均花费数额%的置信区间为（，） 3 要求：①、利用最小二乘法求出估计的回归方程；②、计算判定系数R 。附：10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题解 ① 计算估计的回归方程： ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为：y ) =+x ② 计算判定系数： 4 计算下列指数：①拉氏加权产量指数；②帕氏单位成本总指数。 4题解： ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题（每小题1分，共10题） 1、我国人口普查的调查对象是，调查单位是。 2、___ 频数密度 =频数÷组距，它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用饼图条图图来显示。 4、某百货公司连续几天的销售额如下：257、276、297、252、238、310、240、236、265，则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元，2005年3季度完成的GDP=36亿元，则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%，职工人数增加了2%，则该企业工资总额增长了 % 。 7、对回归系数的显着性检验，通常采用的是 t 检验。 8、设置信水平=1-α，检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲＞σ乙，x 甲＞x 乙，由此可推断 ( )