文档库 最新最全的文档下载
当前位置:文档库 › (完整版)统计学练习题和答案

(完整版)统计学练习题和答案

(完整版)统计学练习题和答案
(完整版)统计学练习题和答案

第一章导论

一、填空题

1.1.1 统计工作是人们对客观事物数量方面进行调查研究的认识活动。

1.1.2 调查得到的经过整理具有信息价值的各种统计数据、图表和文字资料都是统计资料。

1.1.3 统计学是一门收集、整理和分析统计数据的方法论科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识。

1.1.4 统计数据按其采用的计量尺度不同可以分为分类数据、顺序数据、数值型数据。

1.1.5 分类数据是指只能归入某一类别的非数字型数据。

1.1.6 分类数据是按品质属性对事物进行分类的结果,反映各个类型的数量结果。

1.1.7 顺序数据是指归于某一有序类别的非数字型数据。

1.1.8 数值型数据是指按数字尺度测量的观察值,也就是直接反映事物数量特征的数据。

1.1.9 统计数据按其收集方法不同,可以分为观测数据和实验数据。

1.1.10 观测数据是指通过调查或观测而收集到的数据。

1.1.11 实验数据是指在实验中控制实验对象而收集到的数据。

1.1.12 统计数据按被描述的对象和时间的关系不同分为截面数据、时间序列数据和混合数据。

1.1.13 截面数据是指对不同单位在同一个时间点上收集的数据。

1.1.14 时间序列数据是指对同一个单位的一个或多个变量在不同时间上收集到的数据。

1.1.15 混合数据是指在数据集中含有时间序列和截面数据成分的数据。

1.1.17 从统计方法的构成看,统计学可以分为描述统计学和推断统计学。

1.1.18 从统计方法研究和统计方法的应用角度来看,统计学可以分为理论统计学、应用统计学。

1.1.19 根据一定目的确定的所要研究事物的全体称为统计总体。

1.1.27 变量按其数值形式不同,可以分为离散型变量和连续型变量。

1.1.28 根据总体中包含的单位数是否有限,总体可以分为有限总体和无限总体。

1.1.29 统计学研究的对象是客观现象的数量方面。

二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内)

1.2.1 人们对客观事物数量方面进行调查研究的认识活动是指(A )

A.统计工作B.统计学C.统计资料

1.2.2 统计学是一门收集、整理和分析统计数据的(A )

A.方法论科学B.实质性科学C.实证科学

1.2.3 统计数据分为分类数据、顺序数据、数值型数据的依据是(C )

A.价值单位B.计量单位C.计量尺度

1.2.7 变量可以分为离散型变量和连续型变量,其依据是(A )

A.数值形式B.计量单位C.计量尺度

1.2.9 如果要研究某市30万在校高等学校大学生的月消费支出情况,总体单位是(B )

A.30万个大学生B.每一位在校大学生C.每一所大学

1.2.11 如果要研究某市2万户贫困家庭的生活状况,总体是(B )

A.每一户贫困家庭B.2万户贫困家庭C.所有贫困人口

1.2.12 如果对连续生产线上的产品进行质量检验,那么研究对象是(A )

A.无限总体B.有限总体C.抽样总体

1.2.14 当研究对象为某班50名学生时,张三同学的年龄20岁是一个(B )

A.变量B.变量值C.统计指标

三、多项选择题(在下列4个备选答案中,至少有二个是正确的,请将其全部选出,并把字母填在题干后面的括号内)

1.3.1 当人们谈及什么是统计时,通常可以理解为(ACD )

A.统计工作B.统计整理C.统计资料D.统计学

1.3.2 调查得到的经过整理具有信息价值的统计资料包括(ABD )

A.统计数据B.统计图标C.统计软件D.统计年鉴

1.3.3 以下关于统计学的描述,正确的有(ACD )

A.统计学是一门收集、整理和分析统计数据的方法论科学

B.统计学是一门收集、整理和分析统计数据的实质性科学

C.统计学的研究目的是探索数据的内在数量规律性

D.统计学提供了探索数据内在规律的一套方法

1.3.4 统计数据按其采用的计量尺度不同可以分为(ABC )

A.分类数据B.顺序数据C.数值型数据D.截面数据

1.3.5 统计数据按其收集方法不同,可以分为(AB )

A.观测数据B.实验数据C.时序数据D.混合数据

1.3.6 统计数据按被描述的对象和时间的关系不同分为(ABD )

A.截面数据B.时间序列数据C.观测数据D.混合数据

1.3.8 从统计方法的构成看,统计学可以分为(AD )

A.描述统计学B.理论统计学C.应用统计学D.推断统计学

1.3.9 作为一个统计总体,必须具有以下特征(ABD )

A.同质性B.变异性C.统一性D.大量性

四、判断改错题

1.4.1 统计资料是统计工作的成果,包括调查得到的经过整理具有信息价值的各种统计数据、图表和文字资料。(√)

1.4.2 统计学是一门收集、整理和分析统计数据的实质性科学。(×,方法论科学)

1.4.3 分类数据是指只能归入某一类别的非数字型数据。(√)

1.4.4 顺序数据是按数量属性对事物进行分类的结果。(×,品质属性)

1.4.5 分类数据和顺序数据相似之处在于两者都是非数字型数据。(√)

1.4.6 统计数据按其描述的对象不同,可以分为观测数据和实验数据。(×,收集方法)

1.4.7 时间序列数据是指对不同单位在同一个时间点上收集的数据。(×,截面数据)

1.4.8 从统计方法的构成看,统计学可以分为描述统计学和推断统计学。(√)

1.4.9 总体的数量特征都是从每个总体单位的特征加以逐级汇总而体现出来的。(√)

1.4.10 同质性是指构成总体的个别事物在某个方面必须具有相同的性质。(√)

1.4.11 若总体中所包含的统计指标数是有限的,则称为有限总体。(×,总体单位数)

1.4.16 变量按其所受影响因素不同,可分为离散型变量和连续型变量。

(×,确定性变量和随机变量)

1.4.17 甲企业职工人数1248人,这是一个连续变量。(×,离散变量)

1.4.18 某地区2007年人均国内生产总值为13600元,这是一个离散变量。(×,连续变量)

五、简答题

1.5.1 如何理解统计学的性质?

答:为了更好地理解统计学的性质,我们应明确以下三个方面的问题。其一,统计学研究的对象是客观现象的数量方面;其二,统计学研究的是群体现象的数量特征与规律性;其三,统计学是一门方法论的科学。

1.5.2 统计数据有哪些基本分类?

答:统计数据有三种基本分类。一是按其采用的计量尺度不同,统计数据可以分为分类数据、顺序数据、数值型数据;二是按其收集方法不同,统计数据可以分为观测数据和实验数据;三是按被描述的对象和时间的关系不同,统计数据可以分为截面数据、时间序列数据和混合数据。

1.5.3 什么是描述统计学和推断统计学?

答:描述统计学(Descriptive Statistics)研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。

推断统计学(Inferential Statistics)则是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。

1.5.4 什么是统计总体?它具有何特点?

答:统计总体就是根据一定目的确定的所要研究事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体,简称为总体。总体具有以下三个特点:其一,同质性,是指构成总体的个别事物在某个方面(或某一点上)必须具有相同的性质,这是构成总体的必要条件。其二,变异性,是指构成总体的个别事物除了至少在某一个方面具有相同的性质以外,其他方面应该存在差异,这是进行统计研究的前提。其三,大量性,是指构成总体的个别事物要求足够的多,这是探究客观事物规律性的基础。

1.5.5 什么是样本?它具有何特点?

答:从全及总体中抽取出来,作为代表这一总体的部分单位组成的集合体称为样本。

样本有以下显著的特点:其一,构成样本的单位必须取自全及总体内部,不允许总体外部的单位参加抽样过程;其二,从一个全及总体中可以抽取许多个样本;其三,样本具有代表性;其四,样本具有客观性。从全部总体中抽取样本,必须排除主观因素的影响。

第二章统计数据的收集、整理与显示

一、填空题

2.1.1 一切数据最初都来源于调查与实验。

2.1.2 自己进行调查与实验得到的数据称为一手数据(或者直接数据)。

2.1.3 抽样调查是按照随机原则从总体中抽取部分单位进行观察用以推算总体数量特征的一种统计调查方式。

2.1.13 数据数列分组的关键在于分组变量的选择和各组界限的划分。

2.1.14 某开口组的上限为30,相邻组组距是5,则其假定下限为25 ,组中值为27.5 。

2.1.15 某开口组的下限为280,相邻组组距是10,则其假定上限为290 ,组中值为285 。

2.1.16 在组距数列中,表示各组界限的变量值称为组限,各组上限与下限之间中点位置值称为组中值。

二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内)

2.2.1 主要用来调查时点现象总体特征的一次性全面调查称为(C )

A.抽样调查B.统计报表调查C.普查

2.2.2 按照随机原则抽取样本,并对总体的特征做出推断的调查方式是(A )

A.抽样调查B.普查C.统计报表调查

2.2.3 采用事先设计好的问卷进行调查的方法称为(B )

A.小组座谈法B.问卷调查法C.电话调查法

2.2.4 调查人员到现场对调查单位直接观察得到结果的方法称为(A )

A.观察法B.实验法C.电话调查法

2.2.5 在分类的基础上,将总体的所有单位按类进行整理,形成总体单位在各组间的分布,称为(C )A.频数B.次数C.频数分布

2.2.6 在问卷中没有提供答案,由被调查者自由地选择回答形式的问题称为(B )

A.封闭性问题B.开放性问题C.复杂性问题

2.2.7 上四分位数

U

Q位置的计算公式是(A )

A.3(1)

4

n+

B.

1

4

n+

C.

1

2

n+

2.2.8 行标题通常用来表示横向变量的名称,一般在统计表的(B )

A.中间B.左边C.右边

2.2.9 一组数15,18,19,20,22,24,26,27,28,29,32的上四分位数值和下四分位数值分别是(A )A.28,19 B.29,20 C.28,20

2.2.10 一组数25,27,29,30,32,34的中位数值是(B )

A.29 B.29.5 C.30

2.2.11 在分组时,凡遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是(C )

A.此值归入两组均可B.将此值归入上限所在组C.将此值归入下限所在组

2.2.12人口普查的调查单位是(C )

A.全部人口B.每户家庭C.每个人

2.2.13 数据审核时,主要从及时性、准确性和完整性方面进行审核的数据是(A)

A.一手数据B.二手数据C.时间序列数据

三、多项选择题(在下列4个备选答案中,至少有二个是正确的,请将其全部选出,并把字母填在题干后面的括号内)

2.3.1 常用的统计调查方式有(ACD )

A.普查B.科学试验C.统计报表调查D.抽样调查

2.3.2 属于数据收集方法的有(ABCD )

A.访问调查法B.电话调查法C.小组座谈法D.实验法

2.3.3 设计调查表时是采用一览表还是单一表,取决于(AD )

A.调查单位与报告单位的关系B.方便性C.经费的多少D.调查项目的多少

2.3.4 选择回答型的设计方法包括两项选择法及(ABCD )

A.多项选择法B.顺序选择法C.评定尺度法D.双向列联法

2.3.5 对封闭性问题的设计,答案要遵循的原则是(CD )

A.完备性B.系统性C.穷尽性D.互斥性

2.3.6 在分组汇总之前,要对原始资料的哪些方面进行审核(ABC )

A.及时性B.准确性C.完整性D.互斥性

2.3.7分类数据的图示方法主要包括(ACD )

A.条形图B.直方图C.对比条形图D.饼图

2.3.8 数据分组根据分组变量的多少可以分为(CD )

A.单层分组B.多层分组C.简单分组D.复合分组。

2.3.9 从外形看,统计表都由哪些部分组成?(ABCD )

A.表头B.行标题C.列标题D.数字资料

2.3.10 属于数值型数据图示方法的有(ABCD )

A.直方图B.箱线图C.雷达图D.茎叶图

四、判断改错题

2.4.5 实验法具有方法科学、反映客观、过程容易控制等优点。(√)

2.4.6 小组座谈法有匿名性、定量化和轮回反馈式等特点。

(×,德尔菲法有匿名性、定量化和轮回反馈式等特点)

2.4.7 网络调查是指利用国际互联网搜集数据方法。(√)

2.4.8 开放性问题一般放在问卷的前面。(×,开放性问题一般放在问卷的最后)

2.4.9 组织普查时要规定统一的时间。(×,组织普查时要规定统一的标准时点)

2.4.11抽样调查属于全面调查方式。

(×,普查属于全面调查方式,抽样调查属于非全面调查方式)

五、简答题

2.5.1 在选择二手数据时应该注意什么?

答:(1)应根据研究目的选择二手数据;(2)注意二手数据变量名称的含义是否发生变化;

(3)注意二手数据的计算口径和计算方法是否一致;(4)注意尊重二手数据所有者的权益。

2.5.2 什么是普查?组织普查时,应该注意什么问题?

答:普查是国家为了详细地了解某项重要的国情国力而专门组织的一次性全面调查,主要用来调查属于一定时点上现象的总体特征。组织普查时,应该注意(1)要规定统一的标准时点;(2)严格设定必需的调查项目;(3)尽可能地缩短普查登记期限;(4)按一定的周期进行同类普查。

2.5.3 抽样调查具有什么特点?

答:(1)从总体中随机抽取样本单位;(2)抽样调查的目的是根据样本的数量特征推断总体的数量特征;(3)抽样误差可以事先计算并且加以控制。

2.5.4 统计数据的具体收集方法有哪些?

答:有访问调查法、问卷调查法、德尔菲法、电话调查法、电脑辅助调查法、小组座谈法、观察法、实验法、网络调查法等。

2.5.5 什么是访问调查法?访问调查法的特点是什么?

答:访问调查法是调查者通过与被调查者的当面交谈而得到所需资料的调查方法。在访问调查中,调查人员可以直接了解被调查者对调查问题的态度、观点、举止和调查现场的环境等,为判断调查资料的准确程度提供一定的依据。与其他调查法相比,访问调查法的特点有:回答率较高、数据比较准确、可使用较复杂的问卷、调查成本高等。

2.5.6 什么是德尔菲法?德尔菲法的特点是什么?

答:德尔菲法是指按照规定的程序,采用邮寄或电子邮件的方式,反复多次地收集各地专家的看法,使不同意见趋于一致的调查方法。德尔菲法有匿名性、定量化和轮回反馈式等特点。

2.5.7 一份完整的调查方案,应该包括哪些内容?

答:(1)调查目的;(2)调查对象、调查单位和报告单位;(3)调查项目与调查表;

(4)调查时间、调查方式与方法;(5)调查的组织工作。

2.5.8 为了保证原始统计资料的准确性,在确定调查项目时应该注意什么问题?

答:(1)调查项目的含义必须明确,不能模棱两可;(2)考虑取得资料的可行性,有些调查项目虽然需要,但在现有条件下难以取得资料的则不应列入;(3)调查项目的答案应满足完备性和互斥性。如果要求选择回答,则必须列出所有可能的答案,以免出现重复或遗漏;(4)确定不同时期同类调查的调查项目时,前后时期的调查项目应互相衔接,以便进行动态比较分析。

2.5.9 设计问卷的提问项目时一般应注意遵循哪些规则?

答:(1)问题的顺序安排应注意逻辑性;(2)问题的顺序安排应注意兴趣;

(3)问题的顺序安排应注意先易后难;(4)开放性问题一般放在最后。

2.5.10 什么是问卷中的封闭性问题?封闭性问题答案的设计有哪些类型可供选择?

答:封闭性问题是指调查者已经设计好若干个答案,被调查者只需从中选择一个或一个以上答案的问题。其答案的设计有两项选择法、多项选择法、顺序选择法、评定尺度法、双向列联法等可供选择。

2.5.11 分类数据和顺序数据的图示方法各有哪些?

答:分类数据的图示方法包括条形图、Pareto图、对比条形图和饼图;顺序数据的图示方法包括累计频数分布图和环形图。

2.5.12 数据分组应注意什么?

答:(1)保持组内单位的同质性和组间单位的差异性;

(2)统计分组要符合穷举性原则;(3)统计分组要符合互斥性原则。

2.5.13 数值型数据的图示方法有哪些?

答:数值型数据的图示方法包括直方图、茎叶图、箱线图、线图、二维或三维散点图、气泡图、雷达图等。

2.5.14 统计表由哪几个部分组成?

答:统计表有多种具体形式,但不论哪种形式的统计表,从外形看都由表头、行标题、列标题和数字资料四个部分组成。

2.5.15 简述统计表的设计规则。

答:(1)合理安排统计表的结构;(2)统计表的总标题、行标题、列标题都要能简明扼要地

说明有关内容;(3)统计表的左右两端一律不封口;表的上下两端一般用粗线,其他的中间线都用细线隔开;(4)表中数据一般采用右对齐形式,有小数点时以小数点对齐,同栏数据要具有同一精确度;不要求填写或不可能有答案的表格单元,一般用“—”表示,在数字资料区不能出现“同上”、“同左”等文字;(5)若使用的是次级资料,应在表的下方注明资料来源,既显示对原作者的尊重,又便于读者查对。有时还需要在表的下方附上简明的指标解释。

2.5.16 试设计一份调查大学生对本科教学计划意见的问卷,进行调查并将调查结果制成统计表和统计图。

答:略

2.5.17 调查本班同学的来源地(按省或按市),制作频数分布表、条形图、柱形图和Pareto 图。

答:略

六、作图与计算题

2.6.1 为了解某大型居民小区的物业管理质量,随机抽取了由100个家庭组成的样本。质量等级的含义分别为:A.差;B.较差;C.一般;D.较好;E.好。有关资料如下:

C A B B

D A D D C B

D C A

E C A B C D D

B C E B A B C D B B

B C B A D B B C B A

B C D E B C C C C B

D D B A

E A B C E A

D C A B C C D A C E

C B C A B C E B

D A

E C D D B A A C C A

C B A C

D B B B C D

分布。

解:(1)顺序数据。

(2

等级户数向上累积(%)

A1818

B2846

C2874

D1892

E8100

合计100—

(3)条形图

E

D

C

B

A

0510********

2.6.2 某生产车间30名工人日加工零件数(件)如下:

30 26 42 41 36 44 40 37 37 25 45 29 43 31 36

49 34 47 33 43 38 42 32 34 38 46 43 39 35 36

试根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,编制频数分布表,并绘制直方图。

解:

零件数(件)频率百分比(%)

25-30 4 13.33

30-35 6 20

35-40 9 30

40-45 8 26.67

45-50 3 10

合计30 100

直方图:

2.6.3 某调查公司对省内各市2007年度评选的“三八”红旗手的状况进行了调查,得到如下的百分比信息:

(1)所从事的行业:服务业41%,制造业35%,政府机关8%,个体户3%,其他13%;

(2)学历状况:高中30%,本科45%,硕士15%,博士4%,其他6%;

(3)婚姻状况:有配偶85%,未婚6%,其他9%。

要求:试利用上述信息对这些先进人物作出描述。

解:在所选的选的“三八”红旗手中,服务业和制造业占绝大多数,分别为41%和35%。

行业

服务业

41%

制造业

35%

政府机关

8%

个体户

3%

其它

13%

服务业

制造业

政府机关

个体户

其它

在学历中以高中生和本科生居多,分别占30%和45%。

对于配偶情况,有配偶的占85%,未婚的占8%。

2.6.4 为了解某特定商品房型的价格变动情况,某市调查机构随机抽取了25个样本,得销售价格资料如下:

销售价格(单位:元)

5660 5595 6060 5500 5630

5899 6295 5749 5820 5843

5710 5950 5720 5575 5760

6090 5770 5682 6016 5650

5425 5367 6380 5945 6120

要求:试根据上表资料绘制茎叶图。

解:

2.6.5 D超市30天的销售额资料如下(单位:万元):

596335419263

40 67 65 46 45 84

56 42 64 57 43 64

36 56 69 63 54 72

536431705178要求:试根据上表资料进行数据分组,并绘制这组数据的频数直方图。

解:将数据分为7组,组距为10。

频数分布表

按销售额分组(万元)频率百分比(%)

30-40413.3

40-50516.7

50-60723.3

60-70930.0

70-80310.0

80-901 3.3

90-1001 3.3

合计30100.0

直方图:

2.6.6

解:

对比柱形图

(系列1为世界十大富豪,系列2为中国内地十大富豪)环形图:

2.6.7 试通过对次级资料的收集,绘制1990—2006年我国国内生产总值(GDP)的线图,(按当年价格计算,单位:亿元)。

解:

1990—2006年我国国内生产总值(GDP)的线图

解:

如图所示,华东地区的平均销售额最高,其次是华北地区,较低的是华中地区,排最后的是华南地区;从销售额分布的离散程度来说,华中地区(有两个离异点)和华南地区的销售额较为集中,,华北和华东地区的销售额则比较分散。

第三章 数据分布特征的描述

一、填空题

3.1.1 集中趋势 是指一组数据向其中心值靠拢的倾向。 3.1.2 加权算术平均数受两个重要因素的影响,一个是 各组变量值 ;另一个是各组变量值出现的 频数或频率 。

3.1.3 计算比率的平均数时,如果已知比率及其基本计算式的分母资料,则采用 加权算术平均法 。

3.1.4 计算比率的平均数时,如果已知比率及其基本计算式的分子资料,则采用 加权调和平均法 。

3.1.5 几何平均法 是计算平均比率或平均发展速度最适用的一种方法。 3.1.6 众数 是指一组数据中出现次数最多的变量值。

3.1.7 四分位数 是指将按大小顺序排列的一组数据划分为4等分的3个变量值。 3.1.8 十分位数 是指将按大小顺序排列的一组数据划分为10等分的9个变量值。 3.1.11 上四分位数与下四分位数之差的简单算术平均数称为 四分位差 。 3.1.12 各个变量值与其算术平均数离差的绝对值的平均数称为 平均差 。

3.1.13 总体方差是各个数据与其 算术平均数 的离差平方的平均数,通常以2σ表示。

二、单项选择题(在每小题的3个备选答案中选出1个正确答案,并将其字母填在题干后面的括号内)

3.2.1 先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称为 ( B )

A .数值平均数

B .位置平均数

C .离散系数

3.2.2 算术平均数反映的是数据分布的什么特征 ( A ) A .集中趋势 B .离散趋势 C .偏态趋势 3.2.3 根据算术平均数的性质,下列表达式正确的是 ( A )

A .0)(=∑-f x x

B .

0x x f -=? C .2()0x x f -=?

3.2.4 如果分布数列中各变量值呈几何级数变化或频率分布极不对称,计算平均数的常用方法是 ( B )

A .算术平均法

B .几何平均法

C .调和平均法

3.2.5 用各组的组中值代表其实际数据计算算术平均数时,通常假定 ( A ) A .各组数据在组内是均匀分布的 B .各组次数相等 C .各组数据之间没有差异

3.2.6 当数据分布为右偏分布时,算术平均数与中位数、众数的关系表现为 ( A ) A .o e M M x << B .e o x M M << C .o e x M M <<

3.2.7 离散程度测度指标中,受极端值影响最大的是 ( C ) A .平均差 B .标准差 C .全距

3.2.8 平均差与标准差的主要区别在于 ( B ) A .说明问题的角度不同 B .对离差的数学处理方法不同 C .计算对象不同

3.2.9 标准差系数消除了 ( B ) A .总体单位数多少的影响 B .平均数大小和计量单位的影响 C .离散程度的影响 3.2.10 直接使用标准差比较分析两个同类总体平均数的代表性,其前提条件是 ( B ) A .两个总体的标准差应该相等 B .两个总体的平均数应该相等 C .两个总体的离差平方和应该相等

3.2.11 下列指标中,实际应用最广泛的离散程度测度指标是 ( B ) A .平均差 B .标准差 C .离散系数

3.2.12 皮尔逊测度法就是利用算术平均数与众数的关系来测度数据分布的 ( A ) A .偏斜程度 B .离散程度 C .集中程度

三、多项选择题(在下列4个备选答案中,至少有二个是正确的,请将其全部选出,并把字母填在题干后面的括号内)

3.3. 1 描述数据分布集中趋势的指标有 ( ABCD ) A .算术平均数 B .调和平均数 C .众数 D .中位数

3.3.2 描述数据分布离散趋势的指标有 ( ABCD ) A .全距 B .平均差 C .标准差 D .离散系数

3.3.3 算术平均数所具有的数学性质有 ( AC ) A .各个变量值与其平均数离差之和等于零

B .各个变量值与其平均数离差的绝对值之和等于零

C .各个变量值与其平均数离差的平方和为最小值

D .各个变量值与其平均数离差的平方和为最大值

3.3.4 下列不适于计算算术平均数的数据类型有 ( AB ) A .分类数据 B .顺序数据 C .数值型数据 D .截面数据

3.3.5 加权算术平均数中,各个变量值的权数要起作用必须具备两个条件 ( AD ) A .各个变量值之间有差异 B .各个变量值的权数相等 C .各个变量值相等 D .各个变量值的权数有差异

3.3.6 下列对众数的解释说明中,正确的有 ( ABCD ) A .众数是指一组数据中出现次数最多的变量值 B .一组数据中可能有多个众数,也可能没有众数 C .众数不受极端值的影响 D .众数缺乏灵敏性

3.3.7 下列对中位数的解释说明中,正确的有 ( ACD ) A .中位数不受分布数列的极大或极小值影响 B .中位数是指一组数据中出现次数最多的变量值 C .中位数缺乏灵敏性

D .当次数分布偏态时,中位数的代表性会受到影响

3.3.8 以p SK 表示根据皮尔逊测度法计算的偏态系数,下列陈述中正确的是 ( ABCD ) A .经验证明,在适度偏态的情况下,33p SK -≤≤ B .当,0o p x M SK ==时,数据分布呈对称分布 C .当,0o p x M SK >>时,数据分布呈右(正)偏分布 D .当,0o p x M SK <<时,数据分布呈左(负)偏分布

3.3.9 下列关于四分位差的解释说明中,正确的有 ( ABCD ) A .四分位差就是上四分位数与下四分位数之差的简单算术平均数 B .四分位差越小,表明中位数的代表性越好 C .四分位差越大,表明中位数的代表性越差 D .四分位差可以避免受极端值的影响

3.3.10 比较不同总体平均数的代表性时,应该使用离散系数,因为 ( AB ) A .离散系数可以消除平均数大小的影响 B .离散系数可以消除计量单位的影响

C .离散系数可以消除总体单位数多少的影响

D .离散系数可以消除变量值之间差异程度的影响

四、判断改错题

3.4.1 算术平均数既适用于数值型数据,也适用于分类数据和顺序数据。

( ×,不适用于分类数据和顺序数据 )

3.4.2 根据分组数据计算的平均数只是实际平均数的近似值。 ( √ ) 3.4.3 简单算术平均数的大小只与变量值的大小有关,与权数无关。 ( √ ) 3.4.4 各变量值与其算术平均数的离差平方和为最小值。 ( √ ) 3.4.5 众数可直观地说明分布的离散趋势,可用它反映变量值一般水平的代表值。 ( ×,集中趋势 )

3.4.6 对于一组数据,可能存在一个或多个众数,也可能不存在众数。 ( √ ) 3.4.7 四分位数是将按大小顺序排列的一组数据划分为三等分的四个变量值。 (×,四等分的三个变量值)

3.4.8 十分位数是指将按大小顺序排列的一组数据划分为10等分的10个变量值。 ( ×,9个变量值 )

3.4.9 在左偏态分布中,众数最小,中位数适中,算术平均数最大,即e M o M x <<。 ( ×,右偏态分布 )

3.4.10 数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差。 ( √ ) 3.4.11 在实际工作中,全距常用来检查产品质量的稳定性和进行质量控制。 ( √ ) 3.4.12 偏态和峰态是对分布集中程度的测度。 ( ×,分布形状 ) 3.4.13 凡频率分布中各变量值对众数的相对位置都较正态曲线更为分散,其曲线较为平缓,则为低峰度。 ( √ )

3.4.14 如果以β表示峰度系数,当0>β时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。 ( ×,0<β )

五、简答题

3.5.1 什么是集中趋势?测度集中趋势的主要指标有哪些? 答:集中趋势是指一组数据向其中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。

取得集中趋势代表值的方法通常有两种:一是从一组数据(即各个变量值)中抽象出具有一般水平的量,这个量不是某一个具体变量值,但又要反映这些数据的一般水平,这种平均数称为数值平均数。数值平均数有算术平均数、调和平均数、几何平均数等形式。二是先将一组数据的变量值按一定顺序排列,然后取某一位置的变量值来反映这些数据的一般水平,把这个特殊位置上的数值看作是平均数,称作位置平均数。位置平均数有众数、中位数等形式。

3.5.2 什么是调和平均数?调和平均数与算术平均数有何关系? 答:调和平均数也称“倒数平均数”,它是对变量的倒数求平均,然后再取倒数而得到的平均数。

从数学定义角度看算术平均数与调和平均数是不一样的,但在社会经济应用领域,调和平均数实际上只是算术平均数的另一种表现形式,二者本质上是一致的,惟一的区别是计算时使用了不同的数据。

3.5.3 什么是几何平均数?其应用场合是什么?

答:几何平均数也称几何均值,它是n 个变量值乘积的n 次方根。几何平均法是计算平均比率或平均发展速度最适用的一种方法。如果分布数列中各变量值呈几何级数变化或频率分布极不对称,也常采用几何平均法来计算平均数。如果被平均的变量值中有一个为零,则不能计算几何平均数;如果变量值为负数,开奇次根会形成虚根,失去意义。

3.5.4 什么是离散趋势?测度离散趋势的主要指标有哪些?

答:离散趋势是指各个变量值远离其中心值的程度,是数据分布的另一个重要特征。

描述数据离散程度常用的测度值有全距、异众比率、四分位差、平均差、标准差以及离散系数,其中标准差最重要。

3.5.5 什么是偏度和峰度?如何根据偏态系数和峰度系数判断数据分布的形态? 答:偏度是描述数据分布对称性的特征值。

峰度是统计学中描述数据分布平坦或尖峭的程度的特征值。

根据皮尔逊测度法测算的偏态系数p SK ,经验证明,在适度偏态的情况下,33p SK -≤≤。当,0o p x M SK ==时,数据分布呈对称分布;当,0o p x M SK >>时,数据分布呈右(正)偏分布;当,0o p x M SK <<时,数据分布呈左(负)偏分布。

根据中心矩法计算的偏态系数α,当0α=时,数据分布呈对称分布形态;0α<,数据分布呈负(左)偏态;0α>,数据分布呈正(右)偏态;α值越接近于0,数据分布越趋于对称,α的绝对值越大,数据分布越偏斜。

根据峰度系数β,当0β=时,分布曲线为正态曲线;当0>β时,分布曲线为高峰曲线,表明变量值的差异程度小,平均数代表性好;当0<β时,分布曲线为低峰曲线,表明变量值的差异程度大,平均数代表性差。

六、计算题

3.6.1 2007

要求:试计算20名工人日产量的算术平均数、众数和中位数。 解:

(1)20名工人日产量的算数平均数:

282294307315322601

30.052020

xf x f ∑?+?+?+?+?====∑(件/人)

。 (2)从该企业的产量资料表可以看出,20名工人日产量的众数为30件; (3)20名工人日产量的中位数: 工人总数的二分之一是10人,从小到大累计人数首次超过10的组所对应的日产量为30件,则中位数为30件。

要求:试计算该管理局工人的月平均工资。 解:

根据已知资料,列表计算如下:

某管理局工人的月平均工资计算表

该管理局工人的月平均工资为: 150015150035250032350018203000

203010020

k

i

i

i

f x x f

=?+?+?+?==

==∑∑(元/人)。

要求:试计算该工业局工人平均劳动生产率。 解:

根据已知资料,列表计算如下:

该工业局工人平均劳动生产率计算表

该工业局工人平均劳动生产率为:

552400651600751200851200951100532500

7175007500xf x f ∑?+?+?+?+?====∑(吨/人)

3.6.4 某企业生产A 种产品需要经过三个连续作业的车间才能完成。2008年1月第一车间

粗加工产品的合格率为98%,第二车间精加工产品的合格率为95%,第三车间最后装配的合格率为92%。

要求:试计算该产品的企业平均合格率。 解:

该产品的企业平均合格率为:

94.97%m G =

3.6.5 根据抽样调查结果,2008年2月某市居民通讯支出额的众数为120元,算术平均数为150元。

要求:试根据算术平均数、中位数及众数之间的关系,计算中位数的近似值,并说明该市居民通讯支出额分布的态势。

解:

(1)该市居民通讯支出额的中位数近似值为:

21202150

14033o e M x M ++?===(元)

。 (2)由120<140<150显然有e M o M x <<,即该市居民通讯支出额呈尾巴拖在右边的正偏态分布,也即右偏分布。

3.6.6

要求:试计算1996~2007年的平均年利率。 解:

1996~2007年的平均年利率为:

100%100%9.14%G x =

==

3.6.7 根据500户抽样调查结果,2007年某市城市居民家庭按月人均可支配收入分组的资料如下:

要求:根据上述资料计算2007年该市居民家庭月人均可支配收入及其平均差和标准差。 解:

(1)2007年该市居民家庭月人均可支配收入为:

1

5001515002825003235001845007

2240100

k

i

i

i f x x f

=?+?+?+?+?==

=∑∑(元/人)。

(2)相关计算过程如下:

2007年该市居民家庭月人均可支配收入计算表

人均可支配收入的平均差为: 17401522607100x x f AD f

-?++?=

=

∑∑L =93640

100

=936.40(元)

(3)标准差为:

14.1129499

500

10012724000049950010072260151740499500)

(221

2

=?=??++?=?-=

∑=Λi i

k

i i f f x x S (元)

3.6.8 2006年某校学生会为了解在校大学生的消费支出情况,从全校本科学生中按性别随机各抽取要求:根据表中资料

(1)分别计算男女学生的平均月消费支出;

应用统计学试题及答案解析

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%

6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

统计学模拟试卷和答案 (1)

北京语言大学网络教育学院 《统计学》模拟试卷一 注意: 1.试卷保密,考生不得将试卷带出考场或撕页,否则成绩作废。请监考老师负责监督。 2.请各位考生注意考试纪律,考试作弊全部成绩以零分计算。 3.本试卷满分100分,答题时间为90分钟。 4.本试卷分为试题卷和答题卷,所有答案必须答在答题卷上,答在试题卷上不给分。 一、【单项选择题】(本大题共10小题,每小题2分,共20分)在每小题列出的四个选项中只有一个选项是符合题目要求的,请将正确选项前的字母填在答题卷相应题号处。 1.若正态总体,方差2σ已知,则总体均值μ的区间估计所采用的统计量为( )。 2.利用最小二乘法配合趋势线方 程的条件是:( )。 3.有10位学生, 其中8位男生,2位女生。从中一次 随机抽选4人,则恰巧其中有2位女生的概率为( )。 4.假设检验中的显着性水平越高, 对同一问题( )。 [A] 临界点就越小 [B] 所需样本量就越大 [C] 就越有可能接受H [D] 就越小 5.各实际观测值i y 与回归值?i y 的离差平方和称为( )。 [A] 回归平方和 [B] 剩余平方和 x x x x [A] ?()0i i y y -=∑ [B] 2 ?()i i y y -∑最 小 [C] 0t =∑ [D] A 且B [A] 4221028()()10 10 C [B] 2228()()10 10 [C] 224 8210/C C C [D]

[C] 总离差平方和 [D] 估计标准误差 6.在对一个4×4列联表进行2χ检验时,2χ 分布的自由度是( )。 7.我国目前的零售价格指数的特 点是( )。 [A] 对所选商品使用的价格是该商品的市价 [B] 对所选商品使用的价格是该商品的议价 [C] 是根据全部零售商品计算而得 [D] 是采用加权算术平均形式计算的 8.在回归分析中,F 检验主要是用来进行( )检验。 [A] 回归方程的显着性 [B] 相关系数的显着性 [C] 回归系数的显着性 [D] 估计标准误差的显着性 9.样本方差和总体方差在计算上的区别是( )。 [A] 只有样本方差才使用了全部数据 [B] 样本方差是用数据个数去除离差平方和 [C] 只有总体方差才使用了全部数据 [D] 总体方差是用数据个数去除离差平方和 10.2~(,12)X N μ,则(||36)P x μ-≤=( )。 二、【多项选择题】(本大题共 10小题,每小题3分,共30分)在每小题列出的四个选项中至少有两个选项是符合题目要求的,请将正确选项前的字母填在答题卷相应题号处。多选、少选、错选均无分。 11.研究促销方式对销售量的影响,促销方式共有三个水平,则这种方差分析是( )。 [A] 单因素方差分析 [B] 双因素方差分析 [A] 16 [B] 12 [C] 9 [D] 2 [A] [B] [C] [D]

统计学简答题参考答案讲解学习

统计学简答题参考答 案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。 2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。 第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤:

(1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组与组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分, 具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和应用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影

医学统计学试题和答案解析

第一套试卷及参考答案 一、选择题 (40分) 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式B负偏态分布 C 正偏态分布D正态分布与近似正态分布 3、要评价某市一名5岁男孩得身高就是否偏高或偏矮,其统计方法就是( A ) A 用该市五岁男孩得身高得95%或99%正常值范围来评价 B用身高差别得假设检验来评价 C用身高均数得95%或99%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差得根本原因就是( A ) A、个体差异B、群体差异C、样本均数不同D、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为( A ) (A)相对比(B) 构成比(C)定基比 (D)率 7、统计推断得内容为( D ) A、用样本指标估计相应得总体指标B、检验统计上得“检验假设”C、A与B均不就是D、A与B均就是 8、两样本均数比较用t检验,其目得就是检验( C ) A两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本,样本含量分别为n1与n2,在进行成组设计资料得t检验时,自由度就是( D ) (A) n1+ n2 (B) n1+ n2–1(C) n1+ n2 +1 (D)n1+ n2-2 10、标准误反映( A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得(C) A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小D纵向距离最小 12、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为tr,对回归系数检验得t值为tb,二者之间具有什么关系?(C) A t r>t b B t r〈t b C t r= tb D二者大小关系不能肯定 13、设配对资料得变量值为x1与x2,则配对资料得秩与检验(D ) A分别按x1与x2从小到大编秩 B把x1与x2综合从小到大编秩 C把x1与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、05,ν可认为( A ) A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用得统计方法为( A ) A.四格表检验 B、四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3、08kg,标准差为0、53kg;南方n2=4896,均数为3、10kg,标准差为0、34kg,经统计学检验,p=0、0034〈0、01,这意味着( D )

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

统计学模拟试题答案

注意:正式考试的计算题除与下述题目一样外,还包括指数分析中的双因素分析,认真看课本的例题 四、计算题(共3题,共40分) 1、(10分)甲、乙两单位人数及月工资资料如下: 根据上表资料: (1)比较甲乙两单位两个单位哪个单位工资水平高; (2) 说明哪个单位平均工资更具代表性 甲、乙两单位人数及月工资资料如下: 根据上表资料: (1)比较甲乙两单位两个单位哪个单位工资水平高; (2) 说明哪个单位平均工资更具代表性 解: (1)人) 元甲 /(1710== ∑∑f Mf x

人) 元乙 /(1832== ∑∑f Mf x 以上计算可知,乙单位工资水平高; (2) %1.10%100=?=x S V 甲σ %2.10%100=?= x S V s 乙 以上计算可知甲单位平均工资的标准差系数小于乙单位,说明甲单位平均工资更具有代表性。 2、(15分)某高校进行一次英语测验,为了解考试情况,随机抽样抽选1%的学生进行调查,所得资料如下: 试以95.45%的可靠性估计(相应的概率度请在教材上查阅): (1)该校学生英语考试的平均成绩的范围; (2)成绩在80分以上的学生所占的比重的范围。 解:(1),100=n )(761 1 分== ∑ ∑==k i i k i i i f f x x ,)(119)(21 1 22分=-= ∑∑==k i i k i i i f f x x s ,用22σ代替s 有: )(09.1)1(2 分=- = N n n x σμ,)(18.2分==?x x t μ,区间范围:18.276±=?±x x 。 (2)%441 == n n p ,用样本比重代替总体比重,%94.4)1()1(=--=N n n P P p μ。 %88.9==?p p t μ,区间范围:%88.9%44±=?±p p 。 3、(15分)4.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(克)如下: ) /(186.881 )M (2i 人元乙=--= ∑n f x S i )/(173.071 )M (2i 人元甲=--=∑n f x S i

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

统计学模拟试题及解答

统计学模拟试题及解答 Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】

模拟试题一 一. 单项选择题(每小题2分,共20分) 1. 一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均花费是200 元,他们选择在网上购物的主要原因是“价格便宜”。这里的参数是( ) A. 1000个消费者 B. 所有在网上购物的消费者 C. 所有在网上购物的消费者的平均花费额 D. 1000个消费者的平均花费金额 2. 为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学 生调查,这种抽样方法属于( ) A. 简单随机抽样 B. 整群抽样 C. 系统抽样 D. 分层抽样 3. 某班学生的平均成绩是80分,标准差是10分。如果已知该班学生的考试分数为对称分 布,可以判断考试分数在70到90分之间的学生大约占( ) A. 95% B. 89% C. 68% D. 99% 4. 已知总体的均值为50,标准差为8,从该总体中随机抽取容量为64的样本,则样本均值 的数学期望和抽样分布的标准误差分别为( ) A. 50,8 B. 50,1 C. 50,4 D. 8,8 5. 根据某班学生考试成绩的一个样本,用95%的置信水平构造的该班学生平均考试分数的置 信区间为75分~85分。全班学生的平均分数( ) A .肯定在这一区间内 B .有95%的可能性在这一区间内 C .有5%的可能性在这一区间内 D .要么在这一区间内,要么不在这一区间内 6. 一项研究发现,2000年新购买小汽车的人中有40%是女性,在2005年所作的一项调查 中,随机抽取120个新车主中有57人为女性,在05.0=α的显着性水平下,检验2005年新车主中女性的比例是否有显着增加,建立的原假设和备择假设为( ) A .%40:,%40:10≠=ππH H B .%40:,%40:10<≥ππH H C .%40:,%40:10>≤ππH H D .%40:,%40:10≥<ππH H 7. 在回归分析中,因变量的预测区间估计是指( ) A. 对于自变量x 的一个给定值0x ,求出因变量y 的平均值的区间 B. 对于自变量x 的一个给定值0x ,求出因变量y 的个别值的区间 C. 对于因变量y 的一个给定值0y ,求出自变量x 的平均值的区间 D. 对于因变量y 的一个给定值0y ,求出自变量x 的平均值的区间 8. 在多元线性回归分析中,如果F 检验表明线性关系显着,则意味着( ) A. 在多个自变量中至少有一个自变量与因变量之间的线性相关系着 B. 所有的自变量与因变量之间的线性关系都显着 C. 在多个自变量中至少有一个自变量与因变量之间的线性关系不显着 D. 所有的自变量与因变量之间的线性关系都不显着 9. 如果时间序列的逐期观察值按一定的增长率增长或衰减,则适合的预测模型是( ) A. 移动平均模型 B. 指数平滑模型 C. 线性模型 D. 指数模型 10. 设p 为商品价格,q 销售量,则指数∑∑001 0q p q p 的实际意义是综合反映( ) A. 商品销售额的变动程度 B. 商品价格变动对销售额影响程度 C. 商品销售量变动对销售额影响程度 D. 商品价格和销售量变动对销售额影响程度

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

《应用统计学》练习试题和答案解析

《应用统计学》本科 第一章导论 一、单项选择题 1.统计有三种涵义,其基础就是( )。 (1)统计学 (2)统计话动 (3)统计方法 (4)统计资料 2.一个统计总体( )。 (1)只能有个标志 (2)只能有一个指标 (3)可以有多个标志 (4)可以有多个指标 3.若要了解某市工业生产设备情况,则总体单位就是该市( )。 (1)每一个工业企业 (2)每一台设备 (3)每一台生产设备 (4)每一台工业生产设备 4.某班学生数学考试成绩分刷为65分、71分、80分与87分,这四个数字就是( )。 (1)指标 (2)标志 (3)变量 (4)标志值 5.下列属于品质标志的就是( )。 (1)工人年龄 (2)工人性别 (3)工人体重 (d)工人工资 6.现要了解某机床厂的生产经营情况,该厂的产量与利润就是( )。 (1)连续变量 (2)离散变量 ()3前者就是连续变量,后者就是离散变量 (4)前者就是离散变量,后者就是连续变量 7.劳动生产率就是( )。 (1)动态指标 (2)质量指标 (3)流量指标 (4)强度指标 8.统计规律性主要就是通过运用下述方法经整理、分析后得出的结论( )。 (1)统计分组法 (2)大量观察法 (3)练台指标法 (4)统计推断法 9.( )就是统计的基础功能。 (1)管理功能 (2)咨询功能 (3)信息功能 (4)监督功能 10.( )就是统计的根本准则,就是统计的生命线。 (1)真实性 (2)及时件 (3)总体性 (4)连续性 11.构成统计总体的必要条件就是( )。 (1)差异性 (2)综合性 (3)社会性 (4)同质性 12.数理统计学的奠基人就是( )。 (1) 威廉·配第 (2)阿亭瓦尔 (3)凯特勒 (4)恩格尔 13.统汁研究的数量必须就是( )。 (1)抽象的量 (2)具体的量 (3)连续不断的量 (4)可直接相加量 14.数量指标一般表现为( )。 (1)平均数 (2)相对数 (3)绝对数 (1)众数 15.指标就是说明总体特征的.标志则就是说明总体单位特征的,所以( )。 (1)指标与标志之同在一定条件下可以相互变换 (2)指标与标志都就是可以用数值表示的 (3)指标与标志之间不存在戈系 (4)指标与标志之间的关系就是固定不变的 答案:一、1(2) 2(4)3(4)4(4)5(2)6(4)7(2)8(2)9(3)10(1)11(4)12(3)13(2)14(3)15(1) 二、1× 2× 3√ 4× 5√ 6× 7√ 8× 9√ 10× 11× 12× 二、判析题 l.统计学就是一门研究现象总体数量方面的方法论科学,所以它不关心、也不考虑个别现象的数量特征。 ( ) 2.三个同学的成绩不同.因此仃在三个变量 ( ) 3.统计数字的具体性就是统讣学区别于数学的根本标志。 ( ) 4.统计指标体系就是许多指标集合的总称。 ( ) 5.一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。( ) 6.统计研究小的变异就是指总体单位质的差别。 ( ) 7.社会经济统计就是在质与量的联系中.观察与研究社会经济现象的数量方面。( ) 8.运用大量观察法必须对研究对象的所有单位进行观察调查。( )

统计学 模拟试卷及答案

统计学试卷与答案 考试形式:闭卷 班级:姓名:学号: 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案,并将正确答案的序号填在题干的括号内。每小题1分,共15分) 1. 工业企业数、钢产量、电力消耗量、商业网点数四个指标中属于时点指标的是( B )。 A、电力消耗量、商业网点数 B、工业企业数、商业网点数 C、工业企业数、钢产量 D、钢产量、电力消耗量 2.指标是说明总体特征的,标志是说明总体单位特征的,所以( D )。 A、标志和指标都是可以用数值表示的 B、只有指标才可以用数值表示 C、标志和指标之间的关系是固定不变的 D、标志和指标之间的关系是可以变化的 3.下列调查中,调查单位与填报单位一致的是( C )。 A、企业设备调查 B、农村耕地调查 C、工业企业现状调查 D、人口普查 4.下列情况的统计调查属于一次性调查的是( D )。 A、单位产品成本变动 B、商品购销季节变化 C、职工家庭收入与支出的变化 D、全国实有耕地面积 5.统计报表报送周期不同,报表所反映的指标项目有不同的详细程度。一般而言,周期越短,则报告的指标项目( B )。 A、越多 B、越少 C、可能多也可能少 D、是固定的 6.随机重复抽样调查结果表明,甲企业职工平均工资方差为25,乙企业为100,又知从乙企业中抽取工人数比从甲企业中抽取工人数多3倍,则抽样平均误差( D )。 A、甲企业较大 B、乙企业较大 C、不能作出结论 D、相同7.计算向上累计次数及向上累计比率时,本组累计数的意义是本组( A )。 A、上限以下的累计次数或比率 B、上限以上的累计次数或比率 C、下限以上的累计次数或比率 D、下限以下的累计次数或比率 8.某连续型变量数列,其末组为开口组,下限为600,又知其相邻组的组中值为560,则末组的组中值为( B )。 A、580 B、640 C、620 D、660 9.当抽样单位数分别增加3倍和2.5倍时,随机重复抽样平均误差分别是原来的( B )。 A、90%和81.6% B、50%和53.5% C、53.5%和81.6% D、90%和50% 10.某产品单位成本计划规定比基期下降3%,实际比基期下降3.5%,单位成本计划完成程度为( B )。 A、85.7% B、99.5% C、100.5% D、116.7% 11.分配数列各组标志值都增加2倍,每组频数均减少1/2,中位数( C )。 A、不变 B、减少1/2 C、增加2倍 D、无法确定 12.设原时间数列共26项数据,经过5项移动平均以后所得的移动平均数的项数是( B )。 A、20项 B、22项 C、4项 D、5项 13.某种蔬菜价格2月份比1月份上升5%,3月份比2月份下降5%,则3月份该种蔬菜价格与1月份相比( B )。 A、不变 B、降低0.25% C、提高0.25% D、不能确定 14.下列属于相关现象的是( B )。 A、利息与利率 B、居民收入与储蓄存款 C、电视机销售量与销售额 D、圆的面积与半径 15.如果p表示产品单位成本,q表示产品产量,则∑ ∑ 1 1 p q p q =105%表示( C )。 A、由于多种产品产量的变动而使总成本报告期比基期上升5% B、由于多种产品单位成本的变动而使总成本报告期比基期上升5% C、由于多种产品产量和单位成本的综合变动而使总成本报告期比基期上升5% D、由于总成本变动使产品产量和单位成本报告期比基期上升5% 二、多项选择题(在每小题的五个备选答案中,选出二至五个正确的答案,并将正确答案的序号分别填在题干的括号内,多选、少选、错选均不得分。每小题2分,共10分) 1.下列属于强度相对指标的是( BCD )。 A、工人劳动生产率 B、人均国民收入 C、人均粮食产量 D、人口死亡率 E、某工厂人均工资 命题人或命题小组负责人签名:所(室、教研部)负责人签名:分院(部)领导签名:

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组与组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和应用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数:

22 212 2 ()0.56710800.884392.8 () x x R y y β-?= ==-∑∑ 4、某家具公司生产三种产品的有关数据如下: 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数 = 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷( 二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下: 257、276、297、252、238、310、240、236、265,则其下四分位数5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% 。 7、对回归系数的显著性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p

相关文档
相关文档 最新文档