文档库 最新最全的文档下载
当前位置:文档库 › 统计学练习题答案

统计学练习题答案

统计学练习题答案
统计学练习题答案

<<统计学原理>>期末复习参考答案

一.单项选择题部分

1.1.社会经济统计的研究对象是(C )。

A、抽象的数量特征和数量关系

B、社会经济现象的规律性

C、社会经济现象的数量特征和数量关系

D、社会经济统计认识过程的规律和方法

1.2.几位学生的某门课程成绩分别为67分、78分、88分、89分、96分,这些分数是(C )。

A、总体单位

B、数量标志

C、标志值

D、变异

1.3.对某城市工业企业未安装设备进行普查,总体单位是(B )。

A、工业企业全部未安装设备

B、工业企业每一台未安装设备

C、每个工业企业的未安装设备

D、每一个工业企业

1.4.标志是说明总体单位特征的名称(C )。

A、它有品质标志值和数量标志值两类

B、品质标志具有标志值

C、数量标志具有标志值

D、品质标志和数量标志都具有标志值

1.5.工业企业的设备台数、产品产值是(D )。

A、连续变量

B、前者是连续变量,后者是离散变量

C、离散变量

D、前者是离散变量,后者是连续变量

1.6.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,"学生成绩"是(B )。

A、品质标志

B、数量标志

C、标志值

D、数量指标

1.7.在全国人口普查中(B )。

A、男性是品质标志

B、人的年龄是变量

C、人口的平均寿命是数量标志

D、全国人口是统计指标

1.8.下列指标中属于质量指标的是(B )。

A、社会总产值

B、产品合格率

C、产品总成本

D、人口总数

2.1.连续调查与不连续调查的划分依据是(B )。

A、调查的组织形式不同

B、调查登记的时间是否连续

C、调查单位包括的范围是否全面

D、调查资料的来源不同

2.2.调查几个重要铁路枢纽,就可以了解我国铁路货运量的基本情况和问题,这种调查属于(B )。

A、普查

B、重点调查

C、典型调查

D、抽样调查

2.3. 为了解某工厂职工家庭收支情况,按该厂职工名册依次每50人抽取1人,对其家庭进行调查,这种调查属于(B )。

A、简单随机抽样

B、等距抽样

C、类型抽样

D、整群抽样

2.4.下列调查中,调查单位与填报单位一致的是(D )。

A、企业设备调查

B、人口普查

C、农村耕地调查

D、工业企业现状调查

2.5.在对现象进行分析的基础上,有意识地选择若干具有代表性的单位进行调查研究,是(B )。

A、抽样调查

B、典型调查

C、重点调查

D、普查

2.6.下述各项调查中属于全面调查的是(B )。

A、对某连续生产的产品质量进行检验

B、某地区对工业企业设备进行普查

C、对钢铁生产中的重点单位进行调查

D、抽选部分地块进行农产量调查

2.7.抽样调查和重点调查都是非全面调查,二者的根本区别在于(D )。

A、灵活程度不同

B、组织方式不同

C、作用不同

D、选取单位方式不同

3.1.在组距分组时,对于连续型变量,相邻两组的组限(A )。

A、必须是重叠的B、必须是间断的C、可以是重叠的,也可以是间断的D、必须取整数

3.2.下列分组中属于按品质标志分组的是(B )。

A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组

3.3.简单分组和复合分组的区别在于(B )。

A、选择的分组标志的性质不同B、选择的分组标志多少不同

C、组数的多少不同D、组距的大小不同答案:

3.4、品质分组和变量分组的区别在于(A )。

A、选择分组标志的性质不同

B、选择分组标志的多少不同

C、组数的多少不同

D、组距的大小不同

4.1.反映社会经济现象发展总规模、总水平的综合指标是(B )。

A、质量指标

B、总量指标

C、相对指标

D、平均指标

4.2.总量指标按反映时间状况的不同,分为(B )。

A、数量指标和质量指标

B、时期指标和时点指标

C、总体单位总量和总体标志总量

D、实物指标和价值指标

4.3.总量指标是用(A )表示的。

A、绝对数形式

B、相对数形式

C、平均数形式

D、百分比形式

4.4.某厂1996年完成产值2000万元,1997年计划增长10%,实际完成2310万元,超额完成计划(B )。

A、5.5%

B、5%

C、115.5%

D、15.5%

4.5.反映不同总体中同类指标对比的相对指标是(B )。

A、结构相对指标

B、比较相对指标

C、强度相对指标

D、计划完成程度

相对指标

4.6.在什么条件下,简单算术平均数和加权算术平均数计算结果相同(B )。

A 、权数不等

B 、权数相等

C 、变量值相同

D 、变量值不同 4.7.加权算术平均数计算公式x =∑x

f f

的权数是(C )。

A 、f

B 、∑f

C 、

∑f

f

D 、x

4.8.权数对算术平均数的影响作用,实质上取决于(A )。

A 、作为权数的各组单位数占总体单位数比重的大小

B 、各组标志值占总体标志总量比重的大小

C 、标志值本身的大小

D 、标志值数量的多少

4.9.某企业的总产值计划比去年提高11%,执行结果提高13%,,则总产值计划完成提高程度为( C )

A 、13%-11%

B 、113%÷111% C、(113%÷111%)-100% D 、(111%÷113%)-100% 4.10.比较不同水平的总体的标志变动度,需要计算(

C )。

A 、平均差

B 、标准差

C 、标准差系数

D 、全距 4.11.销售成本利润率指标属于(B )。

A 、结构相对数

B 、比例相对数

C 、比较相对数

D 、强度相对数 4.12.总量指标按反映总体内容的不同,可分为(C )。

A.量指标和质量指标 B 、时期指标和时点指标 C.总体单位总量和总体标志总量 D 、实物指标和价值指标

5.1.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的(C )。

A 、2倍

B 、3倍

C 、4倍

D 、1/4倍

5.2.对某种连续生产的产品进行质量检验,每隔一小时抽10分钟产品进行检验,这种抽查方式是(D )。

A 、简单随机抽样

B 、类型抽样

C 、等距抽样

D 、整群抽样 5.3.在其它条件不变的情况下,抽样单位数增加一半,则抽样平均误差(A )。 A 、缩小为原来的81.6% B 、缩小为原来的50% C 、缩小为原来的25% D 、扩大为原来的四倍

5.4.为了了解某工厂职工家庭收支情况,按该厂职工名册依次每50人抽取1 人,对其家庭进行调查,这种调查属于(B )。

A 、简单随机抽样

B 、等距抽样

C 、类型抽样

D 、整群抽样

7.1.相关系数的取值范围是( C )。

A. 0 < r < 1

B. -1 < r < 1

C. -1 ≤ r ≤1

D. -1 ≤ r ≤0

7.2.现象之间线性依存关系的程度越低,则相关系数( C ) 。

A.越接近于-1

B. 越接近于1

C. 越接近于0

D. 在0.5和0.8之间

7.3.若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为( B )。

A.不相关

B. 负相关

C. 正相关

D. 复相关

7.4.现象之间线性相关关系的程度越高,则相关系数( D ) 。

A.越接近于0

B.越接近于1

C.越接近于-1

D.越接近于+1和-1

8.1.统计指数按反映的对象范围可分为(C )。

A.定基指数和环比指数

B.数量指标指数和质量指标指数

C.个体指数和总指数

D.综合指数和平均数指数

8.2.统计指数按指数化指标的性质不同,可分为(B )。

A.总指数和个体指数

B.数量指标指数和质量指标指数

C.平均数指数和平均指标指数

D.综合指数和平均数指数

8.3.某厂05年的产量比04年增长了13.6%,总成本增长了12.9%,则该厂05年产品单位成本( A )。

A.减少0.62%

B.减少5.15%

C.增加12.9%

D.增加1.75%

8.4. 编制总指数的两种形式是( B )。

A.数量指标指数和质量指标指数

B.综合指数和平均数指数

C.算术平均数指数和调和平均数指数

D.定基指数和环比指数

8.5. 平均指数的两种计算形式是( C )。

A.数量指标指数和质量指标指数

B.综合指数和平均数指数

C.算术平均数指数和调和平均数指数

D.定基指数和环比指数

9.1.根据时期数列计算序时平均数应采用(C )。

A.几何平均法

B.加权算术平均法

C.简单算术平均法

D.首末折半法

9.2.间隔相等的时点数列计算序时平均数应采用( D )。

A.几何平均法

B.加权算术平均法

C.简单算术平均法

D.首末折半法

9.3.数列中各项数值可以直接相加的时间数列是( B )。

A.时点数列B.时期数列C.平均指标动态数列D.相对指标动态数列

9.4.下列数列中哪一个属于动态数列( D )。

A.学生按学习成绩分组形成的数列

B.工业企业按地区分组形成的数列

C.职工按工资水平高低排列形成的数列

D.出口额按时间先后顺序排列形成的数列

9.5.说明现象在较长时期内发展的总速度的指标是(C )。

A.环比发展速度

B.平均发展速度

C.定基发展速度

D.环比增长速度

9.6.定基增长速度与环比增长速度的关系是(C)。

A、定基增长速度是环比增长速度的连乘积

B、定基增长速度是环比增长速度之和

C、各环比增长速度加1后的连乘积减1

D、各环比增长速度减1后的连乘积减1

二、多项选择题部分

1.1.要了解某地区的就业情况(ABE )

A、全部成年人是研究的总体

B、成年人口总数是统计指标

C、成年人口就业率是统计标志

D、反映每个人特征的职业是数量指标

E、某人职业是教师是标志表现

1.2.在全国人口普查中(BCE )

A、全国人口总数是统计总体

B、男性是品质标志表现

C、人的年龄是变量

D、每一户是总体单位

E、人口的平均年龄是统计指标

1.3.在工业普查中(BCE )

A、工业企业总数是统计总体

B、每一个工业企业是总体单位

C、固定资产总额是统计指标

D、机器台数是连续变量

E、职工人数是离散变量

1.4.下列各项中,属于统计指标的有(ACD )

A、1999年全国人均国内生产总值

B、某台机床使用年限

C、某市年供水量

D、某地区原煤生产量

E、某学员平均成绩

1.5.下列统计指标中,属于质量指标的有(BDE )

A、工资总额

B、单位产品成本

C、出勤人数

D、人口密度

E、合格品率

1.6.下列各项中,属于连续型变量的有(ACD )

A、基本建设投资额

B、岛屿个数

C、国民生产总值

D、居民生活费用价格指数

E、就业人口数

2.1.普查是一种(ABE )

A、专门组织的调查

B、一次性调查

C、经常性调查

D、非全面调查

E、全面调查

2.2.在工业设备普查中(BDE )

A、工业企业是调查对象 B、工业企业的全部设备是调查对象

C、每台设备是填报单位

D、每台设备是调查单位E、每个工业企业是填报单位

2.3.抽样调查方式的优越性表现在以下几个方面(BCDE )

A、全面性 B、经济性 C、时效性 D、准确性 E、灵活性

2.4.制定统计调查方案,应确定(ABCE )

A、调查目的和调查对象

B、调查单位和填报单位

C、调查项目和调查表

D、调查资料的使用范围

E、调查的时间和时限

3.1.下列分组哪些是按品质标志分组(BCDE )

A、职工按工龄分组

B、科技人员按职称分组

C、人口按民族分组

D、企业按经济类型分组

E、人口按地区分组

3.2.下面哪些分组是按数量标志分组(ACD )

A、企业按销售计划完成程度分组

B、学生按健康状况分组

C、工人按产量分组

D、职工按工龄分组

E、企业按隶属关系分组

4.1.影响加权算术平均数的因素有(AB )

A、各组频率或频数

B、各组标志值的大小

C、各组组距的大小

D、各组组数的多少

E、各组组限的大小

4.2.在下列条件下,加权算术平均数等于简单算术平均数(ADE )。

A、各组次数相等

B、各组变量值不等

C、变量数列为组距数列

D、各组次数都为1

E、各组次数占总次数的比重相等

4.3.下列统计指标属于总量指标的是(ACE )

A、工资总额

B、商业网点密度

C、商品库存量

D、人均国民生产总值

E、进出口总额

4.4.下列指标属于相对指标的是(BDE )

A、某地区平均每人生活费245元

B、某地区人口出生率14.3%

C、某地区粮食总产量4000万吨

D、某产品产量计划完成程度为113%

E、某地区人口自然增长率11.5‰

4.5.下列指标中强度相对指标是(ABCD )

A、人口密度

B、平均每人占有粮食产量

C、人口自然增长率

D、人均每国内生产总值

E、生产工人劳动生产率

5.1.抽样估计中的抽样误差(ACE )

A、是不可避免要产生的B、是可以通过改进调查方式来消除的

C、是可以事先计算出来的D、只能在调查结束后才能计算的E、其大小是可能控制的

5.2.总体参数区间估计必须具备的三个要素是(BDE )

A、样本单位数B、样本指标C、全及指标D、抽样误差范围E、抽样估计的置信度

5.3.用抽样指标估计总体指标,所谓优良估计的标准有(BCD )

A、客观性 B、无偏性 C、一致性 D、有效性 E、优良性

7.1.变量间的相关关系按其程度划分有 ( ABC )

A、完全相关

B、不完全相关

C、不相关

D、正相关

E、负相关

7.2.变量间的相关关系按其形式划分有 ( CE )

A、正相关

B、负相关

C、线性相关

D、不相关

E、非线性相关

8.1.下列属于质量指标指数的有 ( CDE)

A、商品零售量指数

B、商品零售额指数

C、商品零售价格指数

D、职工劳动生产率指数

E、产品单位成本指数

8.2.下列属于数量指标指数的有 ( ACD)

A、工业生产指数

B、劳动生产率指数

C、职工人数指数

D、产品产量指数

E、产品单位成本指数

9.1.下面哪几项是时期数列(BC )

A、我国近几年来的耕地总面积

B、我国历年新增人口数

C、我国历年图书出版量

D、我国历年黄金储备

E、某地区国有企业历年资金利

税率

9.2.下列哪些指标是序时平均数(ABDE )

A、一季度平均每月的职工人数

B、某产品产量某年各月的平均增长量

C、某企业职工第四季度人均产值

D、某商场职工某年月平均人均销售额

E、某地区近几年出口商品贸易额平均增长速度

9.3.下面属于时点数列的有(BDE )

A、历年旅客周转量

B、某工厂每年设备台数

C、历年商品销售量

D、历年牲畜存栏数

E、某银行储户存款余额

三、简述题

1.简述统计指标与统计标志的区别与联系。

统计指标与标志的区别表现为:(1)标志是说明总体单位属性的,一般不具有综合的特征;指标是说明总体综合数量特征的,具有综合的性质。(2)统计指标都可以用数量来表示;标志中,数量标志可以用数量来表示,品质标志只能用文字表示。

统计指标与统计标志的联系表现为:(1)统计指标的指标值是由各单位的标志值汇总或计算得来的;(2)随着研究目的不同,指标与标志之间可以相互转化。

2.什么是数量指标和质量指标?两者有何关系?

数量指标是反映社会经济现象发展总规模、总水平或工作总量的统计指标,用绝对数表示。质量指标是反映社会经济现象发展相对水平或工作质量的统计指标,用相对数或平均数表示。

两者的关系表现为:它们从不同角度反映总体的综合数量特征。数量指标是计算质量指标的基础,而质量指标往往是相应的数量指标进行对比的结果。

3.时期数列和时点数列的基本概念和特点是什么?

在动态数列中,每一指标是反映某现象在一段时间内发展过程的总量,则该动态数列称时期数列。基本特点是:1 数列具有连续统计的特点,2 数列中各个指标的数值可以相加,3 数列中各个指标数值大小与所包括时期长短有直接关系。

在动态数列中,每一指标值是反映某现象在某一时刻内发展状态的总量,则该动态数列称时点数列。基本特点是:1 数列不具有连续统计的特点, 2 数列中各个指标的数值不可以相加,3 数列中各个指标数值大小与所包括时期长短没有直接关系。

4.如何理解抽样推断的概念和特点

抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应的数量特征的统计分析方法。其特点如下: (1)是由部分推算整体的一种认识方法;

(2)建立在随机取样基础上; (3)运用概率估计的方法;(4)抽样推断的误差可以事先计算并加以控制;

5.简述统计分组的概念与种类划分

根据统计研究任务的要求和现象总体的内存特点,把统计总体按照某一标志划分为若干

性质不同而又有联系的几个部分称为统计分组。统计分组的分类:

(1)统计分组按其任务和作用的不同,分为类型分组、结构分组和分析分组。

(2)统计分组按分组标志的多少,分为简单分组和复合分组。

(3)统计分组按分组标志的性质不同,分为品质分组和变量分组。

6.什么是同度量因素,在编制指数时如何确定同度量因素的所属时期?

所谓同度量因素,即使得不同度量单位的现象总体转化为数量上可以加总,并客观上体现它在实际经济现象或过程中的份额或比重的与我们所要研究的指数化指标相联系的因素。

同度量因素固定时期的一般方法是:

编制质量指标综合指数,作为同度量因素的数量指标固定在计算期上。

编制数量指标指数,作为同度量因素的质量指标固定在基期上。

7.简述变异指标的概念和作用。

变异指标又称标志变动度,是综合反映现象总体中各单位标志值变异程度的指标。

在统计分析研究中,变异指标的作用表现为:

(1)变异指标反映总体各单位标志值分布的离中趋势。

(2)变异指标可以说明平均指标的代表性。

(3)变异指标说明现象变动的均匀性或稳定性。

8.统计调查的概念与种类

统计调查是按照预定的统计任务,运用科学的统计调查方法,有计划、有组织地向客观实际搜集资料的过程。

(1)统计调查按被研究总体的范围分全面调查和非全面调查;

(2)统计调查按调查登记的时间是否连续分连续调查和不连续调查;

(3)统计调查按搜集资料的方法分直接调查、凭证调查、派员调查、问卷调查。

四、计算题

1.1.某厂三个车间一季度生产情况如下:

要求计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。 解:一季度三个车间产量平均计划完成百分比x =

∑∑x

m m =720733=101.81% 平均单位产品成本x =

∑∑f

xf =

733

7880

=10.75(元/件) 答:一季度三个车间产量平均计划完成百分比为101.81%,平均单位产品成本10.75元/件。

1.3.1999年某月甲、乙两市场某商品价格、销售量和销售额资料如下:

试分别计算该商品在两个市场上的平均价格。 解:该商品在甲市场的平均价格x =

∑∑f

xf

=

2700

332200

=123.04(元/件) 该商品在乙市场的平均价格x =

∑∑x

m m =2700317900=117.74(元/件) 答:该商品在两个市场上的平均价格分别为123.04元/件、117.74元/件。

2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为

3.5件;乙组工人日产量资料:

试比较甲、乙两生产小组哪个组的日产量更有代表性? 解:x 乙=

∑f xf =100

1700=17(件) 乙σ =()∑∑-f

f

x x 2

=

100

900

=3(件) v σ乙=

x σ

=

173=17.65% v σ甲=甲甲x σ=22

5.3=15.91% ∵v σ乙>v σ

答:甲小组日产量更有代表性。

2.2、有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下:

试研究两个品种的平均亩产量,以确定哪一个品种具有较大稳定性,更有推广价值? 解:x 乙=

∑f xf =5

5005=1001(斤) 乙σ=()∑∑-f

f

x x 2

=

5

26245

=72.45(斤) v σ乙=

x σ

=

100145.72=7.24% v σ甲=甲

甲x σ=9987

.162=16.30% ∵v σ甲>v σ乙

答:乙品种具有较大稳定性,更有推广价值。

3.1、某乡有10000户农户,按随机原则从中抽取100户,测得户均月收入3000元,

标准差为400元,其中有20户的户均月收入在6000元以上。若以95.45%的概率保证程度,用不重复抽样分别估计该乡:

(1)全部农户户均月收入的范围和全部农户月总收入的范围; (2)全部农户中,户均月收入在6000元以上的户数所占比重的范围; (3)全部农户中,户均月收入在6000元以上的户数范围。 已知:N=10000户 n=100户 x =3000元 σ=400 元 Z=2 解:(1)μx =n

σ

)1(N n -

=10000100

1100

400-

?=39.80(元)

△x =Z ×μx =2×39.80=79.6(元)

x -△x ≤X ≤x +△x

3000-79.6≤X ≤3000+79.6 2920.4≤X ≤3079.6

10000×2920.4≤N X ≤10000×3079.6 29204000≤N X ≤30796000

(2)p=

n n 1=100

20

=20% μp=

)1()1(N n n p p --=)10000

100

1(100%)201%(20--=3.98% △p=Z ×μp = 2×3.98%=7.96% p-△p ≤P ≤p+△p

20%-7.96%≤P ≤20%+7.96% 12.04%≤P ≤27.96%

(3)10000×12.04%≤NP ≤10000×27.96% 1204≤NP ≤2796

答:(1)全部农户户均月收入在2029.4元-3079.6元之间,全部农户月总收入在29204000元-30796000元之间。(2)全部农户中,户均月收入在6000元以上的户数所占比重在12.04%-27.96%之间。(3)全部农户中,户均月收入在6000元以上的户数在1204户-2796户之间。

3.2. 某企业生产一种新的电子元件10000只,用简单随机不重复抽样方法抽取100只作

耐用时间试验,测试结果得到:平均寿命1192小时,标准差101.17小时,合格率88%; 试在95%概率保证下估计:

(1)这种新的电子元件平均寿命的区间范围。 (2)这种新的电子元件合格率的区间范围。

已知:N=10000只 n=100只 x =1192小时 σ=101.17小时 P=88% Z=1.96 解:(1)μx =

n

σ

)1(N n -

=10000100

1100

17.101-

?=10.07(小时) △x =Z ×μx =1.96×10.07=19.74(小时)

x -△x ≤X ≤x +△x

1192-19.74≤X ≤1192+19.74 1172.26≤X ≤1211.74

(2)μp=

)1()1(N

n n p p --=)100001001(100%)881%(88--=3.23%

△p=Z ×μp= 1.96×3.23%=6.33% p-△p ≤P ≤p+△p

88%-6.33%≤P ≤88%+6.33% 81.67%≤P ≤94.33%

答:这种新的电子元件平均寿命的区间范围为1172.26小时-1211.74小时之间。这种新的电子元件合格率的区间范围为81.67%-94.33%之间。

3.3. 从一批零件5000件中,按简单随机重复抽取200件进行测验,其中合格品数量为188件。要求:

(1)计算该批零件合格率和抽样平均误差;

(2)按95.45%的可靠程度估计该批零件的合格率区间范围。

(3)按95.45%的可靠程度估计该批零件的合格品数量区间范围。 已知:N=5000件 n=200件 n 1=188件 Z=2

解:(1)p= n n 1=200

188

=94%

μp=

n

p p )1(-=200%)

941%(94-=1.68%

(2) △p=Z ×μp=2×1.68%=3.36%

p-△p ≤P ≤p+△p

94%-3.36%≤P ≤94%+3.36% 90.64% ≤P ≤97.36%

(3)5000×90.64%≤NP ≤5000×97.36%

4532≤NP ≤4868

答:该批零件合格率为94%,抽样平均误差为1.68%;该批零件的合格率区间范围在90.64%-97.36%之间;该批零件的合格品数量区间范围在4532件-4868件之间。

4.1. 某企业各月产品销售额和销售利润资料如下:

试计算:(1)编制产品销售额与销售利润之间的直线回归方程。(2)若6月份产品销售额为30万元时,试估计企业产品销售利润。(要求列表计算所需数据资料,写出公式和计算过程,结果保留四位小数)

解:(1)设:直线回归方程为y c =a+bx

∑∑∑∑∑--=

2

2)

(x x n y x xy n b =

103

1032259512

1039.2535?-??-?=0.0488

x b y a -= =n

y ∑-b n

x ∑=5

12-0.04885

103?=1.3947

y c = 1.3947+0.0488x

(2)估计企业产品销售利润:y c = 1.3947+0.0488x=1.3947+0.0488×30=2.8587(万元)

答:产品销售额与销售利润之间的直线回归方程为y c = 1.3947+0.0488x 。若6月份产品销售额为30万元时,估计企业产品销售利润为2.8587万元。

4.2、某地区2002年-2005年个人消费支出和收入资料如下: 要求:(1)试利用所给资料建立以收入为自变量的直线回归方程;(2)若个人收入为300亿元时,试估计个人消费支出额(要求列表计算所需数据资料,写出公式和计算过程,结果保留四位小数)。

解:(1)设:直线回归方程为y c =a+bx

∑∑∑∑∑--=

2

2)

(x x n y x xy n b =

1022

10222634204911

10222346594?-??-?=0.8258

x b y a -= =

n

y ∑-b n

x ∑=4

911-0.82584

1022?=16.7581

y c = 16.7581+0.8258x

(2) 若个人收入为300亿元时,

y c = 16.7581+0.8258x=16.7581+0.8258×300=264.4981(亿元)

答:以收入为自变量的直线回归方程为y c = 16.7581+0.8258x ,若个人收入为300亿元时,估计个人消费支出额为264.4981亿元。

5.1、某公司销售的三种商品的资料如下:

试求价格总指数、销售量总指数和销售额总指数。 解:价格总指数p k =

∑∑1

11q p q p =∑∑kp

q

p q p 1

111=

16

.4546

=101.86% 销售额总指数pq k =

∑∑0

11q

p q p =

45

46

=102.22% 销售量总指数q k =

p

k pq k =%86.101%

22.102=100.35% 或q k =

%35.10045

16

.450

1

10

1==

=

∑∑

∑∑p q

k q p p q

p q p

答:价格总指数、销售量总指数和销售额总指数分别为101.86%、100.35%、102.22%。

5.2、某企业生产三种产品的有关资料如下:

试计算两种产品的产量总指数,单位成本总指数和总成本总指数。

解:产量总指数q k =

∑∑0

01p

q p q =

32000

43000

=134.38% 单位成本总指数p k =

∑∑1

1

1q

p q p =

43000

45600

=106.05% 总成本总指数pq k =

∑∑0

11q

p q p =

32000

45600

=142.50% 答:两种产品的产量总指数,单位成本总指数和总成本总指数分别为134.38%、106.05%、142.50%。

5.3.某地区对两种商品的收购量和收购额资料如下:

试求收购量总指数、收购价格总指数以及收购额总指数。

解:收购量总指数q k =

∑∑00

0p

q q p k q

=

250

310

=124% 收购额总指数pq k =

∑∑0

1

1q

p q p =

250

290

=116% 收购价格总指数p k =

q

k pq k =%124%

116=93.55% 或p k =

%55.93310

2900

111

011===

∑∑∑∑q

p k q p q

p q

p q

答:收购量总指数、收购价格总指数以及收购额总指数分别为124%、93.55%、116%。 5.4.某企业生产两种产品,其资料如下:

要求:(1)计算单位成本总指数、并分析由于单位成本变动对总成本影响的绝对额;

(2)计算产品产量总指数、并分析由于产品产量变动对总成本影响的绝对额; (3)计算总成本总指数、并分析总成本变动的绝对额;

解:单位成本总总指数p k =

∑∑kp

1

111q p q p =

8

.346370

=106.7% 单位成本变动对总成本影响的绝对额:∑11q p -∑kp

q p 1

1=370-346.8=23.2(万元) 总成本总指数pq k =

∑∑0

11q

p q p =

300

370

=123.3% 总成本变动的绝对额: ∑11q p -∑00q p =370-300=70(万元)

产品产量总指数q k =

p k pq k =%7.106%3.123=115.6% 或q k =∑∑0001p q p q =

∑∑

001

1p q k q p p

=300

8.346=115.6% 产品产量变动对总成本影响的绝对额:01p q ∑-∑00p q =∑kp

1

1q p -∑00p q =346.8-300=46.8(万元)

指数体系:123.3%=106.7%×115.6% 70=23.2+46.8

统计学1-3章练习题参考答案

第一章统计总论 一、单项选择题 1.属于统计总体的是() A.某县的粮食总产量 B.某地区的全部企业 C.某商店的全部商品销售额 D.某单位的全部职工人数 B 2.构成统计总体的个别事物称为()。 A.调查单位 B.标志值 C.品质标志 D.总体单位 D 3.对某城市工业企业未安装设备进行普查,总体单位是()。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 B 4.工业企业的设备台数、产品产值是()。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 D 5.在全国人口普查中()。 A.男性是品质标志 B.人的年龄是变量 C.人口的平均寿命是数量标志 D.全国人口是统计指标 B 6.总体的变异性是指()。 A.总体之间有差异 B.总体单位之间在某一标志表现上有差异 C.总体随时间变化而变化 D.总体单位之间有差异 B 7.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,“学生成绩”是()。 A.品质标志 B.数量标志 C.标志值 D.数量指标 B 8.某年级学生四门功课的最高考分分别是98分、86分、88分和95,这四个数字是() A.指标 B.标志 C.变量 D.标志值 D 9.下列指标中属于质量指标的是()。 A.社会总产值 B.产品合格率 C.产品总成本 D.人口总数 B 10.下列属于质量指标的是() A.产品的产量 B.产品的出口额 C.产品的合格品数量 D.产品的评价 D

11.下列属于离散型变量的是() A.职工的工资 B.商品的价格 C.粮食的亩产量 D.汽车的产量 D 12.标志的具体表现是指() A.标志名称之后所列示的属性或数值 B.如性别 C.标志名称之后所列示的属性 D.标志名称之后所列示的数值 A 13.社会经济统计的研究对象是()。 A.抽象的数量特征和数量关系 B.社会经济现象的规律性 C.社会经济现象的数量特征和数量关系 D.、社会经济统计认识过程的规律和方法 C 14.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种。其中数量指标的表现形式是()。 A.绝对数 B.相对数 C.平均数 D.百分数 A 15.以产品的等级来衡量某种产品的质量好坏,则该产品“等级”是() A.数量标注 B. 品质标志 C. 数量指标 D. 质量指标 B 16.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 17.某机床厂要统计该企业的自动机床的产量和产值,上述两个变量是()。 A.二者均为离散变量 B.二者均为连续变量 C.前者为连续变量,后者为离散变量 D.前者为离散变量,后者为连续变量 D 18.下列哪个是连续型变量() A. 工厂数 B. 人数 C. 净产值 D.设备台数 C 19.设某地区有670家工业企业,要研究这些企业的产品生产情况,总体单位是() A.每个工业企业; B.670家工业企业; C.每一件产品; D.全部工业产品 C 20.统计工作过程不包括()。 A.统计调查 B.统计分布 C.统计整理 D.统计分析 B 二、多项选择题 1.统计一词的含义是()

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学原理练习题及答案

统计学原理练习题及答案 2007-12-7 9:32:24 阅读数:6162 《统计学原理》综合练习题 一、判断题(把正确的符号“√”或错误的符号“×”填写在题后的括号中。) 1、社会经济统计的研究对象是社会经济现象总体的各个方面。() 2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。() 3、总体单位是标志的承担者,标志是依附于单位的。() 4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。() 5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。 6、调查单位和填报单位在任何情况下都不可能一致。() 7、在统计调查中,调查标志的承担者是调查单位。() 8、对全同各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。() 9、统计分组的关键问题是确定组距和组数( ) 10、按数量标志分组的目的,就是要区分各组在数量上的差别( ) 11、总体单位总量和总体标志总量是固定不变的,不能互相变换。() 12、相对指标都是用无名数形式表现出来的。() 13、众数是总体中出现最多的次数。() 14、国民收入中积累额与消费额之比为1:3,这是一个比较相对指标。() 15、总量指标和平均指标反映了现象总体的规模和一般水平。但掩盖了总体各单位的差异情况,因此通过这两个指标不能全面认识总体的特征。() 16、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。() 17、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。() 18、在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。() 19、抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。() 20、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。() 21、抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差。() 22、施肥量与收获率是正相关关系。() 23、计算相关系数的两个变量都是随机变量() 24、利用一个回归方程,两个变量可以互相推算()

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试,甲班平均成绩为81分,标准差为9.5分,乙 班的成绩分组资料如下: 按成绩分组学生人数(人) 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩,并比较甲乙两班,哪个班的平均成绩更有代表性? 2、某车间有甲乙两个生产组,甲组平均每个人的日产量为36件,标准差为9.6件,乙组工人产 量资料如下: 日产量(件)工人数(人) 15 15 25 38 35 34 45 13 要求:(1)计算乙组平均每个工人的日产量和标准差 (2)比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元,试计算上半年,下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长(%) 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 (2)计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下:(万元) 商品单位销售额1996比1995年销售价格提高(%) 1995 1996 甲米120 130 10 乙件40 36 12 要求:(1)计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值(2)计算销售量总指数,计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下: 要求:(1)计算相关系数, 说明两个变量相关的密切程度 (2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? 月份 产量(千克) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

统计学课后习题参考答案

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题与练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔就是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在她的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域就是军机的危险区域。 3.能,拯救与发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3、目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤就是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学就是能发现客观世界规律,更好决策,改变世界与培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩 ;指标体系:上学期全班同学学习的科目 ;统计量:我班部分同学课程的平均成绩 ;定性数据:姓名 ;定量数据: 课程成绩 ;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:广州市大学生;单位:广州市的每个大学生。(2)如果调查中了解的就是价格高低,为定序尺度;如果调查中了解的就是商品丰富、价格合适、节约时间,为定类尺度。(3)广州市大学生在网上购物的平均花费。(4)就是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)40%;(6)30%。 第二章收集数据 思考题参考答案

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学练习题参考答案

统计学参考答案(2013.12) 一、名词解释 1.统计学:是收集、分析、表述和解释数据的科学。 2.众数:一组数据中出现次数最多的变量值。 3.简单随机抽样:从含有N元素的总体中,抽取n个元组作为样本,使得每一个容量为n的样本都有相同的机会被抽中,这样的抽样方式称为简单随机抽样。4.标准分数:变量值与其平均数的离差除以标准差后的值,也称标准化值和z 分数。 二、单项选择 1.下列变量中属于连续变量的是( C ) A 中等学校个数 B 企业个数 C 学生年龄 D 学生个数 2.平均指标反映了总体分布的(A) A 集中趋势 B 离中趋势 C 长期趋势 D 基本趋势 3.标准差指标数值越小,则反映变量值( B ) A 越分散,平均数代表性越低 B 越集中,平均数代表性越高 C 越分散,平均数代表性越高 D 越集中,平均数代表性越低 4.对连续大量生产的某种小件产品进行产品质量检验,最恰当的调查方式方法是( B ) A 全面调查 B 抽样调查 C 重点调查 D 典型调查 5.下列资料中,属于时点指标的是( C ) A 2001年旅游入境人数; B 2001年全国出生人数; C 2001年全国人口数; D 2001年大学生毕业人数 6.某连续变量分组数列,其末组为开口组,下限为500;又知其邻组的组中值为480,则末组的组中值为( A ) A 520 B 510 C 500 D 490 7.计算平均发展速度最合适的平均数是( C ) A 简单算术平均数 B 加权算术平均数

C 几何平均数 D 调和平均数 8.2004年某地区甲、乙两类职工的月平均收入分别为1060和3350元,标准差 分别为230和680元,则职工平均收入的代表性( B )。 A 甲类较大 B 乙类较大 C 两类相同 D 在两类之间缺乏可比性 9.要反映我国上市公司业绩的整体水平,总体是( A )。 A 我国所有上市公司 B 我国每一家上市公司 C 我国上市公司总数 D 我国上市公司的利润总额 10.直线回归方程中,若回归系数为负,则( B )。 A 表明现象正相关 B 表明现象负相关 C 表明相关程度很弱 D 不能说明相关的方向和程度 11.调查50个房地产公司,房屋销售面积与广告费用之间的相关系数为0.76, 这说明( A ) A 二者之间有较强的正相关关系 B 平均看来,销售面积的76%归因于其广告费用 C 如要多销售1万平方米的房屋,则要增加广告费用7600元 D 如果广告费用增加1万元,可以多销售7600平方米的房屋 12.下列各直线回归方程中,哪一个是不正确的( B ) A x y 715?+=,r =0.92 B x y 520?-=,r =0.85 C x y 210?+-=,r =0.78 D x y 35?-=,r =-0.69 13.下面现象间的关系属于相关关系的是( C ) A 圆的周长和它的半径之间的关系 B 价格不变条件下,商品销售额与销售量之间的关系 C 家庭收入愈多,其消费支出也有增长的趋势 D 正方形面积和它的边长之间的关系 14.下列数列中哪一个属于时间数列( D ) A 学生按学习成绩分组形成的数列 B 工业企业按地区分组形成的数列 C 职工按工资水平高低排列形成的数列 D 出口额按时间先后顺序排列形成的 数列 15.对于不同水平的总体不能直接用标准差比较其标志变动度,这时需分别计算 各自的( A )来比较。 A 标准差系数 B 平均差 C 全距 D 均方差

统计学计算题和标准答案

企业型号价格(元/台)甲专卖店销售额(万元)乙专卖店销售量(台) A 2500 50.0 340 B 3400 115.6 260 C 4100 106.6 200 合计—272.2 — 要求:分别计算两个专卖店空调的平均销售价格,并分析平均价格差异的原因。 答案: 2某企业甲、乙两个生产车间,甲车间平均每个工人日加工零件数为65件,标准差为11件;乙车间工人日加工零件数资料如下表。试计算乙车间工人加工零件的平均数和标准差,并比较甲、乙两个生产车间哪个车间的平均日加工零件数更有代表性? 日加工零件数(件)60以下60—70 70—80 80—90 90—100 工人数(人) 5 9 12 14 10 答案: 三、某地区2009—2014年GDP资料如下表,要求: 1、计算2009—2014年GDP的年平均增长量; 2、计算2009—2014年GDP的年平均发展水平; 3、计算2009—2014年GDP的年平均发展速度和平均增长速度。

答案: x-== 年平均增长速度:100%100%22.9% 试用最小平方法配合销售额的直线趋势方程,并预测2016年的销售额将达到什么水平? 答案:2010年—2014年的数据有5项,是奇数,所以取中间为0,以1递增。设定x为-2、-1、0、1、2、 年份/销售额(y)x xy x2 2010 320 -2 -640 4 2011 332 -1 -332 1 2012 340 0 0 0 2013 356 1 356 1 2014 380 2 760 4 合计1728 0 144 10 b=∑xy/∑x2=144/10=14.4 a=∑y/n=1728/5=345.6 y=345.6+14.4x 预测2016年,按照设定的方法,到2016年应该是5 y=345.6+14.4*5=417.6元 五、某企业生产三种产品,2013年三种产品的总生产成本分别为20万元,45万元,35万元,2014年同2013年相比,三种产品的总生产成本分别增长8%,10%,6%,产量分别增长12%,6%,4%。试计算: 1、三种产品的总生产成本增长的百分比及增加的绝对额; 2、三种产品的总产量增长的百分比,及由于产量增长而增加的总生产成本; 3、利用指数体系推算单位产品成本增长的百分比。 试计算: 1、三种商品的销售额总指数; 2、三种商品的价格总指数和销售量总指数;

统计学参考答案

综合指标 1、某企业2006年产值超计划完成8%,比上年增长12%,试问产值计划规定比上期增长多少? 又该企业甲产品单位成本计划在上年230元的水平上降低15元,实际上比上年降低了8%,试计算甲产品单位成本的计划完成程度。 %108% 1% 121=++x %7.31% 108% 121%=-+= x 2 要求计算表中空格数字,并直接填入表中。 3要求:1.计算该工业局的平均劳动生产率; 2.计算该工业局平均每个企业的产值。 该工业局的平均劳动生产率=10600000÷1400=7571.4(元/人)

该工业局平均每个企业的产值=1060÷20=53(万元/人) 5 试分别计算男、女职业人员的总录用率,并比较两组说明各组和总录用率高低不同的原因。 男的总录用率=123÷600=20.5% 女的总录用率=89÷500=17.8% 6、某厂三个分厂同时生产甲产品,第一季度生产情况如下: 一分厂实际产量为500件,刚好完成计划;二分厂实际产量为900件,仅完成计划的90%;三分厂实际产量为1160件,超额完成计划16%。另外,一分厂单位成本为18元/件,二分厂单位成本为16元/件,三分厂单位成本为17元/件。所以全厂超额2%完成甲产品产量计划,即(0+16%-10%)/3=2%;全厂甲产品平均单位成本为17元/件,即(18+16+17)/3=17元/件。 以上平均指标的计算是否正确?为什么?应该如何计算? 全厂计划完成率=%4.1022500 2560 %116/1160%90/9005001160900500==++++ 全厂平均单位成本= 8.162560 43120 1160 9005001711601690018500==++?+?+?(元) 7、2006年某月份A 农贸市场某农产品价格和成交量、成交额资料如下: 试问哪一个市场农产品的平均价格较高?并说明原因。 甲市场平均价格=5.5÷4=1.375(元/斤) 乙市场平均价格=5.3÷4=1.325(元/斤)

统计学第章练习题及答案

第4章 练习题 一、单项选择题 1.平均指标反映了( ) ①总体次数分布的集中趋势 ②总体分布的特征 ③总体单位的集中趋势 ④总体次数分布的离中趋势 2.某单位的生产小组工人工资资料如下:90元、100元、110元、120元、128元、148元、200元,计算结果均值为128=X 元,标准差为( ) ①σ=33 ②σ=34 ③σ= ④σ=35 3.众数是总体中下列哪项的标志值( ) ①位置居中 ②数值最大 ③出现次数较多 ④出现次数最多 4.某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则平均工资为( ) ①600元 ②元 ③元 ④500元 5.标志变异指标说明变量的( ) ①变动趋势 ②集中趋势 ③离中趋势 ④一般趋势 6.标准差指标数值越小,则反映变量值( ) ①越分散,平均数代表性越低 ②越集中,平均数代表性越高 ③越分散,平均数代表性越高 ④越集中,平均数代表性越低 7.在抽样推断中应用比较广泛的指标是( ) ①全距 ②平均差 ③标准差 ④标准差系数 二、多项选择题 1.根据标志值在总体中所处的特殊位置确定的平均指标有( ) ①算术平均数 ②调和平均数 ③几何平均数 ④众数 ⑤中位数 2.影响加权算术平均数的因素有( ) ①总体标志总量 ②分配数列中各组标志值 ③各组标志值出现的次数 ④各组单位数占总体单位数比重 ⑤权数 3.标志变异指标有( ) ①全距 ②平均差 ③标准差 ④标准差系数 ⑤相关系数 4.在组距数列的条件下,计算中位数的公式为( ) ①i f S f L M m m e ?-+ =+∑12 ②i f S f U M m m e ?-=∑12 -- ③i f S f L M m m e ?-+ =∑12 - ④i f S f U M m m e ?-=+∑12 - ⑤i f S f U M m m e ?-=∑12 -+

统计学计算例题及答案

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

统计学练习题及答案

百度文库-让每个人平等地提升自我 《统计学》习题集 PART 1 导论 《第一套》 一、填空 1、统计的研究对象是社会经济现象(总体)的( 2、统计工作程序是统计资料的搜集、(整理)、( 3、统计学的研究方法有(大量观察法)、(实验设计法数量方面)。 分析)。 )(统计分组法)、(综合指标法)和(统计模型法)及 统计推断法。 4、我国统计工作的基本职能包括:(信息)、(咨询)、(监督)及辅助决策等职能。 二、单选题 1、社会经济统计学是一门(C) A自然科学B、新兴科学 C方法论科学D、实质性科学 2、社会经济统计的研究范围是(D) A社会现象的数量方面B、人人类生活现象的数量方面C自然科学研究的数量方面D、社会经济现象的数量方面3、社会经济统计现象形成统计总体的必要条件是( B ): A差异性B、同质性 C 、 社会性D、综合性 4、社会经济统计对社会经济现象总体数量的认识是( A ): A、从个体到总体 B、从总体到个体 C 、 从定性到定量D、从定量到定性 5、一个统计总体(D ) A只能有一个指志B、只冃匕有个标志 C可以有多个标志D、可以有多个指标 6、变量包括标志和(D ) A品质标志B、数量标志 C 、数量指标D、指标 7、在研究某城市商业企业状况中. 某商业企业的营业员人数是( A ) A、数量标志 B、数量指标 C 、变量值D、标志变量 8以产品等级来衡量某产品质量优劣,则该产品等级是( B ): A数量标志B 品质标志 C数量指标D质量指标 9、就统计指标而言,变异是指( D ): A数量指标的具体表现各不相同 B 、质量指标的具体表现各不相冋C统计指标的具体表现各不相同 D 、以上都是正确的 10、商业企业的职工人数、商品销售总额是(A连续变量B C前者是连续变量、后者也是连续变量。 ):

统计学原理计算题及参考答案

"

}

| 1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表; (2) 根据整理表计算工人平均日产零件数。(20分) 解:(1)根据以上资料编制次数分布表如下:

则工人平均劳动生产率为: 17.3830 1145 == = ∑∑f xf x # 要求:(1)建立以产量为自变量的直线回归方程,指出产量每增加1000件时单位成本的平均变动是多少 、 (2)当产量为10000件时,预测单位成本为多少元(15分) x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时, 即x 增加1单位时,单位成本的平均变动是:平均减少元 (2)当产量为10000件时,即10=x 时,单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性 解:乙班学生的平均成绩∑∑=f xf x ,所需的计算数据见下表:

统计学思考题

第一章导论 1、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据和数值型数据。按照统计数据 的收集方法,可以将其分为观测数据和实验数据。按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 分类数据是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的。顺序数据是只能归于某一有序类别的非数字型数据。顺序数据虽然也是类别,但这些类别是有序的,是用文字来表述的。数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。现实中处理的大多数都是数值型数据。 2、解释分类数据、顺序数据和数值数据的意义。 对分类数据,我们通常计算出各组的频数或频率,计算其众数和异众比率,进行列联表分析和x2检验等;对顺序数据,可以计算其中位数和四分位差,计算等级相关系数等;对数值型数据,可以用更多的统计方法进行分析,如计算各种统计量,进行参数估计和检验等 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含所研究的全部个体的集合,它通常由所研究的一些个体组成。如多个企业构成的集合,多个居民户构成的集合,多个人构成的集合 样本:是从总体中抽出的一部分元素的集合。如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。 参数:是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值。在统计中,总体参数通常用希腊字母表示,如,总体平均数用u(miu)表示,总体标准差用(sigma)表示,总体比例用(pai)表示,等。 统计量:是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。样本统计量通常用英文字母来表示。如,样本平均数用(x-bar)表示,样本标准车用s表示,样本比例用p表示,等。 变量:是说明现象某种特征的概念。如,商品销售额,受教育程度,产品的质量等级等。 4、变量可分为哪几类? 变量可以分为分类变量、顺序变量、数值型变量,数值型变量根据其取值的不同,又可分为离散型变量和连续型变量。分类变量是说明事物类别的一个名称,顺序变量是说明事物有序类别的一个名称,数值型变量是说明事物数字特征的一个名称。 5、举例说明离散型变量和连续性变量。 离散型变量是只能取可数值的变量,只能取有限个值,而且其取值都以整位数断开,可以一一列举,如,企业量,产品数量;连续型变量是可以在一个或多个区间中取任何值的变量。它的取值是连续不断的,不 能一一列举,如,年龄,温度,零件尺寸的误差等。 第二章数据的搜集 1、比较概率抽样和非概率抽样的特点。举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。 概率抽样也称随机抽样,是指遵守随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。它具有以下几个特点:首先,抽样时是按一定的概率以随机抽样原则抽取样本;其次,每个单位被抽中的概率是已知的,或是可以计算出来的;最后,当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。 非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。 如果调查的目的在于掌握研究对象总体的数量特征,根据调查的结果对总体参数进行评估,得到总体参数的置信区间,就应当采用概率抽样的方法。非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析做好准备。非抽样调查也适合市场调查中概念测试,如产品包装测试、广告测试等。第三章数据的图表表示 1、分类数据和顺序数据的整理和图示方法各有那些? 分类数据的整理方法有频数和频数分布,图示方法有条形图、帕累托图、饼图、环形图;顺序数据的整理方法有累积频数和累积频率,图示方法有累积频数分布和频率图。 2、数值型数据的分组方法有哪些?简述组距分组的步骤。 数据分组的方法有单变量值分组和组距分组。 组距分组的步骤:(1)确定组数,一般数据所分组数不应少于5组且不多于15组;(2)确定各组的组距,组距=(最大值-最小值)/组数,组距宜取5或10的倍数;(3)确定上下限,第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值。 3、直方图与条形图有何区别? 直方图与条形图不同。首先,条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是 分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章数据的概括性变量 1、一组数据的分布特征可以从那几个方面进行测度? 一组数据的分布特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。 2、对于比率数据的平均为什么采用几何平均? 3、简述众数、中位数、和平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响。其缺点是具有不唯一性,一组数据可能有一个众数,也可能有两个或多个众数,也可能没有众数。众数只有在数据量较多时才有意义,当数据量较少时,不宜采用众数。众数主要适合作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。当一组数据的分布偏斜程度较大时,使用中位数也许是一个好的选择。中位数主要适合作为顺序数据的集中趋势测度值。 平均数是针对数值型数据计算的,而且利用了全部数据信息,它是实际中应用最广泛的集中趋势测度值。当数据呈对称分布或接近对称分布时,3个代表值相等或接近相等时,这时则应选择平均数作为集中趋势的测度值。但平均数的主要缺点是易受数据极端值的影响,对于偏态分布的数据,平均数的代表性较差。因此,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好。 4、为什么要计算离散系数? 方差和标准差是反映数据离散程度的绝对值,其数值的大小一方面受原变量值自身水平高低的影响,也就是与变量的平均数大小有关,变量值绝对水平高的,离散程度的测度值自然也就大,绝对水平低的离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的,为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。 离散系数也成为变异系数,它是一组数据的标准差与其相应的平均数之比,其计算公式为:v s=s/(x-bar),离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说 明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 第五章参数估计 1、怎样理解置信区间? 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限,由于统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间。 2、解释95%的置信区间 如果抽取了许多不同的样本,比如说抽取了100个样本,根据每一个样本构造一个置信区间,这样,由100个样本构造的总体参数的100个置信区间中,有95%的区间包含了总体参数的真值,而5%则没包含,则95%这个值称为置信水平。一般地,如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例成为置信水平,也称为置信度或置信系数。 第六章假设检验 1、什么是假设检验中的显著性水平?统计显著是什么意思? 通常把(a-er-fa)称为显著性水平,显著性水平是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05或0.01. 2、什么是假设检验中的两类错误? 对于原假设提出的命题,我们需要做出判断,这种判断可以用“原假设正确”或“原假设错误”来表述。当然,这是依据样本提供的信息进行判断的,也就是由部分来推断,总体。因而判断有可能正确,也有可能错误,也就是说,我们面临着犯错误的可能。所犯的错误有两种类型,第一类错误是原假设H0为真却被我们拒绝了,犯这种错误的概率用(a-er-fa)表示所以成为其真错误;第二类错误是原假设为伪我们却没有拒绝,犯这类错误的概率用(bei-ta)表示,所以成为取伪错误。 3、解释假设检验中的P值。 P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由就越充分。 第七章方差分析 1、什么是方差分析?它研究的是什么? 方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型隐变量是否有显著影响。 方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响。 2、简述方差分析的基本思想。 为了研究分类型自变量对对数值型因变量的影响,需要从对数据误差来源的分析入手,误差主要分为组内误差和组间误差,组内误差只包含随机误差,而组间误差除了包含随机误差,还会包含系统误差。3、解释组内误差和组间误差的含义。 组内误差(SSE):反映组内误差大小的平方和,也称为残差平方和,是由于抽样的随机性所造成的随机误差。它反映了每个样本内各观测值之间的离散状况。 组间误差(SSA):反映组间误差大小的平方和,也称为因素平方和,是随机误差和系统误差的总和。它反映了样本均值之间的差异程度。 4、解释则内方差和组间方差的含义。 组间误差和组内误差经过平均后的数值称为均方或方差。 组间方差(MSA)=组间平方和/自由度(SSA/k-1) 组内误差(MSE)=组内平方和/自由度(SSE/n-k) 5、简述方差分析的基本步骤。 1、提出假设; 2、构造检验的统计量;(1)计算各样本的均值(2)计算全部观测值的总均值(3)计算各误差平方和(4)计算统计量 3、统计决策; 4、方差分析表; 5、用Excel进行方差分析。 第八章一元线性回归 1、解释相关关系的含义,说明相关系的特点。 相关关系1)变量间关系不能用函数关系精确表达;2)一个变量的取值不能由另一个变量唯一确定;3)当变量x 取某个值时,变量y 的取值可能有几个。 2、相关分析主要解决那些问题? 相关分析就是对两个变量之间线性关系的描述和度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本之间的变量关系是否能代表总体变量之间的关系? 3、解释回归模型、回归方程、估计的回归方程的含义。 回归模型:描述因变量y如何依赖于自变量x和误差项ε的方程。 回归方程:描述因变量y的期望值如何依赖于自变量x的方程。 估计的回归方程:根据样本数据求出的回归方程的估计。 4、解释总平方和、回归平方和、残差平方和的含义,并说明它们之间的联系。 总平方和(SST):是全部观测值Xij与总均值x-两bar的误差平方和。 残差平方和(SSE):反映组内误差大小的平方和。 回归平方和(SSR):反映了y的总变差中由于x与y之间的线性关系引起的y的变化部分。 SST=SSR+SSE 5、解释判定系数(R2)的含义和作用。 含义:判定系数是对估计的回归方程拟合优度的度量。判定系数等于相关系数的平方,即r2=(r)2 作用:反映回归直线的拟合程度;R2越接近1,说明回归方程拟合的越好;R2越接近0,说明回归方程拟合的越差。 6、在回归分析中,F检验和t检验各有什么作用? F检验是检验自变量和因变量之间的线性关系是否显著,或者说,它们之间能否用一个线性模型y= 来表示。 t检验的显著性检验是要检验自变量对因变量的影响是否显著。在一元线性回归模型y= 中,如果白塔1=0,则回归线是一条水平线,表面因变量y的取值不依赖与自变量x,即两个变量之间没有线性关系。 7、简述线性关系检验和回归系数检验的具体步骤。 线性关系检验:1、提出假设,H0:回归系数等于0,两个变量之间的线性关系不显著;2、计算检验统计量F=(SSR/1)/(SSE/(n-2));3、做出决策,根据显著性水平,分子自由度和分母自由度查F分布表,找到相应的临界值,比较与F的大小,判断是否拒绝原假设 回归系数检验:1、提出检验;2、计算检验统计量t;3、做出决策

相关文档