文档库 最新最全的文档下载
当前位置:文档库 › 统计学题库及题库详细答案

统计学题库及题库详细答案

统计学题库及题库详细答案
统计学题库及题库详细答案

统计学题库及题库详细答案

————————————————————————————————作者:————————————————————————————————日期:

统计学题库及题库答案 题库1

一、单项选择题(每题2分,共20分) 1、调查时间是指( )

A 、调查资料所属的时间

B 、进行调查的时间

C 、调查工作的期限

D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业

3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。

A 、全距

B 、平均差

C 、标准差

D 、变异系数

4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( )

A 、扩大为原来的3倍

B 、扩大为原来的2/3倍

C 、扩大为原来的4/9倍

D 、扩大为原来的2.25倍

5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选( )。

A 、576户

B 、144户

C 、100户

D 、288户 6、当一组数据属于左偏分布时,则( )

A 、平均数、中位数与众数是合而为一的

B 、众数在左边、平均数在右边

C 、众数的数值较小,平均数的数值较大

D 、众数在右边、平均数在左边

7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为( )。

A 、520

B 、 510

C 、 500

D 、490

8、用组中值代表组内变量值的一般水平有一定的假定性,即( )

A 、各组的次数必须相等

B 、变量值在本组内的分布是均匀的

C 、组中值能取整数

D 、各组必须是封闭组 9、

n

X X X ,,,21 是来自总体

),(2

N 的样本,样本均值X 服从( )分布 A 、),(2 N B.、)1,0(N C.、

),(2

n n N D 、)

,

(2

n N

10、测定变量之间相关密切程度的指标是( )

A 、估计标准误

B 、两个变量的协方差

C 、相关系数

D 、两个变量的标准差 二、多项选择题(每题2分,共10分)

1、抽样推断中,样本容量的多少取决于( )。

A 、总体标准差的大小

B 、允许误差的大小

C 、抽样估计的把握程度

D 、总体参数的大小

E 、抽样组织形式

2、抽样估计中的抽样误差( )。

A 、是不可避免要产生的

B 、是可能通过改进调查方式来消除的

C 、是可以事先计算出来的

D 、只能在调查结束后才能计算的

E 、其大小是可能控制的

3、在什么条件下,加权算术平均数等于简单算术平均数( )。

A 、各组次数相等

B 、各组变量值不等

C 、变量数列为组距数列

D 、各组次数都为1

E 、各组次数占总次数的比重相等

4、总体平均数的假设检验方法通常有( )

A 、 Z 检验法

B 、 t 检验法

C 、 2 检验法

D 、 F 检验法

E 、 几何检验法

5、指出下列分组哪些是属性分组( )

A 、 人口按性别分组

B 、 企业按产值多少分组

C 、 家庭收入水平分组

D 、 在业人员按文化程度分组

E 、 产品按质量等级分组

三、填空题(每空2分,共20分)

1、统计分组的关键问题是正确选择 与划分 。

2、对某村6户居民家庭共30人进行调查,所得的结果是,人均收入400元,其离差平方和为480,则标准差是 ,标准差系数是 。

3、抽样推断的主要内容有 和 两个方面。

4、假设检验中的两类错误分别称为 和 。

5、相关系数r 的取值范围是 到 。

四、简答题(每题5分,共20分)

1、众数、中位数、均值的特点与应用场合是什么?

2、什么是假设检验的P 值?如何根据P 值作出假设检验的结论?

3、为什么要计算标准差系数?

4、单因素方差分析的步骤是什么? 五、计算题(每题10分,共30分)

1、某班学生统计学原理考试成绩次数分布如下:

要求:根据上表资料,计算相应的的数字,填入表中空格。

2、根据有关调查,北京市每天每个家庭上网的时间服从正态分布

2

(4,1)N 。现从北京市家庭中随机抽取16户,测得平均每天每户家庭上网时间为4.5小时。试在0.05的显著性水平下判断北京市家庭上网的时间是否有显著提高?(

0.050.0251.645, 1.96

Z Z )

3、从100家自选商场销售额资料(x ,亿元)和利润额(y ,亿元)资料计算得知:

n=100,∑X=10,∑Y=20,∑X2=1.5,∑Y2=50,∑XY=3。根据以上数据,求出利润额对销售额的直线回归方程。

题库2

一、单项选择题(每题2分,共20分)

1、统计学自身的发展,沿着两个不同的方向,形成()

A、描述统计学与理论统计学

B、理论统计学与推断统计学

C、理论统计学与应用统计学

D、描述统计学与推断统计学

2、某地区为了掌握地区水泥生产的质量情况,拟对占该地区水泥总产量的80%

的五个大型水泥厂的生产情况进行调查,这种调查方式是()

A普查B典型调查C抽样调查D重点调查

3、用组中值与次数求坐标点连接而成的统计图是()

A直方图B条形图

C曲线图D折线图

4、离中趋势指标中,最容易受极端值影响的是()

A极差B平均差

C标准差D标准差系数

5、一组数据的偏态系数为1.3,表明该组数据的分布是()

A正态分布B平顶分布

C左偏分布D右偏分布

6、抽样平均误差说明抽样指标与总体指标之间的()

A实际误差B平均误差

C实际误差的平方D允许误差

7、假设检验是检验()的假设是否成立。

A样本方差B总体指标

C样本方差D样本平均数

8、用组中值代表组内变量值的一般水平有一定的假定性,即()

A、各组的次数必须相等

B、变量值在本组内的分布是均匀的

C、组中值能取整数

D、各组必须是封闭组

9、总体平均数的假设检验方法,在小样本,且方差未知时,通常采用()

A、Z检验法

B、t检验法

C、

2

检验法D、F检验法

10、年劳动生产率x(千元)和工人工资y=10+70x,这意味着年劳动生产

率每提高1千元时,工人工资平均()

A、增加70元

B、减少70元

C、增加80元

D、减少80元

二、多项选择题(每题2分,共10分)

1、概率抽样调查()

A、是一种非全面调查

B、其目的是根据抽样结果推断总体数量特征

C、它具有经济性、时效性、准确性和灵活性等特点

D、其调查单位是随机抽取的

E、抽样推断的结果往往缺乏可靠性

2、常用的样本指标有()

A样本平均数B样本成数C抽样误差

D样本方差E标准差

3、在什么条件下,加权算术平均数等于简单算术平均数()。

A、各组次数相等

B、各组变量值不等

C、变量数列为组距数列

D、各组次数都为1

E、各组次数占总次数的比重相等

4、总体平均数的假设检验方法通常有()

A、Z检验法

B、t检验法

C、

2

检验法

D、F检验法

E、几何检验法

5、中位数是()

A由标志值在变量数列中所处的位置决定的

B根据标志值出现的次数决定的

C总体单位水平的平均值

D总体一般水平的代表值

E不受总体中极端数值的影响

三、填空题(每空2分,共20分)

1、一个完整的统计工作过程可以划分为_____、____、_____、_______四个阶段。

2、当变量数列中算术平均数大于众数时,这种变量数列的分布呈_____分布;反之,算术平均数小于众数时,变量数列的分布呈______分布。

3、评价点估计量好坏的标准有_____、______和______。

4、相关系数,用于反映______条件下,两变量相关关系的密切程度和方向的统计指标。

四、简答题(每题5分,共20分)

1、离中趋势的指标有哪些(至少列出三个),它们之间有何区别?

2、影响抽样误差的因素有哪些?

3、相关分析和回归分析的联系与区别?

4、假设检验一般有哪些步骤?

五、计算题(每题10分,共30分)

1、某班级分甲、乙两个学习小组,在统计学考试中,甲小组平均成绩75

分,标准差11.5,乙小组成绩资料如表:

成绩(分)人数(人)

60以下60-70 70-80 80-90 90以上2 5 8 6 4

合计25 (1)计算乙小组的平均成绩。

(2)以尽可能精确的方法比较两小组平均成绩的代表性。

2、根据历史的统计,某种产品的次品率为2%。如果要求置信水平为95.45%的置信区间,

并要求允许误差不超过4%,应抽取多大的样本?(

(2)95.45% P Z

3、从100家自选商场销售额资料(x,亿元)和利润额(y,亿元)资料计算得知:

n=100,∑X=10,∑Y=20,∑X2=1.5,∑Y2=50,∑XY=3。根据以上数据,(1)求出利润额对销售额的直线回归方程;

(2)预测当销售额为0.5亿元时,利润额在置信度为95.45%的预测区间(已知预测标准误差为0.05亿元)。

题库3

一、单项选择题(每题2分,共20分)

1.某地进行私营商业企业经营情况调查,则调查对象是()

A该地所有商业企业B该地所有私营商业企业

C该地每一私营商业企业D该地每一商业企业

2. 统计分组的关键问题是()

A确定分组标志和划分各组界限

B确定组距和组数

C确定组距和组中值D确定全距和组距

3用组中值与次数求坐标点连接而成的统计图是()

A直方图B条形图

C曲线图D折线图

4. 离中趋势指标中,最容易受极端值影响的是()

A极差B平均差

C标准差D标准差系数

5. 所谓大样本是指样本单位数在()及以上。

A30个B50个C80个D100个

6. 抽样指标与总体指标之间抽样误差的可能范围是()

A抽样平均误差B抽样极限误差

C区间估计范围D置信区间

7. 原假设为真,我们却拒绝它的概率为()

A1- B C1- D

8. 假设检验是检验()的假设是否成立。

A样本方差B总体指标

C样本方差D样本平均数

9. 下面的函数关系是()

A销售人员测验成绩与销售额大小的关系

B圆周的长度决定于它的半径

C家庭的收入和消费的关系

D数学成绩与统计学成绩的关系

10. 年劳动生产率x(千元)和工人工资(元)y=30+70x,这意味着年劳动生

产率每提高1千元时,工人工资平均()

A增加70元B减少70元C增加100元D减少100元

二、多项选择题(每题2分,共10分)

1.询问调查法有以下几种()

A访问调查B邮寄调查C电话调查D实验法E观察

2.某单位100名职工按工资额分为300以下、300-400、400-600、600-800、

800以上等五个组。这一分组()

A是等距分组B是异距分组C末组组中值为800

D相邻的组限是重叠的E某职工工资600元,应计在600-800元组

3.在各种平均数中,不受极端值影响的平均数是()

A算术平均数B调和平均数

C中位数D几何平均数

E众数

4.在总体1000个单位中,抽取20个单位进行调查,下列各项正确的是

()

A样本单位数是20个

B样本个数是20个

C一个样本有20个单位

D样本容量是20个

E是一个小样本

5.下列哪些变量之间的关系为相关关系()

A家庭收入与消费支出关系

B 圆的面积与它的半径关系

C广告支出与商品销售额关系

D单位产品成本与利润关系

E在价格固定情况下,销售量与商品销售额关系

三、填空题(每空2分,共20分)

1、统计学按方法的构成可以分________________与_________________。

2、组距式变量数列,根据各组的组距是否相等可以分为________________

和_________________。

3、直方图是用__________________的宽度和高度来表示频数分布的图形。

4、标准差系数是______________与________________之比。

5、常用的总体指标有_______________、_____________、______________。

四、简答题(每题5分,共20分)

1、统计调查方案包括有哪几个方面的内容?

2、数据的计量尺度分几类?它们之间有什么区别与联系?

3、标准差与标准差系数各是什么含义?衡量数据的离散程度时,如何选择?

4、必要的抽样数目受哪些因素的影响?

五、计算题(每题10分,共30分)

1.2006年某月份甲、乙两农贸市场某农产品价格和成交额、成交量资料如下:

品种价格(元/斤)甲市场成交额

(万元)

乙市场成交量

(万斤)

甲 1.2 1.2 2

乙 1.4 2.8 1

丙 1.5 1.5 1

合计- 5.5 4 试问哪一个市场农产品的平均价格高?并说明理由。

2、某食品厂用自动装袋机包装食品,每袋标准重量为50克,每隔一定时间抽取包装袋进行检验。现抽取10袋,测得其重量为(单位:克);

49.8,51,50.5,49.5,49.2,50.2,51.2,50.3,49.7,50.6

若每袋重量服从正态分布,每袋重量是否符合要求。

( =0.05,

0.0252.2622

t )

3、某10户家庭样本具有下列收入和食品支出(元/天)数据:

收入x 20 30 32 40 45 53 56 58 65 74

支出y 7 9 8 11 12 14 13 15 17 16

试求出以最小二乘法计算的回归方程,并预测当x=5时y的值。

题库4

一、单项选择题(每题2分,共20分)

1、.人口普查的调查单位是()。

A .全部人口 B.每个人

C.全部人口数

D.每户家庭;

2、将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是()。

A.、单侧检验B、双侧检验C、右单侧检验D、左单侧检验

3、产品质量的检查应该采用()。

A、重点调查的方法;

B、典型调查的方法;

C、普查的方法;

D、抽样检验的方法;

4某组向上累计次数表示( )

A、大于该组上限的次数有多少;

B、大于该组下限的次数有多少;

C、小于该组上限的次数有多少;

D、小于该组下限的次数有多少;

5、对正态总体均值进行区间估计时,其它条件不变,置信水平

1越大,则置信上限与

置信下限的差()

A、越大

B、越小

C、不变

D、不确定

6、在其它条件不变的情况下,如果允许抽样平均误差比原来扩大2倍,则样本容量()。

A.扩大为原来的4倍

B. 扩大为原来的2倍

C.缩小为原来的二分之一

D. 缩小为原来的四分之一

7、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,则职工月平均收入的离散程度( )

A、甲类较大

B、乙类较大

C、两类相同

D、不确定

8、所谓显著水平是指()

A、原假设为真时将其接受的概率;

B、原假设不真时将其舍弃的概率;

C、原假设为真时将其舍弃的概率;

D、原假设不真时将其接受的概率;

9、在一元线性回归方程y a bx

中,b表示( )

A、当x增加一个单位时,y增加a的数量;

B、当y增加一个单位时,x增加b的数量;

C、当x增加一个单位时,y的平均增加量;

D、当y增加一个单位时,x的平均增加量.

10.在其他条件相同的前提下:不重复抽样误差()

A、大于重复抽样误差

B、小于重复抽样误差

C、等于重复抽样误差

D、与重复抽样误差何者更大无法判

二、多项选择题(每题2分,共10分)

1.频率是()

A概率B各组次数C非负数D自然数E各组的次数

占总体单位数的比重

2. 下列的表述正确的有()

A. 总体是唯一确定的,样本是随机的

B. 总体指标是确定不变的

C. 抽样指标是样本量的函数

D. 抽样指标也是随机变量

E. 抽样指标是确定不变的

3.若一组数据的偏度系数是-0.25,则下列说法正确的有()

A平均数、中位数与众数是分离的

B众数在左边、平均数在右边

C数据的极端值在右边,数据分配曲线向右延伸

D众数在右边、平均数在左边

E数据的极端值在左边、数据分配曲线向左延伸

4. 进行方差分析需要满足的假设条件有()

A每次试验都是独立进行

B各样本都来自正态总体

C 各总体的方差相等

D各样本的样本量相等

E各总体分布相互独立

5.人的血压与体重之间存在一定的相关关系,这种相关属于()

A正相关

B 单相关

C负相关

D复相关

E完全相关

三、填空题(每空2分,共20分)

1、统计调查按调查对象包括的范围不同可分为_____________与

______________。

2、测定峰度系数β=3时,次数分布曲线为____________;为β<3时,

为____________;β>3时,为________________曲线。

3、当___________________时,加权算术平均数等于简单算术平均数。

4、总体方差越大,抽样误差就___________;总体方差越小,抽样误差

______________。

5、当变量数列中算术平均数大于众数时,这种变量数列的分布呈

__________分布;反之,算术平均数小于众数时,变量数列的分布呈

___________分布。

四、简答题(每题5分,共20分)

1、什么是统计学?怎样理解统计学与统计数据的关系?

2、如何对任意两个总体平均数的代表性进行比较?

3、影响抽样误差的因素有哪些?

4、什么是假设检验的P 值?如何根据P 值来作出假设检验的结论? 五、计算题(每题10分,共30分)

1、随机抽查某企业100名职工,其月工资资料如下表

月工资额(百元)

职工数(人)

要求:根据表中资料计算职工月工资的平均数、标准差和离散系数。

5—8 8-10 10-12 12-14 14—18 4 10 80 3 3 合计

100

2、从500名初中生中随机抽出100名测量身高,通过计算得样本身高平均值X 为1.65米,样本标准差s 为0.073,在概率为95.45%的保证程度下,对这些初中生的身高作出区间估计。(φ(2)=0.9545)

3、对9位青少年的身高y 与体重x 进行观测,并已得出以下数据:

54

.13y ,

9788

.22y 2,

472x ,

28158

x 2,

02

.803xy

要求:

以身高为因变量,体重为自变量,建立线性回归方程。

题库5

一、单项选择题(每题2分,共20分)

1.统计学的方法分为( ) A 描述统计学与理论统计学 B 理论统计学与推断统计学 C 理论统计学与应用统计学 D 描述统计学与推断统计学

2.某蕊片厂为了掌握该厂的产品质量,拟进行一次质量大检查,这种检查应选择( )

A 统计报表

B 重点调查

C 全面调查

D 抽样调查 3.下列分组中按品质标志分组的是( )

A 人口按年龄分组

B 产品按质量优劣分组

C企业按固定资产原值分组D乡镇按工业产值分组

4. 在分组时,若有某个数据的值正好等于相邻组的下限时,一般应将其归

在()

A上限所在组B下限所在组

C任意一组均可D另设新组

5.方差是数据中各变量值与其算术平均的()

A离差绝对值的平均数B离差平方的平均数

C离差平均数的平方D离差平均数的绝对值

6. 一组数据的偏态系数为-1.3,表明该组数据的分布是()

A正态分布B平顶分布

C左偏分布D右偏分布

7. 原假设为假,我们却不拒绝它的概率为()

A1- B C1- D

8.在简单随机重复抽样条件下,若要求抽样误差为原来的1/2,则样本容量

()

A扩大为原来的5倍B扩大为原来的2倍

C扩大为原来的4倍D扩大为原来的2.5倍

9. 假设检验和区间估计之间的关系,下列说法正确的是()

A虽然概念不同,但实质相同

B两者完全没有关系

C互相对应关系

D不能从数量上讨论它们之间的对应关系

10. 当相关系数r=0时,表明()

A现象之间完全相关B相关程度较小

C现象之间完全相关D无直线相关关系

二、多项选择题(每题2分,共10分)

1.不属于询问调查法有()

A访问调查B邮寄调查C电话调查D实验法E观察

2. 非全面调查是指()

A普查B全面统计报表C重点调查D典型调查E抽样

调查

3.变量数列中频率应满足的条件是()

A各组频率大于1 B各组频率大于0

C各组频率之和等于1 D各组频率之和小于1

E各组频率之和大于1

4.在500位同学中,抽取100名同学进行调查,下列各项正确的是

()

A样本单位数是1000个

B样本个数是100个

C一个样本有100个单位

D样本容量是100个

E是一个大样本

5.下列哪些变量之间的关系为函数关系()

A家庭收入与消费支出关系

B 圆的面积与它的半径关系

C广告支出与商品销售额关系

D单位产品成本与利润关系

E在价格固定情况下,销售量与商品销售额关系

三、填空题(每空2分,共20分)

1、统计数据大体上可分为________________与_________________两种类

型。

2、数据的计量尺度由低级到高级可以分为______________、

____________、________________和__________________。

3、当满足___________________条件,加权算术平均数等于简单算术平均

数。4、参数点估计的方法有____________________与

_______________________。

5、相关系数的取值范围是______________。

四、简答题(每题5分,共20分)

1、简述平均数、众数、中位数三者的特点与应用场合?

2、什么是随机原则?在抽样调查中为什么要遵循随机原则?

3、什么是离散系数?它的计算有什么意义?

4、什么是假设检验的P值?如何根据P值来作出假设检验的结论?

五、计算题(每题10分,共30分)

1.根据下表数据,计算10名工人日加工零件数均值、标准差。

按零

件数

分组

人数

0~10 2

10~20 5

20~30 3

合计10

2、根据过去大量资料,西安市每天每个家庭看电视的时间服从正态分布

2

(4,1)

N。现从西

安市家庭中随机抽取16户,测得平均每天每户家庭看电视时间为4.5小时。试在0.05的显

著性水平下判断西安市家庭看电视的时间是否有显著提高?(0.051.645

Z

)

3、检查5位同学统计学的学习时间与成绩分布如下表:

每周学习时数

x

4 6 7 10 13

学习成绩

y

40 60 50 70 90

试求出以最小二乘法计算的回归方程,并预测当每周学习时数为8时,统计学成绩。

题库6

一、单项选择题(每题2分,共20分)

1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方

法属于( )

A、应用统计学

B、描述统计学

C、推断统计学

D、理论统计学

2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数

()

A、扩大2倍

B、减少到1/3

C、不变

D、减少到1/2

3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、

37、35、31.则最大艇速的均值的无偏估计值为

()

A、32.5

B、33

C、39.6

D、30

4、若两个变量的平均水平接近,标准差越大的变量,其

( )

A、平均值的代表性越好

B、离散程度越大

C、稳定性越高

D、离散程度越小

5、对正态总体均值进行区间估计时,其它条件不变,置信水平

1越小,

则置信上限与置信下限的差()

A、越大

B、越小

C、不变

D、不确定

6、方差分析中的原假设是关于所研究因素( )

A、各水平总体方差是否相等

B、各水平的理论均值是否相等

C、同一水平内部数量差异是否相等

D、同一水平内部数值相等

7、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,则职工月平均收入的离散程度( )

A、甲类较大

B、乙类较大

C、两类相同

D、不确定

8、在假设检验中,若

500

:

,

500

:

1

H

H

,则此检验是

()

A、左侧检验

B、右侧检验

C、双侧检验

D、不知道

9、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为( )

A、45

B、40

C、44

D、43

10、某次考试学生的考试成绩X近似服从正态分布,

64,78

~N

X

,则

可认为有大约95.45%的学生考试成绩分布的范围是

( )

A、(70,80)

B、(70,86)

C、(62,94)

D、(70,90)

二、多项选择题(每题2分,共10分)

1.估计量的评价标准是()

A无偏性B有效性C一致性D客观性E及时性

2. 下列哪些属于全面调查()

A普查B全面统计报表C重点调查D典型调查E抽样

调查

3.下列关于变量数列中频率的说明不正确的是()

A各组频率大于1 B各组频率大于0

C各组频率之和等于1 D各组频率之和小于1

E各组频率之和大于1

4. 总体平均数的假设检验方法通常有()

A Z检验法

B t检验法C

2

检验法

D F检验法E几何检验法

5.收入与消费存在一定的相关关系,这种相关属于()A正相关

B 单相关

C负相关

D复相关

E 完全相关

三、填空题(每空2分,共20分)

1、统计词有三种涵义,即________________、_________________与_____________________。

2、加权算术平均数受两个因素的影响,一个是______________,一个是_____________。

3、在假设检验中,把符合

H 的总体判为不符合

H 加以拒绝,这类错误

称为____________错误;把不符合

H 的总体当作符合

H 而接受,这类

错误称为____________错误;显著性水平 是用来控制犯第_______类错误的概率。

4、直线相关系数等于零,说明两变量之间________________;直线相关系数等于-1,说明两变量之间_______________________。

四、简答题(每题5分,共20分)

1、统计学的确对我们的生活的各个方面起着重要的作用,但如果有意或者无意地误用统计学方法,其结论则会带来更大的欺骗性。为了避免这种情况的发生,请根据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用方法?

2、随机抽样的含义与特点?

3、什么是标准差系数?在什么场合下计算标准差系数?

4、说明单因素方差分析中,总离差平方和、水平项离差平方和、误差项离差平方和的含义与三者的关系?

五、计算题(每题10分,共30分)

1、随机抽查某企业100名职工,其月工资资料如下表

月工资额(百元)

职工数(人)

要求:根据表中资料计算职工月工资的平均数、标准差和离散系数。

5—8 8-10 10-12 12-14 14—18 4 10 80 3 3 合计

100

2、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)

3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:

产品产量(台)x i 40 50 50 70 80 生产费用(万元)

y i

130

140

145

150

156

要求:利用最小二乘法求出估计的回归方程。

附: 58 x 2.144 y

179005

1

2

i x i 1043615

1

2

i y i

424305

1

y

x i

i i

题库一答案

一、选择题(每题2分,共20分)

1. B

2.C

3.D

4.D

5.A

6.D 7A 8.B 9.D 10.C

二、多项选择题(每题2分,共10分)

1.ABCE

2.ACE

3.ADE

4.AB

5.ADE

三、填空题(每空2分,共20分)

1. 分组标志、组矩

2. 4元、0.01

3. 参数估计、假设检验

4. 弃真错误、纳伪错误

5.

-1,1

四、简答题(每题5分,共20分)

1.答:(1)众数是一组数据分布的峰值,是一种位置代表值。其优点是不受极端值影响。其缺点是具有不唯一性。(1分)

(2)中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。(1分)

(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响。(1分)

应用场合:当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值;当数据为偏态分布,特别是当偏斜的程度较大时,应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。此外,均值只适用于定距或定

比尺度的数据,而对于定类和定比尺度的数据则无法计算均值,但却可以计算众数和中位数。(2分)

2.答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2分)。

00

H

3.3.答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平高低的影响,也就是与变量的均值大小有关。(2分)。

因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数(3分)。

4、答:方差分析的步骤:首先,计算出总离差平方和(SST)、误差项离差平方和(SSE)、水平项离差平方和 (SSA)。SST 反映全部数据总的误差程度;SSE 反映随机误差的大小;SSA 反映随机误差和系统误差的大小,三者之间的关系:SST =SSA +SSE 。第二,计算SSE 的均方MSE ,SSA 的均方MSA 。将MSA 和MSE 进行对比,即得到所需要的F 检验统计量。第三,将统计量的值F 与给定的显著性水平a 的临界值F a 进行比较,作出对原假设H0的决策。

五、计算题(每题10分,共30分) 1.解:(全对,给10分,错一空扣1分)

2.解:根据题意:提出假设:01:4,:4H u H u (2分) 检验统计量0 4.54

2/1/16

x u Z n

(3分) 由 =0.05,查表临界值0.05 1.645Z Z

由于Z =2>Z =1.645,所以应拒绝0H 而接受H 1,即北京市家庭每天上网的时间确有显著提高。(5分)

3.解:μ2

222

100310202()100 1.510n XY X Y n X X (4分) μμμ12220210

//0100100

Y n X n Y X (4分) 样本回归方程:μ2Y

X (2分) 考分 人数 比率 向上累计

向下累计

人数(人) 比率(%) 人数(人) 比率(%)

60以下 2 5.0 2 5.0 40 100.0

60-70 7 17.5 9 22.5 38 95.0 70-80 11 27.5 20 50.0 31 77.5 80-90 12 30.0 32 80.0 20 50.0 90以上 8 20.0 40 100.0 8 20.0 合计

40

100.0

题库二答案

一、选择题(每题2分,共20分)

1.C

2.D

3.D

4.A

5.D

6.B7B8.B9.B10.A

二、多项选择题(每题2分,共10分)

1.ABCD

2.ABD

3.ADE

4.AB

5.ADE

三、填空题(每空2分,共20分)

1.统计设计、统计调查、统计整理、统计分析

2.右偏、左偏

3.无偏性、有效性、一致性

4.线性相关

四、简答题(每题5分,共20分)

1. 答:离中趋势的常用指标包括:全距、平均差、标准差与标准差系数(2分)。(1)全距:计算简单、但容易受极端数值的影响,不能全面反映所有标志值的差异及分布状况,准确度差(2分)。(2)平均差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点:用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算(2分)。(3)标准差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算(2分)。(4)离散系数:用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小(2分)。

2.答:总体各单位的差异程度(即标准差的大小),总体各单位的差异程度越大,抽样误差越大(4分);样本单位数的多少,样本单位数越大,抽样误差越小(2分);抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小(2分);抽样组织方式:简单随机抽样的误差最大(2分)。

3.答:相关分析,就是用一个指标来表明现象相互依存关系的密切程度。回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的平均变化关系(2分)。

(1)两者有密切的联系。它们不仅有共同的研究对象,而且在具体应用时,必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度(4分)。

(2)相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之间相关的方向和相关的程度。但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互关系的具体形式,确定一个相关的数学方程式,根据这个数学方程式从已知变量推测未知量,从而为估算和预测提供了一个重要的方法(4分)。

4、答:基本步骤:1.提出原假设和备择假设(2分)

2.确定适当的检验统计量(2分)

3.规定显著性水平α,确定临界值(2分)

4.计算检验统计量的值(2分)

5.作出统计决策(2分)

五、计算题(每题10分,共30分)

1.解:

相关文档