文档库 最新最全的文档下载
当前位置:文档库 › 统计学第9章--列联分析

统计学第9章--列联分析

统计学第9章--列联分析
统计学第9章--列联分析

第9章列联分析

9.1 分类数据与列联表

例:某集团公司下属四个分公司。现该集团欲进行一项改革,由于涉及到各分公司的利益,希望对各分公司职工的态度有所了解。所以从四个分公司中随机选取420名员工进行调查,结果如下表所示:

关于改革方法的调查结果

9.1.1 列联表的构造

列联表:是由两个以上的变量进行交叉分类的频数分布表。

每个单元:反应两方面的信息

行R:态度变量行合计:RT

列C:单位变量列合计:CT

?列联表:24?列联表

R C

9.1.2 列联表的分布

1 观察值的分布

总合计(样本容量):N 百分比:

RT

N

2 期望值的分布

期望值:

CT N

? 9.1.3 观察值与期望值频数对比分布表

9.2 拟合优度检验

9.2.1 思路:

如果各分公司员工对改革方案的态度一致

则各分公司员工赞成或反对该方案的比例应该相同 即1234ππππ===

其中i π为第i 个分公司赞成改革方案的比例

那么,对比分布表中相应的观察值与期望值就应该非常接近

9.2.2 检验统计量:2χ

设0f 为观察值频数

e f 为期望值频数

2

2

0()e e

f f f χ-=∑ 9.2.3 判断准则

当2χ大于某临界值时,拒绝态度一致的原假设——右单侧检验

即22

αχχ>时,拒绝原假设

自由度(1)(1)R C =--

完成上面的例题 解:

01234:H ππππ=== 各分公司员工对这项改革的态度一致 1:H 上面等式不全相等 各分公司员工对这项改革的态度不一致

2χ计算表

2

2

0()e e

f f f χ-=∑=3.0319

自由度(1)(1)R C =--=3

0.1α=,查表得:2

0.1

(3) 6.251χ= 由于3.0319<6.251,所以不能拒绝原假设,即认为四个分公司员工对这项改革的态度是一致的。

例:从总体中随机抽取200n =的样本,调查后按不同属性归类,得到如下结果:

1234528,56,48,36,32n n n n n =====

依据以往经验,各类别在总体中的比例分别为:

123450.1,0.2,0.3,0.2,0.2πππππ=====

请以0.1α=的显著性水平检验,说明现在的情况与经验数据相比是否发生了显著变化。 解:

012345:0.1,0.2,0.3,0.2,0.2H πππππ===== 没有发生显著变化 1:H 上面等式不全相等 发生了显著变化 12000.120e f =?=,22000.240e f =?=,32000.360e f =?=, 42000.240e f =?=,52000.240e f =?=,

()()()()()2

2

02

2

2

2

2

()282056404860364032402040

60

40

40

14

e e

f f f χ-=-----=

+

+

+

+

=∑

自由度=5-1=4

2 0.1(4)7.779

χ=

由于14>7.779,所以不能接受原假设,即认为现在的情况与经验数据相比已经发生了显著变化。

9.3 独立性检验

适用:两个分类变量之间是否存在联系

例:一种原料来自三个不同的地区,原料质量被分为三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表所示

要求检验各个地区与原料的质量之间是否存在依赖关系

解:

0:

H地区与原料等级之间是独立的(不存在依赖关系)

1:

H地区与原料等级之间是不独立的(存在依赖关系)

期望值的计算:

以52为例

设A=样本来自于甲地区则()140/500

P A=

B=样本属于一级原料则()162/500

P B=

若地区与原料等级独立,则有140162

()500500

P AB =

?

即来自于甲地区又属于一级品的原料频数应为140162

500500500

??

一般化:e RT CT RT CT

f N N N N

?=?

?=

检验统计量:2

2

0()e e

f f f χ-=∑

代入数据得:

2

2

22

02

1401621711625260()5005001401621711625005001891507450019.82189150500

e e

f f f χ??????-- ? ?-????==++

????

?- ?

??+=?∑L

自由度(1)(1)R C =--=4

0.05α=,查表得:2

0.05

(4)9.448χ= 由于19.82>9.448,所以拒绝原假设,即认为这些原料的产地与等级之间存在依赖关系。

比较:独立性检验与一致性检验 抽取样本的方法不同

一致性检验:在各类别中分别抽取 独立性检验:先抽取,再分类

计算期望值的理论不同

9.42χ检验的期望值准则

例:下表是某个应用2χ检验问题的观察值与期望值情况,0.05

α=,请检验原假设是否成立

解:

0:

H拟合的好

1:

H拟合的不好2

χ计算表

自由度=7-1=6

2 0.05(6)12.592

χ=

因为14.008>12.592,所以拒绝原假设,认为数据拟合的不好。

2

χ检验的期望值准则

如果只有两个单元,每个单元的期望频数必须是5或者5以上;如果有两个以上单元,若20%的单元期望频数小于5,则不能引用2χ检验。

改进方法:把期望频数小于5的单元进行合并。

自由度=5-1=4

2 0.05(4)9.448

χ=

因为9.448>7.133,所以不能拒绝原假设,认为数据拟合的好。

9.5 列联表中的相关测量

检验结果不独立的情况下,两者的相关程度如何

9.5.1 ?相关系数

?=

其中,2

2

0()e e

f f f χ-=∑

n :列联表中的总频数,样本容量

想法:两个变量越独立,则0e f f 与越接近,?越接近于0

独立 完全相关 完全相关 0?=,相互独立

1?=,完全相关()22?

一般情况下,(0,1)?∈,越接近于1,相关性越强。

局限性

当列联表的行或列大于2时,随着行或列的增加,?相关系数会随之增加且没有上限,对两个变量相关程度的测量就不够清晰了。所以适用于描述22?列联表最常用的一种相关系数

9.5.2 列联相关系数——c 相关系数

c =

说明:

0c =,相互独立

[]0,1c ∈

c 相关系数的可能最大值依赖于列联表的行数与列数,且随着行数或

列数的增大而增大。所以行数、列数不相等的列联表的c 相关系数不能比较

9.5.3 V 相关系数

V =

[]

0,1V ∈ 0V =,相互独立 1V =,完全相关

例:原材料品质等级与产地的问题。计算三个相关系数 解:由前面可知

219.82χ= 所以

0.199?===

0.195c =

=

=

0.141V =

=

=

三个相关系数都不大,说明原料的 品质等级虽然与产地有关,但关

联程度并不大。

统计学课后练习题答案人大第四版

第三章节:数据的图表展示 (1) 第四章节:数据的概括性度量 (15) 第六章节:统计量及其抽样分布 (26) 第七章节:参数估计....................................................... (28) 第八章节:假设检验........................................................ (38) 第九章节:列联分析........................................................ (41) 第十章节:方差分析........................................................ (43) 3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C B C E D B C C B C 要求: (1)指出上面的数据属于什么类型。 顺序数据 (2)用Excel制作一张频数分布表。 用数据分析——直方图制作: 接收频率 E16 D17 C32 B21 A14 (3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作: (4)绘制评价等级的帕累托图。 逆序排序后,制作累计频数分布表:

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

i第八章单因素方差分析 (1)

幻灯片1 【例】调查了5个不同小麦品系的株高,结果如下。试判断这5个品系的株高是否存在显著性差异。 5个小麦品系株高(cm)调查结果 株号品系 ⅠⅡⅢⅣⅤ 1 2 3 4 5 和平均数64.6 65.3 64.8 66.0 65.8 326.5 65.3 64.5 65.3 64.6 63.7 63.9 322.0 64.4 67.8 66.3 67.1 66.8 68.5 336.5 67.3 71.8 72.1 70.0 69.1 71.0 354.0 70.8 69.2 68.2 69.8 68.3 67.5 343.0 68.6 幻灯片2 第八章单因素方差分析 One-factor analysis of variance 幻灯片3 本章内容 第一节方差分析简述 第二节固定效应模型 第三节随机效应模型 第四节多重比较 第五节方差分析应具备的条件 幻灯片4 第一节方差分析简述 一、方差分析的一般概念 1、概念 方差分析( analysis of variance,ANOVA):是同时判断多组数据平均数之间差异显著性的统计假设检验,是两组数据平均数差异显著性t 检验的延伸。 幻灯片5 单因素方差分析(一种方式分组的方差分析):研究对象只包含一个因素(factor)的方差分析。 单因素实验:实验只涉及一个因素,该因素有a个水平(处理),每个水平有n次实验重复,这样的实验称为单因素实验。 水平(level):每个因素不同的处理(treatment)。 幻灯片6 方差分析 Analysis of Variance (ANOVA ) ANOV A 由英国统计学家,用于推断多个总体均数有无差异。

统计学第八章方差分析

第八章方差分析 Ⅰ.学习目的 本章介绍方差分析的理论、方法与运用。通过学习,要求:1.了解方差分析的基本概念和思想;2.理解方差分解原理;3.掌握单因素、双因素(有、无交互作用)方差分析的原理和流程;4学会针对资料提出原假设,并能利用Excel进行方差分析。 Ⅱ.课程内容要点 第一节方差分析方法引导 一、方差分析问题的提出 方差分析,简称ANOVA(analysis of variance),就是利用试验观测值总偏差的可分解性,将不同条件所引起的偏差与试验误差分解开来,按照一定的规则进行比较,以确定条件偏差的影响程度以及相对大小。当已经确认某几种因素对试验结果有显著影响时,可使用方差分析检验确定哪种因素对试验结果的影响最为显著及估计影响程度。 二、方差分析的有关术语和概念 1.试验结果:在一项试验中用来衡量试验效果的特征量,也称试验指100

101 标或指标,类似函数的因变量或者目标函数。 2.试验因素:试验中,凡是对试验指标可能产生影响的原因都称为因素,或称为因子,类似函数的自变量。试验中需要考察的因素称为试验因素,简称为因素。一般用大写字母A 、B 、C 、……表示。方差分析的目的就是分析实验因素对实验或抽样的结果有无显著影响。如果在实验中变化的因素只有一个,这时的方差分析称为单因素方差分析;如果在实验中变化的因素不止一个,这时的方差分析就称为多因素方差分析。 3.因素水平:因素在试验中所处的各种状态或者所取的不同值,称为该因素的水平,简称水平。一般用下标区分。同样因素水平有时可以取得具体的数量值,有时只能取到定性值(如好,中,差等)。 4.交互作用:当方差分析过程中的影响因素不唯一时,这种多个因素的不同水平的组合对指标的影响称为因素间的交互作用。 三、方差分析的基本原理 (一)方差分解原理 一般地,试验结果的差异性可由离差平方和表示,离差平方和又可分解为组间方差与组内方差。其中,组间方差为因素对试验结果的影响的加总;组内方差则是各组内的随机影响的加总。如果组间方差明显高于组内方差,说明样本数据波动的主要来源是组间方差,因素是引起波动的主要原因,则认为因素对试验的结果存在显著的影响;否则认为波动主要来自组内方差,即因素对试验结果的影响不显著。 (二)检验统计量 检验因素影响是否显著的统计量是F 统计量: 组内方差的自由度 组内方差组间方差的自由度 组间方差// F

统计学期末考试试题和答案解析

统计学期末综合测试 一、单项选择题(每小题1分,共20分) 1、社会经济统计的数量特点表现在它是( )。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质与量的联系中,观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应是( )。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度( )。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年1月超额完成计划3%,2月刚好完成计划,3月超额完成12%,则该厂该年一季度超额完成计划( )。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件,若报告期两组工人的平均日产量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 A 上升 B 下降 C 不变 D 可能上升也可能下降

7、同一数量货币,报告期只能购买基期商品量的90%,是因为物价( )。 A 上涨10.0% B 上涨11.1% C 下跌11.1% D 下跌10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )。 A 简单随机抽样的误差公式 B 分层抽样的误差公式 C 等距抽样的误差公式 D 整群抽样的误差公式 10、我国统计调查方法体系改革的目标模式是以( )为主体。 A 抽样调查 B 普查 C 统计报表 D 重点调查 11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为100 的样本,则可采用( )。 A Z 检验法 B t 检验法 C 2χ检验法 D F 检验法 12、要通过移动平均法消除季节变动得到趋势值,则移动平均项数( )。 A 应选择奇数 B 应和季节周期长度一致 C 应选择偶数 D 可取4或12 13、回归估计标准差的值越小,说明( )。 A 平均数的代表性越好 B 平均数的代表性越差 C 回归方程的代表性越好 D 回归方程的代表性越差 14、某企业最近几批同种产品的合格率分别为90%、95.5%、96%,为了对下一批产品的合格率 进行抽样检验,确定抽样数目时P 应选( )。 A 90% B 95.5% C 96% D 3 % 96%5.95%90++ 15、假设检验中,第二类错误的概率β表示( )。 A 0H 为真时拒绝0H 的概率 B 0H 为真时接受0H 的概率

人民大学统计学在职题库统计综述答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学 考试科目:统计思想综述 课程代码:123201 考题卷号:1

除不能导致SSE显著减小为止。 逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复, 直到增加变量不能导致SSE显著减少为止。 五、(20分)如果一个时间序列包含趋势、季节成分、随机波动, 适用的预测方法有哪些?对这些方法做检验说明。 可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分解 法等进行预测。 (1)Winter指数平滑模型 包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。 L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是t期的季节调整因子, 是用于预测的模型。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,

而且需要有四个以上的季节周期(4年以上的数据)。 (2)引入季节哑变量的多元回归 对于以季度记录的数据,引入3个哑变量 ,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为: 其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测 第1步,确定并分离季节成分。计算季节指数,然后将季节成分从 时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。 第2步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。 第3步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。

统计学试题及答案分析-共20页

统计学考试题一 一、 单项选择题(请将正确答案的番号写在括号内,每小题1分,共20分) 1. 统计学名称来源于 A .政治算术学派 B .国势学派 C .数理统计学派 D .社会经济统计学派 2. 统计学是一门关于研究客观事物数量方面和数量关系的 A .社会科学 B .自然科学 C .方法论科学 D .实质性科学 3. 几位学生的统计学考试成绩分别为55,60,70,80,85,60,这几个数字是 A .指标 B .变量 C .标志 D .变量值 4. 重点调查中的重点单位就是 A .有关国际名声的单位 B .在总体中其单位数目占绝大比重的单位 C .特殊的单位 D .其单位数虽少,但被调查的标志值在总体标志值中占绝大比重的单位 5. 调查某大学学生学习情况,则总体是 A .该大学所有学生 B .该大学每一名学生的学习成绩C .该大学每一名学生 D .以上都不正确 6. 某公司员工的工资分为:(1)800元以下;(2)800~1500元;(3)1500~2019元;(4) 2019元以上,则第四组的组中值近似为 A .2019元 B .1750元 C . 2250元 D .2500元 7. 分配数列是 A .按数量标志分组的数列 B .按品质标志分组的数列 C .按指标分组的数列 D . 按数量标志或品质标志分组的数列 8. 统计表的形式构成由总标题、横行标题、纵栏标题 A .数据资料 B .主词 C .宾此 D .以上都不正确 9. 反映同类现象在不同时期发展变化一般水平的指标是 A .算术平均数 B .序时平均数 C .众数 D . 调和平均数 10. 某企业5月份计划要求成本降低3%,实际降低5%,其成本计划完成程度为 A .97.94% B .166.67% C .101.94% D .1.94% 11. 若两总体的计量单位不同,在比较两总体的离散程度时,应采用 A .全距 B .平均差 C .标准差 D .标准差系数 12. 下列指标中,属于强度相对数的是 A .某企业的工人劳动生产率 B .人均国民收入 C .某种商品的平均价格 D .某公司的平均工资 13. 拉氏指数所用的同度量因素是固定在 A .基期 B .报告期 C .固定时期 D .任意时期 14. 某市工业总产值增长了10%,同期价格水平提高了3%,则该市工业生产指数为 A .113.3% B .13% C .106.8% D .10% 15. 我国消费价格指数的编制方法 A .∑∑= 0q p q p K K p p B . ∑∑= 1 1111 q p K q p K p p C .∑∑= 1q p q p K p D .∑∑= 1 011q p q p K p

统计学-基于R第3版习题答案(第二章)

习题 2.1 (1)简单频数分布表: > load("D:\\工作总结\\人大\\R语言\\《统计学—基于R》(第3版)—例题和习题数据(公开资源)\\exercis e\\ch2\\exercise2_1.RData") > summary(exercise2_1) 行业性别满意度 电信业:38 男:58 不满意:75 航空业:19 女:62 满意 :45 金融业:26 旅游业:37 二维列联表: > mytable1<-table(exercise2_1$行业,exercise2_1$满意度) > addmargins(mytable1) # 增加边界和 不满意满意 Sum 电信业 25 13 38 航空业 12 7 19 金融业 11 15 26 旅游业 27 10 37 Sum 75 45 120 三维列联表: > mytable1<-ftable(exercise2_1, row.vars = c("性别","满意度"), col.var="行业");mytable1 行业电信业航空业金融业旅游业 性别满意度 男不满意 11 7 7 11 满意 6 3 7 6 女不满意 14 5 4 16 满意 7 4 8 4 (2) 条形图: > count1<-table(exercise2_1$行业) > count2<-table(exercise2_1$性别) > count3<-table(exercise2_1$满意度) > par(mfrow=c(1,3),mai=c(0.7,0.7,0.6,0.1),cex=0.7,cex.main=0.8) > barplot(count1,xlab="行业",ylab="频数") > barplot(count2,xlab="性别",ylab="频数") > barplot(count3,xlab="满意度",ylab="频数")

(完整版)社会统计学试卷A及答案解析

级专业2010学年第 1 学期《社会统计学》试卷 A 姓名:学号: (□开卷□闭卷) 一、选择题:2*10=20分 1、要了解400个学生的学习情况,则总体单位是( B ) 。 A 400个学生 B 每一个学生 C 400个学生的成绩 D 每一个学生的成绩 2、只与一个自由度有关的是( A ) χ分布 B 超几何分布C 泊松分布 D F分布 A 2 3、将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种 抽样方式叫( B )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 4、在方差分析中,自变量是(A )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 5、某城市男性青年27岁结婚的人最多,该城市男性青年结婚平均年龄为26.2岁,则该城 市男性青年结婚的年龄分布为(B)。 A.正偏B.负偏 C.对称D.不能作出结论 6、分析统计资料,可能不存在的平均指标是( A )。 A 众数 B 算术平均数 C 中位数 D 几何平均数 7、在一个左偏的分布中,小于平均数的数据个数将( C )。 A 超过一半 B 等于一半 C 不到一半 D 视情况而定 8、若P(A)=0.2,P(B)=0.6,P(A/B)=0.4,则) P I=( D )。 A (B A 0.8 B 0.08 C 0.12 D 0.24。 9、关于学生t分布,下面哪种说法不正确(B )。 A 要求随机样本 B 适用于任何形式的总体分布

C 可用于小样本 D 可用样本标准差S 代替总体标准差σ 10、对于大样本双侧检验,如果根据显著性水平查正态分布表得 Z α/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( C )。 A 20% B 10% C 5% D .1% 二、判断题:2*10=20分 1、所有的统计指标都是变量。 ( 对 ) 2、统计所研究的对象就是社会经济现象的数量方面。 (错 ) 3、随机变量在相同的条件下进行观测,其可能实现的值不止一个。 (对 ) 4、在社会现象中,即使相同的意识作用也完全可能有不确定的结果,这就提供了概率论应用的可能性。 ( 对 ) 5、成功次数的期望值λ是决定泊松分布的关键因素。 ( 对 ) 6、进行区间估计,置信水平总是预先给定的。 ( 对 ) 7、可以对置信水平作如下解释:“总体参数落在置信区间的概率是(1-α)”。(错 ) 8、将收集到得的数据分组,组数越多,丧失的信息越多。 (错 ) 9、N 个变量值连乘积的平方根,即为几何平均数。 (错 ) 10、当样本容量n 无限增大时,样本均值与总体均值的绝对离差小于任意正数的概率趋于零。 (错 ) 三、简答题:5*7=35分 1、大数规律 大数规律是随机现象出现的基本规律,它的一般意义是:观察过程中每次取得的结果可能不同(因为具有偶然性),但大量重复观察结果的平均值却几乎接近某个确定的数值。 2、配对样本 所谓配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产生的。 3、消减误差比例 变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的误差0E ,减去知道Y 与X 有关 系时预测Y 的误差1E ,再将其化为比例来度量。将削减误差比例记为PRE 。 4、同分对 如果在X 序列中,我们观察到i j X =X (此时Y 序列中无i j Y =Y ),则这个配对仅是X 方向而非Y 方向的同分对;如果在Y 序列中,我们观察到i j Y =Y (此时X 序列中无i j X =X ),则这个配对仅是Y 方向而非X 方向的同分对;我们观察到i j X =X ,也观察到i j Y =Y ,则称这个配对为X 与Y 同分对。 5、什么是分层抽样? 分层抽样也叫类型抽样,就是先将总体按某种特征或属性分若干类别或层次,再按照一定比 例在各个子类别或层次中随机抽取,最后将各抽取的单位合并成样本。 6、简述回归分析和相关分析之间的密切联系。 一般说来,只有当两个变量之间存在着较高程度的相关关系时,回归分析才变得有意义和有价值。相关程度越高,回归预测越准确。因此,往往先进行相关分析,然后才选用有明显相关关系的变量作回归分析。与此同时,相关关系往往要通过回归分析才能阐释清楚,例如皮尔逊相关系数的PRE 性质。回归分析具有推理的性质,而相关分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。因而从分析层次上讲,回归分析更深刻一些。 7、P 值决策与统计量的比较 P 值是被称为观察到的(或实测的)显著性水平。用P 值进行检验比根据统计量检验提供更多

人大版_贾俊平_统计学_第三版_课后习题答案

第3章 概率与概率分布——练习题(全免) 1 .解:设A =女性,B =工程师,AB =女工程师,A+B =女性或工程师 (1)P(A)=4/12=1/3 (2)P(B)=4/12=1/3 (3)P(AB)=2/12=1/6 (4)P(A+B)=P(A)+P(B)-P(AB)=1/3+1/3-1/6=1/2 4. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。 解:设A =第1发命中。B =命中碟靶。求命中概率是一个全概率的计算问题。再利用对立事件的概率即可求得脱靶的概率。 )|()()|()()(A B P A P A B P A P B P += =0.8×1+0.2×0.5=0.9 脱靶的概率=1-0.9=0.1 或(解法二):P (脱靶)=P (第1次脱靶)×P(第2次脱靶)=0.2×0.5=0.1 8.已知某地区男子寿命超过55岁的概率为84%,超过70岁以上的概率为63%。试求任一刚过55岁生日的男子将会活到70岁以上的概率为多少? 解: 设A =活到55岁,B =活到70岁。所求概率为: ()()0.63(|)0.75()()0.84 P AB P B P B A P A P A ==== 9.某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策? 解:这是一个计算后验概率的问题。 设A =优质率达95%,A =优质率为80%,B =试验所生产的5件全部优质。 P(A)=0.4,P (A )=0.6,P (B|A )=0.955, P(B |A )=0.85,所求概率为: 6115.050612 .030951.0)|()()|()()|()()|(===A B P A P A B P A P A B P A P B A P + 决策者会倾向于采用新的生产管理流程。 10. 某公司从甲、乙、丙三个企业采购了同一种产品,采购数量分别占总采购量的25%、30%和45%。这三个企业产品的次品率分别为4%、5%、3%。如果从这些产品中随机抽出一件,试问:(1)抽出次品的概率是多少?(2)若发现抽出的产品是次品,问该产品来自丙厂的概率是多少? 解:令A 1、A 2、A 3分别代表从甲、乙、丙企业采购产品,B 表示次品。由题意得:P (A 1)=0.25,P (A 2)=0.30, P (A 3)=0.45;P (B |A 1)=0.04,P (B |A 2)=0.05,P (B |A 3)=0.03;因此,所求概率分别为:

统计分析考试试题及答案解析

模考吧网提供最优质的模拟试题,最全的历年真题,最精准的预测押题! 统计分析考试试题及答案解析 一、单选题(本大题17小题.每题1.0分,共17.0分。请从以下每一道考题下面备选答案中选择一个最佳答案,并在答题卡上将相应题号的相应字母所属的方框涂黑。) 第1题 某国国内生产总值2009年为2008年的109.1%,这是( )。 A 比例相对数 B 动态相对数 C 比较相对数 D 计划完成相对数 【正确答案】:B 【本题分数】:1.0分 【答案解析】 [解析] 动态相对数是指用指标的当前状态数值除上期水平、历史最好水平和上年同期水平的结果。题中,指标是当前状态数值除上期水平数值所得的结果,属于动态相对数。 第2题 移动平均修匀方法较多地应用于( )。 A 含有季节影响的时间数列 B 无季节影响的时间数列 C 项数较少的时间数列 D 预测未来 【正确答案】:A 【本题分数】:1.0分 【答案解析】 [解析] 移动平均修匀较多地被应用于含有季节影响的时间数列,如果让移动平均的项数等于季节周期的长度,则所得到的移动平均数列中消除了季节影响。 第3题

模考吧网提供最优质的模拟试题,最全的历年真题,最精准的预测押题! 指数平滑平均数的计算公式是( )。 A S t =αx 0+(1-α)S t-1 B S t =αx t+1+(1-α)S t-1 C S t )=αx t-1+(1-α)S t-1 D S t =αx t +(1-α)S t-1 【正确答案】:D 【本题分数】:1.0分 第4题 某产品单位成本计划今年比去年降低10%,实际降低15%,则计划完成相对数为 ( )。 A 150% B 94.4% C 104.5% D 66.7% 【正确答案】:B 【本题分数】:1.0分 【答案解析】 [解析] 计划完成相对数是指用指标的当前状态数值除计划水平的结果。计划完成相对数以降低率的形式时,计划完成相对数=(1-实际降低率)/(1-计划降低率)×100%=(1-15%)/(1-10%)×100%=94.4%。 第5题 评价某一指标的当前状态的基本方法是找出一个( )作为“参照物”,将指标的当前状态与之进行比较。 A 标准水平 B 发展水平 C 一般水平 D 相对水平

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核B.编制统计表 C.统计汇总问题D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性B.正确性 C.全面性D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组B.60在第二组,80在第五组 C.70在第四组,80在第五组D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列B.单项式分布数列 C.开口式数列D.异距式数列 5.组距式分布数列多适用于() A.随机变量B.确定型变量 C.连续型变量D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数B.下限以上的累计次数 C.各组分布的次数D.各组分布的频率 7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线B.J型分布曲线 C.右偏分布曲线D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉B.不等 C.重叠D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组B.逻辑检查 C.数据录入D.统计汇总 E.制表打印 2.影响组距数列分布的要素有() A.组类B.组限 C.组距D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布B.χ型分布 C.U型分布D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列B.品质数列 C.单项数列D.变量数列 E.开口数列 5.下列变量一般是钟型分布的有()

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数:

22 212 2 ()0.56710800.884392.8 () x x R y y β-?= ==-∑∑ 4、某家具公司生产三种产品的有关数据如下: 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数 = 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷( 二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下: 257、276、297、252、238、310、240、236、265,则其下四分位数5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% 。 7、对回归系数的显著性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p

统计学试题库及试题库答案解析

统计学题库及题库答案 题库1 一、单项选择题(每题2分,共20分) 1、调查时间就是指( ) A 、调查资料所属的时间 B 、进行调查的时间 C 、调查工作的期限 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位就是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( ) A 、扩大为原来的3倍 B 、扩大为原来的2/3倍 C 、扩大为原来的4/9倍 D 、扩大为原来的2、25倍 5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0、9545,极限误差为1元,在简单重复抽样条件下,应抽选 ( )。 A 、576户 B 、144户 C 、100户 D 、288户 6、当一组数据属于左偏分布时,则( ) A 、平均数、中位数与众数就是合而为一的 B 、众数在左边、平均数在右边 C 、众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为 ( )。 A 、520 B 、 510 C 、 500 D 、490 8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、各组的次数必须相等 B 、变量值在本组内的分布就是均匀的 C 、组中值能取整数 D 、各组必须就是封闭组 9、n X X X ,,,21 就是来自总体 ),(2 N 的样本,样本均值X 服从( )分布 A 、),(2 N B 、、)1,0(N C 、、),(2 n n N D 、) ,(2n N 10、测定变量之间相关密切程度的指标就是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题2分,共10分)

人大统计学第四版部分答案

4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2= 5.5,M e =10;平均数:6 .910 96== =∑n x x i (2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.49 4.1561 ) (2 == -= ∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。 4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。 将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23 (2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5 (3)平均数== ∑n x x i 600/25=24,标准差65.61 2510621 ) (2 =-= -= ∑-n i s x x (4)偏态系数SK=1.08,峰态系数K=0.77 (5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。 4.3 (1)茎叶图如下: 茎 叶 频数 5 6 7 5 6 7 8 1 3 4 8 8 1 3 5 (2)== ∑n x x i 63/9=7,714.08 08.41 ) (2 == -= ∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。 第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。 (4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。 4.4 (1)== ∑n x x i 8223/30=274.1 中位数位置=n+1/2=15.5,M e =272+273/2=272.5 (2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5 (3) 17.211 307.130021 ) (2 =-= -= ∑-n i s x x 4.5 (1)甲企业的平均成本=总成本/总产量=41.19340 660030 150020 300015 2100150030002100==++++

统计学原理试题及答案解析

统计学原理试题(6) 一、单项选择题:(每小题1分,共20分) 1.设某地区有200家独立核算的工业企业,要研究这些企业的产品生产情况, 总体是( )。 A.每一家工业企业 B.200家工业企业 C.每一件产品 D.200家工业企业的全部工业产品 2.有600家公司每位职工的工资资料,如果要调查这些公司的工资水平情 况,则总体单位是()。 A.600家公司的全部职工 B.600家公司的每一位职工 C.600家公司所有职工的全部工资 D.600家公司每个职工的工资 3.一个统计总体()。 A.只能有一个指标 B.可以有多个指标 C.只能有一个标志 D.可以有多个标志 4.以产品等级来反映某种产品的质量,则该产品等级是()。 A.数量标志 B.品质标志 C.数量指标 D.质量指标 5.在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数是()。 A.变量值 B.变量 C.指标值 D.指标 6.年龄是()。 A.变量值 B.连续型变量 C.离散型变量 D. 连续型变量,但在实际应用中常按离散型处理 7.人口普查规定统一的标准时间是为了()。 A.登记的方便 B.避免登记的重复与遗漏 C.确定调查的范围 D.确定调查的单位 8.以下哪种调查的报告单位与调查单位是一致的()。 A.职工调查 B.工业普查 C.工业设备调查 D.未安装设备调查 9.通过调查大庆、胜利、辽河等油田,了解我国石油生产的基本情况。这 种调查方式是()。 A.典型调查 B.抽样调查 C.重点调查 D.普查 10.某市进行工业企业生产设备普查,要求在10月1日至15日全部调查完 毕,则这一时间规定是()。 A.调查时间 B.登记期限 C.调查期限 D.标准时间 11.统计分组的关键问题是()。 A.确定分组标志和划分各组界限 B.确定组距和组中值 C.确定组距和组数 D.确定全距和组距

第八章方差分析与回归分析

第八章 方差分析与回归分析 一、教材说明 本章内容包括:方差分析,多重比较,方差齐性检验,一元线性回归,一元非线性回归.主要讲述方差分析和一元线性回归两节内容. 1、教学目的与教学要求 (1)了解方差分析的统计模型,掌握平方和的分解,熟悉检验方法和参数估计,会解决简单的实际问题. (2)了解效应差的置信区间的求法,了解多重比较问题,掌握重复数相等与不相等场合的方法,会解决简单的实际问题. (3)熟练掌握Hartley 检验,Bartlett 检验以及修正的Bartlett 检验三种检验方法,会解决简单的实际问题. (4)理解变量间的两类关系,认识一元线性和非线性回归模型,熟悉回归系数的估计方法,熟练掌握回归方程的显著性检验.能用R 软件来进行回归分析,会解决简单的实际问题. 2、本章的重点与难点 本章的重点是平方和的分解,检验方法和参数估计、重复数相等与不相等场合的方法、检验方法的掌握,回归系数的估计方法,回归方程的显著性检验,难点是检验方法和参数估计,重复数相等与不相等场合的方法. 实际问题的检验,回归方程的显著性检验. 二、教学内容 本章共分方差分析,多重比较,方差齐性检验,一元线性回归,一元非线性回归等5节来讲述本章的基本内容. §8.1 方差分析 教学目的:了解方差分析的统计模型,掌握平方和的分解,熟悉检验方法和参数估计,会 解决简单的实际问题. 教学重点:平方和的分解,检验方法和参数估计 教学难点:检验方法和参数估计 教学内容: 本节包括方差分析问题的提出,单因子方差分析的统计模型,平方和分解,检验方法,参数估计,重复数不等情形. 8.1.1 问题的提出 在实际工作中经常会遇到多个总体均值的比较问题,处理这类问题通常采用方差分析方法. 例8.1.1 8.1.2 单因子方差分析的统计模型 在例8.1.1中,我们只考察一个因子,称为单因子试验.记因子为A ,设其有r 个水平,记为1r A , ,A ,在每一水平下考察的指标可看做一个总体,故有r 个总体,假定 (1)每一总体均为正态总体,记为2 i i N(,)μσ,i 1,2,,r =; (2)各总体方差相同,即22 2212r σσσσ== ==

相关文档
相关文档 最新文档