文档库 最新最全的文档下载
当前位置:文档库 › 5统计学基础复习题.docx

5统计学基础复习题.docx

5统计学基础复习题.docx
5统计学基础复习题.docx

10级电商《应用统计学》期末复习

一、单选题

1 ?统计学的研究对象是(A ) A ?客观事物的总体数量特征和数量关

C. 总体与样本的关系

2?按某一标志分组的结果,表现出(A A ?组内同质性和组间差异性 C. 组内同质性和组间同质性 3 ?指出下面的数据哪一个属于顺序数

据(

A. 5个人的年龄分别是25,22,34,41,33

B. 统计工作过程

D.抽象数量的联系和空间形式 )

B. 组内差异性和组间差异性 D.组内差异性和组间同质性 D )

B. 性别:男,女

C. 上市公司所属行业:金融,房地产,医药,机械制造

D. 员工对企业某项改革措施的态度:赞成,中立,反对 4 ?下列不属于描述统计问题的是(A ) A ?根据样本信息对总体进行的推断 C.分析感兴趣的总体特征 5?我国六次人

口普查规定的标准时间是2010年11月1日0时(截止时间),下列情况应计入人口 数的是(D )

A. 2010年11月2日出生的婴儿

B.2010年10月29日21吋出生,10月31日23时死亡的婴儿

C.2010年10月29 H 23吋死亡的人

D.2010年H 月1日3时死亡的人 6?某商场2010年空调销售量为10000台,库存年末比年

初减少100台,这两个总量指标是(A )

B. 时点指标

D. 前者是吋点指标,后者是吋期指标

420、380、410、420. 420万件,则该企业上半年的平均

&下列数列中属于时间序列数据的是(B )

A. 2010年我国的国内生产总值

B.2000-2010年我国的国内生产总值

C.

2010年底我国的人口数 D.2010年10月我国的进口额

9 ?下列关于相关系数的陈述中哪一个是错误的(A ) A ?数值越大说明两个变量之间的关系就越强

B. 仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系

C. 只是两个变量之间线性关系的一个度量,并不意味两个变量之间存在因果关系

D. 绝对值不会大于1

10?如果报告期商品价格计划降低5%,销售额计划增加10%,则销售量应增加(D ) 11?同时研究

居民的消费支出与居民货币收入和消费品价格的数量关系,属于(B )

A.

单相关 B.复相关 C.直线回归 D.曲线回归

B. 了解数据分布的特征

D.利用图、表或其他数据汇总工具分析数据

A ?时期指标

C.前者是吋期指标,后者是吋点指标 7?某企业某年上半年月产量分别为410、 月产量、中位数和众数分别为A.410x 415> 420

B.410、420、420

C.420、 420、 420

D415、420、410

A.15%

B.5%

C.5.25%

D.15.79%

12?在回归直线$ =仇+0丿中,Q表示(C )

1&为了解居民对小区物业服务的意见和看法,管理人员随机抽取了 50户居民,上门通过问卷进

行 调查。这种数据的收集方法称为(A )

A ?访问调查

B.邮寄调查

C.座谈会

D.个别深度访问

19?下面的陈述中不是评价图形优劣的准则的是(D ) A.精心设计,有助于洞察问题的实质

B.使复杂的观点得到简明、确切、高效的阐述

C. 能在最短的时间内以最少的笔墨给读者提供最大量的信息 20?下面的陈述中不是一张好的图形应包括的基本特征的是(D ) A.让读者把注意力集中在图形的内容上,而不是制作图形的程序上 C.强调数据之间的比较

21 ?与直方图相比,茎叶图(B A. 没有保留原始数据的信息

C.不能用于描述人数据的分布

22?直方图与条形图的区别之一是(A )

A ?直方图的各矩形通常是连续排列的,而条形图则是分开排列的 B. 条形图的各矩形通常是连续排列的,而直方图则是分开排列的 C. 直方图主要用于描述分类数据,条形图则主要用于描述数值型数据

D. 直方图主耍用于描述各类别数据的多少,条形图则主耍用于描述数据的分布

23?对一批进口商品的质量进行假设检验,在显著性水平为0?01时,原假设被拒绝,如果使用0?05 的显著性水平,则原假设(A ) A ?一定会被拒绝 B.可能会被拒绝 C. 一定会被接受 D.重新检验

24?以A 表示事件“吴明喜欢吃烤肉,王兰不喜欢吃烤肉”,其对立事件为(D ) A. “吴明不喜欢吃烤肉,王兰喜欢吃烤肉” B. “吴明和王兰都喜欢吃烤肉” C. “吴明和王兰都不喜欢吃烤肉” D. “吴明不喜欢吃烤肉或王兰喜欢吃烤肉” 25?某超市某种商品的销售量与销售价格之间的相关系数是(A ) A.当x 壇加一个单位时,y 增加0。的数量 C ?当x 增加一个单位时,y 的平均增加量 13?下列现象的相关密切程度最高的是(B B. 当y 增加一个单位吋,x 增加Q 的数量 D. 当y 增加一个单位吋,x 的平均增加量

A. 某商店的职工人数与商品销售额之间的相关系数为0.87

B. 流通费用水平与利润率之间的相关系数为?0?94

C. 商品销售额与利润率之间的相关系数为0.51

D. 商品销售额与流通费用水平的相关系数为-0.81 ) 14?编制数量指标指数一般是采用(A A ?基期质量指标 B.报告期质量指标 15?问卷设计的主体部分是(C ) A.被调查基本情况 B.引言和注释

作同度量因素 C.基期数量指标 D.报吿期数量指标

C ?问题和答案

16?—组数据的偏态系数为1.3,表明该组数据的分布是(D

A.正态分布

B ?平峰分布 C.左偏分布

D.右偏分布

17?如果一个样本因人故意操纵而出现偏差,这种误差属于

( D.结语

B ) D.试验误差

D.漂亮和美观 B.避免歪曲 D.美观和漂亮

) B.适合于描述小批量数据的分布 D.适合描述分类数据的分布

A.-0.9546

B.0.9546

C.-1.3841

D.1.3841

二、判断题

1 ?某音乐会门票标明“1.2米以下半票”,一个小朋友1.2米,应买全票。(V ){上限不在内}2?能够对统计总体进行分组,是由统计总体中各个单位所具有的差异性特点决定的。(V )

3.抽样的样本指标是随机的,则总体也是不能确定的。(X ){后半部分错误}

4?离散型变量可以做单项式分组或组距式分组,而连续型变量只能做组距式分组。(V )

5.为把握开发区土地利用情况而进行的全国开发区规模和土地利用效益调查属于专门调查。

(V )

6.某厂劳动生产率计划在去年的基础上提高10%,实际仅提高5%,则该厂劳动生产率计划仅完成一半。(X ){实际/计划=5%/100%;劳动:105%/110%=}

7.十分位数就是将全部单位按标志值分成两个部分,即两端的标志值个数相等。(X){10个部分}8?正相关指的就是两个变量之间的变动方向都是上升的。(X ){相同方向改变,上升与

下降}

9?当要检验样木平均数和总体平均数,或样木成数与总体成数是否存在显著差界吋,要采用右单侧检验。(X ){没标明差异方向}

10.时间序列也叫时间数列、动态数列,是将不同时间上的同类指标按人小顺序排列而成的数列。(X ){应该按时间顺序}

11.组中值是各组上限和下限之中点数值,故在任何情况下它都能代表各组的i般水平。(X )

12.样本容量是指一个总体一共可以组成多少不同的样本,而样本个数是指一样本中的单位数。(X ){容量?单位数;个数?总体一共可以组成多少不同的样本}

13.点估计和区间估计的主要区别在于,前者不能反映估计的误差和可靠性,后者可以。(V )

14.函数关系和相关关系都是指变量之间存在严格的数量依存关系。(X ){“严格”太绝对}

15.正态分布表现为其取值具有对称性,极大部分取值集屮在区间外,只有少量取值落在以对称点为中心的小区间内。(X ){区间内?极大部分;区间外?少量}

三、计算题

1.某银行为吸收存款,逐年提高存款利率,五年各年分别为3%、3.5%、4%、4.5%、5%,若本金为10000元。问:

1)按算术平均数计算平均利率,则笫五年年末的实际存款额是多少?

2)按几何平均数计算平均利率,则第五年年末的实际存款额又是多少?

解:

1)用算术平均数计算的平均利率为:- = = 0.03 +0.035+ 0.04 + 0.045+ 0.05 = 4%

n 5

第五年年末的实际存款额为=10000 (1+4%*5) =12000元

2)用几何平均数计算的平均利率为:

G = 01.03x1.035x1.04x1.045x1.05—1 = 4%

第五年末的实际存款额WOOO (1+4%)元=12166.53

2.某汽车电瓶商声称其生产的电瓶具有均值为60个月、标准差为6个月的寿命分布,现假设质监部门决定检验该厂的说法是否正确,为此随机抽取50个该厂生产的屯瓶进行寿命试验。贝山(I)假定厂商声称是正确的,试描述50个屯瓶的平均寿命的抽样分布;(2)假定厂商声称是正确的,

则50个样詁组成的样木的平均寿命不超过57个月的概率是多少? F(3.53)=0.9998 ) 解:

(1) 由于7072=0.85

则根据中心极限定理可以推出50个电瓶的平均寿命的分布服从正态分布,即:[?“(60,0.852)(2)如果厂方声称是正确的,则观察得到的50个电池的平均寿命不超过57个月的概率为;?

厂八、r/兀一60,57 — 60、 一 57_60、

p(x<5 )=巾( ------ < ------- ) = P (Z< ---------- )

0.85 0.85

0.85

=p(Z < -3.529) = l-p(Z< 3.529) =1-F(3.529) = 1-0.9998 = 0.0002

结论:即如果厂方的说法正确,则50个电瓶的平均寿命不超过57个月的概率为0.0002,这是 一个不可能事件。根据小概率事件原理,观察到50个电瓶的平均寿命小于或等于57个月的事件 是不可能的;反之,如果真的观察得到50个电瓶的平均寿命低于57个月,则有理由怀疑厂方说 法的正确性,即可认为厂方的说法是不正确的。

3. 学者认为早期教育对儿童智力发展有影响,现在从受过良好教育的儿童中随机抽取70人进行韦

氏智力测验,结果平均数为103.3分。若总体平均分为100分,总体标准差为15分,在显著性水

平为0.05时能否认为受过良好教育的儿童智力高于一般水平?

蘇 V70

J=S5=L64

???z > j

?X 落在拒绝域内,所以拒绝原假设。 即受过良好教育的儿童智力高于般水平。

4. 已知某地区基期农副产品收购总额为360亿元,报告期比基期增长10%,农副产品收购价格指数

为108%,报告期与基期相比:

1) 农民因销售农副产品共增加多少收入?

2) 由于农副产品收购价格提高8%,农民增加了多少收入?

3) 农副产品收购量增加了百分Z 几?农民因此增加了多少收入? 4) 验证以上三方而的分析结论能否协调一致。

解:设农副产品收购量为q,农副产品收购价格为P 1) y

收购总额指数=4^=iio%

所以逻命% =360*110% = 396 农民增加的收入为:

工卩④一工P (^()= 396 - 360 = 36亿元

2)

收购价格指数二举◎二108%

所以彳物(M 二396一 108%二366.67 农民增加的收入:

工卩也—工PW 产396 - 366.67 = 29.33亿元

解: H (): // <100

厲::

元一“)_ 103.3-100

15 = 1.84

收购量指数二曇也二逆凹=101.85%

360 农副产品收购量增帅.85% 农民增加的收入:

E 几皿- Z /?0<70 = 366.67-360=6.67亿元

5. 设随机变量k 在[1, 6]上服从均匀分布,贝IJ 方程兀2 +滋+ 1 = o 有实根的概率是多少? 解

A = b 2 -4ac = k 2

-4 = (k - 2)(k + 2) > 0

即赵2

<-2

p(k > 2或R < -2) = p(k >2) + p(k < -2)

6?100台车床彼此独立地工作着,每台车床的实际工作时间占全部工作吋间的80%,试求:(1) 任一

吋刻有70?86台车床在工作的概率;(2)任一吋刻有80台以上车床在工作的概率。

(F(l.5)=0.9332 , F(2.5)=0.9938 , F(0)=0.5 ) 解:

将在任一时刻观察每台车床是否工作看成是一次试验,依题意本题可以看做100重贝努里概型, 每次试验成功(车床工作)的概率为:p=80/100=0.8

设X 表示100台车床中工作着的车床台数,可见X ?B(100,0?8),现利用正态分布近似计算, np=0?8* 100=80, npq=16,贝U :

Z1 m

z 70 - 80 X — 80 86 — 8°

(l)〃(70

4 4 4

=p(-2.5< X ~80<1.5)

= F(1.5) - F(—2.5) = F(1.5) + F(2.5) -1 =0.9332 + 0.9938 一 1 = 0.9270

7.某厂

3种产品的产量情况如表所示:

产品 计量单位

出厂价格(元)

产量

基期 报告期

基期 报告期

A 件 8 8.5 13500 15000

B 个 10 11

11000 10200 C 公斤 6 5 4000

4800

产品 计量单位

出厂价格(元) 产量

产值(元)

基 报 基 报

A

8

8.5 13500 15000 10800() 120000 127500

⑵p(X > 80) = p( X-80

4 >0) = l-F(0) = 0.5

工 04 一》几弘=263700 - 242000 = 21700元

即:该厂总产值报告期比基期上升了 8.9%,增加额为21700元。

E M - X Po% = 250800 - 242000 = 8800 元

即:该厂产量报告期比基期上升了 3.64%,使总产值增加8800元。 出厂价格指数二 工阳' =26370() = [05 ]4%

2卩曲250800

工皿-工 p ()q }

= 263700 - 250800 = 12900元

即:该厂出厂价格报告期比基期上升了 5.14%,使总产值增加12900元。

8.

公交公司想了解公共汽

车的使用时间和年维修费用之间是否存在某种关系,由10辆公共汽车组 成一个样木,经计算得到相关数据如下所示:工兀= 50, = 61500,

= 308200, ^x 2 =258,

其屮x 代表使用吋间(年),y 代表维修费用(元)。根据以上资料,要求:(1)建立以使用吋 间为因变量的直线冋归方程,并解释冋归系数的含义;(2)若已知某公车已使用5年,则该公车 的维修费用为多少?

解:

(1)设维修费用y 与使用年限x 之间的关系式为:y=bl+b2x

此回归方程表示公车使用年限每增加1年,维修费用平均增加87?5元。维修费用与使用年限成

正比例变动关系,使用年限越长,维修费用越高。 (2)当使用年限为5时,代入回归方程可得维修费用为:

y =(5712.5 + 87.5x5)元元 6150

9. 某单位按简单随机重复抽样的方式抽取40名职工,对英业务情况进行考核,考核成绩资料如下:

B 个 10

11 11000 10200 110000 102000 112200 C 公斤

6

5

4000

4800 24000 28800 24000 合计 — —

242000

250800

263700

工皿二 26370() 工

= 108.97% 产量指数二

”工宀(0)2

10x308200-50x61500

“ =

:

= O / .5

10x258-502

则回归方程为:

y = b x +b 2x = 5712.5 + 87.5%

= y-h 2x

61500

10 -87.5x — 10

= 5712.5 总产值指数

考试成绩(分)职工人数(名)职工人数比重(%)

60以下37.5

60-70615.0

70-801537.5

80 ?901230.0

90?100410.0

合计40100.0

试求:1)根据上述数列,以95%的概率保证程度推算全体职工业务考试成绩的区间范围;

2)若其他条件不变,将允许误差范围缩小一半,应抽取多少名职工?

解:

1)样本均值5^2^ = —= 77

工f 40 样本方差=翌笑= 113.85

工/-1 40-1

概率保证程度为95%,则Z0.025=1.96,则抽样极限误差为:址

=?近=1.96*1.69 = 3.31分

(x±E-) = (77 ±3.31) = (73.69,80.31)

?X

10.假设某地区大学四年级男学生的身高(以厘米计)服从正态分布N(175,5.2'),今在这个地区内任选5名大学四年级男学生,问其中至少冇两名男学生身高超过180厘米的概率是多少?

(F(0.96)=0.8315)

解:设X表示{四年级男生身高}, A表示{男生身高超过180厘米},则: p = P(A) = P(X > 180) = > 180~175)

a 5.2

=1-F(0.96) = 1-0.8315 = 0.1685

又设Y={5名大学生中身高超过180厘米的人数},则Y~B(5,0.1685),故所求的概率为: P(Y n 2) = f C: P k (l - P尸=i-p(Y = O)-p(Y = 1)

k=2

= 0」998

11?某产品组装生产线中一部件的设计组装时间为15分钟,现根拯随机抽选的7名工人的工作时间进行观察,观察结果为(分钟):15.5, 15.7, 13.6, 15.3, 15.1, 14.5, 13.9.计算工人的组装时间的95%的置信区间。

仏⑹= 2.447 ,仏5⑹= 2.969 ,仏(7) = 2.365,仏5(7) = 2.841

15.5 + 15.7 + 13.6 + 15.3 + 15」+14.5+

13.9 7

=12理14.8分钟

7

12.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从每天生产的一批产

则抽样平均误差为:

s V113.5

b = —j= = —= 1.69 分

* 4n V40

2)

72C2

心匠厂Z0名即允许误差缩小一半时,应抽取160名职工。

Zo.O25 = 1 ?96)

- s

(X±'a/2(" 一1)—

^)yjn

二(14.8 ± 2.969

V7

=(14.8±0.914)

= (13.89,15.71)

Z(x(.-x)2

= 0.8145 分钟

品中按重复抽样随机抽取50包进行检查,测得其平均重量为101.32克,样木标准差为1.634克。

(1)确定该种食品平均重量90%的置信区间;(2)采用假设检验方法检验该批食品的重量是否

符合标准要求。(显著性水平为0.10,已知Z ()O 25=L96, Z o05 = 1.64 Z 001 = 1.28 ) 解:(1)根据题意知食品平均重量90%的置信区间为:

— v I n 54 x±Z f7/7-r = (101.32±1.64x-7^)

~ yjn A /50 =101.32±0.38

即(100. 94, 101.70)

(2)仏:“ =100

0 :“工100

由于z = 5.72 > Zo 」"=164 z 落在拒绝域内,所以拒绝原假设;

即该批食品的重量不符合标准要求。

13.某农场研究某种农作物耕种深度

(x,厘米)与平均亩产量(y,千克)的关系,其数据资料如 卜所示:工兀=48,工丁 = 1800,工兀y = 15860, ^x 2 =454, n=6o 根据以上资料,要求:(1) 建立以产量为因变量的直线回归方程,并解释回归系数的含义;(2)估计耕种深度为11.5厘米时

的平均某产量是多少?

)〃工卩工y y = Z?o +h }x = 133

」2 + 20.86x

此回归系数20.86的含义是:当耕种深度增加1厘米时,平均亩产量增加20.86千克。

(2)当耕种深度为11?5厘米时,平均亩产量为:

^ = (133.12 + 20.86x11.5)千克 = 373.01千克

7 =

s! Jn.

101.32-100 1.634/750 = 5.72

X,

b G = y-b {x

= 1800_2086x 48 = 133 J2

6 6

? — 9

吃八(工疔

6x15860-48x1800 ““ = ; -------------------- =20.86

6x454 — 48?

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

统计学期末试卷与答案

2014统计学试卷与答案 一、填空题(每空1分,计10分) 1、统计指标包括 、计算方法、空间限制、时间限制、具体数值和计量单位6个要素。 2、无论采用何种调查方法进行调查,首先都要制定 。 3、质量指标是反映 的指标。 4、8名队员的身高(单位:CM )由低到高排序为: 181,182,182,183,184,185,186,186,身高的中位数是 CM 。 5、假定中国和美国的国民年龄方差相同,现在各自重复随机抽样获取1%的公民来分别估计两个国家国民的平均年龄,其他条件相同的情况下,哪个国家国民平均年龄的估计误差会较小一些 。 6、变量之间完全相关,则其相关系数为 。 7、若逐期增长量每年相等且为正数,则各年的环比发展速度是年年 。(上升,不变,下降)。 8、回归分析中OLS (普通最小二乘法)的原理是 。 9、编制综合指数的特点是 。 10、拉氏指数是把同度量因素的时间固定在 的一种综合指数形式。 二、判断题(每题1分,计10分,请填入“√”或“?”) (× )1、数量指标根据数量标志计算而来,质量指标根据品质标志计算而来; ( ×)2、普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确; ( × )3、凡是离散型变量都适合编制单项式数列; ( × )4、任何变量数列都存在众数; ( √)5、如果o e m m x <<,则变量分布为左偏; ( ×)6、判定系数越大,估计标准误就越大; ( ×)7、正相关是指两个变量的数量变动方向都是上升的; ( √ )8、统计的本质就是关于为何统计,统计什么和如何统计的思想; ( × )9、两个总量指标时间数列相对比得到的时间数列一定是相对数时间数列; ( √ )10、同度量因素在起到同度量的同时,还具有一定的权数作用。 三、单项选择题(每题1分,计10分)

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学考试试卷A及答案

2012—2013学年第二学期闽江学院考试试卷 考试课程:统计学 试卷类别:A卷□√B卷□考试形式:闭卷□√开卷□ 适用专业年级:2011级金融学、国际贸易学、保险学专业 注明:试卷答案请做在答题纸上。 一、单选题(每题1分,共30分,30%) 1. 下列不属于描述统计问题的是() A根据样本信息对总体进行的推断B了解数据分布的特征 C分析感兴趣的总体特征D利用图,表或其他数据汇总工具分析数据 2. 根据样本计算的用于推断总体特征的概括性度量值称作() A.参数 B. 总体C.样本 D. 统计量 3. 通过调查或观测而收集到的数据称为() A.观测数据 B. 实验数据 C.时间序列数据 D. 截面数据 4. 从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为()。 A.重复抽样 B.不重复抽样 C.分层抽样 D.整群抽样5. 调查时首先选择一组调查单位,对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。这样的调查方式称为()。 A 系统抽样 B 整群抽样 C 滚雪球抽样 D 判断抽样 6. 下面的哪一个图形最适合于描述结构性问题() A.条形图 B.饼图 C.雷达图 D. 直方图 7. 对于大批量的数据,最适合描述其分布的图形是( ) A.条形图 B.茎叶图 C.直方图 D.饼图 8. 将某企业职工的月收入依次分为2000元以下、2000元~3000元,3000元~4000元、4000元~5000元、5000元以上几个组。最后一组的组中值近似为( ) A.5000 B.7500 C.5500 D.6500 9. 下列关于众数的叙述,不正确的是() A.一组数据可能存在多个众数 B.众数主要适用于分类数据 C.一组数据的众数是唯一的 D.众数不熟极端值的影响 10. 一组数据的最大值与最小值之差称为() A.平均数 B.规范差 C.极差 D.四分位差 11.如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是() A.至少有75%的数据落在平均数加减3个规范差的范围之内 B. 至少有89%的数据落在平均数加减3个规范差的范围之内

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

教育统计学试题库

教育统计学 一、选择题 1、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( B ) A. 全距( 差异量) B. 四分位距(差异量) C. 方差(差异量) D. 标准差(差异量) 2、总体不呈正态分布,从该总体中随机抽取容量为1000 的一切可能样本的平均数的分布接近于:( D ) A. 二项分布 B.F 分布 C. t 分布 D. 正态分布 3、检验某个频数分布是否服从正态分布时需采用:( C ) A. Z检验 B. t 检验 C. X 2检验 D. F 检验 4、对两组平均数进行差异的显著性检验时,在下面哪种情况下不需要进行方差齐性检验?( B ) A. 两个独立样本的容量相等且小于30; B. 两个独立样本的容量相等且大于30; C. 两个独立样本的容量不等,n1小于30, n2大于30; D. 两个独立样本的容量不等,n1大于30, n2小于30。 5、下列说法中哪一个是正确的?( C ) A. 若r1=0.40 , r2=0.20,那么r1 就是r2 的2 倍;

B. 如果r=0.80 ,那么就表明两个变量之间的关联程度达到80%; C. 相关系数不可能是2; D. 相关系数不可能是-1 。 6、当两列变量均为二分变量时,应计算哪一种相关?( B ) A. 积差相关(两个连续型变量) B. ?相关 C. 点二列相关(一个是连续型变量,另一个是真正的二分名义变量) D. 二列相关(两个连续型变量,其中之一被人为地划分成二分变量。) 7、对多组平均数的差异进行显著性检验时需计算:( A ) A.F值 B. t 值 C. x 2 值 D.Z 值 8、比较不同单位资料的差异程度,可以采用何种差异量?( A ) A. 差异系数 B. 方差 C. 全距 D. 标准差 二、名词解释 1. 分层抽样:按与研究内容有关的因素或指标先将总体划分成几个部分,然后从各部分(即各层)中进行单纯随机抽样或机械抽样,这种抽样方法称为分层抽样。 2. 描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法称为描述统计。 3. 集中量:集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分

统计学考试题库

一、判断题(4个) 1.统计学的研究对象是社会经济总体现象的质量方面。(×) 2.重点调查中的重点单位是根据当前工作的重点来确定的。(×) 3.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。(√)4.平均数是测定总体各单位的离散程度。(×) 5.在时间序列的乘法合成模型中,季节变动成分S通常是季节的个数(F) 6.用最小二乘法拟合时间序列的直线趋势方程Y=a+bt时,若0≤b≤1则该时间序列的趋势为逐步上升的趋(T) 7.从计算方式看,综合评价指数是一种算术平均指数(F) 8.特殊原因偏差表示过程中固有的偏差,这些偏差随机或偶然出现。(F) 9.当样本量给定时,置信区间的宽度随着置信系数的增大而增大;而当置信水平固定时,置信区间的宽度随着样本量的增大而减小。(√) 10.置信区间是一个随机区间,它因样本量的不同而不同,而且所有的区间都包含总体参数的真值。(×) 11通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率小一点。(×) 12抽样单位既可以是一个简单的个体,也可以是一组个体。(√) 13. 第一类错误是假设检验中出现的第一种错误,是将不真实的现象检验为真实的现象(错误) 14. 正态分布总体有两个参数,即均值与方差,当这两个参数确定以后,一个正态分布也就确定了。(正确) 15. 在一元线性回归模型中,回归模型的标准差等于随机干扰项的标准差。(正确) 16. 根据最小二乘估计,可以得到总体回归方程。(错误) 17.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 18.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 19.X2检验不适用于定类变量和定序变量的相关统计。(错) 20.多样本计量资料的比较,当分布类型不清时选择H检验。(对) 21在多元回归分析中,多重共线性是指模型中因变量与一个自变量相关。(×) 22对回归模型y=β0 +β1X1 +β2X2+…+βpXP+ε的假定有自变量X1 ,X2,…,XP 相互之间不存在较强的线性关系。(√) 23如果经检验所有回归系数都是显著的,则可以判定不存在多重共线性问题。(√) 24.DW 值越接近2, t 序列的自相关性就越小。(√) 二、选择题(4个) 1. “统计”一词的三种涵义是(B )。 A、统计调查、统计资料、统计分析 B、统计工作、统计资料、统计学 C、统计设计、统计调查、统计整理 D、大量观察法、分组法、综合指标法 2. 下列属于品质标志的是(D )。

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

统计学试卷五及答案

统计学原理试卷 一、单选题 1.调查某大学2000名学生学习情况,则总体单位是() A 、2000名学生B、2000名学生的学习成绩C、每一名学生D、每一名学生的学习成绩 2.标志是说明( ) A、总体单位的特征的名 B、总体单位量的特征的名称 C、总体质的特征的名称 D、总体量的特征的名称 3.某些不能够或不宜用定期统计表搜集的全面统计资料,一般应采取的方法是() A、普查 B、重点调查 C、典型调查 D、抽样调查 4.下面属于品质标志的是()。 A、工人年龄 B、工人性别 C、工人月工资 D、工人体重 5.下列指标中属于时点指标的是() A、国内生产总值 B、流通费用率 C、人均利税额 D、商店总数 6.某产品单位成本计划1997年比1996年降低10%,实际降低15%,则计划完成程度为() A、150% B、94.4% C、104.5% D、66.7% 7.指标数值随研究范围的大小而增减的综合指标是()。 A、相对指标 B、质量指标 C、平均指标 D、总量指标 8.下列指标属于比例相对指标的是() A、工人出勤率 B、农轻重的比例关系 C、每百元产值利税额 D、净产值占总产值的比重9.下列指标属于总量指标的是() A、人均粮食产量 B、资金利税率 C、产品合格率 D、学生人数 10.某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则平均工资为() A、 600元 B、 533.33元 C 、466.67元 D、 500元 11.标志变异指标是反映同质总体的()。 A、集中程度 B、离中程度 C、一般水平 D、变动程度 12.假定10亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国的1‰人口,则抽样误差() A、两者相等 B、前者大于后者 C、前者小于后者 D、不能确定 13.当可靠度大于0.6827时,抽样极限误差() A、大于抽样平均误差 B、小于平均误差 C、等于抽样平均误差 D、与抽样平均误差的大小关系依样本容量而定 14.下列等式中,不正确的是() A、发展速度=增长速度+1 B、定基发展速度=相应各环比发展速度的连乘积 C、定基增长速度=相应各环比增长速度的连乘积 D、平均增长速度=平均发展速度-1 15.编制动态数列的基本原则是要使动态数列中各项指标数值具有() A、可加性 B、可比性 C、一致性 D、同质性 16.在物价上涨后,同样多的人民币少购买商品3%,则物价指数为( ) A、97% B、103.09% C、3% D、109.13% 17.若销售量增加,销售额持平,则物价指数( ) A、降低 B、增长 C、不变 D、趋势无法确定

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

统计学基础知识

一、数据的特征值 (一)数据的位置特征值 1)平均值 如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为: n-数据个数; x i -第i 个数据数; ∑-求和。 2)中位数 有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。 3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。 4)众数 在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。 (二)数据的离散特征值 1)极差R 测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。 2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。 无偏方差 各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示: ~ x _x _ x ∑ =--=-=n i i x x n n S s 1 2 _2)(1112 _ 2 _ 22 _ 1)(...) () (x x x x x x n -+-+-∑=-n i i x x 1 2 _ )(S = =

标准偏差s 2 (三)变异系数 以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上 上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。 _x

统计学试题及答案

统计学试题及答案文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

统计学试题及答案 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A.5%×7%×9% B. 105%×107%×109% C.(105%×107%×109%)-1 D. 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为 , 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间

7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间: =70件, =件乙车间: =90件, =件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题 (每题2分,共14分) 1. 下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E. 企业职工人数2000人 2. 在数据的集中趋势的测量值中,不受极端数值影响的测度值是

统计学考试试题及答案

统计学考试试题及答案文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

《统计学原理》期末考试题 一、单选题{每小题2分,共12分} 1.对某城市工业企业未安装设备进行普查,总体单位是(B )。 A.工业企业全部未安装设备 B.工业企业每一台未安装设备 C.每个工业企业的未安装设备 D.每一个工业企业 2.反映不同总体中同类指标对比的相对指标是( B)。 A.结构相对指标 B.比较相对指标 C.强度相对指标 D.计划完成程度相对指标 3.在组距分组时,对于连续型变量,相邻两组的组限(A ) A.必须是重叠的 B.必须是间断的 C.可以是重叠的,也可以是间断的 D.必须取整数 4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是(A)。 A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样 5.在其它条件不变的情况下,抽样单位数增加一半,则抽样平均误差(A ) A.缩小为原来的% B.缩小为原来的50% C.缩小为原来的25% D.扩大为原来的四倍 6.下列哪两个变量之间的相关程度高(C )。 A.商品销售额和商品销售量的相关系数是0. 9 B.商品销售额与商业利润率的相关系数是0. 84 C.平均流通费用率与商业利润率的相关系数是一 D.商品销售价格与销售量的相关系数是一

二、多选题(每小题2分,共8分) 1.要了解某地区的就业情况( ABE) A.全部成年人是研究的总体 B.成年人口总数是统计指标 C.成年人口就业率是统计标志 D.反映每个人特征的职业是数量指标 E.某人职业是教师是标志表现 2.影响加权算术平均数的因素有(AB ) A.各组频率或频数 B.各组标志值的大小 C.各组组距的大小 D.各组组数的多少 E.各组组限的大小 3.简单随机抽样(ACDE ) A.适用于总体各单位呈均匀分布的总体 B.适用于总体各单位标志变异较大的总体 C.在抽样之前要求对总体各单位加以编号 D.最符合随机原则 E.是各种抽样组织形式中最基本最简单的一种形式 4.下面哪几项是时期数列(BC ) A.我国近几年来的耕地总面积 B.我国历年新增人口数 C.我国历年图书出版量 D.我国历年黄金储备 E.某地区国有企业历年资金利税率 三、填空题(每小题2分.共10分) 1.变量按其取值的连续性可分为(离散变量)和(连续变量)两种。 2.统计调查根据(被研究总体范围)可分为全面调查和非全面调查,根据(调查登记时间是否连续)可分为连续调查和不连续调查。 3.总体是非标志(0,1)分布的平均数为P ,方差为P(1-P)。

统计学重点知识点

基本统计方法 第一章 概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。 2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章 计量资料统计描述 1. 集中趋势:均数(算术、几何)、中位数、众数 2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV ) 3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法: P 2.5-P 97.5。

第三章 总体均数估计和假设检验 1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式: X σσ=误差的大小。 3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。 4. t 分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。 5. 置信区间(Confidence Interval , CI ):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

统计学试题库及答案

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可分为确定性变 量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者变动方向相 同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。 12、以绝对数形式表示的指标都是数量指标,以相对数或平均数表示的指标都是质量指标。 13、构成统计总体的条件是各单位的差异性。 14、变异是指各种标志或各种指标之间的名称的差异。

相关文档