文档库 最新最全的文档下载
当前位置:文档库 › 推断统计习题及参考答案

推断统计习题及参考答案

推断统计习题及参考答案
推断统计习题及参考答案

抽样与抽样估计习题

5.1单选题

1.不重复随机抽样的误差比重复随机抽样的误差( )

①大②小③相等④有时大,有时小

2.在其他条件不变的情况下,抽样平均误差的大小与总体标准差的大小( )

①成正比②无关③成反比④以上都不对

3.在其他条件不变的情况下,抽样平均误差的大小与样本容量方根的大小( )

①无关②成正比③成反比④以上都不对

4.对重复随机抽样,若其他条件不变,样本容量增加3倍,则样本的平均抽样误差( )

①减少30% ②增加50% ③减少50% ④增加50%

5.抽样成数P值愈接近1,则抽样成数平均误差值( )

①愈大②愈小③愈接近于0.5 ④愈接近于1

6. 抽样结果的估计值与总体指标之间误差允许的限度称为:( )

①极限误差②抽样误差③抽样平均误差④代表性误差

7. 在确定样本容量时,若总体成数方差未知,则P可取( )

①0.2 ②0.3 ③0.4 ④0.5

8. 用重复随机抽样的平均抽样误差公式计算不重复随机抽样的平均抽样误差,将会( )

①高估了误差②低估了误差③既没高估也没低估④以上都不对

9. 随着样本容量的增加,抽样指标与其估计的总体指标之差的绝对值小于任意小的正数的

可能性趋于100%,称为估计的( )

①无偏性②一致性③有效性④充分性

10. 在95.45%的概率保证程度下,当抽样极限误差为0.06时,则抽样平均误差等于( )

①0.02 ②0.03 ③0.12 ④0.18

5.2对批量为10000单位的产品随机抽取100单位为一样本,以推断其产品质量。

⑴在计算抽样平均误差时,需要使用有限总体修正系数吗?为什么?

⑵如果总体标准差σ=8,试分别使用与不使用有限总体修正系数计算抽样平均误差。

5.3 对一批4000件的产品按不重复随机抽样方式进行抽样检查,抽取了该批产品的1/20作为样本,检验结果有8件废品。试问这批产品的废品率在1.3%~

6.7%的可能性有多大?

5.4某市场调查公司在一次调查中,询问250人关于获得某知名企业产品的主要途径,其

中有140人认为他们是通过电视广告了解的。(1)试求总体中通过电视广告认识该厂家产品的人所占比率的95%置信区间;(2)若以95%把握程度,允许误差为0.01时,为估计总

体比率应选取多大的样本容量?

5.5 某职业研究所为了解本地从事IT 行业人员的薪金,随机抽取100名从事IT 行业的人员组成样本,样本均值为50124.58元,样本标准差为1685元,试分别求IT 行业人员薪金的总体均值90%、95%和99%的置信区间,当置信水平增大时,置信区间的宽度如何变化?是否合理?

5.6 某省农调队要了解该省内两个地区农民年人均收入的差别。这两个地区的独立随机样本资料如下:

试求两个地区农民年人均收入之差的点估计值,及两个地区农民年人均收入之差的95%的置信区间。在进行区间估计时需要作什么假设?

5.7 生产工序中的方差是工序质量的重要度量,为此茶业制造商想估计代装茶重量的方差。随机抽取24袋茶组成样本其重量如下:(单位:克)

3.20 3.28 3.35 3.33 3.25 3.18 3.26 3.36 3.34 3.48 3.90 3.70 3.75 3.38 3.45 3.50 3.22 2.95 3.16 3.20 3.12 3.30 3.27 3.28

试求出总体方差的95%的置信区间,计算这一区间时需要用什么假设?总体标准差的95%的置信区间又如何?

假设检验习题

一、名词解释 1. 显著性水平 2. 备择假设 3. 统计量 4. 临界值

二、多项选择题:

1. 根据样本指标,分析总体的假设值是否成立的统计方法称为:

A. 抽样估计

B. 假设检验 C .统计估计 D .显著性检验 E .概率 2. 对总体提出假设,通常有原假设和备择假设,其中,备择假设又称:

A. 虚无假设

B. 对立假设

C. 零假设

D. 替代假设

E. 错误假设 3.犯一类错误的概率通常用( )来表示:

A. α

B.β C .显著水平 D .F (t ) E . 1-α 4. 统计量n

x z /σμ

-=

可以用于以下( )检验。

A. 总体平均数 B .双边检验 C .总体成数 D .单边检验 E .样本平均数

三、简答题

1.什么是第Ⅰ类错误,什么是第Ⅱ类错误? 2.什么是双边检验,什么是单边检验? 3.试述假设检验的步骤。

4.如何选择合适的检验统计量?

5.在单边检验中,如何区分左侧检验和右侧检验? 6.什么是假设检验?其作用是什么?

7.用 Z 统计量检验非正态分布的总体指标,其使用依据是什么? 8.简述区间估计和假设检验的关系。 四、计算题

1.某食品厂用自动装袋机包装食品,每袋标准重量为50克,每隔一定时间抽取包装袋进行检验。现抽取10袋,测得其重量为(单位:克):

49.8, 51, 50.5, 49.5, 49.2, 50.2, 51.2, 50.3, 49.7, 50.6 若每袋重量服从正态分布,每袋重量是否合符要求。(α =0.10)

2.在一批产品中抽40件进行调查,发现次品有6件,试按显著水平为0.05来判断该批产品的次品率是否高于10%。

3. 某产品的废品率是17%,经对该产品的生产设备进行技术改造后,从中抽取 200件产品检验,发现有次品28件,能否认为技术改造后提高了产品的质量?(α =0.05)

相关与回归习题:

一、主要概念理解:

1.相关关系

2.正相关与负相关

3.判定系数(可决系数)

4.相关系数

5.估计标准误差

二、判断、选择题:

1. 估计标准误差S y 的值越小,判定系数r 2的值越大,回归直线的拟合程度越高。( )

2. 在直线回归方程中,若已知:n=30,∑y=13500,∑x=360,b=17.5,则a =(____)

3. 已知变量x 与y 之间存在着负相关,指出下列回归方程中哪一个肯定是错误的。( )

A. x y

85.010?--= B. x y 5.1200?-= C. x y

76.0140?+-= D. x y 076.025?-= 4. 如果两个变量之间完全相关,则以下结论中正确的有( )

A.相关系数1=r

B.判定系致r 2=1

C.估计标准误差S y =1

D.估计标准误差S y =0

E.回归系数b>0

三、计算题:

某公司所属8个企业的产品销售资料如下:

企业编号

产品销售额(万元) 销售利润(万元) 1 170 8.1 2 220 12.5 3 390 18.0 4 430 22.0 5 480 26.5 6 650 40.0 7 950 64.0 8

1000

69.0

要求:(1)计算产品销售额与利润之间的相关系数;

(2)确定利润对产品销售额的直线回归方程,并说明斜率的经济意义; (3)对回归系数b 的显著性进行检验、对方程整体进行检验(取α=0.05); (4)预测产品销售额为1200万元时的利润。

抽样与抽样估计习题简要参考答案

5.1 1 .② 2.① 3.③ 4.③ 5.②

6.①

7.④

8.①

9.② 10.②

5.2 ⑴ 不需要 (

5.0

n

) ⑵ 0.8,0.796 结果基本一致 5.3 解:N=4000 n=200 p=0.04 由)1()1(2

1

N

n

n p p Z p --±得: 0135.004.0)4000

200

1(200)04.01(04.004.02

1

±=--±Z Z 1/2 =1.3%~6.7%

得Z 1/2=2 查表得95.45%

5.4 0.56±0.062=49.8%~62.2% n=9466

5.5 (49848.24, 50400.92) (49794.32, 50454.84) (49683.11, 5056

6.05) 置信水平越大,置信区间的宽度越宽。合理(∵n

Z 2

σ=?)

5.6 372 (18

6.91, 55

7.09) 假定两样本相互独立

5.7 用χ2分布 假定两样本相互独立且均来自正态总体 (0.0266,0.08865) (0.1631,0.2941)

假设检验习题简要参考答案

一、名词解释

1、原假设真实,而样本点都落入临界区域的概率,称显著水平,常用α 表示。

2、替代假设又称对立假设或备择假设,是当原假设被否定时即可成立的假设。

3、由样本所构造的随机变量称为统计量。

4、临界值就是临界区域的端点

二、多项选择题 1、B D 2、C D 3、A C 4、A B D

三、简答题

1、将原假设为真,却将之拒绝的错误称为第一类错误。而将原假设为伪,却将之接受的错误称为第二类错误。

2、临界区域位于统计量分布曲线两侧的假设检验称为双边检验,而临界区域位于统计量分布曲线一侧的假设检验称为单边检验。

3、根据要求,

(1)提出原假设H 。和替代假设,在检验进行中,假设H 。是真实的。 (2)选定合适的检验统计量。

(3)决定显著水平a 。

(4)根据显著水平确定统计量的临界区域,同时注意是双边检验还是单边检验。 (5)根据计算的统计量及所确定的显著水平作出决策。

4、检验统计量的选择取决于总体分布的特征及样本单位数的多少。如总体为正态分布且方差已知的情况下,采用 Z 统计量;总体为正态分布且方差未知,采用 t 统计量。对非正态分布的总体,如果样本客量足够大也可采用 Z 及 t 统计量。

5、临界区域位于统计量分布曲线左侧的假设检验称为左侧检验,临界区域位于统计量分布曲线右侧的假设检验称为右侧检验。

6、假设检验是以样本指标为依据来判断总体指标的假设值是否成立,通过构造合适的统计量来分析样本统计值与参数估计值的差异。它的主要作用在于用样本信息与原假设差异的大小来反映假设值真实性的大小,即差异小,假设值真实性就可能大,差异大,假设值真实性就可能小。

7、当样本容量足够大时,即n >30时,非正态分布的变量近似地服从正态分布,也可选用 Z 统计量进行检验。

8、区间估计是根据样本信息去估计总体的未知信息,而假设检验是对总体参数提出一个假设值,再用样本信息去研究参数假设值是否成立。在双边检验中的接受域即为区间估计的置信区间。

四、计算题

1、解:提出假设:50:0=μH 50:1≠μH 因总体方差未知,宜采用统计量t :

n

s x t μ

-=

根据资料计算:

20.50==

∑n

x x

62.0)

(2

=-=∑n

x x s

n

s x t μ

-=

=1.02 由α=0.1 查α=0.1双侧,得83.19

1.0=t

拒绝域为a t t > 故接受原假设。即每袋重量符合要求。

2、解:提出假设:%10:0≤p H %10:1>p H 采用统计量:

n

p p p p z )

1(000--=

15.040

6

==p 40=n n

p p p p z )

1(000--=

=1.05

64.105.0=z ,拒绝域为a z z >,本题中a z z <,故接受原假设,可以认为该批产品的次

品率不高于10%。

3、解:提出原假设%17:0≥μH %17:1<μH 选用统计量

n

p p p p z )

1(000--=

14.0200

28

==

p 200=n n

p p p p z )

1(000--=

=-1.13

64.105.0=z ,拒绝域为a z z -<,本题中a z z >,故接受原假设,即不能认为技术改造后

产品质量有所提高。

相关与回归分析习题简要参考答案

一、主要概念理解:

1. 相关关系是指变量间具有密切关联但又不能用函数关系精确表示的关系。

2. 在线性相关中,如果两个变量的变动方向相同称为正相关;如果两个变量的变动方

向相反则称为负相关。

3. 判定系数又称可决系数,是回归平方和占总变差平方和的比例,它测度回归直线对

各观测数据的拟合程度。

4. 相关系数是测度变量之间关系密切程度的一个量,对两个变量之间线性相关程度的

度量称为简单相关系数。

5. 估计标准误差是实际观测值(y i )与回归估计值(i y

?)的平均离差,即:m

n y y S i

i y --=

∑2)?( ,它则度各实际观测点在直线周围的散布状况。

二、判断题:

1.(正确)

分析:估计标准误差S y 的大小与剩余平方和∑(y-y

?)2成正比。∑(y-y ?)2越大,S y 越大,判定系数r 2越小,回归直线的拟合程度就越低;∑(y-y

?)2越小,S y 越小,r 2越大,回归直线的拟合程度就越高。

2.(240)

分折:根据x b y a -=可得24030

360

5.173013500=?-=

a 3.C

分析:相关系数r 与回归系数b 的符号是相同的,依题意r 为负值,回归系数b 必为负值,而答案C 中的b=+0.76,因而该回归方程肯定是错误的。 4.(A B D)

分析:依题意,两个变量之间为完全相关,则相关系数1=r ,r=+1为完全正相关,r= -1为完全负相关,所以A 正确;在一元线性回归中相关系数r 实际上是r 2的平方根,因此r 2=1,

B 正确;在完全相关条件下,各观测点全部落在一条直线上,∑(y-y

?)2=0,所以估计标准误差S y =0,S y ≠1,C 错,D 对;回归系数与相关系数的符号相同,由于r=1±,所以b 可能>0,也可能<0,因此E 是错误的。

三、计算题: 解:

(1).设产品销售额润为x ,销售利润为y , 有∑x=4290,∑y=260.1,∑xy=189127,

∑x 2=2969700,∑y 2=12189.11,则相关系数r 为:

2

22

222)1.260(11.121898)4290(296970081

.26042901891278)()(-??-??-?=

-?--=∑∑∑∑∑∑∑y y n x x n y

x xy n r

=0.9934

为高度正相关

(2).设直线回归方程为i i bx a y

+=?,根据最小二乘法有: 0742.0)4290(296970081

.26042901891278)(2

2

2

=-??-?=

--=

∑∑∑∑∑i i i i i i x x n y x y x n b

273.78

4290

0742.081.260-=?-=

-=x b y a 所求回归直线方程为:x y

0742.0273.7?+-= 回归系数b=0.0742的意义是:产品销售额每增加1万元,销售利润平均增加0.0742万元。

(3).对回归系数b 进行假设检验,假设产品销售额与销售利润之间无线性关系,即: H 0:β=0, H 1:β≠0

因为是小样本,所设检验统计量为b

b S b S b t =

-=β

~(n-2) (β=0) 2

2

2

2

2

)(x

n x

S x x S S y

y

b -=

-=

∑∑

在实际工作中S y 2通常可以采用如下简节公式:

2

2

2

---=

∑∑∑n xy b y a y

S y

59.472

8189127

0742.0)1.260273.7(11.121892

=-?-?--=

y S /6=7.9323

00344.0)8/4290(829697009323

.72

=?-=

b S

5698.2100344

.00742.0===

b S b t 取显著性水平α=0.05查t 分布表得t 0.05/2(n-2)=2.4469<21.5698 ∴拒绝H 0,即样本回归系数显著,产品销售额与销售利润之间确实存在线性关系,产品销售额是影响销售利润的显著因素。

(检验统计量t 也可以引入判定系数r 2来计算:2

12r

n r t --=

)

对回归方程整体进行F 检验:设 H 0:回归方程线性关系不显著 检验统计量)21(~)

2/(1/--=

n F n S S F ,残回

∑---=2/)?(1/)?(2

n y y y y 引入判定系数r 2计算F 统计量:

2

21)2(r

n r F --=4509934.01)28(9934.022=--= 对给定的显著性水平α=0.05查F 0.05(1,6)=5.99<450 ∴拒绝H 0,回归方程显著。

(注:以上的t 检验和F 检验,其检验结果是一致的,在一元线性回归分折中可二者取其一。但是,在多元回归分折中,它们是不等价的,t 检验只是检验回归方程中各个系数(参数)的显著性;而F 检验则是检验整个回归关系的显著性。)

(4).当销售额为1200时,由所求回归方程得销售利润预测值为:

)(767.8112000742.0273.7?万元=?+-=y

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

统计学经典习题集参考答案

1.要了解某班50名学生的性别构成情况,则总体是()。 A.每一个学生 B.每一个学生的性别 C.全体学生 D.全体学生的性别 2.要了解全国的人口情况,总体单位是()。 A.每一个人 B.每一户 C.每个省的人口 D.全国总人口 3.某班四名学生金融考试成绩分别为70分、80分、86分和90分,这四个数字是()。 A.变量值 B.标志 C.指标值 D.指标 4.工业企业的职工人数、职工工资是()。 A.离散变量 B.前者是离散变量,后者是连续变量 C.连续变量 D.前者是连续变量,后者是离散变量 5.统计学与统计工作的关系是()。 A.理论与应用的关系 B.工作与结果的关系 C.理论与实践的关系 D.工作与经验的关系 6.某地区为了掌握该地区水泥生产的质量情况,拟对占该地区水泥总产量的90%的五个大型水泥厂的生产情况进行调查,这种调查方式是()。 A.典型调查 B.重点调查 C.抽样调查 D.普查 7.某地进行国有商业企业经营情况调查,则调查对象是()。 A.该地所有商业企业 B.该地所有国有商业企业 C.该地每一家商业企业 D.该地每一家国有商业企业 8.对企业先按经济类型分组,再按企业规模分组,属于()。 A.简单分组 B.平行分组 C.复合分组 D.再分组 9.某变量数列,其末组为开口组,下限为600,又知其相邻组的组中值为550,则末组的组中值是()。 A.100 B.500 C.650 D.700 10.统计表的宾词是用来说明总体特征的()。 A.统计指标 B.总体单位 C.标志 D.统计对象 11.下面属于时期指标的是()。 A.商品销售额 B.商场数量 C.商品价格 D.营业员人数 12.用水平法检查长期计划完成程度,应规定()。 A.计划期初应达到的水平 B.计划期末应达到的水平 C.计划期中应达到的水平 D.整个计划期应达到的水平 13.第五次人口普查结果,我国每10万人中具有大学程度的为3611人。该数字资料为()。 A.绝对数 B.结构相对数 C.比较相对数 D.强度相对数 14.某商场计划11月份销售利润比10月份提高2%,实际提高了3%,则销售利润计划完成程度为()。 A.100.98% B.95.10% C.99.00% D.105.10% 15.平均数反映了()。 A.总体分布的集中趋势 B.总体分布的离中趋势 C.总体中各单位分布的集中趋势 D.总体变动的趋势 16.中位数和众数是一种()。 A.常见值 B.代表值 C.实际值 D.典型值 17.计算发展速度的分母是()。 A.计划期水平 B.固定期水平 C.报告期水平 D.基期水平 18.由一个10项的时间序列可以计算的环比发展速度有()。 A.8个 B.9个 C.10个 D.11个

统计学试题库及答案

统计学试题库及答案 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和 理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可 分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者 变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。

统计学试题库含答案

统计学试题库含答案 Modified by JEEP on December 26th, 2020.

《统计学》试题库 第一章:统计基本理论和基本概念 一、填空题 1、统计是统计工作、统计学和统计资料的统一体,统计资料 是统计工作的成果,统计学是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有大量观察法、统计分组法、统计推断法和综合指标法。 3、统计工作可划分为设计、调查、整理和分析四个阶段。 4、随着研究目的的改变,总体和个体是可以相互转化的。 5、标志是说明个体特征的名称,指标是说明总体数量特征的概念及其数值。 6、可变的数量标志和所有的统计指标称为变量,变量的具体数值称为变量值。 7、变量按其数值变化是否连续分,可分为连续变量和离散变量,职工人 数、企业数属于离散变量;变量按所受影响因素不同分,可分为确定性变量和随机变量。 8、社会经济统计具有数量性、总体性、社会性、具体性等特点。 9、一个完整的统计指标应包括指标名称和指标数值两个基本部分。 10、统计标志按是否可用数值表示分为品质标志和数量标志;按在 各个单位上的具体表现是否相同分为可变标志和不变标志。 11、说明个体特征的名称叫标志,说明总体特征的名称叫指标。 12、数量指标用绝对数表示,质量指标用相对数或平均数表示。 13、在统计中,把可变的数量标志和统计指标统称为变量。 14、由于统计研究目的和任务的变更,原来的总体变成总体单位, 那么原来的指标就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。(×) 2、运用大量观察法,必须对研究对象的所有或足够多的单位进行观察调查。(√) 3、统计学是对统计实践活动的经验总结和理论概括。(√)

统计推断答案(打印版)

Solutions Manual for Statistical Inference, Second Edition George Casella University of Florida Roger L. Berger North Carolina State University Damaris Santana University of Florida

α {?∞ 0, w (α) = α, w (α) = α, x {0 {1, -2, 2.5}]. 3.35 a. In Exercise 3.34(a) w 1(λ) = 1 and for a n(e θ, e θ ), w 1(θ) = 1 . b. E X = μ = αβ, then β = μ . Therefore h (x ) = 1 I (x ), α x {0 0, w 1 (α) = α, w 2 (α) = α , t 1(x ) = log(x ), t 2(x ) = ?x . c. From (b) then (α1, . . . , αn , β1, . . . , βn ) = (α1, . . . , αn , α1 , . . . , αn ) μ μ The pdf ( 1 )f ( (x ?μ) ) is symmetric about μ because, for any ? > 0, o σ 1 f .(μ+?)?μ . = σ σ 1 f . ? . = σ σ 1 f . ? . = σ σ 1 f .(μ??)?μ . . σ σ Thus, by Exercise 2.26b, μ is the median. P (X > x α) = P (σZ + μ > σz α + μ) = P (Z > z α) by Theorem 3.5.6. First take μ = 0 and σ = 1. a. The pdf is symmetric about 0, so 0 must be the median. Verifying this, write ? ∞ 1 1 1 1 .∞ 1 . π . 1 P (Z ≥ 0) = 0 π 1+z 2 dz = tan ? π (z ). = .0 π 2 ?0 = 2 . b. P (Z ≥ 1) = 1 tan ?1(z ).∞ = 1 π ? π = 1 . By symmetry this is also equal to P (Z ≤ ?1). π .1 π . 2 4 . 4 Writing z = (x ? μ)/σ establishes P (X ≥ μ) = 1 and P (X ≥ μ + σ) = 1 . Let X ~ f (x ) have mean μ and variance σ2. Let Z = X ?μ . Then E Z = . 1 . σ E(X ? μ ) = 0 and Var Z = Var . X ? μ . σ . 1 . = σ2 Var(X ? μ) = . 1 . σ2 σ2 Var X = σ2 = 1. Then compute the pdf of Z , f Z (z ) = f x (σz + μ)· σ = σf x (σz + μ) and use f Z (z ) as the standard pdf. a. This is a special case of Exercise 3.42a. b. This is a special case of Exercise 3.42b. a. Let θ1 > θ2. Let X 1 ~ f (x ? θ1) and X 2 ~ f (x ? θ2). Let F (z ) be the cdf corresponding to f (z ) and let Z ~ f (z ).Then F (x | θ1) = P (X 1 ≤ x ) = P (Z + θ1 ≤ x ) = P (Z ≤ x ? θ1) = F (x ? θ1) ≤ F (x ? θ2) = P (Z ≤ x ? θ2) = P (Z + θ2 ≤ x ) = P (X 2 ≤ x ) = F (x | θ2).

统计与概率经典例题(含答案和解析).docx

统计与概率经典例题(含答案及解析) 1.(本题8 分)为了解学区九年级学生对数学知识的掌握情况,在一次数学检测中, 从学区2000 名九年级考生中随机抽取部分学生的数学成绩进行调查,并将调查结果绘 制成如下图表: ⑴表中 a 和 b 所表示的数分别为:a= .,b=.; ⑵请在图中补全频数分布直方图; 2000 名九年级考生数学⑶如果把成绩在70 分以上(含70 分)定为合格,那么该学区 成绩为合格的学生约有多少名? 2.为鼓励创业,市政府制定了小型企业的优惠政策,许多小型企业应运而生,某镇统 计了该镇 1﹣ 5 月新注册小型企业的数量,并将结果绘制成如下两种不完整的统计图: ( 1)某镇今年1﹣5 月新注册小型企业一共有家.请将折线统计图补充完整; ( 2)该镇今年 3 月新注册的小型企业中,只有 2 家是餐饮企业,现从 3 月新注册的小型企业中随机抽取 2 家企业了解其经营状况,请用列表或画树状图的方法求出所抽取的 2家企业恰好都是餐饮企业的概率. 3.( 12 分)一个不透明的口袋装有若干个红、黄、蓝、绿四种颜色的小球,小球除颜 色外完全相同,为估计该口袋中四种颜色的小球数量,每次从口袋中随机摸出一球记下颜 色并放回,重复多次试验,汇总实验结果绘制如图不完整的条形统计图和扇形统计图.

根据以上信息解答下列问题: (1)求实验总次数,并补全条形统计图; (2)扇形统计图中,摸到黄色小球次数所在扇形的圆心角度数为多少度? (3)已知该口袋中有 10 个红球,请你根据实验结果估计口袋中绿球的数量. 4.(本题 10 分)某校为了解2014 年八年级学生课外书籍借阅情况,从中随机抽取了 40名学生课外书籍借阅情况,将统计结果列出如下的表格,并绘制成如图所示的扇形 统计图,其中科普类册数占这40 名学生借阅总册数的40%. 类别科普类教辅类文艺类其他册数(本)12880m48 ( 1)求表格中字母m的值及扇形统计图中“教辅类”所对应的圆心角 a 的度数; (2)该校 2014 年八年级有 500 名学生,请你估计该年级学生共借阅教辅类书籍约多少本? 5.( 10 分)将如图所示的版面数字分别是1, 2,3, 4 的四张扑克牌背面朝上,洗匀后放在桌面上(“ A”看做是“ 1”)。 ( 1)从中随机抽出一张牌,牌面数字是偶数的概率是;(3分) ( 2)从中随机抽出两张牌,两张牌面数字的和是 5 的概率是;(3分)(3)先从中随机抽出一张牌,将牌面数字作为十位上的数字,然后将该牌放回并重新洗 匀,再随机抽取一张,将牌面数字作为个位上的数字,请用画树形图的方法求组成的

统计学试题及答案

统计学试题及答案文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

统计学试题及答案 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A.5%×7%×9% B. 105%×107%×109% C.(105%×107%×109%)-1 D. 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为 , 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间

7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间: =70件, =件乙车间: =90件, =件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题 (每题2分,共14分) 1. 下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E. 企业职工人数2000人 2. 在数据的集中趋势的测量值中,不受极端数值影响的测度值是

统计学题库答案

单选 问题:下列不属于相关关系的现象是( 3 )。 选项一:企业的投资与产出 选项二:居民的收入与存款 选项三:电视机产量与西红柿产量 选项四:商品销售额与商品销售价格 问题:抽样调查中的抽样误差是指(3 ) 选项一:在调查过程中由于观察、测量等差错所引起的误差 选项二:在调查中违反随机原则出现的系统误差 选项三:随机抽样而产生的代表性误差 选项四:人为原因所造成的误差 问题:企业职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( 2 )。 选项一:10.0% 选项二:7.1% 选项三:7.0% 选项四:7.2% 问题:在假设检验中,原假设与备择假设( 3 ) 选项一:都有可能被接受 选项二:都有可能不被接受 选项三:只有一个被接受而且必有一个被接受 选项四:原假设一定被接受,备择假设不一定被接受 问题:小王收集了1978年以来历年我国人均GDP与人均消费额的资料,如果要反映这一时期我国生产与消费的关系,用什么图形最为合适?(2 ) 选项一:直方图

选项二:散点图 选项三:饼图 选项四:折线图 问题:若回归直线方程中的回归系数为0,则直线相关系数( 3 )。 选项一:r=1 选项二:r=-1 选项三:r=0 选项四:r 无法确定 问题:若消费者价格指数为95%,则表示( 4 )。 选项一:所有商品的价格都上涨了 选项二:所有商品的价格都下跌了 选项三:商品价格有涨有落,总体来说是上涨了 选项四:商品价格有涨有落,总体来说是下跌了 问题:某连续变量数列末位组为开口组,下限为200,相邻组组中值为170,则末位组中值为( 1 )。选项一:230 选项二:200 选项三:210 选项四:180 问题:若两变量的r=0.4,且知检验相关系数的临界值为,则下面说法正确的是( 3 )。 选项一:40%的点都密集分布在一条直线的周围 选项二:40%的点低度相关 选项三:两变量之间是正相关 选项四:两变量之间没有线性关系 问题:下列指标中包含有系统性误差的是(1 ) 选项一:SSA 选项二:SSE

统计学经典题库与答案

2. 数据筛选的主要目的是( A 、发现数据的错误 C 、找出所需要的某类数据 3. 为了调查某校学生的购书费用支出, B 、对数据进行排序 D 纠正数据中的错误 将全校学生的名单按拼音顺序排列后,每 ) A H 0:二=0.15;二-0.15 B H o :二二 0.15;二=0.15 C H 0: 一 - 0.15;二:: 0.15 D H 0:二乞 0.15;二 0.15 9. 若甲单位的平均数比乙单位的平均数小, 大,则( )。 A 、甲单位的平均数代表性比较大 C 甲单位的平均数代表性比较小 10. 某组的向上累计次数表明( A 、 大于该组上限的次数是多少 B 、 小于该组下限的次数是多少 但甲单位的标准差比乙单位的标准差 B 、两单位的平均数一样大 D 、无法判断 1.当正态总体方差未知时,在大样本条件下,估计总体均值使用的分布是 ( A )。 z 分布 B 、t 分布 F 分布 D 、 2 分布 A 、比平均数高出2个标准差 C 等于2倍的平均数 D 5.峰态通常是与标准正态分布相比较而言的。 则峰态系数的值( )。 B 比平均数低2个标准差 等于2倍的标准差 如果一组数据服从标准正态分布, A =3 C 、v 3 6. 若相关系数r=0,则表明两个变量之间( A 、相关程度很低 C 不存在任何关系 7. 如果所有变量值的频数都减少为原来的 1/3, 均数( )。 A 、不变 B C 减少为原来的1/3 D > 3, =0 )。 不存在线性相关关系 存在非线性相关关系 而变量值仍然不变,那么算术平 扩大到原来的3倍 不能预测其变化 8. 某贫困地区所估计营养不良的人高达 15%然而有人认为这个比例实际上还要 高,要检验该说法是否正确,则假设形式为( )。 隔50名学生抽取一名进行调查,这种调查方式是( A 、简单随机抽样 B 、分层抽样 C 、系统抽样 D 、整群抽样 4. 如果一组数据标准分数是(-2 ),表明该数据( )。

统计学试题库及答案

1、统计学与统计工作的研究对象就是完全一致的。F 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。T 3、统计学就是对统计实践活动的经验总结与理论概括。T 4、一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。T 5、数量指标就是由数量标志汇总来的,质量指标就是由品质标志汇总来的。F 6、某同学计算机考试成绩80分,这就是统计指标值。F 7、统计资料就就是统计调查中获得的各种数据。F 8、指标都就是用数值表示的,而标志则不能用数值表示。F 9、质量指标就是反映工作质量等内容的,所以一般不能用数值来表示F。 10、总体与总体单位可能随着研究目的的变化而相互转化。T11、女性就是品质标志。T 12、以绝对数形式表示的指标都就是数量指标以相对数或平均数表示的指标都就是质量指标 T 13、构成统计总体的条件就是各单位的差异性。F 14、变异就是指各种标志或各种指标之间的名称的差异。F 9、调查某校学生,学生“一天中用于学习的时间”就是(A)A、标志 13、研究某企业职工文化程度时,职工总人数就是(B) B数量指标 14、某银行的某年末的储蓄存款余额(C)C、可能就是统计指标,也可能就是数量标志 15、年龄就是(B)B、离散型变量 四、多项选择题 1、全国第四次人口普查中(BCE)A、全国人口数就是统计总体B、总体单位就是每一个人 C、全部男性人口数就是统计指标 D、男女性别比就是总体的品质标志 E、人的年龄就是变量 2、统计总体的特征表现为(ACD)A、大量性B、数量性C、同质D、差异性E、客观性 3、下列指标中属于质量指标的有(ABCDE)A、劳动生产率B、产品合格率C、人口密度 D、产品单位成本 E、经济增长速度 4、下列指标中属于数量指标的有(ABC) A、国民生产总值B、国内生产总值C、固定资产净值D、劳动生产率E、平均工资 5、下列标志中属于数量标志的有(BD)A、性别B、出勤人数C、产品等级D、产品产量E 文化程度 6、下列标志中属于品质标志的有(ABE)A、人口性别B、工资级别C、考试分数D、商品使用寿命E、企业所有制性质 7、下列变量中属于离散型变量的有(BE)A、粮食产量B、人口年龄C、职工工资 D、人体身高 E、设备台数 8、研究某企业职工的工资水平,“工资”对于各个职工而言就是(ABE)A、标志B、数量标

统计学题库及题库详细答案

统计学题库及题库详细答案

————————————————————————————————作者:————————————————————————————————日期:

统计学题库及题库答案 题库1 一、单项选择题(每题2分,共20分) 1、调查时间是指( ) A 、调查资料所属的时间 B 、进行调查的时间 C 、调查工作的期限 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( ) A 、扩大为原来的3倍 B 、扩大为原来的2/3倍 C 、扩大为原来的4/9倍 D 、扩大为原来的2.25倍 5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选( )。 A 、576户 B 、144户 C 、100户 D 、288户 6、当一组数据属于左偏分布时,则( ) A 、平均数、中位数与众数是合而为一的 B 、众数在左边、平均数在右边 C 、众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为( )。 A 、520 B 、 510 C 、 500 D 、490 8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、各组的次数必须相等 B 、变量值在本组内的分布是均匀的 C 、组中值能取整数 D 、各组必须是封闭组 9、 n X X X ,,,21 是来自总体 ),(2 N 的样本,样本均值X 服从( )分布 A 、),(2 N B.、)1,0(N C.、 ),(2 n n N D 、) , (2 n N 10、测定变量之间相关密切程度的指标是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题2分,共10分)

生物统计学试题及答案

一、填空 变量按其性质可以分为连续变量和非连续变量。 样本统计数是总体参数的估计量。 生物统计学是研究生命过程中以样本来推断总体的一门学科。 生物统计学的基本内容包括试验设计、统计分析两大部分。 统计学的发展过程经历了古典记录统计学、近代描述统计学、现代推断统计学3 个阶段。 生物学研究中,一般将样本容量n >30称为大样本。 试验误差可以分为随机误差、系统误差两类。 资料按生物的性状特征可分为数量性状资料变量和质量性状资料变量。 直方图适合于表示连续变量资料的次数分布。 变量的分布具有两个明显基本特征,即集中性和离散性。 反映变量集中性的特征数是平均数,反映变量离散性的特征数是变异数。 林星s= 样本标准差的计算公式s= 如果事件A和事件B为独立事件,则事件A与事件B同时发生地概率P (AB) = P(A)*P(B)。 二项分布的形状是由n和p两个参数决定的。 正态分布曲线上,卩确定曲线在x轴上的中心位置,c确定曲线的展开程度。样本平均数的标准误等于c Wi。 t分布曲线和正态分布曲线相比,顶部偏低,尾部偏高。

统计推断主要包括假设检验和参数估计两个方面。

参数估计包括点估计和区间估计假设检验首先要对总体提出假设,一般应作两个假设,一个是无效假设,一个是备择假设。 对一个大样本的平均数来说,一般将接受区和否定区的两个临界值写作卩-U a^x_ 卩+U a c x 在频率的假设检验中,当np或nq v30时,需进行连续性矫正。 2检验主要有3种用途:一个样本方差的同质性检验、适应性检验和独立性检验。 2检验中,在自由度df = (1)时,需要进行连续性矫正,其矫正的2 = ( p85 )。 2分布是连续型资料的分布,其取值区间为[0.+ %)。 猪的毛色受一对等位基因控制,检验两个纯合亲本的F2代性状分离比是否符合 孟德尔第一遗传规律应采用适应性检验法。 独立性检验的形式有多种,常利用列联表进行检验。 根据对处理效应的不同假定,方差分析中的数学模型可以分为固定模型、随机模型和混合模型混合模型3类。 在进行两因素或多因素试验时,通常应该设置重复,以正确估计试验误差,研究因素间的交互作用。 在方差分析中,对缺失数据进行弥补时,应使补上来数据后,误差平方和最小。方差分析必须满足正态性、可加性、方差同质性3个基本假定。 如果样本资料不符合方差分析的基本假定,则需要对其进行数据转换,常用的数据转换方法有平方根转换、对数转换、正反弦转换等。 相关系数的取值范围是[-1,1]O

高二81统计随机抽样直方图茎叶图知识点经典例题及练习题带答案

环球雅思教育学科教师讲义 讲义编号: ______________ 副校长/组长签字:签字日期: 【考纲说明】 1、理解随机抽样的必要性和重要性,了解分布、样本数据标准差的意义和作用,理解用样本估计总体的思想。 2、会画频率分布直方图、频率折线图、茎叶图,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题 【趣味链接】 U2合唱团在17分钟内得赶到演唱会场,途中必需跨过一座桥,四个人从桥的同一端出发,你得帮助他们到达另一端,天色很暗,而他们只有一只手电筒。一次同时最多可以有两人一起过桥,而过桥的时候必须持有手电筒,所以就得有人把手电筒带来带去,来回桥两端。手电筒是不能用丢的方式来传递的。四个人的步行速度各不同,若两人同行则以较慢者的速度为准。BONO需花1分钟过桥,EDGE需花2分钟过桥,ADAM需花5分钟过桥,LARRY需花10分钟过桥,他们要如何在17分钟内过桥呢? 【知识梳理】 一、抽样方法与总体分布的估计 1、随机抽样 (1)总体:在统计学中, 把研究对象的全体叫做总体,把每个研究对象叫做个体,把总体中个体的总数叫做总体容量.总体与个体之间的关系类似于集合与元素的关系. (2)样本:从总体中随机抽取一部分个体叫做总体的一个样本,样本中个体的数目称为样本的容量,样本和总体之间

的关系类似于子集和集合之间的关系. (3)简单随机抽样:一般地,从元素个数为N 的总体中不放回地抽取容量为的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 常用的方法有抽签法和随机数表法. (4)系统抽样:当总体中的个体比较多时,将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样,也称作等距抽样. (5)分层抽样:当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样. 2、频率分布直方图与茎叶图 (1)频率分布:样本中所有数据(或数据组)的频数和样本容量的比就是该数据的频率,所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表、频率分布折线图、茎叶图、频率分布直方图来表示. (2)频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图。 (3)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光华曲线,即总体密度曲线。 (4)制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出. 茎叶图对于分布在0~99的容量较小的数据比较合适,此时,茎叶图比直方图更详尽地表示原始数据的信息. 在茎叶图中,茎也可以放两位,后面位数多可以四舍五入后再制图. 3、样本的数字特征 (1)众数:出现次数最多的数叫做众数. (2)中位数:如果将一组数据按大小顺序依次排列,把处在最中间位置的一个数据或中间两个数据的平均是叫做这组数据的中位数. (3)平均数与加权平均数:如果有n 个数,,,,n x x x x ??321那么12n x x x x n ++???+= 叫做这n 个数的平均数. 如果在n 个数中,1x 出现次1f 次, 2x 出现次2f 次,……,k x 出现次2f 次,(这里),n f f f k =+??++21那么 11221 ()k k x x f x f x f n =++???+叫做这n 个数的加权平均数,其中k f f f ??,,21叫做权. (4)标准差与方差:设一组数据123n x x x x ?,,,,的平均数为x ,则

统计学题库及题库答案

统计学题库及题库答案 ) B 、进行调查的时间 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( ) A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、 对比分析不同性质的变量数列之间的变异程度时 ,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、 在简单随机重复抽样条件下,若要求允许误差为原来的 2/3,则样本容量( ) A 、扩大为原来的 3倍 B 、扩大为原来的 2/3倍 C 、扩大为原来的 4/9倍 D 、扩大为原来的 2.25倍 5、 某地区组织职工家庭生活抽样调查 ,已知职工家庭平均每月每人生活费收入的标准差为 可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选( )。 A 、576 户 B 、144 户 C 、100 户 D 、288 户 6、当一组数据属于左偏分布时,则( ) A 、 平均数、中位数与众数是合而为一的 B 、 众数在左边、平均数在右边 C 、 众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、 某连续变量数列,其末组组限为 500以上,又知其邻组组中值为 480,则末组的组中值为( ) A 、 520 B 、 510 C 、 500 D 、 490 8、 用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、 各组的次数必须相等 B 、 变量值在本组内的分布是均匀的 C 、 组中值能取整数 D 、 各组必须是封闭组 9、 XjX 2’…,X n 是来自总体的样本,样本均值 X 服从( )分布 A 、N(F 2) B.、N(0,1) C 、 N(n 巴nb 2 ) N(=) D 、 n 10、测定变量之间相关密切程度的指标是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题 2分,共10分) 1、抽样推断中,样本容量的多少取决于( )。 A 、总体标准差的大小 B 、 允许误差的大小 c 、抽样估计的把握程度 D 、总体参 题库1 、单项选择题(每题 2分,共20分) 1、调查时间是指( A 、调查资料所属的时间 C 、调查工作的期限 12元,要求抽样调查的

描述统计与推断统计

描述统计与推断统计-心理学统计与测量经典习题1 第一章描述统计 名词解释 1.描述统计(吉林大学2002研) 答:描述统计主要研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质。具体内容有:数据如何分组,如何使用各种统计表与统计图的方法去描述一组数据的分组及分布情况,如何通过一组数据计算一些特征数,减缩数据,进一步显示与描述一组数据的全貌。 2.相关系数(吉林大学2002研) 答:相关系数是两列变量间相关程度的数字表现形式,或者说是表示相关程度的指标。作为样本的统计量用r表示,作为总体参数一般用ρ表示。相关系数不是等距的度量值,因此在比较相关程度时,只能说绝对值大者比绝对值小者相关更密切一些,而不能进行加减乘除。 3.差异系数(浙大2003研) 答:差异系数,又称变异系数、相对标准差等,它是一种相对差异量,为标准差对平均数的百分比。其公式如下: 常用于:①同一团体不同观测值离散程度的比较;②对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。 4.二列相关(中科院2004研) 答:如果两列变量均属于正态分布,其中一列变量为等距或等比的测量数据,另一列变量虽然也是正态分布,但被人为地划分为两类。求这样两列变量的相关用二列相关。 5.集中量数与差异量数(浙大2000研,苏州大学2002研) 答:集中趋势和离中趋势是次数分布的两个基本特征。数据的集中趋势就是指数据分布中大量数据向某方向集中的程度,离中趋势是指数据分布中数据彼此分散的程度。用来描述一组数据这两种特点的统计量分别称为集中量数和差异量数。 6.中位数(南开大学2004研) 答:中位数,又称中点数,中数,是指位于一组数据中较大一半和较小一半中间位置的那个数,用Md 或Mdn来表示。 7.品质相关(华东师大2002研)

统计案例分析典型例题

统计案例分析及典型例题 §抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案80 例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解抽签法: 第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 基础自测

第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k= 10 0001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300× 15 2 =40(人); 300×155=100(人);300×15 2=40(人); 300× 15 3=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

相关文档
相关文档 最新文档