习题答案
第一章
一、是非题
1. 家庭中子女数是离散型的定量变量。
答:对。
2. 同质个体之间的变异称为个体变异。
答:对。
3. 学校对某个课程进行1 次考试,可以理解为对学生掌握该课程知识的一次随机抽样。答:对。
癣患者,其中55 名牛皮个人有效,则该药的有效率为 4. 某医生用某个新药治疗了100 55%。
答:错。只能说该样本有效率为55%或称用此药总体有效率的样本估计值为55%。
5.已知在某个人群中,糖尿病的患病率为8%,则可以认为在该人群中,随机抽一个对象,其患糖尿病的概率为8%。
答:对,人群的患病率称为总体患病率。在该人群中随机抽取一个对象,每个对象均有相同的机会被抽中,抽到是糖尿病患者的概率为8%。
二、选择题
1. 下列属于连续型变量的是A 。
A 血压
B 职业
C 性别
D 民族
2. 某高校欲了解大学新生心理健康状况,随机选取了1000 例大学新生调查,这1000 例大学生新生调查问卷是 A 。
A 一份随机样本
B 研究总体
C 目标总体
D 个体
3. 某研究用X 表示儿童在一年中患感冒的次数,共收集了1000 人,请问:儿童在一年中患感冒次数的资料属于 C 。
A 连续型资料
B 有序分类资料
C 不具有分类的离散型资料
D 以上均不对
4. 下列描述中,不正确的是D 。
A 总体中的个体具有同质性
B 总体中的个体大同小异
C 总体中的个体在同质的基础上有变异
D 如果个体间有变异那它们肯定不是来自同一总体
5.用某个降糖药物对糖尿病患者进行治疗,根据某个大规模随机抽样调查的研究结果得
到该药的降糖有效率为85%的结论,请问降糖有效率是指 D 。
A 每治疗100 个糖尿病患者,正好有85 个人降糖有效,15 个人降糖无效
B 每个接受该药物治疗的糖尿病患者,降糖有效的机会为85%
C 接受该药物治疗的糖尿病人群中,降糖有效的比例为85%
D 根据该研究的入选标准所规定的糖尿病患者人群中,估计该药降糖有效的比例为
85%
三、简答题
1. 某医生收治200 名患者,随机分成2 组,每组100 人。一组用A 药,另一组用B 药。经过2 个月的治疗,A 药组治愈了90 人,B 组治愈了85 名患者,请根据现有结果评议
下列说法是否正确,为什么
药组。B 药组的疗效高于a)A
b)A 药的疗效高于B 药。
答:a)正确,因为就两组样本而言,的确A 组疗效高于B 组。
b) 不正确,因为样本的结果存在抽样误差,因此有可能人群的A 药疗效高于B 药,也
可能人群的两药的疗效相同甚至人群B 药的疗效高于A 药,
2. 某校同一年级的A 班和B 班用同一试卷进行一次数学测验。经过盲态改卷后,公布成
绩:A 班的平均成绩为80 分,B 班的平均成绩为81 分,请评议下列说法是否正确,为
什么
a)可以称A 班的这次考试的平均成绩低于B 班,不存在抽样误差。
b)可以称A 班的数学平均水平低于B 班。
答:a) 正确,因为此处将A 班和B 班作为研究总体,故不存在抽样误差。
b)不正确,因为这一次数学平均成绩只是两班数学成绩总体中的两个样本,样本的差异
可能仅仅由抽样误差造成。
3. 在某个治疗儿童哮喘的激素喷雾剂新药的临床试验中,研究者收集了300 名哮喘儿童患者,随机分为试验组和对照组,试验组在哮喘缓解期内采用激素喷雾剂,在哮喘发作期
内采用激素喷雾剂+扩展气管药;对照组在哮喘缓解期不使用任何药物,在哮喘发作期
内采用扩展气管药物。通过治疗3 个月,以肺功能检查中的第1 秒用力呼吸率
(FEV/FRC)作为主要有效性评价指标,评价两种治疗方案的有效性和安全性。请阐11述这个研究中的总体和总体均数是什么
答:试验组的研究总体是接受试验组治疗方案的全体哮喘儿童患者在治疗3 个月时的
FEV1/FRC1 值的全体。对照组的研究总体是接受对照组治疗方案的全体哮喘儿童患者
在治疗3 个月时的FEV1/FRC1 值的全体。
试验组对应的总体均数是接受试验组治疗方案的全体哮喘儿童患者在治疗3 个月时的
FEV1/FRC1 的平均值;对照组对应的总体均数是接受对照组治疗方案的全体哮喘儿童
患者在治疗3 个月时的FEV1/FRC1 的平均值。
4. 请简述什么是小概率事件对于一次随机抽样,能否认为小概率事件是不可能发生的
答:在统计学中,如果随机事件发生的概率小于或等于,则通常可以认为是一个小
概率事件,表示该事件在大多数情况下不会发生,并且一般可以认为小概率事件在一次随机
抽样中不会发生,这就是小概率事件原理。小概率事件原理是统计学检验的基础。
5. 变量的类型有哪几种请举例说明,各有什么特点
答:(1)连续型变量,可以一个区间中任意取值的变量,即在忽略测量精度的情况下,
连续型变量在理论上可以取到区间中的任意一个值,并且通常含有测量单位。观察连续型变
量所得到的数据资料称为计量资料(measurement data)。如例1-1 中的身高变量就是连续型变量,身高资料为计量资料。.(2)离散型变量,变量的取值范围是有限个值或者为一个数列。离散型变量的取值情况可以分为具有分类性质的资料和不具有分类性质的资料,表示分
类情况的离散型变量亦称分类变量(categorical variable)。观察分类变量所得到的资料称为分
类资料(categorical data)。分类资料可以分为二分类资料和多分类资料,而多分类资料又分成
无序分类资料和有序分类资料,二分类资料如症状指标分为感染或未感染,无序多分类资料(nominal data) 如血型可以分为A、B、AB 和O 型,有序多分类资料(ordinal data) 如病情指
标分为无症状、轻度、中度和重度。
第二章
一、是非题.
1.不论数据呈何种分布,都可以用算术均数和中位数表示其平均水平。
答:错。只有资料满足正态或近似正态分布时计算算术均数是比较有统计学意义的。
2.在一组变量值中少数几个变量值比大多数变量值大几百倍,一般不宜用算术均数表示其平均水平。
答:对,可以采用中位数表示。
3.只要单位相同,用s 和用CV 来表示两组资料的离散程度,结论是完全一样的。
答:错,标准差S 是绝对误差的一种度量,变异系数CV 是相对误差的一种度量,对于两组资料离散程度的比较,即使两组资料的度量单位相同,也完全有可能出现两个指标的结论是不同的。在实际应用时,选择离散程度的指标时,考虑其结果是否有研究背景意义。例如:一组资料为成人的身高观察值,另一组资料为2 岁幼儿的身高观察值,虽然可以用标准差S 比较两组的离散程度,也不能认为这是错误的,但根本没有研究背景意义,相反选择变异系数CV 比较两组资料的相对变异程度,这就有一定的研究背景意义。
4.描述200 人血压的分布,应绘制频数图。
答:对。
5. 算术均数与中位数均不容易受极值的影响。
答:错。算术均数比中位数容易受到极值的影响。
二、选择题
1.中位数是表示变量值A 的指标。
A.平均水平
B.变化范围
C.频数分布
D.相互间差别大小
2.对于最小组段无确定下限值和(或)最大组段无确定上限值的频数分布表资料,宜用下列哪些指标进行统计描述 C ____
A 中位数,极差
B 中位数,四分位数间距
C 中位数,四分位数范围
D 中位数,标准差
3.描述年龄(分8 组)与疗效(有效率)的关系,应绘制A 。
A.线图B. 圆图C. 直方图D. 百分条图
4、为了描述资料分布概况,绘制直方图时,直方图的纵轴可以为D 。
A 频数
B 频率
C 频率密度(频率/组距)
D 都可以
三、简答与分析题
1.100 名健康成年女子血清总蛋白含量(g/L)如表2-14,试描述之。
表2-12 100 名成年健康女子血清总蛋白含量(g/L)
答:制作频数表如下:
_____________________________________________________________________累积百分比累积频数组段频数百分比____________________________________________________________________3 64~ 3
8 66~ 5
16 68~ 8
27 70~ 11
52 72~ 25
76 74~ 24
86 76~ 10
93 78~ 7
99 80~ 6
84~ 1 100
变量例数均数标准差最小值最大值中位数25 百分位数75 百分位数
x 100
2.某医师测得300 名正常人尿汞值(ng/L)如表2-15,试描述资料。
表2-13 300 名正常人尿汞值(ng/L)
尿汞例数累计例数累计百分数(%)
0~ 49 49
4~ 27 76
8~ 58 134
12~ 50 184
16~ 45 229
20~ 22 251
24~ 16 267
28~ 10 277
32~ 7 284
36~ 5 289
40~ 5 294
44~ 0 294
48~ 3 297
52~ 0 297
56~ 2 299
60~ 1 300
合计300 ——
答:根据资料给出统计描述的指标如下:
例数均数标准差最小值最大值
16 2 62
3.对于同一的非负样本资料,其算数均数一定大于等于几何均数。
答:根据初等数学中的不等式1 2
1 2
n n
n
a a a a a a
n
+ + +
≥,可以得到算数均数一定大于
等于几何均数。
4.常用的描述集中趋势的指标有哪些,并简述其适用条件。
答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。
(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数
正态分布)的资料,以及等比数列资料。
(3)中位数:适用各种类型的资料,尤其以下情况:
A 资料分布呈明显偏态;
B 资料一端或两端存在不确定数值(开口资料或无界资料);C
资料分布不明。
第三章
是非题一、1. 二项分布越接近Poisson 分布时,也越接近正态分布。
πππ)nn(1n均较大时,答:错。当二项分布的和不太接近0或者1,随着的增大,πX X n 近似总体均数为的逐渐近似正态分布;较大,较小,二项分布的二项分布的μπππX nnn= 既近较小并且的Poisson 分布,只有较大、较大时,二项分布的似
πX n 所近似的较大、较小时二项分布的Poisson 分布又近似正态分布,其本质是当μπn= 较大时逼近正态分布。Poisson 分布在其总体均数2. 从同一新生儿总体(无限总体)中随机抽样200 人,其中新生儿窒息人数服从二项
分布。
π是相同的并且相互独立,对于随机抽答:对。因为可以假定每个新生发生窒息的概率π)(n,X B。服从二项分布取200 人,新生儿窒息人数πnπ保持常数时的二项分布的极限分布是趋向无穷大、总体比例趋向于0,且3. 在n
Poisson 分布。
答:对。这是二项分布的性质。
4. 某一放射物体,以一分钟为单位的放射性计数为50,40,30,30,10,如果以5 分
160钟为时间单位,其标准差为5 。
μi X = 1,2,3,4,5,并且相互独立。根据的答:错。设服从总体均数为Poisson 分布,i
μ5X + X + + + X X X ,服从总体均数为分布的可加性,Poisson ___________其总体1 2 3 4 5
方差为
μμ50 + 40 + 30 + 30 +10 = 16055,所以其标准,本题 5 分钟的总体方差的估计值为160 。差为
5. 一个放射性物体一分钟脉冲数为20 次,另一个放射性物体一分钟脉冲数为50 次。
假定两种放射性物体的脉冲性质相同,并且两种放射性物体发生脉冲是相互独立的,
则这两种物体混合后,其一分钟脉冲数的总体均数估计值为70 次。
X + X ,这两种物体混合后的发生的脉冲数为混答:对。根据Poisson 分布的可加性,1 2
合后一分钟脉冲数的总体均数估计值为20+50=70 次。
X 表示次(可以认为服从Poisson 分布),用6. 一个放射性物体平均每分钟脉冲数为5
X 也服从Poisson 分钟的脉冲数,则分布。连续观察20
答:对,这是Poisson 分布的可加性。
X 表示次(可以认为服从Poisson 分布),用7. 一个放射性物体平均每分钟脉冲数为5
X 的总体均数和总体方差均为100 分钟的脉冲数,则次。连续观察20
答:对。Poisson 分布的可加性原理。
X 表示某个放射性物体的每分钟脉冲数,其平均每分钟脉冲数为5 次(可以认为8. 用Y Y 近似服从正表示连续观察20 服从Poisson 分布),用分钟的脉冲数,则可以认为X 近似服从正
态分布。态分布,但不能认为μ比较小的时候,Poisson 分布是一个偏态的分布,答:对。因为Y 的总体均数为100,当μ增大时,Poisson 分布会逐渐趋于对称。但是当二、选择题
1. 理论上,二项分布是一种B。
A 连续性分布
B 离散分布
C 均匀分布
D 标准正态分布
2. 在样本例数不变的情况下,下列何种情况时,二项分布越接近对称分布。C
π越大 B 样本率总体率P 越大 A
ππ越小 D 总体率总体率越接近 C
X 呈对数正态分医学上认为人的尿氟浓度以偏高为不正常,若正常人的尿氟浓度3.
Y X 的几何均数,尿氟浓度的95%参考值范围的界值计算公式是A 。布,= lgX , G 为lg ( ) Y + S + G S + G S lg ( ) Y + S D A B C X Y 1X Y 1X , X ,, X B(4, X , X ,, X 相互独立,并且4. 设。令均服从 1 2 10 1 2 10
Y = X + X ++ X ,则D1 2 10
Y Y 近似服从Poisson 分布A 近似服从二项分布B
Y Y ~ B(40,D C 近似服从正态分布X , X ,, X Poisson X , X ,, X 相互独立。令均服从 5. 设,并且1 2 10 1 2 10
Y = (X + X ++ X ) /10,则C1 2 10
Y B(10, Y Poisson(22)分布A 服从近似服从B
Y Y Poisson分布D C 服从近似服从正态分布
三、简答题
X Y Y a+bXσ=μ的总体均,令,则可以证明:1. 如果的总体均数为,总体标准差为X Y X 2 σ= μba+bμ的总体40 =的数为Poisson ,标准差为分布,请问:/。如果服从均数和标准差是多少
40 / 2。= ,总体标准差答:总体均数=20X Y X μ/2 是否服从Poisson Poisson 的分布,请问:分布为什么= 40 2. 设服从=Y X 。10,不等于总体方差=20的总体均数/2 = 答:不是的。因为
X X Y X μ/10,近似服从正态分布。令服从= =40 的Poisson 3. 设分布,可以认为Y 也近似服从正态分布试问:是否可以认为
Y 也近似常数仍服从正态分布,所以可以认为答:正态分布的随机变量乘以一个非0
服从正态分布。
P(X +1) / P(X )μX ,证明: 4. 设Poisson 服从均数为分布。请利用两个概率之比:的μμP(X )P(X )x < X > 1 X X 增大随着时,概率时,概率增大而增加;当当随着而减小。
答:
1
( 1)/( ) ( )/[ ] /( 1)
( 1)! !
x x
P X x P X x e e x
x x
μμμμμ+= + = = = +
+
, 显然,当
μμ11 x x < +1 < 时,对应由此得到,x 1
μ
>
+
P(X = x +1) / P(X = x) > 1,,所以
μ> ) X P(X X 时当,则率概着随增大而增加;明说
( 1)/( ) 1
1
P X x P X x
x x
μμ
= + = = < <
+
P(X )X Xμ增大而减时,概率随着,说明当>小。
升饮用水,1 个,如果随机抽取2 已知某饮用水的合格标准是每升水的大肠杆菌数≤5.
检测出大肠杆菌数的95%参考值范围是多少(提示考虑合格标准的总体均数最大值
为2 个/L,求95%参考值范围)。
答:由于合格标准的总体均数最大值为2 个/L,对于正常而言,大肠杆菌数越少越好,
所以这是单侧参考值范围。即求满足累计概率的不等式2
0 0
( | 2) 2
!
X X k
k k
P k e
k
μ
= =
ΣΣ≤= =
的最大X 的解。
X 0 1 2 3 4 5 6
P(X )
( )
X
k
P k
Σ=
X < 5个/L。根据上述计算得到X 的95%参考值范围是
第四章
一、是非题
X μμ。X 的总体均数为的总体均数也为,则样本均数1、设X μ。的总体均数也为答:对。