文档库 最新最全的文档下载
当前位置:文档库 › 医学统计学课后习题与答案

医学统计学课后习题与答案

医学统计学课后习题与答案
医学统计学课后习题与答案

医学统计学

第一章 绪论

答案

名词解释:

(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基

础上各观察单位(或个体)之间的差异。

(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本

是从总体中随机抽取的部分观察单位。

(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称

为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为

样本统计量。

(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误

差。

(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示

(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。

(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称

为计数资料。。

(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为

等级资料。

是非题:

1. ×

2. ×

3. ×

4. ×

5. √

6. √

7. ×

单选题:

1. C

2. E

3. D

4. C

5. D

6. B

第二章 计量资料统计描述及正态分布

答案

名词解释:

1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标

2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标

3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布

称为标准状态分布。

4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指

标范围称为指标的正常值范围。

填空题:

1. 计量,计数,等级

2. 设计,收集资料,分析资料,整理资料。

3. σ

μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

5. 47.5%

6.均数、标准差

7. 全距、方差、标准差、变异系数

8. σμ96.1± σμ58.2±

9. 全距 R

10. 检验水准、显著性水准、0.05、 0.01 (0.1)

11. 80% 90% 95% 99% 95%

12. 95% 99%

13. 集中趋势、离散趋势

14. 中位数

15. 同质基础,合理分组

16. 均数,均数,μ,σ,规律性

17. 标准差

18. 单位不同,均数相差较大

是非题:

1. ×

2. √

3. ×

4. ×

5. ×

6. √

7. √

8. √

9. √ 10. √

11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √

21. √

单选题:

1. B

2. D

3. C

4. A

5. C

6. D

7. E

8. A

9. C 10. D

11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C

21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D

31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B

41. C 42. B 43. D 44. C 45. B

问答题:

1.均数﹑几何均数和中位数的适用范围有何异同?

答:相同点,均表示计量资料集中趋势的指标。

不同点:表2-5.

表2-5 均数,几何均数和中位数的相异点

平 均 数 意 义 应用场合

均 数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布

几何均数 平均增减倍数 ①等比资料;②对数正态分布资料

中位数 位次居中的观 ①偏态资料;②分布不明资料;③分布一端或两

察值水平 端出现不确定值

2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系?

答:

1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,

反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某

百分位置的水平,最常用的百分位是P 50即中位数。多个百分位数结合使用,可

更全面地描述总体或样本的分布特征。

(2)计算:中位数和百分位数均可用同一公式计算,即

Px=L+(i/f x )(n ·x%-Σf L )

可根据研究目的选择不同的百分位数代入公式进行计算分析。

(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考

值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中

更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。

3.同一资料的标准差是否一定小于均数?

答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。

4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?

(1)样本含量的大小,样本含量越大,标准差越稳定。

(2)分组的多少

(3)分布形状的影响,偏态分布的标准差较近似正态分布大

(4)随机测量误差大小的影响

(5)研究总体中观察值之间变异程度大小

5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同?

(1) 概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的 连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边

对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示

方法不同,正态分布用N (μ,σ2)表示,标准正态分布用N (0,1)表示,对数

正态分布N (μlgX ,σ2lgX )表示。

(2) 应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。

②相异点:标准正态分布是标准正态变量u 的分布,标准正态曲线下的面积唯一

的由u 决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数

变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用

于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。

6.医学中参考值范围的含义是什么?确定的原则和方法是什么?

含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关

疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解

剖、生理、生化等数据绝大多数人的波动范围。

(2)原则:

① 抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结

果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为

稳定的样本为原则。

② 对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值

范围的前提。

③ 判定是否要分组(如男女、年龄、地区等) 确定正常值范围。

④ 决定取双侧范围值还是单侧范围值。

⑤ 选择适当的百分范围

⑥ 确定可疑范围

⑦ 估计界值

(3)方法:

① 百分位数法:P x =L+(i/f x )(n ·x%-Σf L )

② 正态分布法(对数正态分布): ()X lg X lg 1S u X lg S

u X α-α±±双侧

百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近

似正态分布(服从对数正态分布)的资料。

7.对称分布资料在“均数±1.96倍标准差”的范围内,也包括95%的观察值吗?

答:不一定。均数±1.96倍标准差是正态分布的分布规律,对称分布不一定是正

态分布。

计算题:

1. 某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:

4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71

5.69 4.12

4.56 4.37

5.39

6.30 5.21

7.22 5.54 3.93 5.21 6.51

5.18 5.77 4.79 5.12 5.20 5.10 4.70 4074 3.50 4.69

4.38 4.89 6.25

5.32 4.50 4.63 3.61 4.44 4.43 4.25

4.03

5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97

5.16 5.10 5.86 4.79 5.34 4.24 4.32 4.77

6.36 6.38

4.86

5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09

4.52 4.38 4.31 4.58

5.72

6.55 4.76 4.61 4.17 4.03

4.47 3.04 3.91 2.70 4.60 4.09

5.96 5.48 4.40 4.55

5.38 3.89 4.60 4.47 3.64 4.34 5.18

6.14 3.24 4.90

3.05

(1)编制频数分布表,简述其分布特征。

①找出最大值、最小值求全距(R):

全距=最大值-最小值=7.22-2.70=4.50(mmol/L)

②求组距:I=全距/组数=4.52/10=0.452≈0.5(mmol/L)

③分组段,划记(表1-1)

表2-6 某地101例30~49岁健康男子血清总胆固醇值划记表

组段(mmol/L) 划记频数

2.5~ 1

3.0~ 8

3.5~ 9

4.0~ 23

4.5~ 25

5.0~ 17

5.5~ 9

6.0~ 6

6.5~ 2

7.0~7.5 1

合计 101

由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。

表2-7 某地101例30~49岁健康男子血清总胆固醇值(mmol/L )X 、s 计算表

血清总胆 组中值 频数 fX fX 2

累计 累计频数

固醇值 X f 频数 (实际)

2.5~ 2.75 1 2.75 7.563 1 0.0099

3.0~ 3.25 8 26.00 8

4.500 9 0.0891

3.5~ 3.75 9 33.75 126.563 18 0.1782

4.0~ 4.25 23 97.75 41

5.438 41 0.4059

4.5~ 4.75 25 118.75 564.063 66 0.6535

5.0~ 5.25 17 89.25 468.563 83 0.8218

5.5~ 5.75 9 51.75 297.563 92 0.9109

6.0~ 6.25 6 3

7.50 234.375 98 0.9703

6.5~ 6.75 2 13.50 91.125 100 0.9901

7.0~7.5 7.25 1 7.25 52.563 101 1.0000 478.25 2242.315

注:Xu 为组段上限值 (2)计算均数X 、标准s 、变异系数CV 。

由上计算表1-2可见:=∑∑=f fX X /478.25/101=4.735(mmol/L )

1f f

/)fX (fX s 22-∑∑∑-∑=

1101101

/)25.478(313.23422--==0.882(mmol/L ) CV=x s /?100%=0.882/4.735?100%=18.627%

(3)计算中位数M ,并与均数X 比较,利用前表计算中位数M

M = L+(i/f 50)(n ?50%-Σf L )

=4.5+(0.5/25)(101?50%-41)=4.69(mmol/L )

本题算术均数为4.735(mmol/L ),与中位数4.69(mmol/L )很接近,这也是

资料服从正态分布的特征之一。

(4)计算P2.5及P97.5并与X ±1.96s 的范围比较。

P 2。5=3.0+(0.5/8)?(101?2.5%-1)=3.095(mmol/L )

P 97.5=6.5+(0.5/2)?(101?97.5%-98)=6.619(mmol/L ) ±X 1.96S =4.735±1.96?0.882=3.01~6.46(mmol/L )

用百分位数法求得101例30~49岁健康男子血清总胆固醇值95%分布范围

3.095~6.619(mmol/L ),与正态分布法求得的95%分布范围 3.01~6.46

(mmol/L )基本一致。

(5)分别考察±X 1S 、±X 1.96S 、±X 2.58S 范围内的实际频数与理论分布是否基

本一致(表1-3)

表2-8 某地101例30~49岁健康男子血清总胆固醇值理论分布与实际分布比较 us X ± 血清总胆固醇 实际分布 理论分布

人数 % % s X 1± 3.85~5.62 72 71.29 68.27

s X 96.1± 3.01~6.46 97 96.04 95.00

s X 58.2± 2.46~7.01 100 99.01 99.00

由上表, s X 1±范围内,实际分布与理论分布略有不同,而s X 96.1±、

s X 58.2±范围内,实际分布与理论分布基本一致。

(6)现测得一40岁男子的血清总胆固醇值为6.993(mmol/L ),若按95%正常值

范围估计,其血清总胆固醇值是否正常?估计该地30~49岁健康男子中,

还有百分之几的人血清总胆固醇值比他高?

前计算得95%正常值为3.01~6.46(mmol/L )现测得一40岁男子的血清总

胆固醇值为6.993(mmol/L ),在95%范围以外,故属于异常

u=(X-μ)/σ=(6.993-4.735)/0.882=2.56

因ф(2.56)=ф(-2.56),查表1得ф(-2.56)=0.0052

估计该地30~49健康男子中约有0.52%的人血清总胆固醇值比他高。

2.某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑 制抗体滴度资料如表2-9第(1)(2)栏。

表2-9 平均滴度计算表

抗体滴度 人数f 滴度倒数X1 lgX1 flgX1

(1) (2) (3) (4) (5)=(2)×(4)

1:8 2 8 0.9031 1.8062

1:16 6 16 1.2041 7.2247

1:32 5 32 1.5051 7.5257

1:64 10 64 1.8062 18.0618

1:128 4 128 2.1072 8.4288

1:256 2 256 2.4082 4.8165

1:512 1 512 2.7093 2.7093 合计 30 50.5730(1)试计算其平均滴度。

由表1-4得,G=lg-1(50.5730/30)=lg-11.6858=48.5

该站30名麻疹易感儿童经气溶胶免疫一个月后,测得血凝抑制抗体平均滴度为1:48.50

表2-10 平均滴度计算表

抗体滴度人数f 滴度倒数X

1 lgX

1

flgX

1

(1) (2) (3) (4) (5) = (2) (4)

1﹕8 2 8 0.9031 1.8062 1﹕16 6 16 1.2041 7.2247

1﹕32 5 32 1.5051 7.5257

1﹕64 10 64 1.8062 18.0618

1﹕128 4 128 2.1072 8.4288

1﹕256 2 256 2.4082 4.8165

1﹕512 1 512 2.7093 2.7093

合计 30 50.5730 (2)有人发现本例用抗体滴度稀释倍数和直接用滴度(原书误为倒数)算得对数值的标准差相同,为什么?

表2-11 滴度对数值计算表

抗体滴度X

2人数f lgX

2

flgX

2

1﹕8 2 -0.9031 -1.8062

1﹕16 6 -1.2041 -7.2247

1﹕32 5 -1.5051 -7.5257

1﹕64 10 -1.8062 -18.0618

1﹕128 4 -2.1072 -8.4288

1﹕256 2 -2.4082 -4.8165

1﹕512 1 -2.7093 -2.7093

合计 30 -50.5730 1)由表1-4中数据计算标准差为:slgx

1

=lg-10.4444=2.7823

2) 由表1-5中数据计算标准差为:slgx

2

=lg-10.4444=2.7823

直接用抗体滴度的对数lgx

2与稀释倍数的对数lgx

1

计算标准差是相等的,因

为由上表可见lgx

2=lg1-lgX

1

=-lgx

1

,而lgx

1

与-lgx

1

的离散程度是相同的,所以用

抗体滴度稀释倍数和直接用滴度算得对数值的标准差是相同的。

3. 50例链球菌咽峡炎患者的潜伏期如表2-12,说明用均数、中位数或几何均数,何者的代表性较好?并作计算。

表2-12 50例链球菌咽峡炎患者的潜伏期的中位数计算表

潜伏期(小时) 病例数f 累计频数

12~ 1 1

24~ 7 8

36~ 11 19

48~ 11 30

60~ 7

72~ 5

84~ 4

96~ 2

108~120 2

合计 50

本例目测频数分布为偏态分布,长尾拖向右侧,故为正偏态,宜用中位数及几何均数表示其平均水平。

如上表,经计算中位数,几何均数、算术均数分别为:

M=54.55(小时),G=54.08(小时),X=58.56(小时)显然,算术均数受长潜

伏期的影响使其偏大,中位数M与几何均数G接近,故描述链球菌咽峡炎患者潜伏期的集中趋势指标使用中位数M或几何均数G均可。

4.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含量如表2-13:

表2-13 238人发汞含量频数计算表

发汞值人数f 组中值X fX fX2累计频数累计频率(μmol/kg)

1.5~ 20

2.5 50.0 125.00 20 8.40

3.5~ 66

4.5 297.0 1336.50 86 36.10

5.5~ 60

6.5 390.0 2535.00 146 61.34

7.5~ 48 8.5 408.0 3468.00 194 81.50

9.5~ 18 10.5 189.0 1984.50 212 89.08

11.5~ 16 12.5 200.0 2500.00 228 95.80

13.5~ 6 14.5 87.0 1261.50 234 98.32

15.5~ 1 16.5 16.5 272.25 235 98.74

17.5~ 0 18.5 0.0 0.00 235 98.74

19.5~21.5 3 20.5 61.5 1260.75 238 100.00

合计 238 1699.0 14743.50

(1).说明此频数分布的特征:可见发汞值的频数分布高峰位于第2个组段。前

4个组段的频数占总频数的81.5%,长尾拖向右侧,呈极度正偏态。

(2). 计算均数和中位数M,何者较大?为什么?何者用语说明本资料的集中

位置较合适?

f

fX

X∑

=/=1699/238=7.139(μmol/kg)

M =L+(i/f

50)(n?50%-Σf

L

=5.5+2/60(238?50%-86)=6.6(μmol/kg)

由计算结果得知,M

X>其原因因为本例呈正态分布,均数计算结果受到少数较大发汞值的影响,使得X偏向大发汞值一边.本例用中位数描述偏态资

料的集中趋势较好,它不受两端较大值和极小值的影响.

(3). 选用何种指标描述其离散程度较好?

选用四分位数间距描述其离散程度较好.

(4). 估计该地居民发汞值的95%参考值范围

本资料应选用单侧95%上界值,本例是正偏态分布.而且样本含量较大, n=238,保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范围较为合适.

P

95=L+(i/f

95

)(n?95%-Σf

L

)

=11.5+(2/16)(238?95%-212)=13.2625(μmol/kg)

第三章均数的抽样误差与t检验

答案

填空题:

1. 标准误

2. 0.05,0.01

3. 假设检验,(显著性检验)

4. 两总体均数不同(越有理由说明有统计学意义)

5. 自由度大小

6. 一是准确度、二是精度

7. 抽样误差、样本均数、总体均数

8. 总体均数估计、假设检验

9. 第二类错误(Ⅱ型错误)β

是非题:

1.√

2.×

3.×

4.×

5.√

6.√

7.×

8.√

9.×10.√

11.√12.×13.√14.√15.√16.√17.√18.√19.×20.×

21.×22.×

单选题:

1. A

2. E

3. D

4. E

5. E

6. E

7. D

8. A

9. D 10.D 11.D 12.B 13.E 14.D 15.D 16.E 17.B 18.C 19.C 20.D 21.C

问答题:

1.标准差和标准误有何区别和联系?

表3-6 标准差与标准误的区别

标准差(α或s)标准误(x s

x a或)意义上描述一组变量值之间的离散趋势描述样本均数间的离散趋势

应用上 ① s 越小,表示变量值围绕 ① x s 越小,表示样本均数与

均值分布越密集,说明均数 总体均数越接近,说明样本

的代表性越好。 均数推断总体均数可靠性越大。

② 可用s u X a ±估计变量值分 ② 可用x s t X v a ,±估计总体

布范围 均数可信区间

与n 的关系 n 越大,s 越趋于稳定 n 越大,x s 越小

(2)联系

① 二者均是表示变异度大小的统计指标。

② 标准误n /x σ=σ与标准差大小成正比,与抽样例数n 的平方根成反

比。

③ 当n 一定时,同一份资料,标准差越大,标准误也越大。

2.可信区间和参考值范围有何不同?

参考值范围是指同质总体中个体变量值的分布范围,如X ±1.96s 说明有

95%的变量值分布在此范围内,它与标准差的大小有关,若个体变异越大,

该范围越宽,分布也就越散。而可信区间是指在可信度为(1-α)时,估

计总体参数可能存在的范围。即从同一总体中随机抽样,当n 一定时,每

抽一次即可得一个样本均值,以x s t X v a ,±计算可信区间,如95%可信区间,

类似的随机抽样进行一百次,平均有95次,即有95个可信区间包括了总

体均数,有5次没有包括括总体均数,5%是小概率事件,实际发生的可能

性很小,因此实际应用中就认为总体均数在求得的可信区间。这种估计方

法犯错误的可能性最大不超过5%。可信区间与标准误大小有关,标准误越

大,可信区间则越大。

3.假设检验和区间估计有何联系?

假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间

是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信

区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比

假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为

假设检验可得到P 值,比较精确地说明结论的概率保证,而可信区间只能告

诉我们在某α水准上有无统计意义,却不能像P 那样提供精确的概率。因此,

只有将二者有机地结合起来,相互补充,才是完整的分析。

4.假设检验时,一般当P <0.05时,则拒绝H 0,理论依据是什么?

假设检验时,当P <0.05,则拒绝Ho ,其理论依据是在Ho 成立的条件下, 出现大于等于现有检验统计量的概率P <0.05,它是小概率事件,即在一次 抽样中得到这么小概率是事件是不大可能发生的,因而拒绝它。由此可见, 假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于0.05。

5.t 检验和方差分析的应用条件有何异同?

(1)相同点:在均数比较中,t 检验和方差分析均要求各样本来自正态总体;各处理 组总体方差齐且各随机样本间相互独立,尤在小样本时更需注意。

(1) 不同点:t 检验仅用于两组资料的比较,除双侧检验外,尚可

进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方

差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。

6. 怎样正确使用单侧检验和双侧检验?

根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,两种可 能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心 其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有 探索性质时,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出效率 高,但应慎用。

7. 第一类错误与第二类错误的区别及联系何在?了解这两类错误有何实际意义?

(1)假设检验中Ⅰ、Ⅱ型错误的区别。

Ⅰ型错误是拒绝了实际上成立的Ho ,也称为“弃真”错误,用α表

示。统计推断时,根据研究者的要求来确定。

Ⅱ型错误是不拒绝实际上不成立的Ho ,也称为“存伪”错误,用β

表示。它只能与特定的H 1结合起来才有意义,一般难以确切估计。

(2)Ⅰ、Ⅱ型错误的联系。

① 当抽样例数一定时,α越大,β越小;反之,α越小,β越大。 ② 统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,

可适当增加样本含量。

③ 根据研究者要求,n 一定时,可通过确定α水平来控制β大小。

(3)了解两类错误的实际意义。

① 可用于样本含量的估计。

② 可用来计算可信度(1-α),表明统计推断可靠性的大小。

③ 可用于计算把握度(1-β),来评价检验方法的效能等。

④ 有助于研究者选择适当的检验水准。

⑤ 可以说明统计结论的概率保证。

计算题:

1. 某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表:

性别 例数 均数 标准差 标准值 变异系数(%) 标准误

红细胞数 男 360 4.66 0.58 4.84 12.45 0.0306 (×1012/L ) 女 225 4.18 0.29 4.33 6.94 0.0182 血红蛋白 男 360 134.5 7.1 140.2 5.28 0.3742 (1)说明女性的红细胞数与血红蛋白量的变异程度何者为大?

女性 CV RBC =S/x ×100%=0.29/4.18×100%=6.49%

CV HB =S/x ×100%=10.2/117.6×100%=8.67%

由上计算可知该地女性血红蛋白量比红细胞数变异度大

(2)分别计算男﹑女两项指标的抽样误差。

见上表最后一栏,标准误计算公式n s s x / 。

(3)试估计该地健康成年男﹑女红细胞数的均数。

健康成年男子红细胞数总体均数95%可信区间为: X ±1.96Sx=4.66±1.96×0.0306=4.60~4.72(1012/L )

其中n=360 故近似按υ=∞。同理健康成年女子红细胞数总体均数95%可信区

间为4.14~4.22(1012/L )

(4)该地健康成年男﹑女间血红蛋白含量有无差别?

Ho :μ男=μ女

H 1:μ男≠μ女

α=0.05 u=255/2.10360/2.7/)6.1175.134()/()(222121+-=--x x s X X =22.83

按υ=∞,查附表2,得P <0.0005,按α=0.05水准,拒绝Ho ,接受H 1,可

以认为男女间血红蛋白含量不同,男高于女。

2. 将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前及治疗后一个月

的血沉(mm/小时)如下表,问:

(1)甲,乙两药是否均有效?

(2)甲,乙两药的疗效有无差别?

表3-8 甲,乙两药治疗前后的血沉

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

病人号 1 2 3 4 5 6 7 8 9 10

甲 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

药 治疗前 10 13 6 11 10 7 8 8 5 9

治疗后 6 9 3 10 10 4 2 5 3 3

差 值 4 4 3 1 0 3 6 3 2 6

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

病人号 1 2 3 4 5 6 7 8 9 10

乙 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

药 治疗前 9 10 9 13 8 6 10 11 10 10

治疗后 6 3 5 3 3 5 8 2 7 4

差 值 3 7 4 10 5 1 2 9 3 6

━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

(1)甲,乙两药是否均有效?

经计算得:

甲药 d =3.2000(mm/h ) 乙药 d =5.0000(mm/h )

S d =1.9322(mm/h ) S d =2.9810(mm/h ) S d =0.6110(mm/h ) S d =0.9428(mm/h )

n=10 n=10

Ho :μd =0 Ho :μd =0

H 1:μd ≠0 H 1:μd ≠0

α=0.05 α=0.05

t (甲药)=d / S d =3.2000/0.6110=5.237

t (乙药)=d / S d =5.0000/0.9428=5.303

ν=9,查t 界值表,得P <0.001,按α=0.05水准,拒绝Ho ,接受H 1,故可认为

甲、乙两药均有效。

(2)甲,乙两药的疗效有无差别?

由表中资料分别求得治疗前后差值(见表3-8),再作两组比较。

H 0 :甲乙两药疗效相同

H 1 :甲乙两药疗效不同 α=0.05

3110.62

10109814.299322.192)1()1(22212222112=-+?+?=-+-+-=n n s n s n S C 1235

.12622.1)10/110/1(3110.6)/1/1(21221==+=+=-n n s S c d d 6022.11235

.10.52.32121-=-=-=-d d S d d t ν=18,查t 界值表,得0.20>P >0.10,按α=0.05水准,不拒绝Ho ,尚不 能

认为甲乙两药疗效有差别。

3. 将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如 下,问两组的平均效价有无差别?

标准株(11人)100 200 400 400 400 400 800 1600 1600 1600 3200

水生株(9人) 100 100 100 200 200 200 200 400 400

由题知:该资料服从对数正态分布,故得:

标准株 水生株

n=11 n=9 1lg x X =2.7936 2lg x X =2.2676

1lg x S =0.4520 2lg x S =0.2355

(1)两组方差齐性检验:

H 0:22

21σσ= H 1:22

21σσ≠ α =0.05

F=684.32355.0/4520.0/2222==小大S S

V 1 =10 V 2 =8 F 0.05(10,8)=4.30

查附表3,得P >0.05,按α=0.05水准,不拒绝Ho ,可以认为两总体方差齐。

(2)两组均数比较;

H 0 两总体几何均数相等

H 1 两总体几何均数不等

α=0.05

149

.3)9/111/1()]2911/()2355.0)19(4520.0)111[((2676

.27936.2)/1/1)(2/(])1()1[()/1/1(22212122221121212212121=+?-+-+--=+-+-+--=+-=-=

-n n n n s n s n X X n n S X X S X X t C X X

查t 界值表,得0.01>P >0.005,按α=0.05水准,拒绝Ho ,接受H 1,故可认为钩

端螺旋体病人的血清用标准株和水生株作凝溶试验,前者平均抗体效价高于后者

4. 表3-9为抽样调查资料,可做那些统计分析?

表3-9 某地健康成人的第一秒肺通气量(FEV1)(L )

FEV 1 人 数

男 女

2.0~ 1 4

2.5~ 3 8

3.0~ 11 23

3.5~ 27 33

4.0~ 36 20

4.5~ 26 10

5.0~ 10 2

5.5~ 3 0

6.0~6.5 1 0

合计 118 100

(1)统计描述。

由上表可见,男性调查118人,第1秒肺通气量分布为2.0~6.5,高峰位于4.0~

4.5组段内,以中间频数分布最多,两侧逐渐减少,左右基本对称,其频数分布可

见上表和下图。女性调查100人,第1秒肺通气量分布为2.0~2.5,高峰位于3.5~

4.0组段内,以中间频数分布最多,两侧逐渐减少,且左右大体对称,频数分布可

见表3-9和图3-1。

图3-1 某地健康成人第一秒肺通气量(FEV 1)(L )分布

由上表和图可见,男性分布范围较宽,右侧尾部面积向外延伸两个组段,高峰

位置高于女性,向右推移一个组段。

(2)计算集中与离散趋势指标,并对两组进行比较。

Ho :男女间第1秒肺通气量总体均数相同

H 1:男女间第1秒肺通气量总体均数不同

α=0.05

男性: n=118 1X =4.2373 s 1=0.6902

女性: n=100 2X =3.7250 s 2=0.6258

u=222121212121///)(/)(n s n S X X x x s X X +-=--

=(4.2373-3.7250)/100/6258.0118/6902.022+

=5.624

查t 界值表,v=∞,得P <0.001,按α=0.05水准,拒绝Ho ,接受H 1,故可认为

男女间第1秒肺通气量均数不同,男高于女。

(3)根据上述分析结果,分别确定95%参考值范围。

男性第1秒肺通气量单侧95%参考范围下限为:

s u X 05.0-=4.2373-1.645?0.6902=3.16 (L)

即可认为有95%的男性第1秒肺通气量不低于3.16(L )

女性第1秒肺通气量单侧95%参考范围下限为:

s u X 05.0-=3.7250-1.645?0.6258=2.69 (L)

即可认为有95%的女性第1秒肺通气量不低于2.69(L )

5. 某医师就表3-10资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前, 后

(接 种后两月)血清抗体(黄疸出血型)的变化。

表3-10 328例血清抗体滴度及统计量

抗体滴度的倒数 0 20 40 80 160 320 640 1280 X s x s

免疫前人数 211 27 19 24 25 19 3 76.1 111.7 6.17

免疫后人数 2 16 57 76 75 54 25 23 411.9 470.5 25.90

t=(411.91-76.1)/2217.69.25 =12.6>3,查t 界值故P <0.01,说明接种后血清抗体有增长。 试问:

(2) 本例属于何种类型设计?

本例属于自身配对设计。

(3) 统计处理上是否妥当?

统计处理上不妥当,因为:① 在整理资料过程中,未按配对设计整理,而是拆开 对子按成组设计整理,失去原设计的意义。② 统计描述指标使用不当,血清浓度 是按倍比稀释,不适合计算算术均数、标准差、因为有零值,也不宜计算几何均数。 对现已整理好的资料,可计算中位数表示平均水平,用四分位数间距表示离散趋势。 ③ 假设检验因本资料不宜计算均数,故对均数进行t 检验当然是不妥当的。

6.152例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计 和95%区间估计。

滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计

人 数 0 0 1 7 10 31 33 42 24 3 1 152

以滴度倒数X 的对数值求得X1gx =1.85965 ,Slgx=0.44245, n=152, 则点值

估计G=lg -1 1.85965=72.39

患儿病后血清抗体滴度倒数总体均数95%可信区间为

lg -1(Xlgx+1.96Slgx/√n)

= lg -1(1.85965+1.96×0.44245/√152)

= lg -1(1.78931276~1.92999206)

=61.5~85.11

7.某医院对9例慢性苯中毒患者用中草药抗苯1号治疗:

(1)得表 白细胞总数(×109/L ),问该药是否对患者的白细胞总数有影响?

表3-11 9例慢性苯中毒患者治疗前后的白细胞总数

病人号治疗前治疗后 d1

1 6.0 4.

2 1.8

2 4.8 5.4 -0.6

3 5.0 6.3 -1.3

4 3.4 3.8 -0.4

5 7.0 4.4 2.6

6 3.8 4.0 -0.2

7 6.0 5.9 0.1

8 3.5 8.0 -4.5

9 4.3 5.0 -0.7

H 0 该药对患者的白细胞总数无影响,即μ

d

=0

H

1 该药对患者的白细胞总数有影响,即μ

d

≠0 α=0.05

求得(前—后)差值d

i

经计算得:

d =0.3556 S d =1.9951 n=9

t=534

.0

)9

/

9551

.1

/(

3556

.0

)

/

/(

0=

-

=

-n

s

d

d

ν=8查附表2,t界值表,得P>0.5,按α=0.05水准,不拒绝Ho,尚不能认为该药对患者的白细胞总数有影响。

(2)同样得治疗后血小板比治疗前每人平均增加37.8×109/L,并算得t=4.1,问该药是否对患者的血小板有影响?

H 0 该药对患者的血小板无影响,即μ

d

=0

H

1 该药对患者的血小板有影响,即μ

d

≠0 α=0.05

d=37.8 t=4.1 ν=8

查附表2,t界值表,得0.005>P>0.002,按α=0.05水准,拒绝Ho,

接受H

1

,故可认为该药对患者的血小板有影响,可增加患者血小板。

(3)综合上述结果能否提出进一步研究意见/综合上述结果,提出以下建议:

①在此项研究中,从t检验结果来看,血小板治疗前后变化有意义,

而白细胞则无意义,可补充计算两项指标的95%可信区间,结合专

业知识,分析治疗前后指标差数有无实际意义。

②如有可能扩大样本,追踪观察该药对苯中毒患者的远期疗效

第四章方差分析

答案

填空题

1. 各样本是相互独立的随机样本,各样本来自正态总体,

处理组总体方差相等(方差齐性)

2. 总变异、组内变异、组间变异 SS总=SS组间+SS组内

3. q检验(又称Newman-Keuls法)

4. V总=SS组间+SS组内

是非题:

1.×

2.√

3.×

4.√

5.×

单选题:

1. B

2. D

3. E

4. B

5. C

6. A

7. C

8. C

计算题:

1.某湖水不同季节氯化物含量测定值如表2-4所示,问不同季节氯化物含量有无差

别?

表4-1:某湖水不同季节氯化物含量(mg/L)

春夏秋冬

22.6 19.1 18.9 19.0

22.8 22.8 13.6 16.9

21.0 24.5 17.2 17.6

16.9 18.0 15.1 14.8

20.0 15.2 16.6 13.1

21.9 18.4 14.2 16.9

21.5 20.1 16.7 16.2

21.2 21.2 19.6 14.8 ∑

167.9 159.3 131.9 129.3 588.4

∑Х

ij

n

8 8 8 8 32

i

X 20.99 19.91 16.49 16.16 8.39 3548.51 3231.95 2206.27 2114.11 11100.84 ∑Х2

ij

.5298 8.5555 4.5098 3.4712 5.0166

S2

i

(1)多组均数间比较:

表1: 方差分析表

变异来源 SS v MS F

总变异 281.635 31

组间变异 141.170 3 47.057 9.380

组内变异 140.465 28 5.017

查F界值表,得P<0.01,按0.05水准,拒绝H0,接受H1,故可认为不同季

节湖水中氯化物含量不同或不全相同。(2)各组均数间两两比较

H0 :μ

A =μ

B

H1 :μ

A ≠μ

B

α=0.05

表2 四个样本均数顺序排例

组别春夏秋冬X 20.99 19.91 16.49 1 位次 1 2 3 4

表3 四组均数两两比较q检验

对比组两均数之差组数 q值 P值

1与4 4.83 4 6.099 <0.01

1与3 4.50 3 5.682 <0.01 1与2 1.08 2 1.364 >0.05

2与4 3.75 3 4.735 <0.01 2与3 3.42 2 4.319 <0.01

3与4 0.33 2 0.417 >0.05 春与夏、秋与冬湖水中氯化物含量P>0.05,按α=0.05水准不拒绝Ho,即尚不能

认为春与夏、秋与冬季湖水中氯化物含量有差别。除这两对比组外,其它4组均P <0.01,按α=0.05水准,拒绝Ho,接受H1,即可认为春夏两季湖水中氯化物含

量高于秋冬两季。

2.试就表4-2资料说明大白鼠感染脊髓灰质炎病毒后,再作伤寒或白日咳预防接种是否会影响生存日数?

表4-2 各组大鼠接种后生存日数

伤寒百日咳对照

5 6 8

7 6 9

8 7 10

9 8 10

10 9 11

10 9 12

11 10 12

11 10 14

12 11 16 ∑

∑Хij 92 84 112 288 ni 10 10 10 30

i X 9.2 8.4 11.2 9.6

∑2ij X 886 732 1306 2924

2i s 4.400 2.933 5.733 4.3553

解Ⅰ:假定生存日数服从正态分布

(1)方差齐性检验:

Ho :三总体方差齐即2322

21σσσ== H 1:三总体方差不等或不全相等。

α=0.05

=--∑=)/()1(22k N n s s i i c 9(4.4+2.933+5.733)/(30-3)=4.3553

[])k N /(1)1n /(1)]1k (3/[11)s /s ln()1n (x i 2i 2c i 2

---∑?-+-∑= [][][]

)330/(19/13)13(3/11)733.5/3553.4ln()933.2/3553.4ln()4.4/3353.4ln(9--??-+++?= =0.9461

v=2,查附表9,X 2界值表,得0.75>P >0.50,按α=0.05水准,不拒绝

Ho ,故可认为三组资料总体方差齐。

(2)三组均数比较(表4-5)

Ho :大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等。 H 1:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全

相等

α=0.05

C=(∑∑Χij )2/n=2882/30=2764.8

SS 总=∑∑Χij 2-C=2924-2764.8=159.2

SS 组间=∑(∑Χij )2/ni-C

= [ 922+842+1122 ]/10-2764.8

= 41.6

SS 组内= SS 总-SS 组间=159.2-41.6=117.6 表4-5 方差分析表

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体与样本:总体就是根据研究目的确定的同质观察单位的全体。样 本就是从总体中随机抽取的部分观察单位。 (3) 参数与统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量与总体参数的差别称为抽样误 差。 (5) 概率:就是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 就是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1、 平均数 就是描述数据分布集中趋势(中心位置)与平均水平的指标 2、 标准差 就是描述数据分布离散程度(或变量变化的变异程度)的指标 3、 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4、 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4、 σ± σ96.1± σ58.2± 68、27% 95% 99% 5、 47、5% 6、均数、标准差 7、 全距、方差、标准差、变异系数

医学统计学习题答案1

习题答案 第一章思考题答案 1.某医生收治200名患者,随机分成2组,每组100人。一组用A药,另一组用B药。经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么? a)A药组的疗效高于B药组。(对,但不提倡这样说,原因是容易被误解) b)A药的疗效高于B药。(不对,这是针对总体而言的) 2.某校同一年级的A班和B班用同一试卷进行一次数学测验。经过盲态改卷后,公布成绩:A班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法是否正确,为什么? a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。(对) b)通过这次考试的平均成绩,说明B班的数学平均水平高于A班。(不对,一次考试只是一 次抽样的结果) c)对于评价两个班级的数学平均水平而言,这次考试成绩只是一次抽样观察结果,所以存 在抽样误差,不能仅凭这次考试的平均分差异推断两个班级的平均水平的高低。(对) d)对于研究两个班级的这次考试成绩而言,A班所有学生的这次考试成绩构成了一个总体 A,B班所有学生的这次考试成绩构成了一个总体B。(对) 3. 请根据变量和资料分类的定义,评议下列说法是否正确,为什么? a)如果变量取值中含有小数点,则该变量为连续型变量。(不对,离散型变量取值也可以定义为取值含有小数点) b)如果资料为离散型变量的取值,则该资料一定为分类资料。(不对,如白细胞计数,这是离散型的资料,但不具有分类性质) c)某研究者观察某个患者的24小时的心电图,发现该患者在这24小时中共有90个早博, 并记为90个早博/24小时,故该资料也有量纲。根据定义,应认为该资料为计量资料。 (本质上这是个体计数资料,但因为不具有分类意义,所以通常按计数资料进行统计分析)

医学统计学题库

1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0

医学统计学课后答案.

第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学练习题及答案_9

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学练习题及答案 一、单向选择题 1. 医学统计学研究的对象是 E. 有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 E. 依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D. 病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B. 能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是D. 数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E. 提供数据和描述数据的分布特征 1. 变异系数主要用于 A.比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是 E. 标准差 3. 某项指标95%医学参考值范围表示的是D. 在正常总体中有95%的人在此范围4.应用百分位数法估计参考值范围的条件是B.数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B的含量(mg/dl) 呈明显偏态分布,描述其个体差异的统计指标应使用 E.四分位数间距 1. 样本均数的标准误越小说明 E. 由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D. 个体差异 3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为C. 正态分布 4. 假设检验的目的是 D. 检验总体参数是 1 / 7

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学习题

《医学统计学》习题集 第一章绪论 1.下面的变量中,属于分类变量的是( B )。 A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血压 2.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料本属于( A )。 A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义 变量资料 % 第二章定量资料的统计描述 1.欲比较身高(cm)和体重(kg)哪个指标变异程度大,应采用(D )。 A.标准差 B.极差 C.四分位数间距 D.变异系数 2.已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>20,其潜伏期的平均水平约为( B )天。 . 3.调查测定某地107名正常人尿铅含量(mg/L)如下: 0~ 4~ 8~ 12~ 16~ 20~ |24~ 28~ 合计尿铅 含量 例数14 22 29 18 —15 6 1 2 107 (1)描述该资料的集中趋势,宜用(B )。 A.均数 B.中位数 C.几何均数 D.极差 (2)描述该资料的离散趋势,宜用(C )。 . A.极差 B.变异系数 C.四分位间距 D.标准差 第三章定性资料的统计描述 1.某医院某年住院病人中胃癌患者占5%,则( B )。

%是强度指标 B. 5%是频率指标 C. 5%是相对比指标 D. 5%是绝对数 — 2.某病患者120人,其中男性114人,女性6人,分别占95%与5%,则结论 为( D )。 A.该病男性易得 B.该病女性易得 C.该病男性、女性易患 程度相等 D.尚不能得出结论 3.一项新的治疗方法可延长病人的生命,但不能治愈该病,则最有可能 发生的情况是( A )。 A.该病的患病率增加 B.该病的患病率减少 C.该病的发病率增加 D.该病的发病率减少 - 4.某市有30万人口,2002年共发现2500名肺结核患者,全年总死亡人数为3000,其中肺结核死亡98人,要说明肺结核死亡的严重程度,最好应用()。 A. 肺结核的病死率 B.肺结核死亡人数 C.肺结核死亡率 D.肺结核死亡构成 第四章统计表与统计图 1.根据某地6-16岁学生近视情况的调查资料,反映患者的年龄分布可用 ()。 A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式条图 $ 2.表达某地两年几种疾病的患病率可用()。 A.直方图 B.单式条图 C.复式条图 D.线图 E.百分直条图 3.欲比较两家医疗机构近15年来床位数的增加速度,应当使用的统计图 为()。

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学课后答案解析

第二章 1?答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表 示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓开口”资料, 是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。 即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1?不灵敏;2?不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反 映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance , CV)亦称离散系数(coefficient of dispersion ), 为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百 分之几,它是对比的最简单形式。其计算公式为比二A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分 率(%。)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: 率.= 实际发生某现象的观察单位数迸比例基数(K) 可能发生某现象的观察单位总数 构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学试题及答案

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学(第六版马斌荣)课后答案 很全面

医学统计学(第六版) 课后答案 第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2 第三章正态分布与医学参考值范围 一、单项选择题 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A 二、计算与分析 1 2[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。又因血铅含量仅过大为异常,故应计算只有上限的单侧范围,即95P 。

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指 标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为×109/L ~×109/L ,其含义是 E. 该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是检验要求大样本资料

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学第二版高等教育出版社课后习题答案剖析

第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就

医学统计学习题参数估计基础

实习六参数估计基础 [实习目的与要求] 1、掌握均数及频率标准误的计算;掌握总体均数95%和99%置信区间的计算及适用条件; 掌握总体概率的95%和99%置信区间的计算及适用条件 2、熟悉t分布的特征。 (一)最佳选择题 1. 表示均数抽样误差大小的统计指标是________。 A. 标准差 B. 方差 C. 均数标准差 D. 变异系数 E. 样本标准误 S表示________。 2. x A. 总体均数 B. 样本均数的标准差 C. 总体均数离散程度 D. 变量x的离散程度 E. 变量x的可靠程度 3. 标准误越大,则表示此次抽样得到的样本频率_________。 A. 系统误差大 B. 可靠程度越大 C. 抽样误差越大 D. 可比性越差 E. 代表性越差 4. 要减小抽样误差,通常的做法是_________。 A. 适当增加样本例数 B. 将个体变异控制在一个范围内 C. 严格挑选观察对象 D. 增加抽样次数 E. 减小系统误差 5. 关于t分布的图形,下述那项是错误的______。 A. 当ν趋于∞时,标准正态分布是t分布的特例 B. 当ν逐渐增大,t分布逐渐逼近标准正态分布 C. ν越小,则t分布的尾部越高 D. t分布是一条以ν为中心左右对称的曲线 E. t分布是一簇曲线,故临界值因自由度的不同而不同 6. 已知某地25岁正常成年男性的平均收缩压为,从该地随机抽取20名25岁正常成年男性,测得其平均收缩压为。与不同,原因是_________。 A. 样本例数太少 B. 抽样误差 C. 总体均数不同 D. 系统误差 E. 个体差异太大 7. 从上题的同一地区中再随机抽取20名8岁男孩,测得其平均收缩压为,标准差为。与不同,原因是________。 A. 样本例数太少 B. 抽样误差 C. 总体均数不同 D. 系统误差 E. 样本均数不可比 8. 用上题的样本,估计该地8岁正常男孩的平均收缩压的95%的置信区间为_______。 A. ±19,2/05.0t? B. ±? C. ±19,2/05.0t?20 D.

医学统计学试题及答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

医学统计学课后习题答案

医学统计学课后习题答案 Revised by Jack on December 14,2020

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝 大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%

相关文档
相关文档 最新文档