文档库 最新最全的文档下载
当前位置:文档库 › 医学统计学

医学统计学

医学统计学
医学统计学

第一章绪论(p5)

练习题

-、单项选择题

1 医学统计学研究的对象是( )

A医学中的小概率事件 B.各种类型的数据

C.动物和人的本质

D.有变异的医学事物

E.疾病的预防与治疗

2用样本推论总体,具有代表性的样本通常指的是( )

A.总体中最容易获得的部分个体

B.在总体中随意抽取的任意个体

C.挑选总体中的有代表性的部分个体

D.用方法抽取的部分个体

E依照随机原则抽取总体中的部分个体

3下列观测结果属于有序数据的是( )

A.收缩压测量值

B.脉搏数

C住院天数D病情程度

E四种血型

4随机测量误差指的是( )

A.由某些固定的因素引起的误差B由不可预知的偶然因素引起的误差C.选择样本不当引起的误差D选择总体不当引起的误差

E.由操作失误引起的误差

5系统误差指的是( )

A.由某些固定的因素引起的误差

B.由操作失误引起的误差

C选择样本不当引起的误差 D.样本统计量与总体参数间的误差E.由不可预知的偶然因素引起的误差

6抽样误差指的是( )

A.由某些固定的因素引起的误差

B.由操作失误引起的误差

C选择样本不当引起的误差 D.样本统计量与总体参数间的误差E.由不可预知的偶然因素引起的误差

7,收集数据不可避免的误差是( )

A.随机误差

B.系统误差

C过失误差 D.记录误差

E.仪器故障误差

8统计学中所谓的总休通常指的是( )

A.自然界中的所有研究对象

B.概括性的研究结果

C同质观察单位的全体 D.所有的观察数据

E,具有代表性意义的数据

9统计学中所谓的样本通常指的是( )

A.可测量的生物性样品

B.统计量

C.某一变量的测量值

D.数据中有代表性的一部分

E总体中有代表性的部分观察单位

10.医学研究中抽样误差的主要来源是( )

A.测量仪器不够准确

B.检测出现错误

c.统计设计不合理 D.生物个体的变异

E.样本量不够

简答题

1.医学统计学的主要作用是什么?

2.医学统计学包括哪些基本内容?

3.统计描述与统计推断的主要特点是什么?

4.统计量与参数的差别是什么?

5.常见的三类误差是什么?应采取什么措施和方法加以控制?

6.研究尿激酶原治疗心肌梗死的疗效,以瑞替普酶作为对照,该项研究共包含几个总体?

第二章定量数据的统计描述(P16)

一、单项选择题

1 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是( )

A.中位数

B.几何均数

C.均数

D.P95百分位数

E.频数分布

2 算术均数与中位数相比,其特`点是( )

A不易受极端值的影响

B.能充分利用数据的信息

C.抽样误差较大

D.更适用于偏态分布资料

E更适用于分布不明确资料

3.将一组计量资料整理成频数表的主要目的是( )

A.化为计数资料

B.便于计算

C.提供原始数据

D.为能够更精确的检验

E.描述数据的分布特征

4.6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:160、1:320求平均滴度应选用的指标是( )

A.均数

B.几何均数

C.中位数

D.百分位数

E.倒数的均数

5.变异系数主要用于( )

A.比较不同计量指标的变异程度

B.衡量正态分布的变异程度

C.衡量测量的准确度

D.衡量偏态分布的变异程度

E.衡量样本抽样误差的大小

6.对于正态或近似正态分布的资料,描述其变异程度应选用的指标是( )

A.变异系数

B.离均差平方和

C极差

D.四分位数间距

E.标准差

7.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用( )

A 全距

B.标准差

C变异系数

D.方差

E.四分位数间距

8一组原始数据的分布呈正偏态分布,其数据的特点是( )

A数值离散度大

B.数值离散度小

C数值偏向较大的方向

D.数值偏向较小的方向

E数值分布不均匀

9对于正偏态分布总体,其均数与中位数的关系是( )

A均数与中位数相同

B.均数大于中位数

C均数小于中位数

D.两者有一定的数量关系

E两者的数量关系不定

10在衡量数据的变异度时,标准差与方差相比,其主要特点是( )

A标准差小于方差

B.标准差大于方差

C.标准差更容易计算

D.标准差更为准确

E标准差的计量单位与原始数据相同

二、计算与分析

1现测得10名乳腺癌患者化疗后血液尿素氮的含量(mm。l/L)分别为343,2~96,

4+~s,3rl~s,453,525,5“,3幽,4⒛,525,试计算其均数和中位数。

2某地10o例30?-00岁健康男子血清`总胆固醇值(mg,//d)坝刂定结果如下:

202 165 199 234 200 213 155 168 189 170 188 168 184 147 219 174 130 183 178 174

228 156 171 199 185 195 230 232 191 210 195 165 178 172 124 150 211 177 184 149

159 149 160 142 210 142 185 146 223 176 241 164 197 174 172 189 174 173 205 224

221 184 177 161 192 181 175 178 172 136 222 113 161 131 170 138 248 153 165 182

234 161 169 221 147 209 207 164 147 210 182 183 206 209 201 149 174 253 252 156

(1)编制频数分布表并画出直方图;

(2)根据频数表计算均值和中位数,并说明用哪一个指标比较合适;

(3)计算百分位数P5、P25、P75、P95。

3测得10名肝癌病人与16名正常人的血清乙型肝炎表面抗原(H厶Ag)滴度如下表, 试分别计算它们的平均滴度。

手术前后数据的变异情况较为合适。

第三章正态分布与医学参考值范围

1.正态曲线下,横轴上从均数到+∞的面积为()

A.50%

B.95%

C.97.5%

D.99%

E.不能确定(与标准差的大小有关)

2.标准正态分布的形状参数和位置参数分别为()

A .0,1 B.1,0 C.μ,σ D.σ,μ E.S ,Χ

3.正态分布的均数、中位数和几何均数之间的关系为()

A.均数与几何均数相等

B.均数与中位数相等

C.中位数与几何均数相等

D.均数、中位数、几何均数均不相等

E.均数、中位数、几何均数均相等

4.正常成年男子幽红细胞计数近似服从正态分布,已知Χ=4.78×10^12/L,s=0.38×10^12/L, z=(4.00-4.78)/0.38 =-2.05,1-Φ(z)=1-Φ(-2.05)=0.9798,则理论上红如胞计数为( )

A.高于4.78×10^12/L的成年男子占97.98%

B.低于4.78×10^12/L的成年男子占97.98%

C.高于4.00×10^12/L的成年男子占97.98%

D.低于4.00×10^12/L的成年男子占97.98%

E.在4.00×10^12/L至4.78×10^12/L的成年男子占97.98%

5.某项指标95%医学参考值范围表示的是( )

A.在此范围“异常”的概率大于或等于95%

B.在此范围“正常”的概率大于或等于95%

c。在“异常”总体中有95%的人在此范围之外

D.在“正常”总体中有95%的人在哔范围

E。在人群中检测指标有5%的可能超出此范围

6.确定某项指标的医学参考值范围时,“正常人”指的是( )

B。患过疾病但不影响研究指标的人

D.排除了影响研究指标的疾病或因素的人

B.在所有正常^中的波动范围

D.在少部分正常人中的波动范围

B∶用中位数来评价

D.用变异系数来评价

)

B.数据服从偏态分布

D.数据服从对称分布?

A.均数与几何均数相等

c.中位数与几何均数相等

A.用均数来评价

c.用几何均数来评价

E.用参考值范围来评价∷

9.应用百分位数法计算参考值谗围的条件是(

Λ.数据服从正态分布

c。有大样本数据

E.数据变异不能太大

A.从未患过疾病的人

c.排除了患过某种疾病的人

E=健康状况良好的人

7.某人群某项生化指标的医学参考值范围,该指杼指的是( )

A.在所有人中的涔动范围

`/c.在绝大部分正常人中的波动范围

E.在一个人不同时间的波动范围

8.要评价某地区=名5岁男孩的身高是否偏高,其统计学方法尽( )

芒粝某市1974年⒛8名居民的发汞含量(umd瓜g)如下,则该地居民发汞值的95%医学参考值范围是( ) ,

发汞值(∷nm。Vk宫) ”~

人数⒛

35~

66

55亠

60

75~

48

95≈

18

135~ 155~

6 1

175~ 195△215

0 3

A

C(凡5,Pq75)

E

计算分析题

1 已知健康男童的体重近似服从正态分布,某年某地150名12岁健康男童体重的均

数万=~sb~skg,标准差s=619炖,试估计:①该地12岁健康男童体重在50砾以上者占该地12岁健康男童总数的百分比;②该地12岁健康男童体重在30~40kg者占该地12岁健康男童总数的百分比;③该地⑽%的12岁健康男童体重集中在哪个范围;④估计该地12岁健

康男童体重的呖%参考值范围。

2某地⒛0例正常成年人血铅含量(um。l/L)的频数分布如下,试估计该地正常成年

人血铅含量的95%参考值范围。

B )P5

D X+196s

血铅含量(亠Ⅱol/1)∷⒐

频数7

o.24~∷0.48~

49 45

o.72~ 0~96~

32 28

1∶00-

14

2.16~ 2∶40~ 2,64~

1 2 1

医学统计学题库1

绪论知识点 1. 只要增加例数就可以避免抽样误差。 A. + B. – 2. 等级资料也可认为是一种计数资料。 A. + B. - 3. 概率的取值一定在0~1范围内,频率的取值则不一定。 A. + B. - 4. 客观事物中同质是相对的,变异是绝对的。 A. + B. - 5. 观察单位数不确定的总体称为有限总体。 A. + B. - 6. 统计量针对于样本,参数针对于总体。 A. + B. - 7. 统计描述就是用样本推断总体的统计过程。 A. + B. - 8. 有序分类资料就是等级资料。

A. + B. - 9. 统计分析一般包括统计描述和统计推断。 A. + B. - 10. 如果对全部研究对象都进行了调查或测定就没有抽样误差。 A. + B. - 11. 对于统计资料的描述可用统计指标和统计图表两种手段。 A. + B. - 12. 有序变量也称连续型变量,变量值可取连续不断的实数。 A. + B. - 13. 分类资料中的各类别必须互相排斥,不能相互包含。 A. + B. - 14. 离散变量在数值很大时可以取小数值,可近似地看成连续型变量。 A. + B. - 15. 统计指标是用来综合说明总体某一特征的,而标志是说明个体某一特征的。

A. + B. - 16. 若以舒张压>90mmHg为高血压,调查某地1000人中有多少个高 血压患者, 这是________。 a.计量资料b.还不能决定是计量资料还是计数资 料 c.计数资料d.既可作计量也可作计数资料 e.等级资料 17. 某医院用一种中草药治疗9名高血压病人,治疗前后的舒张压见 下表。 病 人号 1 2 3 4 5 6 7 治疗前 11 5 11 12 9 11 11 6 10 9 10 9 治疗后 11 6 90 10 8 92 90 11 0 87 欲比较治疗前后有无差异, 这是_________。 a.计量资料b.还不能决定是计量资料还是 计数资料 c.计数资料d.既可作计量也可作计数资料e.等级资料 18. 一批病人的血球沉降率(%)是________。 a.计量资料b.还不能决定是计量资料还是

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学教学大纲

医学统计学教学大纲 一、课程的性质、任务 《医学统计学》是开展医学研究的重要手段,是认识和揭示医学领域里各种数量特征的科学分析方法,是使医学科研得以成功的一种重要辅助工具。科技的迅速发展,大量信息的产生要求我们面对纷乱复杂的数据世界能够正确、科学地去认识和处理,医学统计分析是医学生教育培训必修课程,特别是中、高级医学人才的培养,应该使其懂得和掌握一些基本的医学科研设计原则或实验研究方法,能正确处理医学信息和数据,在未来的实践工作中发挥作用。医学统计是一种有力工具。它同科研的总体设计、资料采集、整理、分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。只有正确运用统计分析方法,才不致于造成不应有的缺陷或得出错误的结论。数据作为信息的主要载体广泛存在。我们就要借助统计学这个工具,在混沌中发现规律。统计学就是研究数据及其存在规律的科学。 (本大纲规定教学时数为62学时,理论讲授38学时,实习或讨论24学时) 二、课程教学目标 本教学大纲适用于大专检验专业学生。同学在具备一定医学基础知识后,再通过本课程的学习使学生理解和知道随着现代医学的发展,正确地运用统计学方法和理念,进行实验设计和实验数据处理,系统地学习统计学使学员对医学科研工作的认识和提高自身文化素质和业务水平,具有十分重要的实际意义。 大纲中应当体现理论联系实际的原则,教学过程中完全采用医学中的实例,讲述基本概念及基本原理,注意贯彻启发式教学原则,把统计思维方法的训练作为课堂教学的内容,对于统计公式着重讲解其意义、使用方法、应用条件和应用时注意事项,不必追究公式的数学原理和推导过程。本课程通过讲授、课堂实习、课堂讨论,使学生熟悉统计的基本理论、掌握统计方法的应用,通过课后复习、完成作业,加深对基本理论和基本概念的理解,进一步掌握基本方法。理论讲授38学时,实习或讨论24学时 【教学内容分作三级要求】 第一级是学生必须掌握的内容,教师应于理论课详细讲授,亦为实习课与考试的重点。 第二级是要求熟悉的内容,教师应选择性讲授,未讲授部分由学生自学。 第三级为一般了解内容,供学有余力的学生自学,教师亦可选择性讲授,但不在考试范围内。 三、教学内容和要求

医学统计学试题

医学统计学试题 一.选择题(每题 2分,共 20分) 1、有两个独立随机的样本,样本含量分别为n i和n2,在进行成组设计资料的检验时, 自由度是() A n i+n2 B 、n i+n2-i C 、n i+n2+i D 、n i+n2-2 标准误反映() A、抽样误差的大小 B、总体参数的波动大小 C、重复实验准确度的高低 D、数据的离散程度 3、最小二乘法是指各实测点到回归直线的() A、垂直距离的平方和最小 B、垂直距离最小 C、纵向距离的平方和最小 D、纵向距离最小 4、用样本推论总体,具有代表性的样本指的是() A、总体中最容易获得的部分个体 B、在总体中随意抽取任意个体 C、依照随机原则抽取总体中的部分个体 D、用配对方法抽取的部分个体 5、随机误差指的是() A、测量不准引起的误差 B、由操作失误引起的误差 C、选择样本不当引起的误差 D、由偶然因素引起的误差 6、某项指标 95%医学参考值范围表示的是() A、检测指标在此范围,判断“异常”正确的概率大于或等于 95% B、检测指标在此范围,判断“正常”正确的概率大于或等于 95% C、在“异常”总体中有 95%的人在此范围之外 D、在“正常”总体中有 95%的人在此范围 7、从甲、乙两文中,查到同类研究的两个率比较的X检验,甲文x> X o.oi,i, 文X> X o.05,1,可认为() A、两文结果完全相同 B、甲文结果更为可信 C、乙文结果更为可信 D、甲文说明总体的差异较大

8、两样本均数比较的 t 检验和 u 检验的主要差别是() A、t 检验只能用于小样本资料 B、u 检验要求大样本资料 C、t 检验要求数据方差相同 D、u 检验能用于两大样本均数比较 9、对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是() A、适用范围广 B、检验效能高 C、检验结果更准确 D、不易出现假阴性错误 10、两数值变量相关关系越强,表示() A、相关关系越大 B、相关系数越大 C、回归系数越大 D、相关系数检验统计量 t 值越大 [参考答案 ] 1-5:DACCD 6-10 :DBBAB 二.名词解释(每题 4分,共 20 分) 1、偏回归系数 2>n型错误: 3、非参数检验: 4、残差平方和 /剩余平方和: 5、率的标准误: [参考答案 ] 1. 表示其他自变量保持不变时,X j增加或减少一个单位引起的丫的变化量。 2. 指接受了实际上不成立的H0,即“存伪”的错误。U型错误的概率用B表示。 3. 不依赖于总体分布类型、不针对总体参数的检验方法,如假设两总体分布相同检 验统计量基于变量的秩等,这类检验方法称为非参数检验。 4. 指除 x 对 y 的线性影响外,其它所有因素对 y 变异的影响,即在总平方和中无 法用 x 与 y 的线性关系所能解释的部分变异,用以表示考虑回归关系后, y 的随机误差。 5. 指用以衡量由于抽样引起的样本率与总体率之间的误差的统计量。 三.简答题(每题 10分,共 30分) 1、什么是两个样本之间的可比性? [参考答案 ] 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 2、抽样中要求每一个样本应该具有哪三性? [参考答案 ]

常用医学统计学方法汇总

选择合适的统计学方法 1 连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t 检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t 检验;(2)采用非参数检验,如Wilcoxon 检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t '检验;(2)采用非参数检验,如Wilcoxon 检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t 检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon 的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1 资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果 为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe 法,SNK 法等。 1.3.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal -Wallis 法。如 果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用成组的Wilcoxon 检验。 1.4 多组随机区组样本比较 1.4.1 资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。 1.4.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman 检验法。如果 检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用符号配对的Wilcoxon 检验。 **** 需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。** 绝不能对其中的两 组直接采用t检验,这样即使得出结果也未必正确**

《医学统计学》复习题

医学统计学复习题 一、名词解释 1.总体:根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 4.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 5.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。 6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。 7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序资料。如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。 8.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 9.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 10. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 11.系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 12.参数:指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统

医学统计学 练习题

1、某医院用中药治疗7例再生障碍性贫血患者,现将血红蛋白(g/L)变化的数据列在下面,假定资料满足各种参数检验所要求的前提条件,问:治疗前后之间的差别有无显著性意义(15分) 患者编号1234567 治疗前血红蛋白65755076657268 治疗后血红蛋白821121258580105128 2、活动型结核患者的平均心率一般为86次/分,标准差为次/分。现有一医生测量了36名该院的活动型结核患者的心率,得心率均数为90次/分,标准差为次/分,试问该院活动型结核患者与一般活动型结核患者的心率有无差别 3、某医院将200名乙型肝炎患者随机分为甲、乙两组,各100人。甲组患者用常规治疗法,乙组患者用常规治疗加心理治疗,用一种权威评分法对两组患者的疗效进行评价,结果测得甲组均数为分,标准差为3分,乙组患者均数为分,标准差为4分,问心理治疗有无效果 4、某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记

录如下表,问左右肾重量有无不同 20例男性尸解时的左、右肾的称重记录 编号 左肾 (克) 右肾 (克) 编号 左肾 (克) 右肾 (克) 117015011155150 215514512110125 314010513140150 411510014145140 52352221512090 612511516130120 713012017105100 81451051895100 91051251910090 1014513520105125 5、为了研究冠心病与血总胆固醇有无关系,某医生随机收集得冠心病患者和健康人的血总胆固醇(mmol/L)数据如下表,请作分析。 冠心病患者和健康人的血总胆固醇(mmol/L) 组别例数均数标准差 冠心病患者45 健康人46

医学统计学案例分析(1)

案例分析—四格表确切概率法 【例1-5】为比较中西药治疗急性心肌梗塞的疗效,某医师将27例急性心肌梗塞患者随机分成两组,分别给予中药和西药治疗,结果见表1-4。经检验,得连续性校正χ2=3.134,P>0.05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。 表1-4 两种药物治疗急性心肌梗塞的疗效比较 药物有效无效合计有效率(%)中药12(9.33)2(4.67)1485.7 西药 6(8.67)7(4.33)1346.2 合计1892766.7【问题1-5】 (1)这是什么资料? (2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么? 【分析】 (1) 该资料是按中西药的治疗结果(有效、无效)分类的计数资料。 (2) 27例患者随机分配到中药组和西药组,属于完全随机设计方案。 (3) 患者总例数n=27<40,该医师用χ2检验是不正确的。当n<40或T<1时,不宜计算χ2值,需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率 案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取140例胃炎患者分成中药组和西药组,结果中药组治疗80例,有效64例,西药组治疗60例,有效35例。该医师采用成组t检验(有效=1,无效=0)进行假设检验,结果t=2.848,P=0.005,差异有统计学意义检验(有效=1,无效=0)进行进行假设检验,结果t=2.848,P=0.005,差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1)这是什么资料?(2)该资料属于何种设计方案? (3)该医师统计方法是否正确?为什么?(4)该资料应该用何种统计方法?【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料,即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料,不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的 X2检验(chi-square test)。 【例1-2】 2003年某医院用中药和西药治疗非典病人40人,结果见表1-1。 表1-1 中药和西药治疗非典病人有效率的比较 药物有效无效合计有效率(%) 中药西药14(11.2) 2 (4.8) 14(16.8) 10 (7.2) 28 12 50.0 16.7 步骤如下: 1.建立检验假设,确定检验水准 H 0:两药的有效率相等,即π 1 =π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2.计算检验统计量值 (1) 计算理论频数根据公式计算理论频数,填入表7-2的括号内。 (2) 计算χ2值 具体计算略。

医学统计学试题和答案.doc

医学统计学试题和答案

(一)单项选择题 3.抽样的目的是( b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C.研究典型案例研究误差 4.参数是指( b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的(a)。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用(a )。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中(d)可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用(c)描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后,(b)不变。 A.算术均数 B. 标准差 C. 几何均数 D.中位数 11.( a)分布的资料,均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.( c)小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是(c )。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数

《医学统计学》教学大纲

《流行病学》教学大纲供临床医学专业使用 锦州医学院教务处 2003年5月

《流行病学》教学大纲 适用专业: 临床医学 总学时:24,其中理论学时:18、实验学时:6 一、课程的性质和任务 流行病学(Epidemiology)是研究特定人群中与健康相关的状态和事件的分布和决定因素并用以控制健康问题的学科。近数十年来,随着危害人类生命和健康疾病谱的变化,随着医学模式由单纯生物学向生物学、心理学、社会医学相结合模式的转变,流行病学的研究对象、研究方法、研究内容也在不断发展。到现在为止,比较一致认可的流行病学定义为:流行病学是研究人群中疾病与健康状态的分布及其影响因素,制定和评价预防、控制和消灭疾病的对策和措施,并评价这些对策和措施的效果。其研究对象已由仅研究传染病扩大到非传染性疾病,又从疾病扩大、引伸到健康和与健康有关的事件;研究内容既包括了描述“分布”,分析“决定因素”,又包括了研究、提出、评价预防、保健的对策与措施。由此可见流行病学既是一门方法学,又是一门应用性很强的学科。其研究范围已包括了与人类疾病和健康有关的一切问题。 通过本课程的教学使学生掌握流行病学的基本原理、方法和技能,拓宽学生的思路,开阔学生的视野,提高学生能够应用流行病学方法,在疾病的预防、健康促进、病因研究和预防效果评价等方面独立分析问题和解决问题的能力,为今后从事疾病预防和控制工作打下基础。 二、相关课程的衔接 本门课程的前继课程是:基础医学相关课程、计算机基础和医学统计学。 三、教学的基本要求 教学目的 培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用,并了解相应的扩展知识和新进展知识,为学习预防医学各类卫生专业课程奠定流行病学理论基础,也为今后在卫生防疫实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。 教学要求 1、基本理论理论课教学要根据教学大纲的要求,重点突出教授基本理论和基本知识,详细讲授和解释,同时注意教授一定比例的扩展知识、新进展知识和实际应用知识,加强学生创新能力的培养,开拓思路、启发思维,调动学生的学习积极性。内容精练,条理清楚,合理使用教学设备和教具。也可根据本章节的特点规定学生必要的自学内容。

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ~9.1×109 /L ,其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料

医学统计学完整

对于均数为,标准差为的正态分布,95%的变量值分布范围为 A. - ~ + B. -1.96 ~ +1.96 C. -2.58 ~ +2.58 D. 0 ~ +1.96

10.从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A.总体中的个体值存在差别B.样本中的个体值存在差别 C.总体均数不等于0 D.样本均数不等于0 11从偏态总体抽样,当n足够大时(比如n > 60),样本均数的分布。 A. 仍为偏态分布 B. 近似对称分布 C. 近似正态分布 D. 近似对数正态分布 12某市250名8岁男孩体重有95%的人在18~30kg范围内,由此可推知此250名男孩体重的标准差大约为 A.2.0kg B.2.3kg C.3.1kg D.6.0kg 13.单因素方差分析中,造成各组均数不等的原因是 A.个体差异B.测量误差C.各处理组可能存在的差异D.以上都有 14.医学中确定参考值范围是应注意 A.正态分布资料不能用均数标准差法B.正态分布资料不能用百分位数法 C.偏态分布资料不能用均数标准差法D.偏态分布资料不能用百分位数法 15.方差分析中,当P<0.05时,则 A.可认为各总体均数都不相等B.可认为各样本均数都不相等 C.可认为各总体均数不等或不全相等D.以上都不对 16.两样本中的每个数据减同一常数后,再作其t检验,则 A.t值不变B.t值变小C.t值变大D.无法判断t值变大还是变小 17.在抽样研究中,当样本例数逐渐增多时 A.标准误逐渐加大B.标准误逐渐减小C.标准差逐渐加大D.标准差逐渐减小18.计算样本资料的标准差这个指标 A.不会比均数大B.不会比均数小C.决定于均数D.不决定于均数 19.各观察值均加(或减)同一个不等于0的数后 A.均数不变,标准差改变 B. 均数改变,标准差不变 C.两者均不变 D. 两者均改变 20.描述一组偏态分布资料的变异度,以下哪个指标为好 A.全距B.四分位数间距C.标准差D.变异系数 21.正态曲线的横轴上从均数到+1.96的面积为 A.95% B.45% C.47.5%D.97.5% 22.设同一组7岁男童的身高的均数是110cm,标准差是5cm,体重的均数是25kg,标准 差是3kg,则比较两者变异程度的结论为 A.身高的变异程度小于体重的变异程度B.身高的变异程度等于体重的变异程度

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体

均数不同 6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2(B)n1+ n2–1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C)

【免费下载】医学统计学课程教学大纲

《医学统计学》课程教学大纲 课程编号:140087 学分:1.5 总学时:34 大纲执笔人:刘艺敏大纲审核人: 一、课程性质与目的 使学生掌握医学统计学的基本理论知识、方法和技能,为其运用到医学实践,进行科学研究,学习其它课程和阅读专业书刊打下必要的统计学基础。 二、面向专业 临床医学专业、口腔医学专业五年制 采用多媒体演示教学和学生每人一台计算机操作,要求学生通过实习课重点掌握统计学的基本概念和不同资料的统计分析思路,同时要求学生基本掌握国际流行统计软件SAS或SPSS的使用方法,能用软件来完成课后的习题。并通过接触真实的科研资料,逐步引导学生提出分析思路、分析方法,直至用计算机软件完成统计分析的全过程。使学生在掌握统计学基本理论知识的基础上,进一步培养他们综合分析问题、动手解决问题的能力,拓宽学生的知识面,有利于学生实践能力和创新精神的培养。 三、课程基本要求 学习医学统计学应着重理解基本概念、基本理论,掌握收集资料、整理资料和分析资料的基本知识、基本技能。培养科学的统计思维方法。 四、实验基本要求 采用多媒体演示教学和学生每人一台计算机操作,要求学生通过实习课重点掌握统计学的基本概念和不同资料的统计分析思路,同时要求学生基本掌握能用软件来完成课后的习题。并通过接触真实的科研资料,逐步引导学生提出分析思路、分析方法,直至用计算机软件完成统计分析的全过程。使学生在掌握统计学基本理论知识的基础上,进一步培养他们综合分析问题、动手解决问题的能力,拓宽学生的知识面,有利于学生实践能力和创新精神的培养。 五、课程基本内容 第一章绪论 第一节统计学与医学统计方法 了解统计学与医学统计学的定义、医学统计学在医学研究中的应用。 第二节统计学基本概念 重点掌握内容:随机变量的概念及其分类-离散型变量及连续型变量;误差的定义,系统误差与随机误的概念;三种数据类型-计数资料、计量资料、等级资料及三者间的转换;总体与样本的概念,总体参数与样本统计量的概念,抽样误差的概念;概率与频率的概念。

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

医学统计学试题及答案完整版

医学统计学试题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

医学统计学试题及答案 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分 布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n 1和n 2 ,在进行成组设计资料的 t检验时,自由度是( D ) (A)n 1+ n 2 (B)n 1+ n 2 –1 (C)n 1+ n 2 +1 (D)n 1+ n 2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小

医学统计学重点总结教学提纲

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation ):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity ):对研究指标有影响的非实验因素相同。 4 总体(population ):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample ):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter ):总体的设计指标称为参数。 统计量(statistic ):样本的统计指标称为统计量。 6 变量(variable ):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean )简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G )适用于倍数关系变化,经对数转换后呈正态分布(如:抗 体滴度,血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -(n x f ∑lg ) 三 中位数(M )和百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距和频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距和频数,

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

相关文档