文档库 最新最全的文档下载
当前位置:文档库 › 医学统计学课后习题全

医学统计学课后习题全

医学统计学课后习题全
医学统计学课后习题全

第一章:单选题(5/5 分数)

1.统计学中所说的样本是指()。

.随意抽取的总体中任意部分.有意识的选择总体中的典型部分.依照研究者要求选取总体中有意义的一部分.依照随机原则抽取总体中有代表性的一部分.依照随机原则抽取总体中有代表性的一部分- 正确. 有目的的选择总体中的典型部分

2.下列资料属等级资料的是()。

.白细胞计数.住院天数.门急诊就诊人数.病人的病情分级.病人的病情分级- 正确. ABO血型分类

3.为了估计某年华北地区家庭年医疗费用的平均支出,从华北地区的5个城市随机抽样调查了1500户家庭,他们的平均年医疗费用支出是997元,标准差是391 元。该研究中研究者感兴趣的总体是()

.华北地区1500户家庭.华北地区的5个城市.华北地区1500户家庭的年医疗费用.华北地区所有家庭的年医疗费用.华北地区所有家庭的年医疗费用- 正确. 全国所有家庭的年医疗费用

4.欲了解研究人群中原发性高血压病(EH)的患病情况,某研究者调查了1043人,获得了文化程度(高中及以下、大学及以上)、高血压家族史(有、无)、月人均收入(元)、吸烟(不吸、偶尔吸、经常吸、每天)、饮酒(不饮、偶尔饮、经常饮、每天)、打鼾(不打鼾、打鼾)、脉压差(mmHg)、心率(次/分)等指标信息。则构成计数资料的指标有()

.文化程度、高血压家族史吸烟、饮酒、打鼾.月人均收入、脉压差、心率.文化程度、高血压家族史、打鼾.文化程度、高血压家族史、打鼾- 正确.吸烟、饮酒. 高血压家族史吸烟、饮酒、打鼾

5.总体是指()

.全部研究对象.全部研究对象中抽取的一部分.全部样本.全部研究指标. 全部同质研究对象的某个变量的值-正确

第二章-

单选题(10/10 分数)

1.描述一组偏态分布资料的变异度,以()指标较好。

. 全距. 标准差. 变异系数. 四分位数间距. 四分位数间距- 正确.方差

2.用均数和标准差可以全面描述()资料的特征。

. 正偏态分布. 负偏态分布. 正态分布. 正态分布- 正确. 对称分布.对数正态分布

3.各观察值均加(或减)同一数后()。

. 均数不变. 几何均数不变. 中位数不变. 标准差不变. 标准差不变- 正确.变异系数不变

4.比较某地1~2岁和5~5.5岁儿童身高的变异程度,宜用()。

. 极差. 四分位数间距. 方差.变异系数.变异系数- 正确.标准差

5.偏态分布宜用()描述其分布的集中趋势。

.均数. 标准差. 中位数. 中位数- 正确. 四分位数间距.方差

6. 各观察值同乘以一个不等于0的常数后,()不变。

.算术均数.标准差.几何均数.中位数.变异系数.变异系数- 正确

7.()分布的资料,均数等于中位数。

. 对数正态. 正偏态. 负偏态. 偏态.正态.正态- 正确

8. 对数正态分布是一种()分布。(说明:设变量经变换后服从正态分布,问变量属何种分布)

. 正态. 近似正态. 左偏态. 右偏态. 右偏态- 正确.对称

9.横轴上,标准正态曲线下从0到2.58的面积为()。

. 99%. 45%. 99.5%. 47.5%.49.5%.49.5%- 正确

10.当各观察值呈倍数变化(等比关系)时,平均数宜用()。

. 均数. 几何均数. 几何均数- 正确. 中位数. 相对数.四分位数

第三章

单选题

1.均数的标准误反映了( )。

. 个体变异程度的大小. 个体集中趋势的位置. 指标的分布特征. 频数的

分布特征. 样本均数与总体均数的差异?. 样本均数与总体均数的差异- 正确

2.两样本均数比较的t检验,差别有统计学意义时,P越小,说明( )。

.两样本均数差别越大.两总体均数差别越大.越有理由认为两总体均数不同?.

越有理由认为两总体均数不同 - 正确.越有理由认为两样本均数不同

.越有理由认

为两总体均数相同

.X 1=X2

.S12=S22

.作两样本t 检验,必然得出差异无统计学意义的结论

.

作两样本方差比较的F 检验,必然方差齐

.由甲、乙两样本均数之差求出的总体均数

95%可信区间,很可能包括0?.由甲、乙两样本均数之差求出的总体均数95%可信区间,很可能包括0 - 正确

A

B

C

D

E?E - 正确

5.某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L ,标准差为4g/L ,则其95%的参考值范围为( )。

.74±4×4.74±1.96×4?.74±1.96×4 - 不正确(统计专业认为这是正确答

案)

.74±2.58×4

.74±2.58×4÷10

. 74±1.96×4÷10

6.关于以0为中心的t 分布,叙述错误的是( )。

. t 分布图是一簇曲线. t 分布图是单峰分布.当v →∝,t →u . t 分布图以0

为中心,左右对称

.相同v 时,|t|越大,P 越大?.相同v 时,|t|越大,P 越大 - 正确

7.在两样本均数比较的t 检验中,无效假设为( )。

.两样本均数不等.两样本均数相等.两总体均数不等.两总体均数相等?.两

总体均数相等 - 正确

.样本均数等于总体均数

8.两样本均数比较作t 检验时,分别取以下检验水准,犯第二类错误概率最小的是( )。

.α=0.01.α=0.05.α=0.10.α=0.20.α=0.30?.α=0.30 - 正确

9.正态性检验,按α=0.10水准,认为总体服从正态分布,此时若推断有错,其错误的概率( )。

.大于0.10.小于0.10.等于0.10.等于β,而β未知?.等于β,而β未知

- 正确.等于1–β,而β未知

10.关于假设检验,说法是正确的( )。

.单侧检验优于双侧检验.若P>α,则接受H0犯错误的可能性很小.采用配对t 检验还是两样本t检验是由试验设计方案所决定的?.采用配对t检验还是两样本t检验是由

试验设计方案所决定的- 正确.检验水准α只能取0.05.用两样本u检验时,要求两总体方差齐性

第四章

D

C

D

A

A

A 5.完全随机设计方差分析中的组间均方是()的统计量。

表示抽样误差大小表示某处理因素的效应作用大小表示某处理因素的效应和随机误差两者综合影响的结果表示某处理因素的效应和随机误差两者综合影响的结果 - 正确表示N个数据的离散程度表示随机因素的效应大小

第五章

单选题

(6/6 分数)

. 同正态分布.同t分布.为对称分布.与自由度v有关?.与自由度v

有关- 正确.与样本含量n有关

A B C?C - 正确D E

3.当四格表的周边合计数不变时,如果某格的实际频数有变化,则其理论频数()。

. 增大. 减小. 不变?. 不变- 正确. 不确定. 随该格实际频数的增减而增减

. 两样本均数的比较?. 两样本均数的比较- 正确. 两样本率的比较. 多个样

本构成比的比较. 拟合优度检验. 两无序分类变量间关联性检验

A B C D?D - 正确 E

.各总体率不全等?.各总体率不全等- 正确. 各总体率均不等. 各样本率均不

等. 各样本率不全等. 至少有两个总体率相等

第六章

单选题

(6/6 分数)

A?A - 正确B C D E

A B C?C - 正确D E

A B C D E?E - 正确

A B C D E?E - 正确

A B C D?D - 正确 E

A B?

B - 正确

C

D E

第七章

单选题

(6/6 分数)

.A.B.C.D.E?.E - 正确

.A.B.C.D?.D - 正确.E

.A.B.C.D?.D - 正确.E

.A.B.C.D?.D - 正确.E

.A?.A - 正确.B.C.D.E

.A.B.C?.C - 正确.D.E

第八章

单选题

(7/7 分数)

1. 欲比较两地20年来冠心病和恶性肿瘤死亡率的上升速度,最好选用()。

. 普通线图. 半对数线图?. 半对数线图- 正确. 条图. 直方图. 圆图

.A.B.C.D?.D - 正确.E

3. 比较某地在两个年份几种传染病的发病率可用()。

. 构成比条图. 复式条图?. 复式条图- 正确. 线图. 直方图. 圆图

.A.B.C?.C - 正确.D.E

5. 表示某地区某年各种死因的构成比,可绘制()。

. 条图. 圆图?. 圆图- 正确. 直方图. 统计地图. 线图

6. 关于统计表的制作,不正确的叙述是()。

. 统计表不用竖线和斜线分隔表、标目和数据. 统计表的标题放在表的上方.

统计表包含的内容越多越好?. 统计表包含的内容越多越好- 正确. 统计表中的数字

按小数点位对齐. 统计表一般用纵标目和横标目说明数字的意义和单位

7. 关于统计图的制作,正确的叙述是()。

. 统计图的标题放在图的上方. 线图中的线条越多越好. 直条图的纵轴必须从

零开始?. 直条图的纵轴必须从零开始- 正确. 直方图的组距不必相等. 以上都不对

第九章单选题

(8/8 分数)

1.直线回归中,如果自变量X乘以一个不为0或1的常数,则有()。

.截距改变.回归系数改变?.回归系数改变- 正确.两者都改变.两者都不改

变.以上情况都可能

2.利用直线回归估计X值所对应Y值的均数可信区间时,()可以减小区间长度。

.增加样本含量.令X值接近其均数.减小剩余标准差. 减小可信度.以上都可以?.以上都可以- 正确

3.直线相关假设检验得到P>α,可认为()。

.两变量无关.两变量有关.两变量无直线关系?.两变量无直线关系- 正确

.两变量无曲线关系.两变量有曲线关系

.A.B.C?.C - 正确.D.E

.A.B?.B - 正确.C.D.E

.A.B.C.D?.D - 正确.E

7.用最小二乘法确定直线回归方程的原则是()。

.各观测点距直线的纵向距离相等.各观测点距直线的纵向距离平方和最小?.各

观测点距直线的纵向距离平方和最小- 正确.各观测点距直线的垂直距离相等.各

观测点距直线的垂直距离平方和最小.各观测点距直线的纵向距离最小

.A?.A - 正确.B.C.D.E

第十章

单选题

(4/4 分数)

1. 3×4析因设计表示()。

. 有3个因素,每个因素4个水平. 有4个因素,每个因素3个水平. 有2

个因素,分别有3个和4个水平?. 有2个因素,分别有3个和4个水平- 正确. 有

1个因素,共12个水平. 有12个因素,每个因素1个水平

. 实验次数16次,实验因素2个. 实验次数15次,实验因素2个.实验次

数16次,各因素2个水平?.实验次数16次,各因素2个水平- 正确. 实验次数15

次,各因素2个水平. 实验次数16次,实验因素2个,每个因素15个水平

3. 3×4析因设计资料进行方差分析时,总变异可分解为()。

.两部分变异.三部分变异.四部分变异?.四部分变异- 正确.五部分变异

. N-1部分变异

4. 3×4×4析因设计资料进行方差分析时,总变异可分解为()。

.三部分变异.四部分变异.五部分变异.六部分变异. 八部分变异

第十一章

单选题

(5/5 分数)

1、下列关于重复测量设计的说法,哪项是正确的。()。

. 同一个观察对象在不同时间点进行重复观察某项指标?. 同一个观察对象在不同时间

点进行重复观察某项指标- 正确. 不同观察对象在不同时间点进行重复观察某项指标

. 各组间的差别可以用最后一个时间点与第一个时间点观察指标间的差值进行对比分

析. 各观察时间点的观测值相互独立. 可以用完全随机区组的方差分析方法进行分析

2、重复测量设计时应遵循如下原则

. 随机分配各时间点的测量对象. 研究中可设置多个处理组,其中一个最好是平行

对照.明确规定重复测量的时间点,每个受试对象按规定时间点接受依次测量?.明确

规定重复测量的时间点,每个受试对象按规定时间点接受依次测量- 正确. 各时间点

的测量结果相互独立. 必须设立空白对照

3.重复测量数据的变异是()。

.干预引起的处理组间的差异.干预引起的处理组间的差异和每个观察对象前后观

察之间的差异.干预引起的处理组间的差异和每个观察对象前后观察之间的差异,以及

干预与测量时间之间的交互作用.干预引起的处理组间的差异和每个观察对象前后观察

之间的差异、干预与测量时间之间的交互作用,以及不同观察对象之间的个体差异. 干预引起的处理组间的差异和每个观察对象前后观察之间的差异、干预与测量时间之间的交互作用、不同观察对象之间的个体差异,以及同一观察对象不同时间点间的变异?. 干预引起的处理组间的差异和每个观察对象前后观察之间的差异、干预与测量时间之间的交互作用、不同观察对象之间的个体差异,以及同一观察对象不同时间点间的变异- 正确

4.重复测量数据的方差分析时,哪种说法是错误的()。

.计算处理组间差别F值时,分母用观察对象间的误差均方.计算不同时间点差别F

值时,分母用观察对象内的误差均方.计算干预与时间交互作用的F值时,分母用观察

对象内的误差均方.处理组间差别的F值说明处理效应.不同时间点差别F值说明处理效应?.不同时间点差别F值说明处理效应- 正确

5.关于无平行对照的单组重复测量数据,下列哪种说法正确()。

.单组重复测量数据观察对象内的重复测量点不能随机分配.在满足“球对称”假设的

情况下,单组重复测量数据的方差分析可用随机区组方差分析进行分析.在不满足“球对

称”假设的情况时,应用“球对称”系数对P值进行校正.如果不考虑单组重复测量数据是

否满足“球对称”假设,可采用多变量方差分析.以上都正确?.以上都正确- 正确

第十二章

单选题

(4/4 分数)

在降压药物疗效考核的临床试验中,病人的初始血压水平对服药一段时间后的血压下降量有影响,但病人的初始血压水平难以控制。为均衡病人的初始血压水平因素的影响,可考虑应用( )。

.t 检验.回归分析. 方差分析. 秩和检验. 协方差分析?. 协方差分析

- 正确

协方差分析应用条件

观察变量服从正态分布各观察变量相互独立各样本的总体方差齐性. 存

在应变量对协变量的线性回归关系且斜率相同. 以上都对?. 以上都对 - 正确

协方差分析中比较的是( )。

.均数.率.构成比.修正均数?.修正均数 - 正确. RR

协方差分析要求协变量是( )。

.连续变量?.连续变量 - 正确.离散变量.无序分类变量.有序分类变量.

以上都对 第十三章

单选题

(5/5 分数)

1、对重复测量设计资料的多变量分析的轮廓分析,检验两个总体的轮廓是否重合,应采用( )。

. 平行轮廓检验. 相合轮廓检验?. 相合轮廓检验 - 正确. 水平轮廓检验.

正态轮廓检验

. 线性轮廓检验

.A .B .C .D .E?.E - 正确

3.多变量方差分析适用于反应变量的类型为( )。

.正偏态分布变量.等级变量.分类变量.正态分布变量?.正态分布变量- 正

确.负偏态分布变量

4.研究者欲了解高血压患者与正常人有无差别,测量了其收缩压、舒张压和脉搏三个指标。适合的统计分析方法为()。

.多元线性回归方程.多元方差分析?.多元方差分析- 正确.条件logistic回归

分析.协方差分析.相关分析

5.如果用多次单变量分析来代替多变量分析,可能出现的结果是()。

.增大假阴性错误.减少假阴性错误.与多变量分析结果一致.减少假阳性错

误.增大假阳性错误

第十四章

单选题

(5/5 分数)

1.多元线性回归分析中,反映回归平方和在应变量的总离均差平方和中所占比重的统计量是()。

.复相关系数.偏相关系数.偏回归系数.决定系数?.决定系数- 正确

.标准化偏回归系数

.A.B?.B - 正确.C.D.E

3.在多元回归中,若对某个自变量的值都增加一个常数,则相应的偏回归系数()。

.不变?.不变- 正确.增加相同的常数.减少相同的常数.增加

但数值不定. 以上都正确

4. 在多元回归中,若对某个自变量的值都乘以一个相同的常数k,则()。

.该偏回归系数不变.该偏回归系数变为原来的1/k倍?.该偏回归系数变为原来

的1/k倍- 正确.所有偏回归系数均发生改变.该偏回归系数改变,但数值不定

.以上都正确

5.作多元回归分析时,若降低进入的界值,则进入方程的变量一般会()。

增多增多- 正确减少不变可增多也可减少以上都正确

第十五章

单选题

(5/5 分数)

1.Logistic回归分析的参数估计所用的方法是()

.最小二乘法.最小似然法.最大二乘法.最大似然法?.最大似然

法- 正确. 乘继极限法

.A.B.C.D?.D - 正确.E

3.研究是否患冠状动脉疾病与性别、年龄及ECG的关系,适合的统计分析方法为

.多元线性回归分析.判别分析.聚类分析.Cox回归分析

.logistic回归分析?.logistic回归分析- 正确

4.Logistic回归分析适用于应变量的类型为()。

.正偏态分布变量.负偏态分布变量.分类变量?.分类变量- 正确.正

态分布变量. 连续型变量

5.与Logistic回归模型的回归系数有关的指标是()。

.构成比.优势比?.优势比- 正确.生存率.相对危险度. 发病率

十六章--单选题?

(5/5 分数)

1.为了研究膀胱癌病人化疗后的生存情况,进行纵向随访收集资料时,以下哪一生存结局不能当删失数据处理( ):

.死于膀胱癌或其并发症?.死于膀胱癌或其并发症- 正确.死于意外事故.死

于其它肿瘤.因病人不配合主动退出. 以上都可作为删失数据

2.采用log-rank检验分析肺癌发病资料,其中吸烟、慢性支气管炎2个因素都有统计学意义,由此可认为( )。

.吸烟与肺癌有因果联系.慢性支气管炎与肺癌有因果联系.2个因素与肺癌

有因果联系.2个因素与肺癌有交互作用.2个因素都有可能是肺癌发病的危险因

素。?.2个因素都有可能是肺癌发病的危险因素。- 正确

3. log-rank检验与Breslow检验相比()。

.log-rank检验对随访早期的组间差别敏感.Breslow检验对随访早期的组间差

别敏感?.Breslow检验对随访早期的组间差别敏感- 正确.Breslow检验对随访后

期的组间差别敏感.二者对随访早期的组间差别同样敏感.二者对随访观察后期的组间差别同样敏感

4. Cox回归模型要求两个不同个体在不同时刻t的风险函数之比()。

.随时间增加而增加.随时间增加而减小.开始随时间增加而增加,后来随时

间增加而减小.不随时间改变?.不随时间改变- 正确.视具体情况而定

5.多元线性回归、Logistic回归和Cox比例风险回归分析都可用于()。

. 预测自变量. 预测应变量Y取某个值的概率P. 预测风险函数H. 筛选

影响因素(自变量)?. 筛选影响因素(自变量)- 正确. 克服共线性

第十七章---

单选题

(5/5 分数)

1.用于计量资料两类判别分析方法错误的是()

.Fisher判别.最大似然判别?.最大似然判别- 正确. Bayes线性判别.二

值回归判别.二分类logistic回归

2.一般而言,训练样本占总样本量的比例为()

.80%.85%?.85% - 正确. 90%.95%.75%

3.一般而言,验证样本占总样本量的比例为()

.10%.15%?.15% - 正确. 20%.25%.5%

4.Fisher判别是寻找合适的投影方向,将样本投影在该方向上,使得投影()

.类内的变异极小化,类间的变异极大化?.类内的变异极小化,类间的变异极大化- 正

确. 类内的变异极小化. 类内的变异极大化. 类间的变异极大化. 类间的变异极小化

5. 判别分析应注意的问题有()

. 样本足够大. 有较好的代表性. 样本的原始分类正确. 判别指标的选择

要适当. 以上都正确?

第十八章-

单选题

(4/4 分数)

.A.B.C.D?.D - 正确

2. Q型聚类的常用相似系数有()

. 欧氏距离. 绝对距离. 马氏距离. 以上都正确?. 以上都正确- 正确

3.系统聚类时,当类内含有两个或两个以上变量时,计算类间相似系数的方法有()

. 最大相似系数法. 重心法. 类平均法. 离差平方和法. 以上都正确?. 以上都正确- 正确

4. 系统聚类时,当类内含有两个或两个以上样品时,计算类间相似系数的方法有()

. 最大相似系数法. 最小相似系数法. 类平均法. 离差平方和法. 以

上都正确?. 以上都正确- 正确

第二十章

单选题

(5/5 分数)

1.下列那项评价方法属于按评价手段的分类

.定性评价?.定性评价- 正确.卫生评价.管理评价.中期评价

2.使用专家评分法进行评价指标的估计时,常用哪两种指标来估计权重分配的相对合理性

.擅长系数和确定系数.擅长系数和一致性系数?.擅长系数和一致性系数- 正确

.相关系数和确定系数.相关系数和一致性系数

3.医院工作质量指标通常由三层子指标构成,已知第一层的权重为0.6370,第二层权重为0.2970,第三层权重为1.0。由Saaty法提供的评价指标组合权重方法可知第三层的

组合权重为

.1.9340.0.9340.1.7636.0.1892?.0.1892 - 正确

4.以下哪一种综合评价方法是建立在专家评价法的基础上

.综合指数法.层次分析法.综合评分法?.综合评分法- 正确.TOPSIS 法

.m 为分组数.n 为指标数.y 为个体指标?.y 为个体指标 - 正确.以

上均正确 第二十一

单选题

(4/4 分数)

下列哪些状态不用量表测量。

.疼痛.失眠.心理压抑.认知障碍.血压?.血压 - 正确

量表具有的特性包括( )

.测评结果具有多维性.测评具有定量化特性.制作过程中的标准化特性.制

作过程中的规范化特性

.以上都对?.以上都对 - 正确

信度(reliability)是测量过程中( )误差造成的测定值的变异程度的大小。

.随机?.随机 - 正确.系统.过失.偏倚.相对

量表的考评方法包括

.定性考评.信度分析.效度分析.反应度分析.以上都对?.以上都对 -

正确 第二十二章

单选题

1. 在以试验组与对照组均数之差作为合并效应量的meta 分析中,合并效应量的95%可信区间下限如果大于零,则可认为

.试验组效应高于对照组?.试验组效应高于对照组 - 正确.对照组效应高于试验组

.两组效应相同

.只能认为两组效应不同

.无法确定

2. 在以试验组与对照组的比数比(OR )作为合并效应量的meta 分析中,合并效应量的95%可信区间包含1,则可认为

.试验组暴露程度高于对照组.对照组暴露程度高于试验组.两组暴露程度相同

.两组暴露程度不同.无法确定?.无法确定- 正确

3. 在meta分析的异质性检验中,若P小于0.05,则合并效应量的计算应选择

.固定效应模型.随机效应模型?.随机效应模型- 正确.计量指标采用固定效应

模型.分类指标采用随机效应模型.两种模型都适用

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体与样本:总体就是根据研究目的确定的同质观察单位的全体。样 本就是从总体中随机抽取的部分观察单位。 (3) 参数与统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量与总体参数的差别称为抽样误 差。 (5) 概率:就是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 就是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1、 平均数 就是描述数据分布集中趋势(中心位置)与平均水平的指标 2、 标准差 就是描述数据分布离散程度(或变量变化的变异程度)的指标 3、 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4、 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4、 σ± σ96.1± σ58.2± 68、27% 95% 99% 5、 47、5% 6、均数、标准差 7、 全距、方差、标准差、变异系数

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学课后答案.

第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学课后答案解析

第二章 1?答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表 示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓开口”资料, 是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。 即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1?不灵敏;2?不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反 映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance , CV)亦称离散系数(coefficient of dispersion ), 为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百 分之几,它是对比的最简单形式。其计算公式为比二A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分 率(%。)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: 率.= 实际发生某现象的观察单位数迸比例基数(K) 可能发生某现象的观察单位总数 构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学试题及答案

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

医学统计学知识点梳理

医学统计学知识点梳理 Revised as of 23 November 2020

医学统计学知识点梳理 医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。 统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。 统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征: ①参数估计:用样本的指标去推断总体相应的指标 ②假设检验:由样本的差异推断总体之间是否可能存在的差异 同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。 总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

医学统计学(第六版马斌荣)课后答案 很全面

医学统计学(第六版) 课后答案 第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2 第三章正态分布与医学参考值范围 一、单项选择题 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A 二、计算与分析 1 2[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。又因血铅含量仅过大为异常,故应计算只有上限的单侧范围,即95P 。

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指 标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为×109/L ~×109/L ,其含义是 E. 该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是检验要求大样本资料

医学统计学课后思考题答案(李晓松版)

第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。 2.简述调查设计的基本内容。 ①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。 3.试比较常用的四种概率抽样方法的优缺点。 (1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。 (2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。 (3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。 (4)整群抽样优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学试题及答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

医学统计学课后习题与答案

医学统计学 第一章绪论 答案 名词解释: (1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。 (2)总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。 (3)参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。 (5)概率:是描述随机事件发生的可能性大小的数值,用p表示 (6)计量资料:由一群个体的变量值构成的资料称为计量资料。 (7)计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。。 (8)等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。 是非题: 1.× 2.× 3.× 4.× 5.√ 6.√ 7.× 单选题: 1.C 2.E 3.D 4.C 5.D 6.B 第二章计量资料统计描述及正态分布 答案 名词解释: 1. 平均数是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1.计量,计数,等级

2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99% 5. 47.5% 6.均数、标准差 7. 全距、方差、标准差、变异系数 8. σμ96.1± σμ58.2± 9. 全距 R 10. 检验水准、显著性水准、0.05、 0.01 (0.1) 11. 80% 90% 95% 99% 95% 12. 95% 99% 13. 集中趋势、离散趋势 14. 中位数 15. 同质基础,合理分组 16. 均数,均数,μ,σ,规律性 17. 标准差 18. 单位不同,均数相差较大 是非题: 1. × 2. √ 3. × 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √ 11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √ 21. √ 单选题: 1. B 2. D 3. C 4. A 5. C 6. D 7. E 8. A 9. C 10. D 11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C 21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D 31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B 41. C 42. B 43. D 44. C 45. B 问答题: 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5.

医学统计学重点总结

<<医学统计学>>重点总结 1. 总体:根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。 2. 样本:按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。 3. 同质:影响研究指标的主要因素易控制的因素基本上相同。 4. 抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为。。。 5. 变量:观察指标在统计学上统称为指标变量,它反应的是生物个体间的变异情况,根据其性质可分为定性变量(分类)和定量变量(连续)。 6. 截尾数据:生存时间观察过程被人为的截止称为截尾,又称删失或终检。原因:失访/退出/ 终止(研究时限已到而终止观察)。 7. 卡方基本思想:X2分布是一种连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立,则A-T 一般不大,X2应很小,即出现大X2值概率很小。即X2越大,P越小,若P≤a时,就怀疑假设的成立,拒绝H0。若P>a则没有理由拒绝H0。 8. X2用途: (1)实际频数与拟合频数拟合优度:A推断两个或两个以上总体率或构成比有无差别(四格表/行x 列表)。B两变量之间有无相互关系。C频数分布的拟合优度检验(判断次样本是否来自某种分布)。(2)某些分布可用X2近似。 (3)间接应用:如t分布和F分布就是在X2分布基础上推导出来的。 9. 方差分析的基本思想:根据研究目的和设计类型,把总体变异中离均差平方和分解成两部分或更多部分,也把总变异中的自由度相应分成两部分或更多部分,然后再进行比较,评价由某种因素引起的变异是否具有统计学意义。 10. 假设检验中P,a,b(倍他)的关系及统计学意义: a:检验水准,即显著性检验,在此概率之下的认为是小概率事件,统计学上以为此事件“不可能发生”,以此判断是否不拒绝H0无效假设,在假设检验中,按a检验水准,拒绝了原来正确的H0,即犯了第1类错误,犯此错误的概率为a。 b:在T假设检验中,按照a检验标准,没有拒绝原来错误的无效假设,即犯了第2类错误,犯次错误的概率是b。 P:是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较,根据比较的结果作出统计判断。如果P≤a时,就怀疑假设的成立,拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0,接受H1的推论时犯错误的机会越小。 11.行x列表X2检验应注意: (1)行x列表中不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1,若发生上述情况可采用:A将理论频数过小的格子所在的行或列与性质相近的邻近行或列中的实际频数合并,使重新计算的理论频数增大。B删去理论频数过小的行或列。C增大样本含量以增大理论频数。 (2)当效应按强弱分为若干级别,则按实验结果可整理为单向有序行x列表,在比较各处理组的效应有无差别时,宜用秩和检验,ridit分析等。如作X2检验只说明各组构成比的差异有无统计学意义。

相关文档
相关文档 最新文档