文档库 最新最全的文档下载
当前位置:文档库 › 医学统计学历年考题及答案

医学统计学历年考题及答案

医学统计学历年考题及答案
医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计

简答

1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等

2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对?为什么?如果是你,用什么?

3 假设检验的基本思想和原则

4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么?

5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么?你的设计是什么?

6一型错误和二型错误的区别和联系

7什么是抽样误差?举例说明分类资料和数量资料的抽样误差

计算

1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值

(1)比较白天晚上血压有无差别(配对t检验计算)

(2)白天和晚上血压有无相关(相关分析)

(3)如何用白天血压估计晚上血压(回归分析)

2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)

(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)

3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析)

2008

1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等)

2. 医学统计中,将正态分布视为近似正态分布有哪几种情况?列出应用条件和公式

3. 数值资料的统计描述指标?公式?

4. 多元回归模型的基本形式?参数含义?回归效果的评价?

5. 什么叫截尾值?产生原因?举例说明

6. 一同学两样本率的比较用了卡方检验,你有什么建议?若不符合卡方检验的应用条件,你又有什么建议?他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议?

7. 一个三因素的2X2X2的析因设计的实验设计及分析思路

8. 给了一个数值资料:

小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值

小鼠的体重增加量也有十个值

(1)对体重增加量资料进行统计描述

(2)求饮食量和体重增加量的关系

(3)由体重增加量的样本估计其代表总体均数的可信区间

(4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间

(5)(3)和(4)中的可信区间有什么差别?

2006

1直线回归中的b与多元线性回归中的B有什么区别?多元线性回归中,是否可以用B来表示各自变量对因变量的影响?为什么?

2数值变量的完全随机设计的样本与总体的比较,配对设计的两样本的比较,成组设计两样本比较的统计分析思路

3统计分析中P.a,B以及1-B的意义

4给了一个单向有序资料,统计效应是有序的,他用了t检验,问你对不对,为什么?应该用什么统计方法,并写出统计思路

5有一个两样本的秩和检验的应用题,写思路,不要求计算

6生存分析中,有哪些非参数检验的方法?两个生存率的比较用什么检验?

7给了一个实验,测量抗体.

样本序列抗体滴度效应是否有效

1 1:40 + 是

2 1:160 ++ 是.

.

.

.就是几个表格,让你给每个列个表,并且应该用哪些指标来描述.

8正态分布,二项分布,poisson分布的可信区间

9有两个变量,让你说出分析它们相关的统计分析思路

10有个析因设计的题,让你写出检验的思路,好象是还要写出公式.

2005(研究生)

1.举例说明变量及变量类型。(10分)

答案:变量:在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,该特征称为变量。如身高、体重、疗效等

变量按其性质可分为两种类型:(1)数值变量:其变量值是定量的,表现为数值的大小,通常是使用仪器或某种尺度测定出来的,多有度量衡单位。如身高(cm)、体重(kg)、心律(次/min)、血压(mmHg)等。(2)分类变量:表现为互不相容的类别或属性,它又分为无序与有序两类:a.无序分类变量:是指所分类别或属性之间无程度或顺序上的差别,如:性别(男、女)血型(A、B、O、AB)等。b.有序分类变量:是指所分类别或属性之间有程度或顺序上的差别。如尿糖化验结果按-、+-、+、++、+++分类,疗效按治愈、好转、无效、恶化分组。

2.在假设检验过程中,若设定a为0.05,算得统计量后,得p值为0.015,按a=0.05的检验水准拒绝无效假设。请对这一结论做出适当的评论,并为此写例假设检验中p值的含义,以及p与a的关系。(10分)

答案:P值为0.015小于检验水准a(0.05),依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H

,接受H1,尚可以认为现有样本所代表的总体与已知总

体不相等。

P值的含义是指从H

所规定的总体中随机抽样时,获得等于及大于(负值为等于及小于)

,可认为现有样本所代表的总体现有样本统计量的概率。若p>a,按a检验水准不拒绝H

与已知总体的差别是由抽样误差造成的。若p<=a,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H0,接受H1;可认为从已知总体中抽到现有样本的可能性很小,该样本可能来自另一总体。

3.写出数值变量资料中完全随机设计的多个样本比较的统计分析思路(不必写出计算公式)。(15分)

答案:(1)统计描述:描述资料的类型:数值变量资料频数表

资料的分布:正态性检验 服从正态分布:均数、标准差(方差);不服从正态分布,服从对数正态分布:几何均数、几何标准差;偏态分布:中位数、四分位数间距 (2)统计推断:资料的设计类型:完全随机设计的多个样本比较 分布:正态性检验和方差齐性检验:(1)如果样本服从正态分布且方差齐,就用完全随机设计的多个样本的方差分析来作统计推断;(2)如果样本不服从正态分布或者方差不齐,经变量变换转换为正态分布方差齐,再用方差分析推断;(3)如果变量变换不能使样本服从正态分布且方差齐,就用秩和检验来做统计推断。 4. 写出两变量之间相关关系的分析思路。(15分) 答案:(1)绘制散点图:在直角坐标系内绘制散点图,看两变量之间有没有线性趋势,如果有就做相关分析。如果两变量都服从双变量正态分布,则做直线相关分析;如果不服从线性模型条件要求即不服从或总体未知的资料,则作Spearman 等级相关分析。或者进行曲线拟合。

(2)计算直线相关系数r 或者Spearman 秩相关系数r s 。 (3)对相关系数作假设检验,由于抽样误差的存在,即使从p=0的总体中做随机抽样误差,所得的R 值也不一定等于零,应对样本相关系数做假设检验。根据检验目的,检验假设为: H0:P=0;H1=/0.常用t 检验

,2

12

--=

=

n r r s

r t r

v=n-2,拒绝H0认为两变量间存在直线相关。

(4)总体相关系数的可信区间估计,先对相关系数做Z 变换,估计Z 的可信区间,其分布服从正态分布原理,,按正态分布原理100(1-a )%可信区间(3,3/-+--n u z n u z a a ),

再对Z 的可信区间上下限按r=tanh z 进行逆变换。

5.请利用下面的随机数字表将15只小白鼠完全随机的分配到甲、乙、丙3个实验组中,使各组例数相等。要求写出随机分配方案。(10分)

随机数字表(部分数据)

编号 1-10 11-20 21-30 31-40

41-50

1 2

2 17 68 65 81 68 95 2

3 92 35 87 02 22 57 51 61 09 43 95 06 58 2

4 82 03 47

2 19 36 27 59 46 1

3 79 93 37 55 39 77 32 77 09 85 52 05 30 62 47 83 51 62 74

3 16 77 23 02 77 09 61 87 25 21 28 06 2

4 2

5 93 1

6 71 13 59 78 23 05 4

7 47 25

4 78 43 76 71 61 20 44 90 32 64 97 67 63 99 61 46 38 03 93 22 69 81 21 99 21

5 03 28 28 2

6 08 73 3

7 32 04 05 69 30 16 09 05 8

8 6

9 58 28 99 35 07 44 75 47

答案:先把十五只动物按体重从小到大分别编号:1 2 3 4 5 6 7 8 9 10 11 12 13 14 15;在随机数字表任意指定某行某列,如

取第三行的1列开始,向下录入不重复的二位随机数字:16 77 23 02 09 61 87 25 21 28 06 24 93 71 13;

对应于十五只动物的编号,对随机数字有小到大编秩得出序号R 如下:5 13 7 1 3 11 14 9 6 10 2 8 15 12 4;并规定:一到五号分到甲试验组,六到十号分到乙组,十一到十五

号分到丙组;随机分配结果是:甲实验组动物有:1 4 5 11 15;乙组动物为:3 8 9 10 12 ;丙组动物有:2 6 7 13 14。

6. 某试验需在5%和15%两种氧浓度下进行,每种氧浓度下分别使用甲、乙、丙三种药物对K 562细胞进行抑制。此研究宜用何种试验设计,并写出设计方案;若每种实验条件下各观察4个独立的样品,共需多少样品(即样本含量)?(10分)

答案:此研究宜用析因试验设计,析因设计是一种多因素多水平交叉分组进行全面试验的设计方法,可以研究两个或两个以上因素多个水平的效应,也可以检验各因素间的交互作用;因本试验中有2个试验因素,即氧浓度和药物,一个因素有2个水平,另一个因素有3个水平,而且氧浓度和药物之间可能存在交互作用;因此选用析因试验设计。

设计方案:该试验是一个2X3的析因设计,共有2X3=6个试验组,用a1表示5%的氧浓度,a2表示15%的氧浓度;用b1表示甲药物。b2表示乙药物,b3表示丙药物。

先按随机分组的原则,将试验动物按随机化原则分配到各组,各组先进行不同试验因素的处理,间隔一段时间后,再把各组之间的处理方法交换,并统计处理的结果。分析两因素之间有无交互作用及其交互作用的性质。同时分析两个因素各个水平之间的效应来评价对细胞的抑制作用。 样本含量:2X3X4=24

7. 某研究者随机测定了某地100例健康成人血清NSE 酶(ug/l )含量,请你充分利用该资料所能提供的信息,写出全面的分析思路。(20分) 答案:(1)资料的类型,列频数表,观察分布类型和分布特征:经判断资料为数值变量资料,对该资料作正态性检验,如果资料服从正态分布,进行统计描述,用均数、标准差(方差)来描述资料;不服从正态分布,进行变量变换使其服从正态分布,若是服从对数正态分布,用几何均数、几何标准差来描述资料;若资料服从偏态分布,则用中位数、四分位数间距对资料进行统计描述。

统计描述:

(2)通过资料来估计制定医学参考值范围:比如估计该地健康成年人血清NSE 酶含量的上双侧95%(90%、99%)参考值范围,如果资料为正态分布资料,则95%医学参考值范围为(S X 96.1-,S X 96.1+);如果资料为对数正态分布资料,则95%医学参考值范围为

1lg -(X lgx -1.96x S lg ,X lgx +1.96x S lg );如果资料为偏态分布,则95%医学参考值范围为

(5.975.2~P P )。

(3)统计推断:参数估计包括均数的抽样误差即标准误:n

S

S x =

和总体均数的可信区间估计①σ未知且n 较小:可信区间为(X a X a S t X S t X νν,2/,2/,+-);②σ未知但n 足够大:(X a X a S u X S u X ,2/,2/,+-);③σ已知:(X a X a u X u X σσ,2/,2/,+-)。

8. 多元回归方程为:yhat=b0+b1x1+b2x2+…+bjxj+…+bpxp,其中bj 的名称是什么,它的意义是什么?若比较各自变量对因变量影响的大小,应通过什么统计量比较?判断多元线性回归分析的效果应看那些指标?(10分)

答案:bj 称为偏回归系数,意义是在其他自变量固定不变的条件下,自变量xi 每改变一个单位时所引起的因变量y 的平均改变量。

比较各自变量对因变量影响的大小,应通过bj 的大小来比较。

常用的多元线形回归分析的效果指标有决定系数R 2(是回归平方和占总平方和的比例,值越大,回归效果越好)、复相关系数(决定系数的算术平方根,反应应变量和自变量线性组合见得相关关系的密切程度R 越就接近1,线性关系越密切)、校正决定系数(越大回归效果越好)、剩余标准差(不能有m 个自变量的变化解释的Y 的变异,越小回归效果越好)等。

2001级七年制临床医学专业考试试题答案

1、同质:对研究指标影响较大的、可以控制得主要因素尽可能相同。 变异:同质基础上各观察单位的某变量值得差异称为变异。

2、均数的抽样误差:由抽样研究造成的样本均数与总体均数间的差异称为均数的抽样误差。

3、假设检验P 值含义:P 值是指从所规定得总体中随机抽样时,获得等于及大(负值时为等于及小于)现有样本统计量的概率。

若,按检验水准不拒绝,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的。若,依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝,接受;可认为从已知总体抽到现有样本得可能性很小,该样本可能来自另一总体。 4、变量及其变量类型:

变量:在搜集资料时,对每个观察单位得某项特征进行测量或观察,该特征称为变量。 变量类型:

1.数值变量其变量值是定量的,表现为数值得大小,通常用仪器或某种尺度测定出来,多有度量衡单位。由数值变量的测定值组成的资料称为数值变量资料或计数资料。如:身高、体重、心律、住院天数、血压等。

2.分类变量亦称定性变量,表现为互不相容的类别或属性。分类变量可分为无序与有序两类:

(1)无序分类分类是指所分类别或属性之间无程序或顺序上的差别。分析无序分类变量时,应先按类别分组,计各组的观察单位数,所得资料称为无序分类变量资料或计数资料。如:性别(男、女),血型(O 、A 、B 、AB )等。

(2)有序分类变量是指所分类别或属性之间无程序或顺序上的差别。分析有序分类变量时,应先按等级顺序分组,计各组的观察单位数,所得资料称为有序分类变量资料或等级资料。如:尿糖化验结果按-、±、+、++、+++分类,疗效按治愈、好转、无效、恶化分组。 二、

标准差:计算公式:()1

n s —∑-=

X X

(1) 表示观察值的变异程度

(2) 计算变异系数%100s

?=X

CV

(3) 确定医学参考值范围 (4) 计算标准误

(5) 与样本含量没有关系 标准误:计算公式:n

s s x =

(1) 估计均数的抽样误差的大小 (2) 估计总体均数可信区间 : (3) 进行假设检验 (4) 与样本含量成反比

三、1、t 分布,均数的区间估计:

1)δ未知且n 小:()

x 2x 2s t s t νανα,,,+-X X

2)δ未知,但n 足够大时(n>100),t 分布逼近u 分布:()

x 2x 2s u s u αα+-X X , 3)δ已知:()

x 2x 2u u σσαα+-X X ,

2、二项分布:当样本含量n 足够大,且样本率p 或1-p 均不太小,如np 与n (1-p )均

大于5时,样本率p 的抽样分布近似正态分布,总体率π的可信区间:()p 2p 2s u p s u p αα+-, 3、Poisson 分布:当样本阳性数X>50时,可按正态近似原理先求总体平均数μ的95%或99%可信区间:()

X u X X u X 22αα+-,

四、方差分析的应用条件:

1)各样本是相互独立的随机样本;2)个样本来自正态分布总体;3)各总体方差相等,即方差齐。

应用:1)两个或多个样本的均数间的比较;2)分析两个或多个因素间的交互作用;3)回归方程的线性假设检验;4)多元线性回归分析中偏回归系数的假设检验等。 五、该设计是2*4析因设计

设计方案如下,如图所示,可将八个样品随机分为下面的八组:

A1 A2 A3 A4 B1 A1B1 A2B1 A3B1 A4B1 B2 A1B2 A2B2 A3B2 A4B2

先为八个样品按取样先后标上1、2、3、4、5、6、7、8,再用随机数字表将其标上随机数字,(随机数字表略去)将随机数字排秩,按秩次的1到8,分别取从A1B1、A1B2、A2B1、...、A4B2。进行实验。

六、先将受试对象编号,再利用随机列表或随机数字表或计算机软件产生的随机数字,按某一行将受试对象编上随机数字,然后将其随机数字编秩,秩次为奇数的分为一组,秩次为偶数的分为一组进行实验。这就是完全随机设计两样本比较的分析思路。 其检验统计量t值是:

22

1

s s t 1X X X X --= , 2n n 21-+=ν 七、

非条件logisti 回归模型:

()(m m 22110m m 22110ex p 1ex p X X X X X X P ββββββββ+++++++++= ,

其中0β是常数项,m 21βββ 、为偏回归系数。

2002级临床医学七年制《医学统计学》期末考试题(A 卷)

一、试述标准差与标准误的联系与区别。

二、请以完全随机设计资料为例说明方差分析的基本思想。

三、在某次假设检验中, =α0.05,所得的概率为

四、研究人员调查了2005年某社区全部居民的全死因死亡及恶性肿瘤死亡人数(见表1),根据该资料可以得出哪些统计信息? (10分)

表1 某社区居民2005年死亡人口调查

年龄 人口数

全死因 死亡人数

恶性肿瘤 死亡人数 0?

82920 138 4 20?

46639 63 12 40?

28161 172 42 60?

9370 342 32 合计 167090

715 90

五、请解释多元线性回归分析中R 2和m y s 123?的统计学意义。

六、什么是随访资料中的截尾值?出现截尾值的原因有哪些?

七、中国人民解放军总后卫生部军需装备研究所研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉(用评分表示),且需要进行全搭配实验,应采用何种设计?需安排几个实验组?请写出设计方案。

八、今测得101名30~49岁的正常成年男子的血清总胆固醇(表2)。试根据此资料进行全面的统计分析。(10分)

血清胆固醇

(mmol/L) 频数

2.5~ 1

3.0~ 8 3.5~ 9

4.0~ 23 4.5~ 25

5.0~ 17 5.5~ 9

6.0~ 6 6.5~ 2

7.0~7.5 1

合 计

101 九、为了比较工人和农民的高血压患病率,随机调查了50~59岁的男性工人1281人,其中高血压患者386人;又随机调查了50~59岁的男性农民387人,其中高血压患者65人。问工人与农民的高血压患病率是否相同?

十、今测得10名男20岁男青年的身高与前臂长(表3),问二者有无线性相关关系,若有相关关系,其相关关系的密切程度及方向如何。(10分)

表3 10名男20岁男青年的身高与前臂长

编号

1 2 3 4 5 6 7 8 9 10

身高(cm)

170 173 160 155 173 188 178 183 180 165 前臂长(cm)

45 42 44 41 47 50 47 46 49 43

可能用到的界值: 860.18

,05.0=t , 833.19,05.0=t ,306.28

,205.0=t , 262.29

,205.0=t 。

2002级临床医学七年制《医学统计学》期末考试试题(A )参考答案

一、试述标准差与标准误的区别和联系 答:区别:

⑴意义:标准差是描述数据分布离散程度的指标;标准误是样本统计量的标准差。 ⑵公式:1

)(2--=

∑n X X

S ;n

S S

X

=

(2分)

⑶用途:标准差①用于表示数据离散程度的大小;②也可用于计算变异系数、估计频数分布、制定参考值范围、

进行质量控制;③很多统计处理方法中要用到标准差。

标准误①用于反映抽样误差的大小;②计算总体均数的可信区间;③统计处理方法的基础,如t 检验。

联系:标准误与标准差成正比;若标准差固定不变,可通过增加样本含量来减少抽样误差。 二、请以完全随机设计为例说明方差分析的基本思想

答:方差分析的基本思想就是把全部观察值间的变异----总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小。在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组

内变异:总SS 分解为组间SS 和组内SS ;总ν分解为组间ν和组内ν,得组间变异和组内变异分别为组间MS =组间

组间

νSS 和

组内MS =

组内

组内

νSS ,若各组的来自同一总体,则各组间的变异与组内变异一样,均由随机误差所致,组间MS =组内MS ,

F 值(组内

组间MS MS F

=

)服从F 分布,查F 界值表得到相应的P 值,然后根据所取的检验水准α做出推断结论。答案难

以统一,只要基本意思表达正确,均应给分,阅卷时需灵活掌握,注意把握尺度。 三、在某次假设检验中,检验水准为=α

0.05,所得的概率为

答:α称检验水准,是预先给定的概率值,它确定了小概率事件的标准;P 的含义是指从0H 规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率,即抽样误差的概率。将获得的概率P 与检验水准α进行比较可得出结论。本例=α0.05,

或不等。

四、研究人员调查了2005年某社区全部居民的全死因死亡及恶性肿瘤死亡人数(见表1),根据该资料可以得出哪些

统计信息?

答:可以得到以下统计信息:各年龄组人口构成比、各年龄组全死因构成比、恶性肿瘤死因构成比和各年龄组恶性肿瘤

死亡构成比、粗死亡率和年龄别死亡率、恶性肿瘤死亡率和年龄别恶性肿瘤死亡率。(不要求:肿瘤后的死亡人数占全死因死亡人数的比例、全死因寿命表死亡概率、全死因寿命表生存概率、去肿瘤死亡后的生存概率、去肿瘤死亡后的尚存人数、去肿瘤死亡后的死亡人数、去肿瘤死亡后的生存人年数、去肿瘤死亡后的生存总人年数、去肿瘤死亡后各年龄尚存者的平均预期寿命。)

五、请解释多元线性回归分析中R 2

和m y s 123?的统计学意义。

答:R 2

为决定系数,其意义是回归平方和回归SS 占总离均差平方和总SS 的比例,用R 2

可定量评价在y 的总变异中,

由x 变量组建立的线性回归方程所能解释的比例。m y s 123?为剩余标准差,可以说明估计值的精确度,剩余标准差越小,

表示回归方程的估计精度越高。

六、什么是随访资料中的截尾值?出现的原因有哪些?

答:由于某种原因使得部分病人不能随访到底,称之为截尾,从起点至截尾点所经历的时间称为截尾值。出现截尾值的原因主要有随访对象失访、治疗措施改变、研究工作结束时事件尚未发生等情况。

七、研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉(用评分表示),且需要进行全搭配实验,应采用何种设计?需安排几个实验组?请写出设计方案。

答:应采用2×2析因设计,需安排4个实验组。具体设计方案如下:

状态1 状态2 环境1 1 2 3 4 5 1 2 3 4 5 环境2

1 2 3 4 5

1 2 3 4 5

八、今测得101名30~49岁正常成年男子的血清总胆固醇(表2)。据此资料进行全面的统计分析。(10分) 答:⑴由频数表可看出,资料近似服从正态分布,可用均数和标准差描述其集中趋势和离散趋势。

74.4==∑∑f

fX X ,8816.01

)(2

2

=--

=

∑∑∑∑f

f

fX fX

S

⑵制定95%参考值范围:

⑶估计总体均数的可信区间:n=101>50

九、为了比较工人和农民的高血压患病率,随机调查了50~59岁的男性工人1281人,其中高血压患者386人;又随机调查了50~59岁的男性农民387人,其中高血压患者65人。问工人与农民的高血压患病率是否相同? 答:首先将资料整理成下表形式:

是否患高血压

是 否 合计 工人 386 895 1281 农民 65 322 387 合计

451

1217

1668

1.建立检验假设,确定检验水准

,:210ππ=H 工人与农民的高血压患病率相同 ,:210ππ≠H 工人与农民的高血压患病率不同

2.选定检验方法,计算检验统计量(可选用下列两种方法之一): (1)2

χ检验: (2)u 检验:

⑶确定P 值,作出推断结论

84.380.262>=χ,(或96.117.5>=u ),所以

P <0.05。拒绝0H ,接受1H ,可以认为工人和农民的高血

压患病率不同。

十、今测得10名男20岁男青年的身高与前臂长(表3),问二者有无线性相关关系,若有相关关系,其相关关系的密切程度及方向如何。(10分) ⑴作散点图(略) ⑵求相关系数

22610

1725

*45478541=-=xy l ,

5.9621017252985252=-=xx

l , 4.7810454206902

=-=yy l

⑶相关系数的假设检验 ①,0:0

=ρH 两变量间无线性相关关系

,:01≠ρH 两变量间有线性相关关系

05.48

82.0182.02

12

2

=-=

--=

n r r t

③,860.1>t

所以P <0.05,拒绝0H ,接受1H ,可以认为两变量间存在线性相关关系,并且呈正相关,即身高越

长,前臂长越长。

2002级临床医学七年制《医学统计学》期末考试题(B 卷)

一、试述t 分布与u 分布的联系与区别。

二、请以完全随机设计资料为例说明方差分析的基本思想。 三、什么是假设检验的检验效能?其大小与哪些因素有关系?

四、某医师对一组高血压病人在治疗过程中作追踪观察,记录其死因,并与未作治疗的高血压病人组作比较,两组死因构成比见表1。有人据此提出:“高血压患者经过治疗虽然可以降低充血性心力衰竭等的病死率,但却使因冠状动脉硬化性心脏病和心脏病猝死的死亡危险性增加了。”这样的认识是否正确,为什么?

死 亡 原 因 治疗组 未治疗组

充血性心力衰竭

4.3 23.2 脑血管病

23.2 39.6 尿毒症

9.8 12.2 冠状动脉病和心脏病猝

48.7 17.1 其它原因

14.0 7.9 合 计

100.0 100.0 五、请分别解释Logistic 回归模型和Cox 回归模型中偏回归系数的意义。 六、生存时间资料有哪些特点?生存分析常用的分析方法有哪些?

七、某研究室人员为研究5个不同剂量的甲状腺提取液对豚鼠甲状腺重的影响,考虑到豚鼠的种系和体重对观测指标可能有一定的影响,选用5个种系的豚鼠作实验,并按5个不同的体重标准选择受试对象,根据专业知识得知,药液、豚鼠种系、体重之间不存在交互作用。本研究应采用何种设计类型?共需多少只豚鼠?请写出实验设计方案。

八、今测得101名30~49岁的正常成年男子的血清总胆固醇(表2)。试根据此资料进行

全面的统计分析。(10分)

血清胆固醇(mmol/L) 频数

2.5~ 1

3.0~ 8 3.5~ 9

4.0~ 23 4.5~ 25

5.0~ 17 5.5~ 9

6.0~ 6 6.5~ 2

7.0~7.5 1 合 计 101

九、某医院收集了305例手术患者的资料,其中手术时间≥5小时者242人,感染者13人;手术时间<5小时者63人,感染者7人。试据此分析手术时间长短对患者切口感染是否有影响?

十、某地10名一年级女大学生的胸围(cm )与肺活量(L )数据如表3所示,试进行直线回归分析。(10分)

学生编

号 1 2 3 4 5 6 7 8 9 10 胸围X

72.5

83.9

78.3

88.4

77.1

81.7

78.3

74.8

73.7

79.4

肺活量Y 2.51 3.11 1.91 3.28 2.83 2.86 3.16 1.91 2.98 3.28

可能有用到的界值: 860.18,05.0=t , 833.19,05.0=t ,306.28

,205.0=t , 262.29

,205.0=t 。

方差分析用F 界值: 32.5)8,1(05.0=F

2002级临床医学七年制《医学统计学》期末考试试题参考答案(B 卷)

一、试述t 分布与u 分布的异同与联系 (10分)

答:相同点: t 分布与u 分布均为以0为中心的单峰对称分布。

不同点:(1)t 分布是一个分布族,t 曲线的形状与自由度有关,自由度越小,t 值越分散,曲线越低平;自由度越大,t 值越往中间集中,曲线峰值越高。而u 分布即标准正态分布的图形,是唯一的一条曲线。

(2)特定自由度的t 分布曲线与u 分布曲线相比,峰值低而尾部高翘,相应区间内曲线下的面积小于u 分布。 联系:t 分布的极限形式是u 分布。随着自由度的增加,t 分布逐渐接近u 分布,当自由度???时,t 分布?u 分布。 二、请以完全随机设计为例说明方差分析的基本思想

答:方差分析的基本思想就是把全部观察值间的变异----总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小。在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组

内变异:总SS 分解为组间SS 和组内SS ;总ν分解为组间ν和组内ν,得组间变异和组内变异分别为组间MS =组间

组间

νSS 和

组内MS =

组内

组内

νSS ,若各组的来自同一总体,则各组间的变异与组内变异一样,均由随机误差所致,组间MS =组内MS ,

F 值(组内

组间MS MS F =

)服从F 分布,查F 界值表得到相应的P 值,然后根据所取的检验水准α做出推断结论。

三、什么是检验效能?其大小与哪些因素有关? (10分)

答:检验效能是指,在假设检验中,当无效假设H 0不正确时,用现有统计方法能够检验出其错误的能力,其概率用1-?表示。其中?为犯第二类错误即当H0不正确但不拒绝H 0的概率。

检验效能的大小与设定的检验水准?、样本含量n 、两总体参数的差值? 有关。其它条件一定时,?越大,检验效能越高;样本量n 越大,检验效能越高;两总体参数的差值? 越大,检验效能越高。反之,检验效能越低。 五、请分别解释Logistic 回归模型和Cox 回归模型中偏回归系数的意义。

答:Logistic 回归模型中的偏回归系数?i 的意义为,当其它协变量均不变时,x i 每变化一个单位或一个等级时, 比数比的自然对数(ln OR i ) 平均变化?i 个单位,可以反映x i 对结局事件的作用强度。

Cox 回归模型中的偏回归系数?i 的意义为,当其它协变量均不变时,x i 每变化一个单位或一个等级时, 相对危险度的自然对数(ln RR i ) 平均变化?i 个单位,可以反映x i 对结局事件的作用强度。

八、答:⑴由频数表可以看出,资料近似服从正态分布,可以用均数和标准差描述其集中趋势和离散趋势。

74.4==

∑∑f

fX X , 8816

.01

)(2

2=--

=

∑∑

∑∑f f

fX fX S

⑵制定95%参考值范围: ⑶估计总体均数的可信区间

九、答:首先将资料整理成下表形式:

手术时间 是否感染

是 否 合计 <5小时 13 229 242 ≥5小时 7 56 63 合计

20

285

305

1.建立检验假设,确定检验水准

,:210ππ=H 两组患者总体感染率相同 ,:210ππ≠H 两组患者总体感染率不同

2.选定检验方法,计算检验统计量(可用两法之一): (1)2

χ检验: (2)u 检验:

⑶确定P 值,作出推断结论

84.3832.12<=χ,(或96.1354.1<=u ),所以

P >0.05。按05.0=α

的检验水准, 不拒绝0H ,尚不能认

为手术时间长短对患者切口感染有影响。 十、答:⑴作散点图,散点图呈直线趋势。 ⑵求回归方程

3357.1110

83

.27*1.788618.2204=-

=xy l ,

029.21210

1.78819.623222

=-=xx

l , 3888.21083.278397.792

=-

=yy l

0535

.0029

.2123357

.11==

=

xx

xy l l b ,

4304

.181.780535.0783.2-=?-=-=x b y a 故回归方程为

X Y

0535.04304.1?+-=。

⑶回归方程的假设检验 ①,0:0

=βH 两变量间无线性关系

,:01≠βH 两变量间有线性关系

3888

.2==yy l SS 总, 91=-=n 总ν

6060.0029

.2123357.1122

====XX XY XY

l l bl SS 回归, 1=回归ν 72.28

7828.11

6060.0==

=

回MS MS F 。

③,)8,1(05.0F F

<所以P >0.05,不拒绝0H ,尚不能认为两变量间存在线性关系。

三、 常用的抽样分布及参数及其参数的区间估计

1 数值变量资料的n 分布和t 分布 总体均数u 的95%可信区间为

一,σ未知且n 小时,按t 分布原理计算:() 二,σ未知,但n 足够大时,t 分布逼近u 分布:() 三,σ已知时,按u 分布原理计算()

2 分类变量资料的二项分布和Poisson 分布 二项分布资料:总体率π的95%可信区间为

一,查表法:当样本含量n 较小,如n ≤50时,特别是p 原理0.5时。根据n 和阳性数X 查“百分率的可信区间”表

二,正态近似法:当样本含量n >50,且样本率p 或(1-p )均大于5时,p ±1.96Sp ,即(p-1.96Sp ,p+1.96Sp )

Poisson 分布资料:总体平均数(阳性数)u95%可信区间为

一,查表法,当样本计数X ≤50时,用X 值查Poisson 分布u 的可信区间 二,正太近似法:当样本阳性数X >50时,(X-1.96√X,X+1.96√X)

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

医学统计学题库

1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学试题及答案

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ~9.1×109 /L ,其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学试题及答案

医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

医学统计学选择题及答案个

医学统计学试题 姓名____________分数_________ 选择题(每个2分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差C标准差D四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A )A相对比 B 构成比C定基比D率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验(C) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )A n1+ n2 B n1+ n2–1 C n1+ n2 +1 D n1+ n2 -2 10、标准误反映(A)A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?(C) A tr>tb B trχ20.05,ν可认为(A) A各总体率不同或不全相同B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B.四格表校正检验 C t检验 D U 检验

(完整版)医学统计学试题及答案[1]

医学统计学试题及答案 医学试题精选2009-12-20 12:28:11 阅读6171 评论0 字号:大中小订阅 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2

医学统计学试题及答案完整版

医学统计学试题及答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

医学统计学试题及答案 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分 布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n 1和n 2 ,在进行成组设计资料的 t检验时,自由度是( D ) (A)n 1+ n 2 (B)n 1+ n 2 –1 (C)n 1+ n 2 +1 (D)n 1+ n 2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计 简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对为什么如果是你,用什么 3 假设检验的基本思想和原则 4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么 5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么你的设计是什么 6一型错误和二型错误的区别和联系 7什么是抽样误差举例说明分类资料和数量资料的抽样误差 计算 1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值 (1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析) (3)如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)

3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析) 2008 1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况列出应用条件和公式 3. 数值资料的统计描述指标公式 4. 多元回归模型的基本形式参数含义回归效果的评价 5. 什么叫截尾值产生原因举例说明 6. 一同学两样本率的比较用了卡方检验,你有什么建议若不符合卡方检验的应用条件,你又有什么建议他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值 (1)对体重增加量资料进行统计描述 (2)求饮食量和体重增加量的关系 (3)由体重增加量的样本估计其代表总体均数的可信区间 (4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5)(3)和(4)中的可信区间有什么差别

医学统计学模拟试卷及答案

(注:红色字体表示已经改正,多余表示删除的内容) 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验(C) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A) A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小

医学统计学练习题及答案

练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值B.脉搏数 C.住院天数D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是: (1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购臵一定精度的稳压器、恒温装臵等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,

重点医学统计学试题及答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数

C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数

(完整版)医学统计学题库

For personal use only in study and research; not for commercial use 第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A . 调查、录入数据、分析资料、撰写论文 B . 实验、录入数据、分析资料、撰写论文 C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据设计的不

相关文档
相关文档 最新文档