医学统计学重点复习题
一、两组计量资料比较(20分)
题干由试题和相关SPSS分析结果组成
1、根据资料选择正确的统计检验方法;
2、请写出假设检验步骤:检验假设,检验水准,根据SPSS结果选择正确的统计量值和P值、并作出结果判断。
3、说明:正态性检验提供K-S检验结果;方差齐性检验提供Levene’s检验结果。
正态性检验和方差齐性检验不必列出检验步骤,作出判断即可。
可能包括的内容:
配对:(1)将受试者配成相似的对,每对随机进行处理【u=0】
(2)同一种东西进行不同的处理
(3)治疗前,治疗后
成组:(1)计量资料,研究设计为完全随机【两组被试数目不同】
(2)方差齐性,t检验,不齐性,近似t检验【假设u1=u2】
●配对设计的两样本均数比较的t检验
●成组设计的两样本均数比较的t检验
●成组设计的两样本均数比较的近似t检验
●配对设计的两样本比较的符号秩和检验
●成组设计的两样本比较的秩和检验
举例:例2.17 某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X1和X2,试问两组的均数有无不同。
X1:3.14 5.83 7.35 4.62 4.05 5.08 4.98 4.22 4.35 2.35 2.89 2.16 5.55 5.94 4.40 5.35 3.80 4.12
X2:4.12 7.89 3.24 6.36 3.48 6.74 4.67 7.38 4.95 4.08 5.34 4.27 6.54 4.62 5.92 5.18
【答案】
1、此资料是计量资料,研究设计为完全随机设计 (又称成组设计);
2、根据正态性单样本K-S检验结果:P值分别为 0.992、0.987,均大于 0.1,因此两样本均服从正态分布;
3、根据方差齐性检验结果:F=0.225、P=0.638,P>0.05,因此两样本总体方差齐性;
4、根据以上三点,统计方法选用成组设计两样本 t检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:u1=u2,即两组的总体均数相同
H1:u1≠u2,即两组的总体均数不同
α=0.05
(2)计算检验统计量t值:
ν=18+16-2=32
t= -1.818
(3)确定 P值,做出统计推断:
P=0.078>0.05
根据α=0.05的检验水准,不拒绝 H0,差异无统计学意义。
因此尚不能认为慢性支气管炎患者和健康人尿17酮类固醇排出量有差别。
【06真题】
一、某医院外科用两种手术治疗肝癌患者 18例,患者采用随机方法分配到不同手术组,每例手术后生存月数如下表,问两种手术方法的术后生存月数有无差别?(20分)
甲法 2 3 4 4 5 5 6 8 10
乙法 5 8 9 11 12 12 13 15 19
要求:请写出上述题目假设检验过程:检验假设、检验水准、统计检验方法、检验统计量值和 P值,并作出结果判断(正态性检验和方差齐性检验不必列出检验步骤,作出判断即可)
【答案】
1、此资料是计量资料,研究设计为完全随机设计 (又称成组设计);
2、根据正态性单样本K-S检验结果:P值分别为 0.855、0.995,均大于0.1,因此两样本均服从正态分布;
3、根据方差齐性检验结果:F=1.161、P=0.297,P>0.05,因此两样本总体方差齐性;
4、根据以上三点,统计方法选用成组设计两样本 t检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:u1=u2,即两组的总体均数相同;H1:u1≠u2,即两组的总体均数不同;α=0.05
(2)计算检验统计量t值:
ν=9+9-2=16 t= -3.986
(3)确定 P值,做出统计推断:P=0.001<0.05
根据α=0.05的检验水准,拒绝 H0,接受H1,差异有统计学意义。
因此认为两种手术方法的术后生存月数有差别。
————————————————————————————————————————————————配对设计t检验【答案模板】
1、此资料是计量资料,研究设计为配对设计;
2、根据正态性单样本K-S检验结果:P值分别为 ?,大于0.1,因此差值服从正态分布;
3、根据以上两点,统计方法选用配对设计两样本t检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:ud=0,即两组的总体均数相同;H1:ud≠0,即两组的总体均数不同;α=0.05
(2)计算检验统计量t值:
ν=n-1=? t=?
(3)确定 P值,做出统计推断:
P=?<0.05 根据α=0.05的检验水准,拒绝 H0,接受H1,差异有统计学意义。因此认为两种?有差别。
P=?>0.05 根据α=0.05的检验水准,不拒绝 H0,差异无统计学意义。因此尚不能认为两种?有差别。
【05真题】【04真题】
一、随机抽样调查了某地绣品厂和蓄电池厂工人各 10名,测定其血中锌卟啉含量(μg/100ml)如下表。问这两个工厂工人血中锌卟啉含量有无差别?( 20分)某地绣品厂和蓄电池厂工人血中锌卟啉含量(μg/100ml)结果
绣品厂 12.1 42.9 0.0 0.0 11.1 25.0 0.0 26.3 9.1 25.0
蓄电池厂 72.5 75.3 28.3 60.0 70.5 73.1 60.0 20.0 20.0 32.6
要求:请写出上述题目假设检验过程:检验假设、检验水准、统计检验方法、检验统计量值和 P值,并作出结果判断(正态性检验和方差齐性检验不必列出检验步骤,作出判断即可)。SPSS软件有关分析结果见附页。
<0.05,方差不齐,近
似t检验
方差不齐,第二行
【答案1近似t检验】jszb
1、此资料是计量资料,研究设计为完全随机设计 (又称成组设计);
2、根据正态性单样本K-S检验结果:P值分别为 0.886、0.575,均大于 0.1,因此两样本均服从正态分布;
3、根据方差齐性检验结果:F7.45
4、P=0.014,P<0.05,因此两样本总体方差不齐;
4、根据以上三点,统计方法选用成组设计两样近似t检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:u1=u2,即两组的总体均数相同
H1:u1≠u2,即两组的总体均数不相同
α=0.05
(2)计算检验统计量t值:
t= -4.013
ν=14.960
(3)确定 P值,做出统计推断:
P=0.001<0.05
根据α=0.05的检验水准,拒绝 H0,接受H1,差异有统计学意义。
因此认为两个工厂工人血中锌卟啉含量有差别。
【答案2】成组设计秩和检验jszb
1、此资料是计量资料,研究设计为完全随机设计 (又称成组设计);
2、根据正态性单样本K-S检验结果:P值分别为 0.886、0.575,均大于 0.1,因此两样本均服从正态分布;
3、根据方差齐性检验结果:F7.45
4、P=0.014,P<0.05,因此两样本总体方差不齐;
4、根据以上三点,统计方法选用两独立样本比较的 Wilcoxon符号秩和检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
H0:两个工厂工人血中锌卟啉含量总体分布相同;
H1:两个工厂工人血中锌卟啉含量总体分布不同;
α=0.05
(2)计算检验统计量T值:
①统一编秩;②求秩和;③确定统计量T值。
T=65或 145
n1=10
n2-n1=0
(3)确定 P值,做出统计推断:
查 T界值表得 P<0.005
根据α=0.05的检验水准,拒绝 H0,接受H1,差异有统计学意义。
因此认为两个工厂工人血中锌卟啉含量有差别。————————————————————————————————————————————
配对设计秩和检验【答案模板】jszb
1、此资料是计量资料,研究设计为配对设计;
2、根据正态性单样本K-S检验结果:P值分别为 ?,小于0.1,因此差值不服从正态分布;
3、根据以上两点,统计方法选用配对秩和检验,既Wilcoxon符号秩和检验,其假设检验过程如下:
(1)建立假设检验,确立检验水准:
(2)计算检验统计量T值:
①求差值D;②编秩;③求秩和;④确定统计量T值。
(3)确定 P值,做出统计推断:
【知识点解析】Jszb 【正态性检验】
1、图示法:概率图(P-P plot)、分位数图(Q-Q plot)
2、计算法:偏度系数γ1;峰度系数γ2
3、K-S 检验:属于单样本非参数检验
K-S 检验(Kolmogorov-Smirnov 检验):一般作为小样本的正态性检验方法 K-S 检验:检验频数分布的正态性检验
单样本K-S 检验的原假设是:样本来自得总体与指定的理论分布无显著差异
SPSS 单样本非参数检验是对单个总体的分布形态等进行推断的方法,包括:卡方检验、二项分布检验、K-S 检验、变量值随机性检验
二、单样本K-S 检验
单样本K-S 检验(1-sample K-S test )是以两位苏联数学家柯尔莫哥(Kolmogorov )和斯米诺夫(Smirnov )命名的。K-S 检验是一种拟合优度检验,研究样本观察值的分布和设定的理论分布间是否吻合,通过对两个分布差异的分析确定是否有理由认为样本的观察结果来自所设定的理论分布总体。
设)(x S n 是一个n 次观察的随机样本观察值的累积概率分布函数,即经验分布函数;)(0x F 是一个特定的累积概率分布函数,即理论分布函数。定义)()(0x F x S D n -=,显然若对每一个x 值来说,)(x S n 与)(0x F 十分接近,也就是差异很小,则表明经验分布函数与特定分布函数的拟合程度很高,有理由认为样本数据来自具有该理论分布的总体。K-S 检验主要考察的是绝对差数)()(0x F x S D n -=中那个最大的偏差,即利用下面的统计量作出判断。
)()(max 0max x F x S D n -= (8.2)
K-S 检验的步骤为:
1. 提出假设:)()(:00x F x S H n =,)()(:01x F x S H n ≠
2. 计算各个D ,找出统计量max D
3. 查找临界值:根据给定的显著性水平α和样本数据个数n ,查《单样本K-S 检验统计量表》可以得到临界值αD (单样本K-S 检验统计量表见附录六)。
4. 作出判定:若max D ≥αD ,则在α水平上,拒绝0H ;若max D <αD ,则不能拒绝0H ;
【例8.3】 随机抽取100名生产线上的工人,调查他们的日产量,资料情况如下表,判断生产线上工人的日产工人日产量 500以下 500-540 540-580 580-620 620-640
640以上 合
计 组中值 480 520 560 600 640 680 — 人数 6 23 27 19 15 10 100
【解】0H :)(x S n 服从正态分布,1H :)(x S n 不服从正态分布。 根据所给的资料,借助Excel 进行相关的计算,见图8.2:
图8.2 max D 统计量的计算表
查表得136.0100
36.1==
αD ,
由于max D = 0.0430<αD ,所以,不能拒绝0H ,即生产线上工人的日产量服从正态分布。
(1)完全随机设计的两样本均数比较(两独立样本t 检验) 【Independent Sample T 】又称成组 t 检验
(2)配对设计的两样本均数比较例【Paired Sample T test 】配对样本的t 检验
完全随机设计(两独立样本)的秩和检验
配对设计的秩和检验
问题:若方差不齐,将如何处理?
(1)采用适当的变量变换,使达到方差齐性;
(2)采用秩和检验;
(3)采用近似法 tˊ检验:
① Cochran & Cox法
② Satterthwaite法
二、两样本率比较(X2检验或确切概率法)(20分)
题干由试题和相关SPSS分析结果组成
1、根据资料选择正确的统计检验方法;
2、列出计算表;
3、请写出假设检验步骤:检验假设,检验水准,列出计算公式,根据SPSS结果选择正确的统计量值和P值、并作出结果判断。
1、成组设计四格表资料χ2检验
四格表χ2检验的条件:
n :为总例数;A:为(所有各各中的)实际数;T:为(所有各各中的)理论数。
n,T。可先求四格表中最小的理论数。
(1)T≥ 5,而且n ≥ 40 ---------直接用χ2检验
(2)1 ≤ T< 5,而且n ≥ 40------校正χ2检验
(3)T < 1 或n < 40-----------确切概率法
注意:上述条件是以理论数为依据,而非实际数
检验的适用条件及四格表专用公式:
表3.5 两种药物治疗十二指肠球部溃疡效果
处理 愈合 未愈合 合计 愈合率(%) 呋喃硝胺组 甲氰咪胍组 合计
54(48.22) 8(13.78) 62 87.10 44(49.78) 20(14.22) 64 68.75 98 28 126 77.78
四格表χ2检验——Pearson χ2
某医学院随机抽查四年级和五年级学生的近视眼患病情况如下表,问两个年级的近视眼患病率有无差别?
四年级和五年级学生的近视眼患病率比较
年级 检查人数 近视人数 近视率(%) 四年级 28 2 7.14
四年级 2 26 28 五年级 5 9 14 1<33.242
T min ==
<5,合计Min 相乘除以总人数 四格表校正χ2
检验
例:某防疫站观察当地的一个污水排放口,在高温季节和低温季节水样的伤寒菌检出情况,资料如下表,问两个季节污水的伤寒菌检出率有无差别?
高低温季节污水中伤寒菌的检出率
季节气温
阳性水样数 阴性水样数 合计 阳性率(%)
高 1(4) 11(8) 12 8.33 低 7(4) 5(8) 12 58.33 合计 8
16
24
33.33
5424
8
*12min <==
T 四格表确切概率法:
表3.5 两种药物治疗十二指肠球部溃疡效果
处理 愈合 未愈合 合计 愈合率(%) 呋喃硝胺组 甲氰咪胍组 合计 54(48.22) 8(13.78) 62 87.10 44(49.78) 20(14.22) 64 68.75 98 28 126 77.78
578.13126
28
*62min ≥==
T 0084.0
126
*)44*820*54()(a 2=-=?-=n bc d χ
2、配对设计四格表资料χ2
检验
已确诊肝癌患者100人,每个患者分别用甲、乙两法检测AFP,结果如下表。问甲、乙两法AFP阳性检出率有无差别?
甲法 合计
+ -
+ 60 20 80 - 10 10 20 合计 70 30 100
C h i-Square T
e sts
.099a
100
McNe
mar Test
N of Valid C ase s Valu e
E xact S ig.
(2-sided)
B ino mial distribution used.
a.
2、研究盐酸丁咯地尔改善周围血管闭塞性病变患者的皮肤微循环状况,以安慰剂作对照得结果如下表。问盐酸丁
咯地尔是否具有改善缺血组织的皮肤微循环作用?(15分)
盐酸丁咯地尔改善缺血组织的皮肤微循环状况
处理例数改善数改善率(%)
盐酸丁咯地尔组20 15 75.00
要求:P值,并作出结果判断。
【06真题】五、某医院收治了 186例重症乙型脑炎患者,随机分成两组,分别用同样的方法治疗,但其中一组加一定量的人工牛黄,治疗结果如下所示,问加人工牛黄是否增加该方剂的疗效?(20分)
要求:请写出上述题目假设检验过程:检验假设、检验水准、计算表、检验统计量的计算公式、检验统计量值和 P 值,并作出结果判断。
【05真题】
五、为观察药物A、B治疗某病的疗效,某医生将100例该病患者随机分成两组,一组40人,服A药;另一组60人,服B药。结果发现:服A药的40人中有30人治愈;服B药的60人中有11人治愈。问A、B两药对该病的疗效有无差别?(20分)
要求:请写出上述题目假设检验过程: 检验假设、检验水准、计算表、统计检验方法、检验统计量值和P值,
Chi-Square Tests
10.550b1.001
9.0971.003
10.4271.001
.002.001
10.4331.001
90
Pearson Chi-Square
Continuity Correction a
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear Association
N of Valid Cases
Value df
Asymp. Sig.
(2-sided)
Exact Sig.
(2-sided)
Exact Sig.
(1-sided)
Computed only for a 2x2 table
a.
0 cells (.0%) have expected count less than 5. The minimum expected count is 11.00.
b.
【答案】jszb
1、此资料是按服A、B药疗效(治愈、未治愈)分类的二分类资料,即计数资料。
2、将100例该病患者随机分成两组,属于完全随机设计方案。
3、该资料的目的是通过两样本率的比较来推断它们分别代表的两总体率有无差别,是成组设计两样本率比较,因此,统计方法选用成组设计四格表资料χ2检验(Chi-Square Test)。
处理治愈未治愈合计治愈率(%)
A药30(16.4)a 10(23.6)b 40(a+b)75.0
B药11(24.6)c 49(35.4)d 60(c+d)18.3
合计41(a+c)59(b+d)100(n)41.0
(1)建立假设检验,确立检验水准:
H0:A药和B药的治愈率相同,即π1=π2=41.0%
H1:A药和B药的治愈率不同,即π1≠π2
α=0.05
(2)计算检验统计量χ2值:
理论数(T)值的计算:
依据公式计算T值,并添入计算表中;
由于总例数n=100;最小T值=40*41/100=16.4≥5;
满足T≥ 5,而且n ≥ 40条件,因此直接用χ2检验
ν=(2-1)(2-1)=1【和分类有关2*3就是v=(2-1)*(3-1)】
(3)确定 P值,做出统计推断:
根据SPSS软件有关分析结果,χ2=10.550,ν=1
P=0.001<0.05
根据α=0.05的检验水准,拒绝 H0,接受 H1,差异有统计学意义。
因此认为A药和B药的治愈率有差别。
【知识点解析】Jszb
1、成组设计四格表资料 2检验
一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n
医学统计学试题及答案 The latest revision on November 22, 2020
医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同
6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小
医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。
(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数
《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关
7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描
第一章健康管理概论 健康管理是以现代健康概念(生理、心理和社会适应能力)和新的医学模式(生理、心理、社会)以及中医治未病为指导,通过采用现代医学和现代管理学的理论、技术、方法和手段,对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。 其目的是以最小投入获取最大健康效益。 健康管理的八大目标: 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进 健康管理的特点: 标准化足量化个体化系统化 健康管理的三个基本步骤: 1.了解和掌握健康,开展健康信息收集和健康检查 2.关心和评价健康,开展健康风险评价和健康评估 3.干预和促进健康,开展健康风险干预和健康促进 健康风险评估是手段,健康干预是关键,健康促进是目的 健康管理的五个服务流程: 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务 健康管理的六个基本策略: 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理 生活方式管理的特点: 1.以个体为中心,强调个体的健康责任和作用
2.以预防为主,有效整合三级预防 生活方式的四大干预技术: 教育激励训练营销 影响需求管理的四大主要因素: 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机(残疾补贴、请病假的能力等) 需求管理的策略: 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约 疾病管理的三个特点: 1.目标人群是患有特定疾病的个体 2.不以单个病例和(或)其单次就诊事件为中心,而关注个体或群体连续性的健康状况与 生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要 灾难性病伤管理的五大特点: 1.转诊及时 2.综合考虑各方面因素,制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍,能够有效应对可能出现的多种 医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意 残疾管理的八大目标: 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理 《健康中国2030规划纲要》 1.强调预防为主,防患未然
考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是
医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr 医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数 一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ~9.1×109 /L ,其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料 预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1 1、样本是总体中:D A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、参数是指:C A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、抽样的目的是:E A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是: B A、观察单位 B、数值变量 C、名义变量 D.等级变量 E.研究个体 5、疗效是: D A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、抽签的方法属于 D A分层抽样B系统抽样C整群抽样D单纯随机抽样 E二级抽样 7、统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断 C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料 E搜集资料、整理资料、分析资料、进行推断 8、实验设计中要求严格遵守四个基本原则,其目的是为了:D A便于统计处理 B严格控制随机误差的影响 C便于进行试验 D减少和抵消非实验因素的干扰 E以上都不对 9、对照组不给予任何处理,属 E A、相互对照 B、标准对照 C、实验对照 D、自身对照 E、空白对照 10、统计学常将P≤0.05或P≤0.01的事件称 D A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件 11.医学统计的研究内容是 E A.研究样本 B.研究个体C.研究变量之间的相关关系 D.研究总体 E.研究资料或信息的收集.整理和分析 12.统计中所说的总体是指:A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 13.概率P=0,则表示 B A某事件必然发生B某事件必然不发生C某事件发生的可能性很小 D某事件发生的可能性很大 E以上均不对14.总体应该由 D A.研究对象组成B.研究变量组成C.研究目的而定 D.同质个体组成E.个体组成 15. 在统计学中,参数的含义是 D A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量 16.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于 A A.计数资料B.计量资料C.总体D.个体E.样本 17.统计学中的小概率事件,下面说法正确的是:B A.反复多次观察,绝对不发生的事件B.在一次观察中,可以认为不会发生的事件 C.发生概率小于0.1的事件 D.发生概率小于0.001的事件E.发生概率小于0.1的事件 18、统计上所说的样本是指:D A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 19、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 B A、计算 B、计数 C、计量 D、等级 E、都对 20、红细胞数(1012L-1)是:B A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 21、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为:C A.所有成年男子B.该市所有成年男子C.该市所有健康成年男子 D.120名该市成年男子E.120名该市健康成年男子 22、某地区抽样调查1000名成年人的血压值,此资料属于: A、集中型资料 B、数值变量资料 C、无序分类资料 D、有序分类资料 E、离散型资料 23、抽样调查的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99 l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2 医学统计学考试重点 The latest revision on November 22, 2020 一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) 误差:观测值与真实值、样本计量与总体参数之间的差别。 相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。 相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。 统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。 统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 同质:指根据研究目的所确定的观察单位其性质应大致相同。 变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。 定量数据:也称计量资料。变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。 有序数据:也称半定量数据或等级资料。变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。 总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。 参数:描述总体特征的指标称为参数。 统计量:描述样本特征的指标称为统计量。 概率:描述某事件发生可能性大小的度量。 小概率事件:习惯上将P≤0.05的事件称为小概率事件。 平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。 率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。 构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。 线性相关的概念:研究两个变量之间是否具有直线相关关系。 相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。 研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。 处理因素:根据研究目而欲施研究对象的干预措施。 处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。 对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。 重复:是指在相同实验条件下重复进行多次观察。 统计学的基本内容:统计设计,数据整理,统计描述,统计判断 数据类型:定量数据,定性数据,有序数据 误差的类型:系统误差,随机测量误差,抽样误差 配对样本t检验配对设计:同源配对,异源配对,自身配对 方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。 非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。 标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。应用,与X拔结合,用以描述个体观察值的 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体 均数不同 6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2(B)n1+ n2–1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) 医学统计学考试重点Prepared on 21 November 2021 一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 不 真实情况拒绝H 拒绝H 正确Ⅰ型错误(ɑ) 推 H 断正确(1ɑ) 不正确推断正确(1β) Ⅱ型 H 错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H Ⅱ型错误(β错误): H 为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S =S/√n x ㈡样本率 率的抽样误差:样本率p和总体率π的差异医学统计学重点总结
医学统计学练习题与答案
预防医学考试重点完整最新版
医学统计学试题集锦
医学统计学重点图表总结
医学统计学试题及其答案
医学统计学考试重点
医学统计学期末重点总结
医学统计学试题及答案
医学统计学考试重点