当前位置：文档库 › 医学统计学方差分析(ANOVA)

医学统计学方差分析(ANOVA)

方差分析是为了比较多个总体样本均数是否存在差别。该方法有RA.Fisher首先提出，后来由GW.Snedecor完善，为了纪念Fisher，故称方差分析为F检验。

组间均方：MS组间=SS组间/ v组间，SS代表离均差平方和，v代表自由度，组间变异包括处理效应和随机误差。

组内均方：MS组内=SS组内/ v组内，组内差异包括随机误差。

F=MS组间/MS组内，F接近1，说明组间差异不大。

方差分析的基本思想，首先将总变异分为组间和组内变异，然后计算两者的F 值。F值越大，说明组间差异大，处理起作用，反之，则不起作用，是由随机误差导致的。

方差分析应用条件：1）样本独立；2）来自正态总体；3）方差齐性。

方差分析包括完全随机设计（completely random design）的方差分析，又叫单向（one-way）方差分析和随机区组设计（radomized block design）的方差分析又叫双向（two-way）方差分析。

完全随机设计的方差分析是将受试对象随机化的分配到各个处理组或对照组的方法，未考虑干扰因素的影响，各个组的样本数可以不一样多。

随机区组设计的方差分析将受试对象按照性质相同或相近组成b个区组，每个区组有g个受试对象，分别随机分配到g个处理组，这样各个处理组不仅样本个数相同，生物学特性也比较均衡。

方差分析拒绝H0，接受H1，只说明g个总体均数不全相等，如果想要进一步了解那两个组均数不等，需要进行两两比较或称多重比较，即post-hoc检验。

ANOVA与T test的关系：.

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误的区别与联系？区别：（1）含义不同：标准差S表示观察值的变异程度,描述个体变量值（x）之间的变异度大小,S越大,变量值（x）越分散；反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大；反之,样本均数越接近总体均数,抽样误差越小。（2）与n的关系不同： n增大时,S趋于σ（恒定）,标准误减少并趋于0（不存在抽样误差）。（3）用途不同：标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。联系：二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用：? 特点：?1、集中性：正态曲线的高峰位于正中央,即均数所在的位置；? 2、对称性：正态分布曲线位于直角坐标系上方，以x=u为中心,左右对称,曲线两端永远不与横轴相交； 3、均匀变动性：正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降；?

4、正态分布有两个参数,即均数μ和标准差σ,可记作N（μ,σ）：均数μ决定正态曲线的中心位置；标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭；σ越大,曲线越扁平； ?5、u变换：为了便于描述和应用,常将正态变量作数据转换；?? 应用：?1.估计医学参考值范围?2.质量控制?3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系可信区间与参考值范围的意义、计算公式和用途均不同。 ?1.从意义来看?95％参考值范围是指同质总体内包括95％个体值的估计范围,而总体均数95％可信区间是指?95％可信度估计的总体均数的所在范围? 2.从计算公式看?若指标服从正态分布,95％参考值范围的公式是：±1.96s。?总体均数95％可信区间的公式是：??前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。用途：（1）揭示资料的分布特征和分布类型；（2）便于进一步计算指标和分析处理；（3）便于发现某些特大或特小可疑值。基本步骤：（1）求出极差；（2）确定组段，一般设8~15个组段；（3）确定组距；组距=R/组段数，但一般取一方便计算的数字；（4）列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。（1）资料不符合参数统计法的应用条件（总体为正态分布、且方差相等）或总体分布类型未知；（2）等级资料；（3）分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件；（4）在资料满足参数检验的要求时，应首选参数法，以免降低检验效能 7.线性回归的主要用途。

医学统计学案例分析 (1)

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学案例分析(1) 案例分析四格表确切概率法【例 1-5】为比较中西药治疗急性心肌梗塞的疗效，某医师将 27 例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表 1-4。经检验，得连续性校正 2 =3.134，P＞0.05，差异无统计学意义，故认为中西药治疗急性心肌梗塞的疗效基本相同。表 1-4 两种药物治疗急性心肌梗塞的疗效比较药物中药西药合计有效 12（9.33） 6（8.67）无效 2（4.67） 7（4.33）合计 14 13 27 有效率（％） 85.7 46.2 66.7 18 9 【问题 1-5】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？【分析】 (1) 该资料是按中西药的治疗结果（有效、无效）分类的计数资料。 (2) 27 例患者随机分配到中药组和西药组，属于完全随机设计方案。 (3) 患者总例数 n=27＜40，该医师用 2 检验是不正确的。当 n＜40 或 T＜1时，不宜计算 2 值，需采用四格表确切概率法（exact probabilities in 22 table）直接计算概率案例分析－卡方检验（一）【例 1-1】某医师为比较中药和西药治疗胃炎的疗效，随机抽取 140 例胃炎患者分成中药组和西药组，结果中药组治疗 80 例，有效 64 例，西药组治疗 60例，有效 35 例。 1 / 5

医学统计学分析计算题_与解析

第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012 ·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV )比较二者的变异程度。女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示，由表4计算各项指标的标准误。男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100，可视为大样本。σ未知，但n 足够大，故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。该地男性红细胞数总体均数的95%可信区间为： (4.66－1.96×0.031 , 4.66＋1.96×0.031)，即(4.60 , 4.72)1210/L 。该地女性红细胞数总体均数的95%可信区间为： (4.18－1.96×0.018 , 4.18＋1.96×0.018)，即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较，用u 检验。 1) 建立检验假设，确定检验水准 H 0：12μμ=，即该地健康成年男、女血红蛋白含量均数无差别 H 1：12μμ≠，即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值，作出统计推断查t 界值表(ν＝∞时)得P <0.001，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为该地健康成年男、女的血红蛋白含量均数不同，男性高于女性。 (5) 样本均数与已知总体均数的比较，因样本含量较大，均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设，确定检验水准 H 0：0μμ=，即该地男性红细胞数的均数等于标准值

医学统计学考试重点整理

一、基本概念 1.总体与样本总体：所有同质观察单位某种观察值（即变量值）的全体样本：是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查普查：就是全面调查，即调查目标总体中全部观察对象抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查 3.参数与统计量参数：总体的某些数值特征统计量：根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误（ɑ错误）: H0为真时却被拒绝，弃真错误 Ⅱ型错误（β错误）: H0为假时却被接受，取伪错误 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义:①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示为S x =S/√n ㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π（1-π）/n

医学统计学试题与答案

医学统计学试题及答案习题《医学统计学》第二版（五年制临床医学等本科生用）（一）单项选择题 1．观察单位为研究中的( d )。 A．样本 B. 全部对象 C．影响因素 D. 个体 2．总体是由（ c ）。 A．个体组成 B. 研究对象组成 C．同质个体组成 D. 研究指标组成 3．抽样的目的是（b ）。 A．研究样本统计量 B. 由样本统计量推断总体参数 C．研究典型案例研究误差 D. 研究总体统计量 4．参数是指（b ）。 A．参与个体数 B. 总体的统计指标 C．样本的统计指标 D. 样本的总和 5．关于随机抽样，下列那一项说法是正确的（ a ）。 A．抽样时应使得总体中的每一个个体都有同等的机会被抽取 B．研究者在抽样时应精心挑选个体，以使样本更能代表总体 C．随机抽样即随意抽取个体 D．为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ b ）。 A.均数不变，标准差改变 B.均数改变，标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ a ）。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中（d）可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用（c）描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后，（b）不变。 A．算术均数 B.标准差 C.几何均数 D.中位数 11.（ a ）分布的资料，均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种（ c ）分布。

医学统计学分析计算题-答案

第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV )比较二者的变异程度。女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示，由表4计算各项指标的标准误。男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

医学统计学案例分析(1)

案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞的疗效，某医师将27例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检验，得连续性校正χ2=3.134，P＞0.05，差异无统计学意义，故认为中西药治疗急性心肌梗塞的疗效基本相同。表1-4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率（％）中药12（9.33）2（4.67）1485.7 西药 6（8.67）7（4.33）1346.2 合计1892766.7【问题1-5】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？【分析】 (1) 该资料是按中西药的治疗结果（有效、无效）分类的计数资料。 (2) 27例患者随机分配到中药组和西药组，属于完全随机设计方案。 (3) 患者总例数n=27＜40，该医师用χ2检验是不正确的。当n＜40或T＜1时，不宜计算χ2值，需采用四格表确切概率法（exact probabilities in 2×2 table）直接计算概率案例分析－卡方检验（一）【例1-1】某医师为比较中药和西药治疗胃炎的疗效，随机抽取140例胃炎患者分成中药组和西药组，结果中药组治疗80例，有效64例，西药组治疗60例，有效35例。该医师采用成组t检验（有效=1，无效=0）进行假设检验，结果t＝2.848，P＝0.005，差异有统计学意义检验（有效=1，无效=0）进行进行假设检验，结果t＝2.848，P＝0.005，差异有统计学意义，故认为中西药治疗胃炎的疗效有差别，中药疗效高于西药。

【问题1-1】（1）这是什么资料？（2）该资料属于何种设计方案？（3）该医师统计方法是否正确？为什么？（4）该资料应该用何种统计方法？【分析】(1) 该资料是按中西药疗效（有效、无效）分类的二分类资料，即计数资料。(2) 随机抽取140例胃炎患者分成西药组和中药组，属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别，适用于正态或近似正态分布的计量资料，不能用于计数资料的比较。(4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别，应用四格表资料的 X2检验（chi-square test）。【例1-2】 2003年某医院用中药和西药治疗非典病人40人，结果见表1-1。表1-1 中药和西药治疗非典病人有效率的比较药物有效无效合计有效率（％）中药西药14（11.2） 2 （4.8） 14（16.8） 10 （7.2） 28 12 50.0 16.7 步骤如下： 1．建立检验假设，确定检验水准 H 0：两药的有效率相等，即π 1 ＝π 2 H 1：两药的有效率不等，即π 1 ≠π 2 2．计算检验统计量值 (1) 计算理论频数根据公式计算理论频数，填入表7-2的括号内。 (2) 计算χ2值具体计算略。

医学统计学分析计算题_答案与解析

WORD 文档下载可编辑第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012·L -1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L -1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1 解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV )比较二者的变异程度。女性红细胞数的变异系数CV S 100% X S 0.29 4.18 100% 6.94% 10.2 女性血红蛋白含量的变异系数CV 100% 100% 8.67% X 117.6

由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误S X 来表示，由表 4 计算各项指标的标准误。男性红细胞数的标准误S X S 0.58 0.031 ( 1012 /L ) n 360 S 男性血红蛋白含量的标准误S X n 7.1 360 0.374 (g/L ) 女性红细胞数的标准误S X S 0.29 0.018 ( 1012 /L) n 255 女性血红蛋白含量的标准误S X S 10.2 0.639 (g/L ) n 255 (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100 ，可视为大样本。未知，但n 足够大，故总体均数的区间估计按( X u / 2S X, X u / 2 S X)计算。该地男性红细胞数总体均数的95% 可信区间为： (4.66 －1.96 ×0.031 , 4.66 ＋1.96 ×0.031) ，即(4.60 , 4.72) 1012 /L。该地女性红细胞数总体均数的95% 可信区间为： (4.18 －1.96 ×0.018 , 4.18 ＋1.96 ×0.018) ，即(4.14 , 4.22) 1012 /L。 (4) 两成组大样本均数的比较，用u 检验。 1) 建立检验假设，确定检验水准 H0： 1 2 ，即该地健康成年男、女血红蛋白含量均数无差别 H1： 1 2 ，即该地健康成年男、女血红蛋白含量均数有差别 0.05 2) 计算检验统计量

医学统计学分析题

五、分析应用题（4题，共40分） 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何？请说出理由（6分） 1、答：结论不可信（2分）；因为在设计分组上不科学，两组间不具有可比性（4分）。 2、24名志愿者完全随机地分成两组，接受降胆固醇试验。甲组为特殊饮食组，乙组为药物处理组，受试者在试验前后各测量一次血清胆固醇（mmol/L），数据如下表，甲组乙组受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 （1）欲分析两种治疗方法是否有效，采用何种统计分析方法？（6分）（2）欲判断两种降血清胆固醇措施效果是否相当，又采用何种统计分析方法？（6分） 2、答：（1）欲分析两种治疗方法是否有效，可用治疗前后比较，属配对设计（2分），应用配对t检验（3分）。（2）如判断两种方法的效果有无差别，则属成组设计（2分），应用两样本均数比较的t检验（3分）。 3、检验血磷含量有甲、乙两种方法，其中，乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品，所得结果如下表。样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问：⑴若要判断能否用乙法推算甲法，又用何统计方法？（6分） ⑵欲比较甲乙两法检出血磷是否相同，用何统计方法？（6分） 3、答：（1）根据题意，应用回归分析（6分）（2）这是配对设计计量资料（2分），应用配对t检验（4分） 4、某单位对常住本市5年以上，从未接触过铅作业，也未服过含铅药物或其它重金属，饮用自来水，无肝、肾疾患及贫血，近日未使用利尿剂的健康成年，用乙酸乙酰法测24小时尿δ-ALA的结果如下，欲制定其95％正常值范围。请问：用何种估计方法？说出理由并给出计算公式。（10分） δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

医学统计学案例分析

案例分析—四格表确切概率法【例１-5】为比较中西药治疗急性心肌梗塞的疗效，某医师将2７例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检验,得连续性校正χ２＝3.134，P＞0．05,差异无统计学意义,故认为中西药治疗急性心肌梗塞的疗效基本相同。表1－4 两种药物治疗急性心肌梗塞的疗效比较药物有效无效合计有效率（%)中药1２（9.3３)2(4.67）1485.7 西药６（８．6７）7(4．3３）13４6．2 合计1892７6６．７【问题1-5】 (1）这是什么资料？（2）该资料属于何种设计方案？ (3) 该医师统计方法是否正确？为什么？【分析】 (1) 该资料是按中西药的治疗结果(有效、无效）分类的计数资料。 (2) ２7例患者随机分配到中药组和西药组，属于完全随机设计方案。(３) 患者总例数n=27<40,该医师用χ２检验是不正确的。当n＜40或Ｔ＜１时，不宜计算χ2值，需采用四格表确切概率法(exａct pｒoｂaｂｉｌiｔies in 2×2 taｂlｅ)直接计算概率案例分析-卡方检验(一) 【例1-1】某医师为比较中药和西药治疗胃炎的疗效,随机抽取1４0例胃炎患者分成中药组和西药组，结果中药组治疗8０例,有效64例,西药组治疗60例，有效3５例。该医师采用成组t检验(有效=１，无效=0）进行假设检验，结果t=2．8４8,P=0.0０5,差异有统计学意义检验(有效=１，无效=０)进行进行假设检验，结果t＝２.8４８,P＝０.005，差异有统计学意义,故认为中西药治疗胃炎的疗效有差别,中药疗效高于西药。

【问题1-1】 (1）这是什么资料？(2）该资料属于何种设计方案？ (３)该医师统计方法是否正确？为什么？(4）该资料应该用何种统计方法? 【分析】(1) 该资料是按中西药疗效(有效、无效)分类的二分类资料，即计数资料。（2) 随机抽取140例胃炎患者分成西药组和中药组,属于完全随机设计方案。（３) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别,适用于正态或近似正态分布的计量资料，不能用于计数资料的比较。（4) 该资料的目的是通过比较两样本率来推断它们分别代表的两个总体率有无差别,应用四格表资料的检验(ｃｈｉ-sｑuare test）。【例1-２】 20０３年某医院用中药和西药治疗非典病人４0人，结果见表1-1。表1－1 中药和西药治疗非典病人有效率的比较药物有效无效合计有效率（%）中药西药14(11.2） 2 (4.８) １４(1６.8） 1０(7.2） 28 １2 ５0．0 １６.7 步骤如下: 1.建立检验假设,确定检验水准 H 0：两药的有效率相等，即π 1 ＝π 2 H 1:两药的有效率不等,即π 1 ≠π 2 2．计算检验统计量值（1) 计算理论频数根据公式计算理论频数，填入表7-2的括号内。 (2) 计算χ2值

医学统计学分析计算题答案

第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012·L-1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L-1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV)比较二者的变异程度。女性红细胞数的变异系数女性血红蛋白含量的变异系数由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误来表示，由表4计算各项指标的标准误。男性红细胞数的标准误(/L) 男性血红蛋白含量的标准误(g/L)

女性红细胞数的标准误(/L) 女性血红蛋白含量的标准误(g/L) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100，可视为大样本。未知，但足够大，故总体均数的区间估计按()计算。该地男性红细胞数总体均数的95%可信区间为： (4.66－1.96×0.031 , 4.66＋1.96×0.031)，即(4.60 , 4.72)/L。该地女性红细胞数总体均数的95%可信区间为： (4.18－1.96×0.018 , 4.18＋1.96×0.018)，即(4.14 , 4.22)/L。 (4) 两成组大样本均数的比较，用u检验。 1) 建立检验假设，确定检验水准 H0：，即该地健康成年男、女血红蛋白含量均数无差别 H1：，即该地健康成年男、女血红蛋白含量均数有差别 2) 计算检验统计量 3) 确定P值，作出统计推断查t界值表(ν＝∞时)得P<0.001，按水准，拒绝H0，接受H1，差别有统计学意义，可以认为该地健康成年男、女的血红蛋白含量均数不同，男性高于女性。 (5) 样本均数与已知总体均数的比较，因样本含量较大，均作近似u检验。 1) 男性红细胞数与标准值的比较 ①建立检验假设，确定检验水准 H0：，即该地男性红细胞数的均数等于标准值

医学统计学案例分析报告.doc

医学统计学案例分析评述医学期刊论著：《口岸出入境人员预防接种统计分析》【题目】口岸出入境人员预防接种统计分析【研究目标】对口岸出入境人员的预防接种情况进行统计分析，为各种跨国传染性疾病的预防提供参考数据。【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位，其基本资料如下：男3678 人，女3021 人；年龄在3-79 岁之间，平均年龄45.6 岁。经免疫前检查和询问，研究对象均无严重的疾病，且无接种疫苗过敏史及禁忌症。【资料类型】本资料是计数资料。（1）原文：研究对象：选择我处2010 年1 月-2011 年4 月，2011 年5 月-2012 年5月两个时间段6870 位出入境人员，将其按公务人员、船员、劳务人员、留学人员、旅游探亲及商务等进行分组。（2）问题：①文献中未明确“我处”的具体含义，没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的，即是普查，还是抽样调查？如果是抽样调查，未明确抽样的方法，是如何应用随机抽样的方法选择这6870 位研究对象的？【统计方法】（1）本论著未明确使用了何种统计学方法，我们组认为：首先应对资料进行正态性检验和方差齐性检验，若满足正态、方差齐，选择χ2检验，否则应选用秩和检验。一篇论文结论的正确与否，需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理，就无法知道检验结果是否出错，也就无法对结论进行准确判断。（2）文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”，注明所采用的统计软件，但方法中未注明统计推断方法，没有明确

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布，（1）可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验；（2）采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐，（1）采用Satterthwate 的t’检验；（2）采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布，采用配对t检验。 1.2.2 两组差值不服从正态分布，采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布，且各组方差齐性，直接采用完全随机的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey法，Scheffe 法，SNK法等。 1.3.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Kruscal－Wallis法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布，且各组方差齐性，直接采用随机区组的方差分析。如果检验结果为有统计学意义，则进一步作两两比较，两两比较的方法有LSD检验，Bonferroni法，tukey法，Scheffe 法，SNK法等。 1.4.2资料不符合正态分布，或各组方差不齐，则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义，则进一步作两两比较，一般采用Bonferroni法校正P值，然后用符号配对的Wilcoxon检验。 ****需要注意的问题：

医学统计学案例分析

医学统计学案例分析案例分析—四格表确切概率法【例1-5】为比较中西药治疗急性心肌梗塞de疗效，某医师将27例急性心肌梗塞患者随机分成两组，分别给予中药和西药治疗，结果见表1-4。经检2验，得连续性校正χP,0.05，差异无统计学意义，故认为中西药治=3.134，疗急性心肌梗塞de疗效基本相同。表1-4 两种药物治疗急性心肌梗塞de疗效比较药物有效无效合计有效率(,) 中药 12(9.33) 2(4.67) 14 85.7 西药 6(8.67) 7(4.33) 13 46.2 合计 18 9 27 66.7 【问题1-5】 (1) 这是什么资料, (2) 该资料属于何种设计方案, (3) 该医师统计方法是否正确,为什么, 【分析】 (1) 该资料是按中西药de治疗结果(有效、无效)分类de计数资料。 (2) 27例患者随机分配到中药组和西药组，属于完全随机设计方案。 2(3) 患者总例数n=27,40，该医师用χ检验是不正确de。当n,40或T,1时， 2不宜计算χ值，需采用四格表确切概率法(exact probabilities in 2×2 table)直接计算概率案例分析,卡方检验(一)

【例1-1】某医师为比较中药和西药治疗胃炎de疗效，随机抽取140例胃炎患者分成中药组和西药组，结果中药组治疗80例，有效64例，西药组治疗60例，有效35例。该医师采用成组t检验(有效=1，无效=0)进行假设检验，结检验(有效=1，无效=0)进行进行果t,2.848，P,0.005，差异有统计学意义假设检验，结果t,2.848，P,0.005，差异有统计学意义，故认为中西药治疗胃炎de疗效有差别，中药疗效高于西药。【问题1-1】 (1)这是什么资料,(2)该资料属于何种设计方案, (3)该医师统计方法是否正确,为什么,(4)该资料应该用何种统计方法, 【分析】 (1) 该资料是按中西药疗效(有效、无效)分类de二分类资料，即计数资料。 (2) 随机抽取140例胃炎患者分成西药组和中药组，属于完全随机设计方案。(3) 该医师统计方法不正确。因为成组t检验用于推断两个总体均数有无差别，适用于正态或近似正态分布de计量资料，不能用于计数资料de比较。 (4) 该资料de目de是通过比较两样本率来推断它们分别代表de两个总体率有无差别，应用四格表资料de 检验(chi-square test)。【例1-2】 2003年某医院用中药和西药治疗非典病人40人，结果见表1-1。表1-1 中药和西药治疗非典病人有效率de比较药物有效无效合计有效率(,) 中药 (11.2) (16.8) 28 50.0 1414 西药 2 (4.8) 10 (7.2) 12 16.7 合计 16 24 40 40.0 某医师认为这是完全随机设计de2组二分类资料，可用四格表de检验。其步骤如下: 1(建立检验假设，确定检验水准

医学统计学公式总结

一资料的描述性统计（一）算术均数(mean) （1）简单算术平均值定义公式为（直接法）：（2）利用频数表计算均数（加权法）：（二）方差（即标准差的平方）（三）变异系数二参数估计与参考值范围（一）均数的标准误（二）样本率的标准误（p 为样本率）（三）T 分布（u 为总体均数）（四）总体均数的区间估计（一般要求计算95%或99%的可信区间）（五)总体率的区间估计（六)参考值范围估计双侧1-a 参考值范围： s u x a 2/± 单侧1-a 参考值范围： s u x a ->或s u x a +< （可信区间计算是用标准误，参考值范围计算用标准差，百分位数法大家自己看书）三 T 检验与方差分析（一）T 检验（1）单样本T 检验 n x n x x x x x n ∑= ++++= 321∑∑= ++++++++=f fx f f f f x f x f x f x f x k k k 3213322111 )(2 2--= ∑n x x s 22 2()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-=n s x t μ-=x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

检验假设：（假设样本来自均数为0 u 的正态总体）统计量t 值的计算：（2）配对T 检验检验假设：统计量t 值的计算：（d 为两组数据的差值，Sd 为差值的标准差）（3）两样本T 检验检验假设：统计量t 值的计算：其中两样本方差齐性检验（即为两样本方差的比值）（二）单因素方差分析 SS MS F SS MS νν= = B B B W W W （1）完全随机设计资料的方差分析这里（T 即为该组数据之和）（2）随机单位组设计资料的方差分析 SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差 μμ=：H 1 ,/0 0-=-=-= n n s x s x t x νμμ0210==-μ μμ：H d d t s μ-== 1 -=n ν210μμ=：H 2 1)()(2121x x s x x t ----=μμ2 21-+=n n ν ? ??? ??+=-2121121n n s s C x x 2)()(112222112-+∑-∑+-=n n x x x x s C 2221s s F =111-=n ν1 2 2-=n ν组内组间总SS SS SS +=组内组间总ννν+=2()/C x N =∑ij j T x = ∑

医学统计学案例分析

医学统计学案例分析集团文件发布号：（9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学案例分析评述医学期刊论着：《口岸出入境人员预防接种统计分析》【题目】口岸出入境人员预防接种统计分析【研究目标】对口岸出入境人员的预防接种情况进行统计分析，为各种跨国传染性疾病的预防提供参考数据。【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位，其基本资料如下：男3678 人，女3021 人；年龄在3-79 岁之间，平均年龄45.6 岁。经免疫前检查和询问，研究对象均无严重的疾病，且无接种疫苗过敏史及禁忌症。【资料类型】本资料是计数资料。（1）原文：研究对象：选择我处2010 年1 月-2011 年4 月，2011 年5 月-2012 年5月两个时间段6870 位出入境人员，将其按公务人员、船员、劳务人员、留学人员、旅游探亲及商务等进行分组。（2）问题：①文献中未明确“我处”的具体含义，没有明确研究对象的来源。

②文献中未提及“6870 位出入境人员”是如何产生的，即是普查，还是抽样调查？如果是抽样调查，未明确抽样的方法，是如何应用随机抽样的方法选择这6870 位研究对象的？【统计方法】（1）本论着未明确使用了何种统计学方法，我们组认为：首先应对资料进行正态性检验和方差齐性检验，若满足正态、方差齐，选择χ2检验，否则应选用秩和检验。一篇论文结论的正确与否，需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理，就无法知道检验结果是否出错，也就无法对结论进行准确判断。（2）文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”，注明所采用的统计软件，但方法中未注明统计推断方法，没有明确采用了那种统计方法，即是卡方检验还是秩和检验等。

医学统计学 (2)

第一单元概述 1.研究设计应包括那几方面内容？答：包括：专业设计和统计设计。专业设计是针对专业问题进行的研究设计，如选题、形成假说等。统计设计是针对统计数据收集和分析进行的设计，如样本来源、样本量等。统计设计是统计分析的基础。任何设计上的缺陷，都不能在统计分析阶段弥补和纠正。第二单元资料描述性统计 1.描述计量资料的集中趋势和离散趋势的指标有哪些？各指标的适用范围如何？答：集中趋势的指标有：算术均数、几何均数、中位数。算术均数适用于描述对称分布资料的集中位置，尤其是正态分布资料；几何均数用来描述等比资料和对数正态分布资料的集中位置；中位数可用于任何资料。描述离散趋势有：极差、四分位数间距、方差、标准差和变异系数。极差和四分位数间距可用于任何分布，但两个指标都不能反映变异程度；方差和标准差常用于资料为近似正态分布；变异系数可用于多组资料间量纲不同或均数相差较大时变异程度间的比较。 2.变异系数和标准差有何区别和联系？答：区别：1.计算公式不同：CV=S/X*100%，标准差是方差的平方根。2.单位不同：变异系数无量纲，标准差量纲和原指标一致。3.用途不同。联系：都是适用于对称分布的资料，尤其是正态分布的资料，并且由公式所知，在均数一定时，CV与s呈正比。 3.频数表的用途有哪些？答：1.描述资料的频数分布的特征；2.便于发现一些特大或特小的可疑值；3.将频数表作为陈述资料的形式，便于进一步的统计分析和处理；4.当样本量足够大时，可以以频数表作为概率的估计值。 4.用相对数时应注意哪些问题？答：1.在实践工作中，应注意各相对数的含义，避免以比代率的错误现象。2.计算相对数时分母应该有足够的数量，如资料的总数过少，直接报告原数据更为可取。3.正确计算频数指标的合并值。4.相对数的比较具有可比性。5.在随机抽样的情况下，从样本估计值推断总体相对数应该考虑抽样误差，因此需要对相对数指标进行参数估计和假设检验。第三单元医学统计推断基础 1.正态分布和标准正态分布的联系和区别？答：联系：均为连续型随机变量分布。区别：标准正态分布是一种特殊的正态分布（均数为0，标准差为1）。一般正态分布变量经标准化转换后的新变量服从标准正态分布。 4.简述二项的应用条件？答：条件为：1.每次试验只会发生两种互斥的可能结果之一，即两种互斥结果的概率之和为1；2.每次试验产生某种结果固定不变；3.重复试验是相互杜立的，即任何一次试验结果的出现不会影响其他试验结果的概率。 5.简述Q-Q图法的基本原理？答：u－变换可以把一个一般正态分布变量变换为标准正态分布变量，反之，u－变换的逆变换也可以把一个标准正态分布变量变换为一个正态变量。Q-Q图法实际上就是首先求的小于某个x的积累频率，再通过该积累频率求得相应的u值，如果该变量服从正态分布，则点（u，x）应近似在一条直线上（u－变换直线），否则（u，x）不会近似在一条直线上。Q－Q图法正是根据（u，x）是否近似在一条直线上来判断是否为正态分布。第四单元参数估计与参考值范围的估计 1.均数的标准差和标准误的区别和联系？答：区别和联系：标准差是描述个体值变异程度的指标，为方差的算术平方根，该变异不能