当前位置：文档库 › (完整版)孙振球第三版研究生医学统计学课后习题答案

(完整版)孙振球第三版研究生医学统计学课后习题答案

医学统计学作业答案（二～四章）

第二章

三、计算分析题 1.（1）均数=1.156 （2）标准差=0.2044

（3）)5566.1~7554.0(96.1=±s x

（4）0.8mmol/L 以下者占4.09%； 1.5 mmol/L 以下者占95.35%

2. 平均抗体滴度：1:36.83

3. 08.15=x ；M=14；M 代表性好；95%的参考值范围：<(P 95) 36

第三章

（1）女性血红蛋白的变异程度（CV=0.087）> 红细胞的变异程度（CV=0.069）（2）男性血红蛋白的标准误=0.374；红细胞的标准误=0.0306 （3）健康成年女性红细胞均数95%C.I.为4.144～4.216 （4）成年男女血红蛋白含量不同，t=24.03, P =0.0001

（5）男性两项指标均低于标准值，红细胞与标准值比较， t=5.89,P =0.0001 血红蛋白与标准值比较，t=15.23, P =0.0001

2. 该批药有效成分平均含量为95%C.I.=(101.41～104.59)

3. t=1.1429， P =0.1355, 还没有足够证据认为当地现在20岁男子比以往的高。

4. t=3.71, P =0.001，新药和标准药的疗效差别有统计学意义。

5. （1）对数转换；（2）方差齐性检验，F=3.69, P =0.038，转换后两总体方差仍不齐；

（3）用welch 法校正t 检验：t=3.35, ν=17, P =0.0039 标准株和水生株平均效价差别有统计学意义。 6.

（1）两药平均退热天数之差的95% C.I.为：1.0～1.8天

（2）t=6.96, P =0.0001, 两药平均退热天数差别有统计学意义（3）上述两种方法中（1）因95%C.I.不包括H 0（μ1-μ2=0），也可以说明两药退热天数不同（α=0.05）；（2）的检验中可以看出两药退热天数不同，并说明其概率非常小。

7. （1）经方差齐性检验，F=37.84，P =0.0001，两总体方差不齐；（2）Welch 法校正t 检验，t=5.33，ν=15， P =0.0001

第四章

1. 不同刺激下的反应时间是否不同

方差分析结果

变异来源SS νMS F P 总723.07 41

组间561.57 2 280.79 67.81 0.0001 组内161.50 39 4.14

不同刺激下反应差别有统计学意义

2. 不同剂量药物注射抑癌作用比较

方差分析结果

变异来源SS νMS F P 总80.52 38

组间43.93 3 14.40 13.70 0.0001 组内36.59 35 1.05

不同剂量药物注射抑癌作用差别有统计学意义。

3. 不同种系、不同剂量的雌激素对大白鼠子宫重量的影响

方差分析结果

变异来源SS νMS F P 总12053.67 11

种系5115.67 3 1705.22 23.53 0.0001 处理6503.17 2 3251.58 44.87 0.0002 误差434.83 6 72.47

不同种系、不同剂量组的雌激素对大白鼠子宫重量的影响都有统计学意义

4. 检验五种溶液抑菌效果有无不同？四种细菌被抑制效果有无不同？

方差分析结果

变异来源SS νMS F P 总708.20 19

细菌种类602.60 3 200.87 37.14 0.0001 不同溶液40.70 4 10.18 1.88 0.1785 误差64.90 12 5.41

尚不能认为五种溶液抑菌效果有不同；四种细菌被抑制效果差别有统计学意义。

5. 检验五种防护服对脉搏数有无不同影响。

方差分析结果

变异来源SS νMS F P 总4105.91 24

日期508.07 4 127.02 2.09 0.0680 受试者2853.67 4 713.42 16.27 0.0001 防护服218.03 4 54.51 1.24 0.3445 误差526.14 12 43.85

尚不能认为五种防护服对脉搏数有不同影响。

6. 分析两阶段交叉设计试验数据。方差分析结果

变异来源 SS ν MS

F P 总 83965.63 23

患者 67303.13 11 6118.47 6.87 0.003 时期 234.38 1 234.38 0.26 0.620 药物 7526.04 1 7526.04 8.45 0.016 误差

8902.08

890.21

不同患者之间、不同药物之间差别有统计学意义，不同时期对疗效差别无统计学意义。

7（1）对第1 题进行不同刺激下反应的两两比较

均数 15.21 8.86 6.57 组别刺激I 刺激III 刺激II 组次 1 2 3 MS 误差=MS 组内=4.14，ν误差=39 54.0)14

141(214.4=+=-j i x x S 两两比较* 比较均数差 a q q 0.05 q 0.01 P 1与2 6.36 2 11.76 2.86 3.82 <0.01 1与3 8.64 3 16.00 3.44 4.37 <0.01 2与3

2.29 2

4.24 2.86

3.82 <0.01

*SNK-q 检验结果表明，三种刺激之间差别均有统计学意义。

7（2）对第2 题进行不同剂量药物注射抑癌作用的两两比较均数 4.66 2.51 2.39 2.00 组别对照组 A B C 组次 1 2 3 4 MS 误差=MS 组内=1.051，ν误差=36 3240

01.051.0)11

11(2=+=

-j i x x S 两两比较*

比较均数差 a q q 0.05 q 0.01 P 1与2

2.15 2 6.64 2.86

3.82 <0.01 1与3 2.27 3 7.01 3.44

4.37 <0.01 1与4 2.66 4 8.21 3.79 4.70 <0.01 2与3 0.12 2 0.37 2.86 3.82 >0.05 2与4 0.51 3 1.57 3.44 4.37 >0.05 3与4

0.39 2

1.20

2.86

3.82

>0.05

*SNK-q 检验

8（1）对第1题进行方差齐性检验：Levene 检验：F=2.053，P=0.142，各总体方差齐同。

8（2）对第2题不同剂量组的方差齐性检验：Levene 检验：F=0.178，P=0.911，各总体方差齐同。

医学统计学名词解释及问答题

1、总体（population）：是根据研究目的确定的同质研究对象的全体。 2、样本（sample）：从总体中抽取的一部分有代表性的个体。 3、同质（homogeneity）：是指所研究的观察对象具有某些相同的性质或特征。 4、变异（variation）：指同质个体的某项指标之间的差异。 5、参数（parameter）：反映总体特征的指标称为参数。 6、统计量（statistic）：通过样本资料计算出来的相应指标称为统计量。 7、抽样误差（sampling error）：由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 8、概率（probability）：某事件发生的可能性大小。 9、正态分布（normal distribution）：高峰位于均数处，中间高两边低，左右完全对称地下降，但永远不与横轴相交的钟形曲线。 10、平均数（average）：是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数（median）：将一组数据由小到大排列，位于中间位置的观测值。 12、医学参考值范围（medical reference range）：又称正常值范围，医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。 13、方差（variance）：是各个数据与平均数之差的平方的平均数。 14、标准差（standard deviation）：是各数据偏离平均数的距离的平均数，它是离均差平方和平均后的方根，用σ表示。 15、标准误（standard error）：样本均数的标准差，等于原变量总体标准差除以例数的平方根，用以说明均数抽样误差的大小。 16、均数的抽样误差（sampling error of mean）：由个体差异和抽样所导致的样本均数与样本均数之间，样本均数与总体均数之间的差异。 17、假设检验（hypothesis testing）：先对总体做出某种假设，然后根据样本信息来推断其是否成立的一类统计方法的总称。 18、统计推断（statistical inference）：是根据已知的样本信息来推断未知的总体，是统计分析的目的，包括参数估计和假设检验。 19、Ⅰ型错误（type Ⅰ error）：拒绝了实际上成立的H0，这类弃真错误，发生的概率为α，为已知。 20、Ⅱ型错误（type Ⅱ error）：不拒绝实际上不成立的H0，这类存伪错误，发生的概率为β，未知。 21、检验效能（power of test）：又称把握度，为1-β，其意义是两总体确有差别，按α水准能发现它们有差别的能力。 22、可信区间（confidence interval）：指总体参数可能所在的范围。 23、率（rate）：说明某现象发生的频率或强度。 24、构成比（constituent ratio）：表示某事物内部各组成部分所占的比重或分布，常以百分数表示。 25、相对比（relative ratio）：表示两个有关事物指标之比，常以百分数和倍数表示，用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率（standardized rate）：亦称调整率，是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。 27、参数检验（parametric test）：一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验（non parametric test）：一类不依赖总体分布类型的检验，在应用中可以不考虑被研究对象为何种分布以及分布是否已知，检验假设中没有包括总体参数的统计方法。

医学统计学课后习题答案

医学统计学第一章绪论答案名词解释: （1）同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。（2）总体与样本:总体就是根据研究目的确定的同质观察单位的全体。样本就是从总体中随机抽取的部分观察单位。（3）参数与统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。（4）抽样误差:由抽样造成的样本统计量与总体参数的差别称为抽样误差。（5）概率:就是描述随机事件发生的可能性大小的数值,用p 表示（6）计量资料:由一群个体的变量值构成的资料称为计量资料。（7）计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。。（8）等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。就是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章计量资料统计描述及正态分布答案名词解释: 1、平均数就是描述数据分布集中趋势(中心位置)与平均水平的指标 2、标准差就是描述数据分布离散程度(或变量变化的变异程度)的指标 3、标准正态分布以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。 4、参考值范围参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4、 σ± σ96.1± σ58.2± 68、27% 95% 99% 5、 47、5% 6、均数、标准差 7、全距、方差、标准差、变异系数

医学统计学名词解释+问答题-1

医学统计学 1、应用相对数时应注意的事项 ①计算相对数时分母不能太小； ②分析时不能以构成比代替率； ③当各分组的观察单位数不等时，总率（平均率）的计算不能直接将各分组的率相加求其平均； ④对比时应注意资料的可比性：两个率要在相同的条件下进行，即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致，其他影响因素在各组的内部构成应相近； ⑤进行假设检验时，要遵循随机抽样原则，以进行差别的显著性检验。 2、正态分布的特点及其应用性质：①两头低中间高，略呈钟形； ②只有一个高峰，在X=μ，总体中位数亦为μ； ③以均数为中心，左右对称； ④μ为位置参数，当σ恒定时，μ越大，曲线沿横轴越向右移动； σ为变异度参数，当μ恒定时，σ越大，表示数据越分散，曲线越矮胖，反之，曲线越瘦高； ⑤对于任何服从正态分布N（μ，σ2）的随机变量X作的线性变换，都会变换成u 服从于均数为0，方差为1的正态分布，即标准正态分布。应用：①概括估计变量值的频数分布； ②制定参考值范围； ③质量控制； ④是许多统计方法的理论基础。 3、确定参考值范围的一般原则和步骤、方法一般原则和步骤：①抽取足够例数的正常人样本作为观察对象； ②对选定的正常人进行准确而统一的测定，以控制系统误差； ③判断是否需要分组测定； ④决定取单侧范围值还是双侧范围值； ⑤选定适当的百分范围； ⑥选用适当的计算方法来确定或估计界值。方法：①正态分布法：②百分位数法（偏态分布） 4、总体均数的可信区间与参考值范围的区别概念：可信区间是按预先给定的概率来确定的未知参数μ的可能范围。参考值范围是绝大多数正常人的某指标范围。所谓正常人，是指排除了影响所研究指标的疾病和有关因素的人；所谓绝大多数，是指范围，习惯上指正常人的95%。计算公式：可信区间① ② ③ 参考值范围①正态分布 ②偏态分布用途：可信区间用于总体均数的区间估计参考值范围用于表示绝大多数观察对象某项指标的分布范围

医学统计学课后答案.

第二章 1.答：在统计学中用来描述集中趋势的指标体系是平均数，包括算术均数，几何均数，中位数。均数反映了一组观察值的平均水平，适用于单峰对称或近似单峰对称分布资料的平均水平的描述。几何均数：有些医学资料，如抗体的滴度，细菌计数等，其频数分布呈明显偏态，各观察值之间呈倍数变化(等比关系)，此时不宜用算术均数描述其集中位置，而应该使用几何均数（geometric mean ）。几何均数一般用G 表示，适用于各变量值之间成倍数关系，分布呈偏态，但经过对数变换后成单峰对称分布的资料。中位数和百分位数：中位数（median ）就是将一组观察值按升序或降序排列，位次居中的数，常用M 表示。理论上数据集中有一半数比中位数小，另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述，也适用于开口资料的描述。所谓“开口”资料，是指数据的一端或者两端有不确定值。百分位数（percentile ）是一种位置指标，以P X 表示，一个百分位数P X 将全部观察值分为两个部分，理论上有X ％的观察值比P X 小，有（100-X ）％观察值比P X 大。故百分位数是一个界值，也是分布数列的一百等份分割值。显然，中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答：常用来描述数据离散程度的指标有：极差、四分位数间距、标准差、方差、及变异系数，尤以方差和标准差最为常用。极差（range ，记为R ），又称全距，是指一组数据中最大值与最小值之差。极差大，说明资料的离散程度大。用极差反映离散程度的大小，简单明了，故得到广泛采用，如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是：1.不灵敏； 2.不稳定。四分位数间距（inter-quartile range ）就是上四分位数与下四分位数之差，即：Q ＝Q U －Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似，数值大，说明变异度大；反之，说明变异度小。常用于描述偏态分布资料的离散程度。极差和四分位数间距均没有利用所研究资料的全部信息，因此仍然不足以完整地反映资料的离散程度。方差（variance ）和标准差（standard deviation ）由于利用了所有的信息，而得到了广泛应用，常用于描述正态分布资料的离散程度。变异系数（coefficient of variance ，CV ）亦称离散系数（coefficient of dispersion ），为标准差与均数之比，常用百分数表示。变异系数没有度量衡单位，常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答：常用的相对数指标有：比，构成比和率。比（ratio ），又称相对比，是A 、B 两个有关指标之比，说明A 为B 的若干倍或百分之几，它是对比的最简单形式。其计算公式为比＝A /B 率(rate)又称频率指标，用以说明某现象发生的频率或强度。常以百分率(％)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为：）比例基数（单位总数可能发生某现象的观察单位数实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标，它说明一种事物内部各组成部分所占的比重或

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误的区别与联系？区别：（1）含义不同：标准差S表示观察值的变异程度,描述个体变量值（x）之间的变异度大小,S越大,变量值（x）越分散；反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大；反之,样本均数越接近总体均数,抽样误差越小。（2）与n的关系不同： n增大时,S趋于σ（恒定）,标准误减少并趋于0（不存在抽样误差）。（3）用途不同：标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。联系：二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用：? 特点：?1、集中性：正态曲线的高峰位于正中央,即均数所在的位置；? 2、对称性：正态分布曲线位于直角坐标系上方，以x=u为中心,左右对称,曲线两端永远不与横轴相交； 3、均匀变动性：正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降；?

4、正态分布有两个参数,即均数μ和标准差σ,可记作N（μ,σ）：均数μ决定正态曲线的中心位置；标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭；σ越大,曲线越扁平； ?5、u变换：为了便于描述和应用,常将正态变量作数据转换；?? 应用：?1.估计医学参考值范围?2.质量控制?3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系可信区间与参考值范围的意义、计算公式和用途均不同。 ?1.从意义来看?95％参考值范围是指同质总体内包括95％个体值的估计范围,而总体均数95％可信区间是指?95％可信度估计的总体均数的所在范围? 2.从计算公式看?若指标服从正态分布,95％参考值范围的公式是：±1.96s。?总体均数95％可信区间的公式是：??前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。用途：（1）揭示资料的分布特征和分布类型；（2）便于进一步计算指标和分析处理；（3）便于发现某些特大或特小可疑值。基本步骤：（1）求出极差；（2）确定组段，一般设8~15个组段；（3）确定组距；组距=R/组段数，但一般取一方便计算的数字；（4）列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。（1）资料不符合参数统计法的应用条件（总体为正态分布、且方差相等）或总体分布类型未知；（2）等级资料；（3）分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件；（4）在资料满足参数检验的要求时，应首选参数法，以免降低检验效能 7.线性回归的主要用途。

医学统计学课后习题答案

医学统计学第一章绪论答案名词解释：（1）同质与变异：同质指被研究指标的影响因素相同，变异指在同质的基础上各观察单位（或个体）之间的差异。（2）总体和样本：总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。（3）参数和统计量：根据总体个体值统计算出来的描述总体的特征量，称为总体参数，根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。（4）抽样误差：由抽样造成的样本统计量和总体参数的差别称为抽样误差。（5）概率：是描述随机事件发生的可能性大小的数值，用p 表示（6）计量资料：由一群个体的变量值构成的资料称为计量资料。（7）计数资料：由一群个体按定性因数或类别清点每类有多少个个体，称为计数资料。。（8）等级资料：由一群个体按等级因数的级别清点每类有多少个体，称为等级资料。是非题： 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题： 1. C 2. E 3. D 4. C 5. D 6. B 第二章计量资料统计描述及正态分布答案名词解释： 1. 平均数是描述数据分布集中趋势（中心位置）和平均水平的指标 2. 标准差是描述数据分布离散程度（或变量变化的变异程度）的指标 3. 标准正态分布以μ服从均数为0、标准差为1的正态分布，这种正态分布称为标准状态分布。 4. 参考值范围参考值范围也称正常值范围，医学上常把把绝大多数的某指标范围称为指标的正常值范围。填空题： 1. 计量，计数，等级 2. 设计，收集资料，分析资料，整理资料。 3. σ μχ-=u （变量变换）标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

【缩印整理版】医学统计学名词解释及问答题

统计学（Statistics）：运用概率论、数理统计的原理与方法，研究数据的搜集；分析；解释；表达的科学。总体（population）：大同小异的研究对象全体。更确切的说，总体是指根据研究目的确定的、同质的全部研究单位的观测值。样本（sample）：来自总体的部分个体，更确切的说，应该是部分个体的观察值。样本应该具有代表性，能反映总体的特征。利用样本信息可以对总体特征进行推断。抽样误差（sampling error）在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异，以及多个样本统计量之间的差异。可用标准误描述其大小。标准误(Standard Error) 样本统计量的标准差，反映样本统计量的离散程度，也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比，与样本例数的平方根呈反比，故欲降低抽样误差，可增加样本例数区间估计（interval estimation）：将样本统计量与标准误结合起来，确定一个具有较大置信度的包含总体参数的范围，该范围称为置信区间（confidence interval，CI），又称可信区间。参考值范围描述绝大多数正常人的某项指标所在范围；正态分布法（标准差）、百分位数法，参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法（标准误）、二项分布法。置信区间估计总体参数所在范围可信区间：按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间（confidence interval，CI）。它的确切含义是：可信区间包含总体参数的可能性是1- α ，而不是总体参数落在该范围的可能性为1-α 。参数统计（parametric statistics）非参数统计（nonparametric statistics）是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。变异（variation）：对于同质的各观察单位，其某变量值之间的差异同质（homogeneity）：研究对象具有的相同的状况或属性等共性。回归系数有单位，而相关系数无单位 β为回归直线的斜率(slope)参数，又称回归系数(regression coefficient)。线性相关系数（linear correlation coefficient）：又称Pearson积差相关系数（Pearson product moment coefficient），是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。参数（parameter）：描述总体特征的统计指标。统计量（statistic）：描述样本特征的统计指标。实验设计的基本原则对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时，要同时设立对照组重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复；观察多个受试对象（样本量）；同一受试对象重复观察。作用是估计变异大小和降低变异随机化(randomization) 采用随机的方式，使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误（假阳性错误）真实情况为H0是成立的，但检验结果为H0不成立，这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误（假阴性错误）真实情况为H1是成立的，但检验结果为H1不成立，这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ，因此在假设检验中无法确定。变异指标是用于描述一组观察值围绕中心位置散布的范围，即描述离散趋势的统计指标。数值越大，说明数据越离散，反之越集中。极差 (range)；四分位数间距(quartile range)；方差(variance)；标准差(standard deviation)；变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势，反映一组观察值的平均水平。算术均数（arithmetic mean）；几何均数（geometric mean）；中位数（median）；众数（mode）单纯抽样将调查总体的全部观察单位编号，从而形成抽样框架，在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号，然后随机地抽取一个号码作为第一个调查个体，其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样分层抽样先将总体中全部个体按某种特征分成若干“层”，再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差，要求层内误差最小，层间误差最大。整群抽样先将总体分成若干“群”，从中随机抽取几个群，抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差，需多抽几个“群”。方差分析：又称变异数分析或 F检验，适用于对多个平均值进行总体的假设检验，以检验实验所得的多个平均值是否来自相同总体。析因设计（factorial design）实验：凡同时配置两个或两个以上处理因素，这些因素的各水平又具有完全组合的实验，统称为析因设计（factorial design）实验。随机区组设计（randomized block design）是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组（block），使每一区组内的受试对象例数与处理因素的分组数相等，使每个实验组从每一区组得到一例受试对象。单向方差分析（one way analysis of variance）是指处理因素只有一个。这个处理因素包含有多个离散的水平，分析在不同处理水平上应变量的平均值是否来自相同总体。（2）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。（3）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。随机变量（random variable）是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的，但共同的特点是不能用一个常数来表示，而且，理论上讲，每个变量的取值服从特定的概率分布。变异系数（coefficient of variation）用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示。计算：标准差/均数*100% 直线回归（linear regression）建立一个描述应变量依自变量变化而变化的直线方程，并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种，故又称简单回归（simple regression）。回归系数（regression coefficient ）即直线的斜率 (slope)，在直线回归方程中用b 表示，b 的统计意义为X每增（减）一个单位时，Y平均改变b 个单位。相关系数r：用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。秩次：变量值按照从小到大顺序所编的秩序号称为秩次（rank）。秩和：各组秩次的合计称为秩和（rank sum），是非参数检验的基本统计量。方差（variance）：方差表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。检验效能：1- β称为检验效能（power of test），它是指当两总体确有差别，按规定的检验水准a 所能发现该差异的能力。百分位数（percentile）是将n 个观察值从小到大依次排列，再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围随机误差（random error）又称偶然误差，是指排除了系统误差后尚存的误差。它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。一、统计表有哪些要素构成的？制表的注意事项有哪些？一般来说，统计表由标题、标目、线条和数字、备注五部分组成。但备注并不是必需的内容，可以根据需要出现。 1简明扼要，重点突出：最好一张表突出一个中心，不易太多中心，如果需要说明多个中心，可分成多张统计表。 2合理安排主语和谓语的位置：对于表中任意一行，从左至右，通过简短的连接词，可连成成一句通顺的句子。 3表中数据要认真核对，保证准确可靠二、为什么不宜用t 检验对多组均数进行比较？如果用t检验进行多个样本均数的两两比较，则会增加犯I 类错误的概率。经检验得到拒绝H0 ，认为两组之间有差别的结论可能犯I类错误的概率为α，不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数，上例α=0.05, k=3，则均不犯错误的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么？按实验设计的类型，将全部观察值间的变异分解成两个或多个组成部分，然后将各部分的变异与随机误差进行比较（每个部分的变异可由某因素的作用来解释），以判断各部分的变异是否具有统计学意义，从而推断不同样本所代表的总体均数是否相同。五、简述直线相关与回归的区别与联系区别：1．回归说明依存关系，直线回归用于说明两变量间数量依存变化的关系，描述y如何依赖于x 而变化；相关说明相关关系，直线相关用于说明两变量间的直线相关关系，此时两变量的关系是平等的 2．r与b有区别：r说明具有直线关系的两个变量间相关的密切程度与相关方向； b表示x每改变一个单位，y平均增（减）多少个单位； 3．资料要求不同：直线回归要求应变量 y是来自正态总体的随机变量，而x可以是来自正态总体的随机变量，也可以是严密控制、精确测量的变量，相关分析则要求x，y是来自双变量正态分布总体的随机变量。 4.取值范围：-∞

2017年人民大学统计学生物医学统计学考研参考书

2017年人民大学统计学生物医学统计学考研参考书统计学:生物医学统计学风险管理与精算学: 《概率论》，李贤平，高等教育出版社《数理统计基础》，陆璇，清华大学出版社《概率论与数理统计》，茆诗松、周纪芗，中国统计出版社《应用回归分析》，何晓群等编，中国人民大学出版社《统计学》，贾俊平等编，中国人民大学出版社概率论与数理统计: 《数学分析》上、下册复旦大学数学系陈传璋、金福临等编高等教育出版社《高等代数》北京大学出版社《概率论》李贤平高等教育出版社《数理统计基础》陆璇清华大学出版社《概率论与数理统计》茆诗松、周纪芗中国统计出版社流行病与卫生统计学: 《流行病学》詹思延人民卫生出版社《卫生统计学》方积乾、徐勇勇、陈峰编人民卫生出版社 (专业学位)应用统计: 《统计学》第四版贾俊平中国人民大学出版社配套习题《应用回归分析》何晓群等编中国人民大学出版社《多元回归分析》何晓群等编中国人民大学出版社《抽样技术》金勇进等编中国人民大学出版社《时间序列分析》易丹辉中国人民大学出版社《概率论与数理统计》第三版刘次华高等教育出版社配套习题 2017年新祥旭考研全程复习计划

一、英语全程规划基础阶段(3月-6月) 1.学习目标：完成至少1轮的单词背诵，巩固语法基础 2.阶段重点：英语单词、语法 3.复习建议：（1）英语每天抽空背背单词，建议时长0.5-1h；不管是用单词软件还是传统词书，不管是用词根词缀还是死记硬背，最重要的是每天都背。积累到某一天时，你会发现好多文章都看得懂了。（2）英语基础不牢的童鞋，应该花点时间复习语法。语法知识能帮助你在读文章和翻译时更加流畅、对文章意思把握得更准确。（3）多看看新闻，关注时事热点。近年来的英语作文和阅读都是涉及到热点话题的。（4）不建议大家在这个阶段做习题集。强化阶段(7月-10月) 1.学习目标：熟读并详细分析近10年真题 2.阶段重点：真题真题真题，重点是阅读 3.复习建议：（1）单词记忆每天进行，不间断。（2）定时做真题阅读，做完后详细分析。 ①利用早上整段的时间做真题（作文可以不写），不要查单词，完全自己做，然后对答案，之后看一下答案分析。 ②每天分析2-3篇，分析包括：第一遍分析正确选项，第二遍分析错误选项的设置，第三遍在原位中找对应的句子，是每个选项对应的句子哟，分析为什么这样出题，第四遍，了解文章的背景，作者的情感。 ③此阶段不建议专门建立单词笔记本，重要的单词在分析时顺便查一下就好。 ④时间比较充足的童鞋可以全文翻译阅读原文。（3）完成阅读后，用同样的方法完型、翻译和新题型。完型和新题型这两类题型不用全文

医学统计学课后答案解析

第二章 1?答：在统计学中用来描述集中趋势的指标体系是平均数，包括算术均数，几何均数，中位数。均数反映了一组观察值的平均水平，适用于单峰对称或近似单峰对称分布资料的平均水平的描述。几何均数：有些医学资料，如抗体的滴度，细菌计数等，其频数分布呈明显偏态，各观察值之间呈倍数变化（等比关系），此时不宜用算术均数描述其集中位置，而应该使用几何均数（geometric mean）。几何均数一般用G表示，适用于各变量值之间成倍数关系，分布呈偏态，但经过对数变换后成单峰对称分布的资料。中位数和百分位数：中位数（median）就是将一组观察值按升序或降序排列，位次居中的数，常用M表示。理论上数据集中有一半数比中位数小，另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述，也适用于开口资料的描述。所谓开口”资料，是指数据的一端或者两端有不确定值。百分位数（percentile）是一种位置指标，以P X表示，一个百分位数P X将全部观察值分为两个部分，理论上有X%的观察值比P X小，有（100-X）%观察值比P X大。故百分位数是一个界值，也是分布数列的一百等份分割值。显然，中位数即是P50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答：常用来描述数据离散程度的指标有：极差、四分位数间距、标准差、方差、及变异系数，尤以方差和标准差最为常用。极差（range,记为R）,又称全距，是指一组数据中最大值与最小值之差。极差大，说明资料的离散程度大。用极差反映离散程度的大小，简单明了，故得到广泛采用，如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是：1?不灵敏；2?不稳定。四分位数间距（inter-quartile range）就是上四分位数与下四分位数之差，即：Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似，数值大，说明变异度大；反之，说明变异度小。常用于描述偏态分布资料的离散程度。极差和四分位数间距均没有利用所研究资料的全部信息，因此仍然不足以完整地反映资料的离散程度。方差（variance）和标准差（standard deviation）由于利用了所有的信息，而得到了广泛应用，常用于描述正态分布资料的离散程度。变异系数（coefficient of variance , CV）亦称离散系数（coefficient of dispersion ）, 为标准差与均数之比，常用百分数表示。变异系数没有度量衡单位，常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答：常用的相对数指标有：比，构成比和率。比（ratio）,又称相对比，是A、B两个有关指标之比，说明A为B的若干倍或百分之几，它是对比的最简单形式。其计算公式为比二A/B 率（rate）又称频率指标，用以说明某现象发生的频率或强度。常以百分率（%）、千分率（%。）、万分率（1/万）、十万分率（1/10万）等表示。计算公式为：率.= 实际发生某现象的观察单位数迸比例基数（K）可能发生某现象的观察单位总数构成比（proportion）又称构成指标，它说明一种事物内部各组成部分所占的比重或

医学统计学题库

第一章绪论习题一、选择题 1．统计工作和统计研究的全过程可分为以下步骤:（D ） A . 调查、录入数据、分析资料、撰写论文 B . 实验、录入数据、分析资料、撰写论文 C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中，习惯上把（B ）的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3～8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下：0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是（ A ）。 4.分别用两种不同成分的培养基（A 与B ）培养鼠疫杆菌，重复实验单元数均为5个，记录48小时各实验单元上生长的活菌数如下，A ：48、84、90、123、171；B ：90、116、124、225、84。该资料的类型是（C ）。 5.空腹血糖测量值，属于（ C ）资料。 6.用某种新疗法治疗某病患者41人，治疗结果如下：治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是（B ）。 7.某血库提供6094例ABO 血型分布资料如下：O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是（D ）。 8. 100名18岁男生的身高数据属于（C ）。二、问答题 1．举例说明总体与样本的概念. 答：统计学家用总体这个术语表示大同小异的对象全体，通常称为目标总体，而资料常来源于目标总体的一个较小总体，称为研究总体。实际中由于研究总体的个体众多，甚至无限多，因此科学的办法是从中抽取一部分具有代表性的个体，称为样本。例如，关于吸烟与肺癌的研究以英国成年男子为总体目标，1951年英国全部注册医生作为研究总体，按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2．举例说明同质与变异的概念答:同质与变异是两个相对的概念。对于总体来说，同质是指该总体的共同特征，即该总体区别于其他总体的特征；变异是指该总体内部的差异，即个体的特异性。例如，某地同性别同年龄的小学生具有同质性，其身高、体重等存在变异。 3．简要阐述统计设计与统计分析的关系答：统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的，统计设计在前，然而一定的统计设计必然考虑其统计分析方法，因而统计分析又寓于统计设计之中；统计分析是在统计设计的基础上，根据设计的不同特点，选择相应的统计分析方法对资料进行分析

医学统计学(第六版马斌荣)课后答案很全面

医学统计学（第六版）课后答案第一章绪论一、单项选择题答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果，需要对其进行统计描述和统计推断，统计描述可以使数据更容易理解，统计推断则可以使用概率的方式给出结论，两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律，使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率，并使结果更加准确和可靠，数据整理主要是对数据进行归类，检查数据质量，以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征，统计推断指由样本数据的特征推断总体特征的方法，包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图，统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标，由样本数据计算得到，参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生，随机测量误差是生物体的自然变异和各种不可预知因素产生的误差，抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。第二章定量数据的统计描述一、单项选择题答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2 第三章正态分布与医学参考值范围一、单项选择题答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A 二、计算与分析 1 2[参考答案] 题中所给资料属于正偏态分布资料，所以宜用百分位数法计算其参考值范围。又因血铅含量仅过大为异常，故应计算只有上限的单侧范围，即95P 。

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析，按α=0.05水准，拒绝H0，接受H1，认为四组治疗组小白鼠的肿瘤重量总体均数不全相等，即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F：44.867 23.529 P：0.000246 0.001020<0.01 根据随机区组资料的方差分析，按α=0.05水准，拒绝H0，接受H1，三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等，即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

(完整版)孙振球第三版研究生医学统计学课后习题答案

医学统计学名词解释及问答题

医学统计学课后习题答案

医学统计学 名词解释+问答题-1

医学统计学课后答案.

医学统计学简答题

医学统计学课后习题答案

【缩印整理版】医学统计学名词解释及问答题

2017年人民大学统计学生物医学统计学考研参考书

医学统计学课后答案解析

医学统计学题库

最新医学统计学问答题(含答案)

医学统计学(第六版马斌荣)课后答案 很全面

医学统计学第三版第四章课后习题答案

医学统计学名词解释+问答题-1

医学统计学(第六版马斌荣)课后答案很全面