当前位置：文档库 › 医学统计学名词解释

医学统计学名词解释

1.总体：是根据研究目的确定的同质研究对象所有观察单位某变量的集合。

2.样本：从总体中抽取部分个体的过程称为抽样，所抽得的部分称为样本。

3.变异：同一性质的事物，其观察值（变量值）之间的差异。

4.概率：是指某事件出现可能性大小的度量，以符号P表示。

5.医学参考值范围：又称正常值范围。指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围

6.正态分布规律：实际工作中，经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数，用以估计该区间的

观察例数占总例数的百分数，或变量值落在该区间的频数或概率。

7.可比性：是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。

8.抽样误差：在同一总体中随机抽取样本含量相同的若干样本时，样本指标之间的差异以及样本指标与总体指标的差异。

9.标准误：表示样本均数间变异程度。

10.率的抽样误差：抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差，率之间的差异称为率的抽样误差。

11.可信区间：总体参数的所在范围通常称为参数的可信区间或置信区间，即该区间以一定的概率（如95%或99%）包含总

体参数。

12.I型错误：拒绝了实际撒谎能够成立的H0，这类“弃真”的错误称为I型错误。

13.II型错误：接受了实际撒谎能够不成立的H0，这类“存伪”的错误称为II型错误。

14.参数检验：是一种要求样本来自总体分布型是已知的（如正态分布），在这种假设的基础上，对总体参数（如总体均数）

进行统计推断的假设检验。

15.非参数检验：是一种不依赖总体分布类型，也不对总体参数（如总体均数）进行统计推断的假设检验。

16.秩次：即通常意义上的序号，实际上就是将观察值按顺序由小到大排列，并用序号代替了变量值本身。

17.直线相关系数：它是说明具有直线关系的两个变量间，相关关系的密切程度与相关方向的统计指标。相关系数没有单位，

取值范围是-1〈=r〈=1，r的绝对值越大表明两变量的关系越密切。

18.完全负相关：这是一种极为特殊的负相关关系，从散点图上可以看出，由x与y构成的散点完全分布在一条直线上，x

增加，y相应减少，算得的相关系数r=-1。

19.正相关：它是说明具有直线关系的两个变量间，存在有正的相关方向，即当x增加时，y有相应增大的趋势，所算得的

相关系数r为正值。

20.等级相关：是对等级数据作相关分析，它又称为秩相关，是一种非参数统计方法。

21.随机抽样：是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察

单位的过程。随机抽样是样本具有代表性的保证。

22.计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料，一般有度量衡单位。如某

一患者的身高（cm）等。

23.计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料。如调查某地某时的男、女性人口数

24.等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料，一批肾病患者

尿蛋白含量的测定结果分为+、++、+++等。

25.等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确

切定量，故亦称为半计量资料。

26.频率：在相同的条件下，独立重复做n 次试验，事件A 出现了m 次，则比值m/n 称为随机事件A 在n 次试验中出现

的频率(freqency)。当试验重复很多次时P（A）= m/n。

27.随机误差：又称偶然误差，是指排除了系统误差后尚存的误差。它受多种因素的影响，使观察值不按方向性和系统性而

随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。

28.系统误差：是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因，使观察值不是分散在

真值的两侧，而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。

29.随机变量：是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的，但共同的特点是不能用一个常

数来表示，而且，理论上讲，每个变量的取值服从特定的概率分布。

30.参数：是指总体的统计指标，如总体均数、总体率等。总体参数是固定的常数。多数情况下，总体参数是不易知道的，

但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数

31.统计量：是指样本的统计指标，如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数，统

计量是在总体参数附近波动的随机变量。

32.频数表（frequency table）用来表示一批数据各观察值或在不同取值区间的出现的频繁程度（频数）。对于离散数据，每

一个观察值即对应一个频数，如某医院某年度一日内死亡0，1，2?0个病人的天数。对于散布区间很大的离散数据和连续型数据，数据散布区间由若干组段组成，每个组段对应一个频数。

33.平均数：简称均数，常作为一组数据的代表值，用于分析和进行组间比较，包括算术平均数、几何平均数，中位数等

34..算术均数:描述一组数据在数量上的平均水平。总体均数用μ表示，样本均数用X 表示。

35.几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。

36.中位数:（Md将一组观察值由小到大排列，n 为奇数时取位次居中的变量值；为偶数时，取位次居中的两个变量的平均

值。反映一批观察值在位次上的平均水平。

37.极差:亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。

38.百分位数:是将n 个观察值从小到大依次排列，再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定

医学参考值范围。

39.四分位数间距：是由第3 四分位数和第1 四分位数相减计算而得，常与中位数一起使用，描述偏态分布资料的分布特

征，较极差稳定。

40.方差：方差表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。

41.标准差：是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大样本、小样本均可，最为常用。

42.变异系数：用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示。计算：标准差/均数*100%。

43.参数估计：指用样本指标值（统计量）估计总体指标值（参数）。参数估计有两种方法：点估计和区间估计。

44.假设检验中P 的含义：指从H0 规定的总体随机抽得等于及大于（或等于及小于）现有样本获得的检验统计量值的概率。

45.检验效能：1- β称为检验效能（power of test），它是指当两总体确有差别，按规定的检验水准a 所能发现该差异的能力。

46.检验水准：是预先规定的，当假设检验结果拒绝H0，接受H1，下“有差别”的结论时犯错误的概率称为检验水准（level

of a test），记为α 。

47.率：又称频率指标，说明一定时期内某现象发生的频率或强度。计算公式为：发生某现象的观察单位数/可能发生某现象

的观察单位总数*100%，表示方式有：百分率（%）、千分率（‰）等。

48.构成比：又称构成指标，说明某一事物内部各组成部分所占的比重或分布。计算公式为：某一组成部分的观察单位数/

同一事物各组成部分的观察单位总数*100%，表示方式有：百分数等。

49..比：又称相对比，是A、B 两个有关指标之比，说明A 是B 的若干倍或百分之几。计算公式为：A/B ，表示方式有：

倍数或分数等。

50.率的标准化：是为了在比较两个不同人群的患病率、发病率、死亡率等资料时，消除其内部构成（如年龄）的影响。

51.非参数统计：针对某些资料的总体分布难以用某种函数式来表达，或者资料的总体分布的函数式是未知的，只知道总体

分布是连续型的或离散型的，用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制，故称非参数统计法

52.参数统计：通常要求样本来自总体分布型是已知的（如正态分布），在这种假设的基础上，对总体参数（如总体均数）

进行估计和检验，称为参数统计

53.秩次：变量值按照从小到大顺序所编的秩序号称为秩次（rank）。

54.秩和：各组秩次的合计称为秩和（rank sum），是非参数检验的基本统计量。

55.直线回归（linear regression）建立一个描述应变量依自变量变化而变化的直线方程，并要求各点与该直线纵向距离的平

方和为最小。直线回归是回归分析中最基本、最简单的一种，故又称简单回归（simple regression）。

56.回归系数：即直线的斜率(slope)，在直线回归方程中用b 表示，b 的统计意义为X每增（减）一个单位时，Y平均改变

b 个单位。

57.相关系数r：用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。

58.相对数：为了使技术资料具有可比性，取原始的两个资料之比所得的指标统称为相对数，常用有率，构成比，相对比

59.参数估计：指由样本指标值估计总体指标，是统计推断的一个重要内容

60.点估计：用样本统计量直接作为总体参数的估计值

61.区间估计：又称可信区间，按预先给定的的概率估计未知总体均数的可能范围

62.统计推断：在总体中随机抽取一定数量观察单位作为样本进行抽样研究，然后由样本信息推断总体特征，这一过程称

63.小概率事件：在统计学上，习惯将P≤0.05或P≤0.01称之，表示该事件在一次抽样试验中发生的可能性很小

64.P值：从H0所规定的总体中作随机抽样，获得大于及等于现有样本统计量值的概率

65.直方图：用直条矩形面积代表各组频数，个矩形面积总和代表各组频数的总和

66.

67.

68.正态分布的特征：a正态分布以均值u为中心，左右对称。X取值范围理论上没有边界，x离u越远，函数越接近于0，

但是不会等于0 b在正态分布中，曲线面积集中在以均值u为中心的中心部位，离中心越远，曲线越接近于x轴，曲线下面积越少，超过一定范围以外的面积可以忽略c所有正态分布曲线在u左右的相同倍数的标准差范围内面积相同，并在u＋6范围内的面积约为68.3%，在u+1.966范围内约为95%，在u+2.586范围为99% d正态分布完全由u和6,。

U是位置参数，决定分布曲线在横轴的偏移位置，6是变异参数，决定分布曲线的形态

69.医学参考值的制定方法：a选择足够数量的正常人作为参考样本b对选定的正常人进行准确的测定c决定去单侧范围

还是双侧范围d选择适当的百分范围e估计参考值范围的界限

70.T检验中的注意事项和条件：a有严密的抽样设计b选用检验方法必须符合其使用条件c假设检验的结论不能绝对化d

单侧检验和双侧检验e正确理解p值与差别有无统计意义f假设检验与可信区间的关系

71.方差分析基本思想及使用条件：基本思想；将全部观察值的总变异按影响实验结果的诸多因素分解为若干变异，构造出

反应各部分变异作用的统计量，之后构造假设试验统计量f，实现对总体均数的推断使用条件：a各样本相互独立的随机样本b各样本均来自正态分布总体c各总体方差相等

72.卡方检验的注意事项：a、在应用X2检验时，一般规定，若有1/5的理想频数小于5，其结论的可靠性将存疑b、RC卡

方检验有统计学意义，并不等于任意两组之间都有统计学意义，要继续做RC分割的卡方检验，才能得出任意两组间有无统计学的结论b、有些RC数资料不能用X2检验

73.线性相关分析的注意事项：a分析两个变量之间有无相关关系可首先绘制散点图，散点图呈现出直线趋势时，再计算相

关系数和做假设检验b相关关系的计算只适用于两个变量都服从正态分布的情形，如资料不符合正态分布，应先通过变量交换，使之正太化，再根据变换值计算相关系数c依据公式计算出的相关系数仅是样本相关系数，它是总体相关系数的是个估计值，与总体相关系数之间存在着抽样误差，要判断两个事物之间有无相关和相关的密切程度，必须作假设检验d相关分析是用相关关系来描述两个变量相互关系的密切程度和方向，而两个事物之间的关系既可以是依存因果关系，也可以是相互伴随的数量关系

74.相对数使用注意的问题：a不要把构成比与率混淆b使用相对数时分母不宜过小c要注意资料的可比性d要注意使用率

的标准化e要考虑存在抽样误差

75.线性回归的应用：a分析两个变量之间是否存在线性依存关系b利用回归方程对因变量Y进行估计，必要时可作区间估

计c利用回归方程进行统计控制，实际就是利用回归方程进行逆运算，通过控制自变量X取值来限定因变量Y在一定范围内波动

76.线性回归分析的注意事项：a只有两个内在联系的放在一起进行回归分析才是有意义的b做回归分析时，如果两个内在

联系的变量之间存在一种依存因果的关系，那么应该以因变量X，以结果变量Y。如果变量之间因果关系难以确定，则应以易于测定、较为稳定或变异较小者为X c在回归分析中，因变量是一个服从正态分布的随机变量，自变量可以是随机变量，也可以是给定的量。如不服从正态分布，应先进行变量的交换使变量复合条件d使用回归方程计算估计值时，不要轻易把估计值的范围扩大到建立方程时的自变量的取值范围之外

77.线性相关与回归的区别、联系：区别：a相关系数的计算只适用于两个变量都服从正态分布的情况，而在线性回归分析

中，因变量是随机变量，自变量可以是随机变量，也可以是给定变量b线性相关表示两个变量之间的相互关系是双向的，回归则反映两个变量之间的依赖关系，是单向的联系：a方向一致，对一组数据都能同时计算b和r，他们的符号一致b假设检验等价，对同一样本b和r的假设检验得到的t值相等，即tr=tb。用回归解释相关，回归平方和越接近总平均和则y2越接近1，回归效果越好

78.非参数检验的概率及优缺点：采用符号和等级排列来代替数据的分析方法，不依赖于总体分布的具体形式的统计方法

优点：a适用于任何分布的资料b不受总体方差一致的限制c可用于等级资料的统计分析d有些问题本身没有使用的参数检验方法二非参数检验则恰能处理缺点：由于它没有充分利用原始数据中所提供的信息故检验效能处理，其效果有一定的近似值

79.相关系数的特征：a、r的绝对值为1的机会极少b常见r值介于-1和1之间c、r值为正，表示正相关，r为0，既无直

线相关，r为负，表示负相关，r为1，表示完全相关

80.非参数检验的使用条件：a总体分布为偏态，或位置分布形式的未知计量资料b 等级资料c 个别数据偏大或某一短无

确定的数值 d 各组离散程度相差悬殊，即各总体方差不齐

81.医学统计的工作内容有：实验设计，收集资料，整理资料，分析资料

82.医学统计资料一般分为：计数资料，计量资料，等级分组资料

83.抽样的特征：代表性，随机性，可靠性，可比性

84.集中趋势与离散趋势的指标有哪些：集：算术平均数，集合均数，中位数离：极差，四分位间距，方差，标准差，

变异系数，离均差平方和

85.设计类型：完全随机设计，配对设计，交叉设计，随机区组设计，析因设计

86.计算标准差有何用途：a用于表示观察值的变异程度，b用于对变量值的分布情况进行估计，c计算变异系数d实验室的

质量控制

87.试验设计的要素：a处理因素，b受试对象，c实验效应

88.T值的应用范围：计量资料，正态分布，单因素分析，总体方差相同，两均数比较，设计合理条件齐全可比

89.常用的统计图：条图，线图，半对数线图，直方图，圆图，百分条图，散点图等

90.统计表的结构：标题，标目，线条，数字，和备注

91.统计图的结构：标题，图域，标目，图例，刻度

医学统计学考试重点整理

一、基本概念 1.总体与样本总体：所有同质观察单位某种观察值（即变量值）的全体样本：是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查普查：就是全面调查，即调查目标总体中全部观察对象抽样调查：是一种非全面调查，即从总体中抽取一定数量的观察单位组成样本，对样本进行调查 3.参数与统计量参数：总体的某些数值特征统计量：根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 0 推断正确(1?ɑ) 不正确推断正确(1?β) H Ⅱ型错误(β) 为真时却被拒绝，弃真错误 Ⅰ型错误（ɑ错误）: H 为假时却被接受，取伪错误 Ⅱ型错误（β错误）: H 5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组，使每个研究对象都有同等机会被分配到各组中去，以平衡两组中已知和未知的混杂因素，从而提高两组的可比性，避免造成偏倚。（意义: ①是提高组间均衡性的重要设计方法；②避免有意扩大或缩小组间差别导致的偏倚；③各种统计学方法均建立在随机化基础上）安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物，是一种无药理作用的制剂，不含试验药物的有效成分，但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样，不能被受试对象和研究者所识别。（安慰剂对照主要用于临床试验，其目的在于控制研究者和受试对象的心理因素导致的偏倚，并提高依从性。安慰剂对照还可以控制疾病自然进程的影响，显示试验药物的效应） 6.误差与标准误（区分率与均数）

㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。标准误：是指样本均数的标准差，反映抽样误差大小的定量指标，其公式表示 =S/√n 为S x ㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π（1-π）/n 7.方差分析方差分析：又称F检验，是通过对数据变异按设计类型的不同，分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。（方差分析的基本思想:把全部观察值间的变异按设计类型的不同，分解成两个或多个组成部分，然后将各部分的变异与随机误差进行比较，以判断各部分的变异是否具有统计学意义）二、问题 1.集中趋势与离散趋势描述的常用指标、适用范围与优缺点㈠描述集中趋势的常用指标：

医学统计学章节重点归纳

医学统计学章节重点归纳第一节概述 1、主要内容：a、卫生统计学的基本原理和方法（研究设计和数据处理中的统计理论和方法）b、健康统计（医学人口统计、疾病统计和生长发育统计）c、卫生服务统计（卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题）。 2、卫生统计工作的步骤：设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面：统计报表、报告卡（单）、日常医疗卫生工作记录，专题研究或实验。 4、观察单位：是获得数据的最小单位，观察单位是根据研究目的确定的，观察单位可以是人、标本、家庭、国家等。 5、变异：是指客观事物的多样性和不确定性。 6、变量：观察单位的某种特征，称为变量。a、数值变量（定量变量）b、分类变量（定型变量或字符变量）。 7、总体：根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本：从总体中随机抽取部分观察单位，其变量值就构成样本，通过样本信息来推断总体特征。 9、概率：事件发生的可能性大小的量度，通常以符号P表示。 10、误差：测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征：集中趋势和离散趋势。 2、频数分布类型：正态分布型频数、正偏态分布型频数，负偏态分布型频数。 3、集中趋势指标：算术平均数（均数）、几何均数、中位数。指标使用条件计算公式算术平均数适用于正态或近似正态分布的数值变量资料几何均数①对数正态分布，即数据经过对数变换后呈正态分布的资料；②等比级数资料，即观察值之间呈倍数或近似倍数变化的资料。中位数①非正态分布资料（对数正态分布除外）；②频数分布的一端或两端无确切数据的资料③总体分布不清楚的资料。为奇数 , 为偶数, 4、离散型趋势指标：极差、标准差和变异系数指标计算公式主要优缺点极差R=Xmax-Xmin 计算简单，便于理解；只考虑最大值与最小值之差异，不能反映组内其它观察值的变异度，不稳定，受样本量影响很大。

医学统计学基本概念

习题-医学统计学基本概念选择题： 1. 若以舒张期血压大于等于1 2.7kPa 为为高血压，调查某地1000 人，记录每人是否患有高血压。最后清点结果，其中有10 名高血压患者，有990 名非高血压患者。（） A.这是计量数据 B.这是等级数据 C.还看不出是记数还是计量数据 D.这是连续型数据 E.这是计数数据 2、统计学中所说的样本是指（） A.随意抽取的总体中任意的部分 B.有意识的选择总体中的典型部分 C.依照研究者要求选取总体中有意义的一部分 D.依照随机原则抽取总体中有代表性的一部分 E.按研究目的随意抽取有代表性的一部分 3、下列资料属等级资料的是（） A.白细胞计数 B.住院天数 C.门、急症就诊人数 D.病人的病情分级（轻、中、重） E.疾病疗效（有效、无效） 4、总体是由（） A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 E.观察单位组成 5、抽样的目的是（） A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例研究误差 D.研究总体参数 E.研究样本特征 6、参数是（） A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 E.参考值范围 7、关于随机抽样，下列哪一项说法是正确的（） A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体，以使样本更能代表总体 C.随机抽样即随意抽样个体 D.为确保样本具有更好的代表性，样本量应越大越好 E.以上均不对 8、统计工作各个步骤的首要基础是（） A.收集资料 B.整理资料 C.核对资料 D.分析资料 E.医学研究设计 9、统计工作的基本步骤是：() A.调查资料、核对资料、整理资料 B调查资料、归纳资料、整理资料 C收集资料、核对资料、整理资料

健康管理师考试重点归纳总结

第一章健康管理概论健康管理是以现代健康概念（生理、心理和社会适应能力）和新的医学模式（生理、心理、社会）以及中医治未病为指导，通过采用现代医学和现代管理学的理论、技术、方法和手段，对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。其目的是以最小投入获取最大健康效益。健康管理的八大目标： 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进健康管理的特点：标准化足量化个体化系统化健康管理的三个基本步骤： 1.了解和掌握健康，开展健康信息收集和健康检查 2.关心和评价健康，开展健康风险评价和健康评估 3.干预和促进健康，开展健康风险干预和健康促进健康风险评估是手段，健康干预是关键，健康促进是目的健康管理的五个服务流程： 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务健康管理的六个基本策略： 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理生活方式管理的特点： 1.以个体为中心，强调个体的健康责任和作用

2.以预防为主，有效整合三级预防生活方式的四大干预技术：教育激励训练营销影响需求管理的四大主要因素： 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机（残疾补贴、请病假的能力等）需求管理的策略： 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约疾病管理的三个特点： 1.目标人群是患有特定疾病的个体 2.不以单个病例和（或）其单次就诊事件为中心，而关注个体或群体连续性的健康状况与生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要灾难性病伤管理的五大特点： 1.转诊及时 2.综合考虑各方面因素，制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍，能够有效应对可能出现的多种医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意残疾管理的八大目标： 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理《健康中国2030规划纲要》 1.强调预防为主，防患未然

医学统计学重点图表总结

描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值 ①非对称分布；②半定量资料；③末端开口资料；④分布不明众数频数最多的观察值不拘分布形式，概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式，概略分析标准差（方差）观察值平均离开均数的程度对称分布，特别是正态分布资料四分位数间距居中半数观察值的全距 ①非对称分布；②半定量资料；③末端开口资料；④分布不明变异系数标准差与均数的相对比 ①不同量纲的变量间比较；②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些？分别适用于什么分析目的？常用统计图的适用资料及实施方法图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系散点图双变量间的关联点的密集程度和形成的趋势，表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形，叶片为个体值，叶长为频数定性资料统计描述常用的统计指标及其适用场合指标计算公式适用场合频率 n/N 估计总体中某一结局发生的概率频率分布 n 1/N ，n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率强度阳性人数/总观察人时数估计总体中单位时间内某一结局发生的概率比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定？参考值范围（%）正态分布法百分位数法双侧单侧双侧单侧下限上限下限上限 90 S X 64.1± S X 1.28－ S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1－ S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33－ S X 2.33+ P 0.5~P 99.5 P 1 P 99

医学统计学重点要点

医学统计学重点第一章绪论 1.基本概念：总体：根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。样本：从总体中随机抽取部分个体的某个变量值的集合。总体参数：刻画总体特征的指标，简称参数。是固定不变的常数，一般未知。统计量：刻画样本特征的指标，由样本观察值计算得到，不包含任何未知参数。抽样误差：由随机抽样造成的样本统计量与相应的总体参数之间的差异。频率：若事件A在n次独立重复试验中发生了m次，则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。概率：频率所稳定的常数称为概率。统计描述：选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。统计推断：包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数)，称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别，称为假设检验。 2.样本特点：足够的样本含量、可靠性、代表性。 3.资料类型：（1）定量资料：又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料，观察指标是定量的，表现为数值大小。每个个体都能观察到一个观察指标的数值，有度量衡单位。（2）分类资料：包括无序分类资料（计数资料）和有序分类资料（等级资料） ①计数资料：是将观察单位按某种属性或类别分组，清点各组观察单位的个数(频数)，由各分组标志及其频数构成。包括二分类资料和多分类资料。二分类：将观察对象按两种对立的属性分类，两类间相互对立，互不相容。多分类：将观察对象按多种互斥的属性分类 ②等级资料：将观察单位按某种属性的不同程度、档次或等级顺序分组，清点各组观察单位的个数所得的资料。 4.统计工作基本步骤：统计设计、资料收集、资料整理、统计分析。

医学统计学重点总结

医学统计学第一章医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体。样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。第二章集中趋势的统计描述一算术均法(mean)简称为均数,适用于正态或近似正态分布资料（一）直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三中位数(M)与百分位数中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。百分位数:用符号X P 表示,x 即百分位公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学期末重点总结

误差：观测值与真实值、样本计量与总体参数之间的差别。相对数：两个有关的绝对数之比，也可以是两个有关联统计指标之比。相对比：相对比是A、B两个有关联指标值之比，用以描述两者的对比水平，说明A是B 的若干倍或百分之几。统计描述：描述及总结一组数据的重要特征，目的是使实验或观察得到的数据表达清楚并便于分析。统计推断：指由样本数据的特征推断总体特征的方法，包括参数估计和假设检验。同质：指根据研究目的所确定的观察单位其性质应大致相同。变量：反映实验或观察对象生理、生化、解剖等特征的指标，变量的观测值称为数据。定量数据：也称计量资料。变量的观测值是定量的，其特点是能够用数值大小衡量其水平的高低，一般有计量单位。根据变量的取值特征可分为连续型数据和离散型数据。有序数据：也称半定量数据或等级资料。变量的观测值是定性的，但各类别（属性）之间有程度或顺序上的差别。总体：根据研究目的确定的所有同质观察单位的全体，它包括所有定义范围内的个体变量值。样本：从研究总体中抽取部分有代表性的观察单位，对变量进行观测得到的数据。参数：描述总体特征的指标称为参数。统计量：描述样本特征的指标称为统计量。概率：描述某事件发生可能性大小的度量。小概率事件：习惯上将P≤0.05的事件称为小概率事件。平均数：是描述一组观察值集中位置或平均水平的统计指标，常用的有算术均数、几何均数和中位数。率：率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。构成比：表示某事物内部各组成部分在整体中所占的比重，常以百分数表示，计算公式为区间估计：是指按预先给定的概率，计算出一个区间，使它能够包含未知的总体均数。线性相关的概念：研究两个变量之间是否具有直线相关关系。相关系数：是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。研究对象：根据研究目的而确定的观察总体，也可称为受试对象或实验对象。处理因素：根据研究目而欲施研究对象的干预措施。处理水平：处理因素在实验中所处的状态称为因素的水平（level），亦称处理水平。对照：指在实验中应设立对照组，其目的是通过与对照组效应对比鉴别出实验组的效应大小。随机化：是指每个受试对象有相同的概率或机会被分配到不同的处理组。重复：是指在相同实验条件下重复进行多次观察。统计学的基本内容：统计设计，数据整理，统计描述，统计判断数据类型：定量数据，定性数据，有序数据误差的类型：系统误差，随机测量误差，抽样误差配对样本t检验配对设计：同源配对，异源配对，自身配对方差分析的基本思想：将全部观测值的总变异按影响因素分解为相应的若干部分变异，在此基础上，计算假设检验的统计量F 值，实现对总体均数是否有差别的推断。非参数检验的适用范围：①总体分布类型未知或非正态分布数据；②有序或半定量资料；③数据两端无确定的数值。标准差与标准误的区别与联系：区别：标准差：意义，描述个体观察值变异程度的大小，标准差越小，均数对一组观察值的代表性越好。应用，与X拔结合，用以描述个体观察值的

医学统计学题库完整

第一章绪论习题一、选择题 1．统计工作和统计研究的全过程可分为以下步骤:（D ） A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中，习惯上把（B ）的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3～8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下：0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是（ A ）。 4.分别用两种不同成分的培养基（A 与B ）培养鼠疫杆菌，重复实验单元数均为5个，记录48小时各实验单元上生长的活菌数如下，A ：48、84、90、123、171；B ：90、116、124、225、84。该资料的类型是（C ）。 5.空腹血糖测量值，属于（ C ）资料。 6.用某种新疗法治疗某病患者41人，治疗结果如下：治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是（B ）。 7.某血库提供6094例ABO 血型分布资料如下：O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是（D ）。 8. 100名18岁男生的身高数据属于（C ）。二、问答题 1．举例说明总体与样本的概念. 答：统计学家用总体这个术语表示小异的对象全体，通常称为目标总体，而资料常来源于目标总体的一个较小总体，称为研究总体。实际中由于研究总体的个体众多，甚至无限多，因此科学的办法是从中抽取一部分具有代表性的个体，称为样本。例如，关于吸烟与肺癌的研究以英国成年男子为总体目标，1951年英国全部注册医生作为研究总体，按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2．举例说明同质与变异的概念答:同质与变异是两个相对的概念。对于总体来说，同质是指该总体的共同特征，即该总体区别于其他总体的特征；变异是指该总体部的差异，即个体的特异性。例如，某地同性别同年龄的小学生具有同质性，其身高、体重等存在变异。 3．简要阐述统计设计与统计分析的关系答：统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的，统计设计在前，然而一定的统计设计

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值 ①非对称分布；②半定量资料；③末端开口资料； ④分布不明众数频数最多的观察值不拘分布形式，概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异度全距观察值取值范围不拘分布形式，概略分析标准差（方差）观察值平均离开均数的程度对称分布，特别是正态分布资料四分位数间距居中半数观察值的全距 ①非对称分布；②半定量资料；③末端开口资料； ④分布不明变异系数标准差与均数的相对比 ①不同量纲的变量间比较；②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些？分别适用于什么分析目的？常用统计图的适用资料及实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散点图双变量间的关联点的密集程度和形成的趋势，表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布用茎表示组段的设置情形，叶片为个体值，叶长为频数定性资料统计描述常用的统计指标及其适用场合指标计算公式适用场合频率 n/N 估计总体中某一结局发生的概率频率分布 n 1/N ，n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率强度阳性人数/总观察人时数估计总体中单位时间内某一结局发生的概率比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定？参考值范围（%）正态分布法百分位数法双侧单侧双侧单侧下限上限下限上限 90 S X 64.1± S X 1.28－ S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1－ S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33－ S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1．标准差与标准误的区别与联系？

医学统计学重点总结

<<医学统计学>>重点总结 1. 总体：根据研究的目的确定的同质研究对象中所有的观察单位变量值的集合。 2. 样本：按随机化原则从同质总体中随机抽取的部分观察单位某变量值的集合。 3. 同质：影响研究指标的主要因素易控制的因素基本上相同。 4. 抽样误差：在抽样研究中，由于变异的存在，即使在同一总体中抽取的几个样本，各样本统计量往往不等。样本统计量与总体参数也不等，这种由于抽样研究所至样本之间和样本与总体之间的差异称为。。。 5. 变量：观察指标在统计学上统称为指标变量，它反应的是生物个体间的变异情况，根据其性质可分为定性变量（分类）和定量变量（连续）。 6. 截尾数据：生存时间观察过程被人为的截止称为截尾，又称删失或终检。原因：失访/退出/ 终止（研究时限已到而终止观察）。 7. 卡方基本思想：X2分布是一种连续型分布，可用于检验资料的实际频数和按检验假设计算的理论频数是否相等等问题。X2反应实现了实际频数与理论频数的吻合程度。如果检验假设成立，则A-T 一般不大，X2应很小，即出现大X2值概率很小。即X2越大，P越小，若P≤a时，就怀疑假设的成立，拒绝H0。若P>a则没有理由拒绝H0。 8. X2用途：（1）实际频数与拟合频数拟合优度：A推断两个或两个以上总体率或构成比有无差别（四格表/行x 列表）。B两变量之间有无相互关系。C频数分布的拟合优度检验（判断次样本是否来自某种分布）。（2）某些分布可用X2近似。（3）间接应用：如t分布和F分布就是在X2分布基础上推导出来的。 9. 方差分析的基本思想：根据研究目的和设计类型，把总体变异中离均差平方和分解成两部分或更多部分，也把总变异中的自由度相应分成两部分或更多部分，然后再进行比较，评价由某种因素引起的变异是否具有统计学意义。 10. 假设检验中P，a,b（倍他）的关系及统计学意义： a：检验水准，即显著性检验，在此概率之下的认为是小概率事件，统计学上以为此事件“不可能发生”，以此判断是否不拒绝H0无效假设，在假设检验中，按a检验水准，拒绝了原来正确的H0，即犯了第1类错误，犯此错误的概率为a。 b：在T假设检验中，按照a检验标准，没有拒绝原来错误的无效假设，即犯了第2类错误，犯次错误的概率是b。 P：是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较，根据比较的结果作出统计判断。如果P≤a时，就怀疑假设的成立，拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0，接受H1的推论时犯错误的机会越小。 11．行x列表X2检验应注意：（1）行x列表中不宜有1/5以上格子的理论频数小于5或有一个格子的理论频数小于1，若发生上述情况可采用：A将理论频数过小的格子所在的行或列与性质相近的邻近行或列中的实际频数合并，使重新计算的理论频数增大。B删去理论频数过小的行或列。C增大样本含量以增大理论频数。（2）当效应按强弱分为若干级别，则按实验结果可整理为单向有序行x列表，在比较各处理组的效应有无差别时，宜用秩和检验，ridit分析等。如作X2检验只说明各组构成比的差异有无统计学意义。

医学统计学总结重点笔记复习

章第一1 选2）是根据研究目的确定的同质观察单位（研究对象）的全体，population总体：总体（实际上是某一变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。总体population根据研究目的而确定的同质观察单位的全体。）。样样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。从总体中随机抽得的部分观察单位，其实测值的集合。样本sample1 3选（即在大量重复试验中出现的频率非常低）的事件小概率事件：我们把概率很接近于0 称为小概率事件。值即概率，反映某一事件发生的可能性大小。统计学根据显著性检验方法所得P 值：P 认为有高 P ≤0.01 P 到的P 值反应结果真实程度，一般以≤ 0.05 认为有统计学意义，或0.01。度统计学意义，其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 值是：P 1) 一种概率，一种在原假设为真的前提下出现观察样本以及更极端情况的概率。 2) 拒绝原假设的最小显著性水平。实例的) 显著性水平。3) 观察到的( 4) 表示对原假设的支持程度，是用于确定是否应该拒绝原假设的另一种方法。小概率原理：一个事件如果发生的概率很小的话，那么可认为它在一次实际实验中是不会发生的，数学上称之小概率原理，也称为小概率的实际不可能性原理。统计学中，一 0.01的概率为小概率。般认为等于或小于0.05或 1）资料的类型（3选）计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称1（其变量值是定量.为计量资料（measurement data）。计量资料亦称定量资料、测量资料。、红细胞(kg)的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重12L分）、血压（KPa(10/）等。)、脉搏（次/计数numerical quantitative data数值变量资料计量资料measurement data定量资料variable 为观测每个观察单位某项指标的大小，而获得的资料。）计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料2（）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相count data（容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、 O 四种血型的人数等。ABA、B、、无效的人数；调查一批少数民族居民的unordered qualitative data定性资料无序分类变量资料enumeration data 计量资料nominal variable 名义变量资料categorical variable 为将观察单位按某种属性或类别分组计数，分组汇总各组观察单位数后而得到的资料。．）等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察3（）。等级资料又称有序变量。如患者的治疗结果可ordinal data单位数，称为等级资料（分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但等。、+++这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为 +、++等级资料ranked data半定量资料semi-quantitative data有序分类变量ordinal categorical variable资料为将观察单位按某种属性的不同程度分成等级后分组计数，分类汇总各组观察单位后而得到的资料。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。两种误差（2选1）抽样误差（sampling error ）由于抽样而引起的总体指标(参数)与样本指标(统计数)之间的差异。抽样误差是由个体变异或其它随机因素造成的，是不可避免的，但误差分布有规律可循，可

医学统计学重点总结

1.简述总体和样本的定义，并且举例说明。总体是研究目的确定的所有同质观察单位的全体。样品是从研究总体中抽取部分有代表性的观察单位。 2.简述参数和统计量的定义，并且举例说明。描述总体特征的指标称为参数，描述样本特征的指标称为统计量。 3.变量的类型有哪几种？举例说明各种类型变量有什么特点。 ①定量数据：计量资料；定量的观测值是定量的，其特点是能够用数值的大小衡量其水平的高低。 ②定性数据：计数资料；变量的观测值是定性的，表现为互不相容的类别或属性。 ③有序数据：半定量数据/等级资料；变量的观测值是定性的，但各类别（属性）有程度或顺序上的差异。 4.请举例说明一种类型的变量如何变换为另一种类型的变量。定量数据>有序数据>定性数据 ---------------> 5.请简述什么是小概率事件？概率是描述事件发生可能性大小的度量，P0.05事件称为小概率事件。 6．举例说明什么是配对设计。配对设计是将受试对象按某些重要特征相近的原则配成对子，每对中的两个个体随机地给予两种处理。①同源配对：同一受试对象或同一标本的两个部分，随机分配接受两种不同处理；②异源配对：为消除混杂因素的影响，将两个同质受试对象配对分别接受两种处理。 7.非参数假设检验适合什么类型数据进行分析？ ①总体分布类型未知或非正态分布数据；②定量或半定量数据；③数据两端无确定的数值。 8．简述P 25 P 5０ P ７5 的统计学意义。（条件：明显偏态且不能转化为正态或近似对称；一端或两端无确定数值；分布情况未知）用来描述资料的观测值序列在某百分位置的水平，四分位数间距可以作为说明个体差异的指标（说明个体在不同位置的变异情况）。 9.直条图、直方图、圆饼图的使用条件是什么？直条图：各自独立的统计指标的数值大小和他们之间的对比；直方图：连续变量频数分布情况；圆饼图：全体中各部分所占的比例。 10.统计分析包括哪两个方面的内容？为什么要进行统计推断？统计描述和统计分析；统计描述用来描述及总结一组数据的重要特征，其目的是使实验或观察得到的数据表达清楚并便于分析。统计推断指由样本数据的特征推断总体特征的方法，包括参数估计（点估计和区间估计）和假设检验（判断随机波动引起差别的概率大小）。统计推断是通过样本推断总体的统计方法/根据样本提供的信息和抽样分布的规律，以一定的概率推断总体的特征。总体是通过总体分布的数量特征即参数 (如方差) 来反映的。很多时候并不知道总体的参数，只能由样本统计量推断获得。 11.定量数据如何进行统计描述？请举例说明。通过具体数值反应高低水平。 12.定性数据如何进行统计描述？请举例说明。根据类别或属性的不同分类。 13.简述均数的抽样误差及率的抽样误差。由抽样造成的样本统计量与总体参数的差异称为抽样误差，样本均数不等于总体均数μ，总体率参数π不等于样本率p。 14.简述正态分布和标准正态分布的关系。 (μ=0，)关系：标准正态分布是正态分布的一种，具有正态分布的所有特征。所有正态分布都可以通过Z分数公式转换成标准正态分布。区别：正态分布的平均数为μ，标准差为σ；不同的正态分布可能有不同的μ值和d值，正态分布曲线形态因此不同。标准正态分布平均数μ＝0，标准差σ＝1，μ和σ都是固定值；标准正态分布曲线形态固定。

医学统计学公式总结

一资料的描述性统计（一）算术均数(mean) （1）简单算术平均值定义公式为（直接法）：（2）利用频数表计算均数（加权法）：（二）方差（即标准差的平方）（三）变异系数二参数估计与参考值范围（一）均数的标准误（二）样本率的标准误（p 为样本率）（三）T 分布（u 为总体均数）（四）总体均数的区间估计（一般要求计算95%或99%的可信区间）（五)总体率的区间估计（六)参考值范围估计双侧1-a 参考值范围： s u x a 2/± 单侧1-a 参考值范围： s u x a ->或s u x a +< （可信区间计算是用标准误，参考值范围计算用标准差，百分位数法大家自己看书）三 T 检验与方差分析（一）T 检验（1）单样本T 检验 n x n x x x x x n ∑= ++++= 321∑∑= ++++++++=f fx f f f f x f x f x f x f x k k k 3213322111 )(2 2--= ∑n x x s 22 2()/1 x x n s n -= -∑∑%100?= x s CV n s s x = n p p s p ) 1(-=n s x t μ-=x x s t x s t x ναναμ,2/,2/+<<-p p s u p s u p 2/2/ααπ+<<-

检验假设：（假设样本来自均数为0 u 的正态总体）统计量t 值的计算：（2）配对T 检验检验假设：统计量t 值的计算：（d 为两组数据的差值，Sd 为差值的标准差）（3）两样本T 检验检验假设：统计量t 值的计算：其中两样本方差齐性检验（即为两样本方差的比值）（二）单因素方差分析 SS MS F SS MS νν= = B B B W W W （1）完全随机设计资料的方差分析这里（T 即为该组数据之和）（2）随机单位组设计资料的方差分析 SS 总=SS 处理+SS 区组+SS 误差 V 总=V 处理+V 区组+V 误差 μμ=：H 1 ,/0 0-=-=-= n n s x s x t x νμμ0210==-μ μμ：H d d t s μ-== 1 -=n ν210μμ=：H 2 1)()(2121x x s x x t ----=μμ2 21-+=n n ν ? ??? ??+=-2121121n n s s C x x 2)()(112222112-+∑-∑+-=n n x x x x s C 2221s s F =111-=n ν1 2 2-=n ν组内组间总SS SS SS +=组内组间总ννν+=2()/C x N =∑ij j T x = ∑

临床医学统计学各种资料比较选择方法小结

医学统计学各种资料比较选择方法小结一、两组或多组计量资料的比较 1.两组资料： 1)大样本资料或服从正态分布的小样本资料 (1)若方差齐性，则作成组t检验 (2)若方差不齐，则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料，则用成组的Wilcoxon秩和检验 2.多组资料： 1)若大样本资料或服从正态分布，并且方差齐性，则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：LSD检验，Bonferroni检验等）进行两两比较。 2)如果小样本的偏态分布资料或方差不齐，则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：用成组的Wilcoxon秩和检验，但用Bonferroni方法校正P值等）进行两两比较。二、分类资料的统计分析 1.单样本资料与总体比较 1)二分类资料： (1)小样本时：用二项分布进行确切概率法检验； (2)大样本时：用U检验。 2)多分类资料：用Pearson c2检验（又称拟合优度检验）。 2. 四格表资料 1)n>40并且所以理论数大于5，则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5，则用校正c2或用Fisher’s 确切概率法检验 3)n￡40或存在理论数<1，则用Fisher’s 检验 3. 2×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则行评分的CMH c2或成组的Wilcoxon秩和检验 2)列变量为效应指标并且为二分类，列变量为有序多分类变量，则用趋势c2检验 3)行变量和列变量均为无序分类变量 (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%，则用Pearson c2 (2)n￡40或理论数小于5的格子数>行列表中格子总数的25%，则用Fisher’s 确切概率法检验 4. R×C表资料的统计分析 1)列变量为效应指标，并且为有序多分类变量，行变量为分组变量，则CMH c2或Kruskal Wallis的秩和检验 2)列变量为效应指标，并且为无序多分类变量，行变量为有序多分类变量，作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量，可以作Spearman相关分析 4)列变量和行变量均为无序多分类变量， (1)n>40并且理论数小于5的格子数<行列表中格子总数的25%，则用Pearson c2 (2)n￡40或理论数小于5的格子数>行列表中格子总数的25%，则用Fisher’s 确切概率法检验三、Poisson分布资料 1.单样本资料与总体比较： 1)观察值较小时：用确切概率法进行检验。 2)观察值较大时：用正态近似的U检验。 2.两个样本比较：用正态近似的U检验。配对设计或随机区组设计四、两组或多组计量资料的比较 1.两组资料： 1)大样本资料或配对差值服从正态分布的小样本资料，作配对t检验 2)小样本并且差值呈偏态分布资料，则用Wilcoxon的符号配对秩检验 2.多组资料： 1)若大样本资料或残差服从正态分布，并且方差齐性，则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：LSD 检验，Bonferroni检验等）进行两两比较。 2)如果小样本时，差值呈偏态分布资料或方差不齐，则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义，则进一步作统计分析：选择合适的方法（如：

硕士医学统计学知识点总结汇总

第2章统计描述 1. 对定量资料进行统计描述时，如何选择适宜的指标？定量资料统计描述常用的统计指标及其适用场合描述内容指标意义适用场合平均水平均数个体的平均值对称分布几何均数平均倍数取对数后对称分布中位数位次居中的观察值 ①非对称分布；②半定量资料；③末端开口资料；④分布不明众数频数最多的观察值不拘分布形式，概略分析调和均数基于倒数变换的平均值正偏峰分布资料变异全距观察值取值范围不拘分布形式，概略分析

度标准差（方差）观察值平均离开均数的程度对称分布，特别是正态分布资料四分位数间距居中半数观察值的全距 ①非对称分布；②半定量资料；③末端开口资料；④分布不明变异系数标准差与均数的相对比 ①不同量纲的变量间比较；②量纲相同但数量级相差悬殊的变量间比较定性资料：阳性事件的概率，概率分布，强度和相对比。 2. 应用相对数时应注意哪些问题? 答：（1）防止概念混淆相对数的计算是两部分观察结果的比值，根据这两部分观察结果的特点，就可以判断所计算的相对数属于前述何种指标。（2）计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。

（3）观察单位数不等的几个相对数，不能直接相加求其平均水平。（4）相对数间的比较须注意可比性，有时需分组讨论或计算标准化率。 3. 常用统计图有哪些？分别适用于什么分析目的？常用统计图的适用资料及实施方法图形适用资料实施方法条图组间数量对比用直条高度表示数量大小直方图定量资料的分布用直条的面积表示各组段的频数或频率百分条图构成比用直条分段的长度表示全体中各部分的构成比饼图构成比用圆饼的扇形面积表示全体中各部分的构成比线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系半对数线定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系

医学统计学相关公式汇总

医学统计学相关公式汇总 Chapter 基本概念显著性检验（test of significance ）：计算P 值医学统计工作的内容： 1、实验设计：最关键最重要 2、收集资料：最基础原始资料：实验数据现场调查资料医疗卫生工作记录报表报告卡质量控制——精度和偏倚 3、整理资料（1）资料的逻辑检查（坏数）（2）一致性检查（3）原始数据加工：频数分布表 4、分析资料：统计描述（表、图、离散趋势、集中趋势）和统计推断统计描述类型的选择：集中趋势离散趋势对称、正态 μ，x S SS ，，对数正态 G S lgX 偏态及其他 M Q ，R 单位不同或均数差别大 CV 医学统计的资料类型：计量资料、计数资料、等级分组资料医学统计学的对象：有变异的事物总体和样本：总体（population ）的特性：同质性、大量性、差异性。

抽样的要求：代表性、随机性、可靠性、可比性。样本的三性：代表性、随机性、可靠性。可靠性（reliability ）：实验的结果要具有可重复性。即由科研课题的样本得出的结论所推测总体的结论有较大的可信度。两样本间具有：可比性。误差的类别： 1、系统误差（system error ）：在资料的收集过程中，由于仪器初始状态没有调零、标准试剂未经矫正、标准指定偏高或偏低等原因，造成的观察结果的倾向性的偏大或偏小。必须克服。 2、随机测量误差（random measurement error ）：在避免系统误差的情况下，由于各种偶然因素的影响造成对同一对象多次测量值的不一致。 3、抽样误差（sampling error ）：由于抽样造成的的样本统计量与总体参数之间的差别。不可避免。样本含量越大，抽样误差越小。如均数的抽样误差：|-X | 。概率（probability ）：P （A ）小概率事件：P ≤0.05（有统计学意义）或P ≥0.01（有高度统计学意义）。 Chapter 集中趋势的统计描述手工整理资料频数表（frequency table ）的步骤： 1、求极差（全距） 2、确定组数、组距参考组距=全距 / 组数 3、确定组段 4、手工编制划记表直方图（histogram ）：高度：各组的频数纵轴宽度：组距横轴表示组限均数（average ）：适用：对称分布或偏度不大的资料，尤其适合正态分布。抽样总体样本推断