文档库 最新最全的文档下载
当前位置:文档库 › 实用卫生统计名词解释简答题

实用卫生统计名词解释简答题

实用卫生统计名词解释简答题
实用卫生统计名词解释简答题

《实用卫生统计学》

一、名词解释

1.变异:同一性质的事物,其观察值(变量值)之间的差异,统计上称为变异。

2.抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,抽样研究的目的是通过用样本资料计算的指标去推论总体。

3.统计描述:用统计图表或计算统计指标的方法表达一个特定群体(这个群体可以是总体也可以是样本)的某种现象或特征,称统计描述。

4.统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。

5.均数:是反映计量资料全部观察值平均水平的统计指标,适用于对称分布尤其是正态分布资料,公式如下:

∑X

X=————

n

6.标准差:是反映计量资料全部观察值离散程度的统计指标,用于描述对称分布资料,尤其正态分布资料的离散趋势,公式如下:

7.标准正态变换:将服从正态分布的原始变量x~n(μ,σ)进行变量变换,,这种变换叫标准正态变换(或M变换)。

8.构成比:又称构成指标,它表示事物内部各组成部分所占的比重或分布。

9.动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。

10.统计表:统计表是以表格的形式列出统计指标,它是对资料进行统计描述时的一种常用手段。11.统计图:统计图是以各种几何图形(如点、线、面或立体)显示数据的大小、升降、分布以及关系等,它也是对资料进行统计描述时的一种常用手段。

12.抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。13.均数的抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。统计学上,对于抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差。

14.率的抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。统计学上,对于抽样过程中产生的同一总体中率之间的差异称为率的抽样误差。

15.检验水准:检验水准,也称为显著性水准,符号为α。α是预先规定的概率值,通常取0.05,它是“是否拒绝H。的界限”。

16.可比性:可比性是指除了处理因素外,其他可能影响结果的非处理因素在各组间应该尽可能相同或相近,即“齐同”。

17.检验效能:检验效能又称为把握度(1一β)。它的含义是:当两总体确实有差别时,按规定的检验水

准α,能够发现两总体间差别的能力。

18.四格表资料:两个样本率的资料又称为四格表资料,在四格表资料中两个样本的实际发生频数和实际未发生频数为基本数据,其他数据均可由这四个基本数据推算出来。

19.列联表资料:对同一样本资料按其两个无序分类变量(行变量和列变量)归纳成双向交叉排列的统计表,其行变量可分为R类,列变量可分为C类,这种表称为R×C列联表。

20.参数检验:参数检验是一种要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行统计推断的假设检验。

21.非参数检验:非参数检验是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。

22.秩次:秩次即通常意义上的序号。实际上就是将观察值按顺序由小到大排列,并用序号代替了变量值本身。

23.直线相关系数:它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统

计指标。相关系数没有单位,取值范围是-1≤r≤1,

r的绝对值越大表明两变量的关系越密切。

24.直线回归系数:它是直线回归方程的重要参

数之一,即回归直线的斜率。当b>0时,表示直

线由左下方走向右上方,y随x增大而增大。回

归系数b的统计学意义是x每增加(或减少)一个单

位时,y平均改变b个单位。

25.正相关:它是说明具有直线关系的两个变量

间,存在有正的相关方向,即当x增大时,y有

相应增大的趋势,所算得的相关系数r为正值。

26.完全负相关:这是一种极为特殊的负相关关

系,从散点图上可以看出,由X与y构成的散点

完全分布在一条直线上,x增加,y相应减少,算

得的相关系数r=-1。

27.等级相关:等级相关是对等级数据作相关分

析,它又称为秩相关,是一种非参数统计方法。

28.评价:所谓评价,是通过对照某些标准来判

断观测结果,并赋予这种结果以一定的意义和价

值的过程。

29.综合评价:所谓的综合评价,是指人们根据

不同的评价目的,选择相应的评价形式,据此选

择多个因素或指标,并通过一定的数学模型,将

多个评价因素或指标转化为能反映评价对象总体

特征的信息。

30.综合评分法:综合评分法是在以专家评分法

作为权重估计的基础上而建立的一种综合评价方

法。

31.优序法:为了比较某几个事物或方案的优劣,

在选定各项评价指标后,将待评价的对象或方案

就各项评价指标的测量值大小分别排序,并分别

对各序号(等级)以相应的评分值即优序数,然后综

合诸评价指标,分别计算评价对象的总赋优序数,

并按总赋优序数大小评定其优劣顺序的方法即优

序法。

32.Topsis法:Topsis法常用于系统工程中有限

方案多目标决策分析,此外,也可用于效益评价、

卫生决策和卫生事业管理等多领域。

33.层次分析法:用层次分析法作系统分析,首

先需要把问题层次化,根据问题的性质和评价目

的,将问题分解为不同的组成因素,得到各层的

评价指标,并以最下层的评价目标作为衡量目标

达到程度的评价指标。然后依据这些指标计算出

综合评分指数,对评价对象的总评价目标进行评

价,最后依其大小来确定评价对象的优劣等级。

34.发病率:发病率是指一定时期(年、季、月)

内,可能发生某病的人群中实际发生某病新病例

的频率。

35.时点患病率:时点患病率:指在某时点检查

时,接受检查的人群中现患病例所占的比例,分

子为新老病人数,又称现患率或流行率。

36.某病病死率:某病病死率:表示在规定的观

察期间内,某病患者中因该病而死亡的频率。

37.某病死亡率:某病死亡率是一定时期内某人

群因某病而死亡的频率。

38.卫生服务调查统计:1.卫生服务调查统计是

卫生统计的主要内容之一,卫生服务调查统计是

从卫生服务资料的设计、收集,整理、分析的角

度,来阐述卫生服务研究的特点、研究方法和注

意事项,以便使卫生服务研究工作更具有科学性。

39.卫生服务调查:卫生服务调查是指对卫生服

务状况、人群健康的危险因素、人群卫生服务的

需求和利用、卫生服务资源的分配和利用所进行

的一种社会调查。

40.调查表:把调查项目按调查时提问的逻辑顺

序列成表格就是调查表,调查表又称调查问卷。

41.卫生服务需要:卫生服务需要是指人们因疾

病影响健康,引起人体正常活动的障碍,实际应

当接受各种卫生服务的需要(如预防保健、治疗、

康复)。

42.两周患病率:两周患病率指在每千名被调查

者的居民中,在调查日之前两周之内患病的人数。

43.两周就诊率:两周就诊率指每千名被调查的

居民中,在调查之日前两周内因病、伤去医疗机

构就诊的人(次)数。

44.住院分娩率:住院分娩率某年某地每百名活

产中在县级或县级以上医院接受住院分娩的产妇

数。

45.卫生资源:卫生资源是指卫生人力,卫生费

用、卫生设施和设备、卫生技术和卫生信息。

二、简答题

1.卫生事业管理专业与卫生统计学的关系是什

么。卫生事业管理的研究对象也存在许多不确定

性,因此,要利用卫生统计这个有效工具,充分

发挥卫生统计的信息、咨询、监督的整体功能,

为满足决策管理和卫生服务研究的需要。

2.总体和样本的关系是什么。样本是从总体中随

机抽取的一部分有代表性的个体组成,除了数量

比总体少,其他构成均与总体一样,是总体具体

而微的缩影。

3.收集资料时,对统计资料的要求是什么?要做

到①资料必须完整、正确和及时;②要有足够的数

量;③注意资料的代表性和可比性。

6.正态分布有哪些参数?为什么说正态分布是很

重要的连续性分布?总体均数卢和总体标准差a

被称为正态分布参数。卢为位置参数,它描述了

正态分布集中趋势的位置;a为变异度参数,反

映正态分布的离散程度。若已知某数值变量服从

正态分布或近似正态分布,如同年龄、同性别儿

童及同性别健康成人身高、体重等,可按正态分

布的规律估计其个体变量值所在范围,如95%的

医学参考值的估计。同时正态分布是很多统计分

析方法的基础。

4.标准正态曲线下横轴上下侧尾部面积为

O.5 %、2.5%、5%时所对应的u值?标准正态

曲线下横轴上下侧尾部面积的0.5%、2.5%、5%

时所对应的u值分别为-2.58、-1.96、-1.64。

5.了解正态曲线下面积分布规律有何用处?根据

正态曲线下面积的分布规律,可以估计观察值的

频数分布情况,通常用于估计95%的观察值所在

范围和99%的观察值所在范围,临床医学常用以

估计医学参考值范围。

7.应用相对数时有哪些注意事项?(1)构成比与率

是意义不同的两个统计指标,应用时不能相互混

淆。构成比说明事物内部各组成部分所占的比重,

而率则说明某事物或现象的发生频率或强度,不

能以构成比代替率来说明问题。(2)样本含量太小

时,不宜计算相对数,最好用绝对数来表示。(3)

对各组观察例数不等的几个率,不能直接相加求

其总率。(4)在比较相对数时应注意资料的可比性。

8.率的标准化法的基本思想?直接标化法需要的

条件是什么?当不同人群的总率进行比较时,若其

人群的内部构成(如年龄、性别、病情轻重等)存在

差异,而年龄、性别等因素对率有影响。为消除

构成的影响,要按照统一标准构成对两个人群进

行校正,使两个人群构成一致。这种选择统一构

成,然后计算标准化率的方法称为率的标准化法。

直接法计算标化率需下面2个条件:(1)资料条件:

已知实际人群的年龄别(组)率,且各年龄组率无明

显交叉。(2)选择标准:可选择标准人群的年龄组

人口数或构成比。

10.统计表和统计图在表达资料中有何特殊作用?

统计表和统计图是我们分析、对比事物的重要工

具,统计图表的合理采用可以使资料得以准确表

达,使人印象深刻和一目了然,便于资料的计算、

分析和对比。

11.绘制统计表的基本原则是什么?绘制统计表有

两个基本原则是:1)一张表只能有一个中心,要

说明什么问题,应该十分明确;2)横纵标目的排

列要合理,主谓分明。

12.绘制统计表的基本要求是什么?①标题不可缺

少,要求用一句简明扼要的话来说明表的内容,

写在表的上方;②横纵标目的设计要符合逻辑,

主谓分明,标目的文字应简明,有单位的要注明;

③线条同样应力求简洁,除基本线条外,应

尽量减少其他不必要的线条;④数字应准确无误,

要求一律采用阿拉伯数字表示,同一指标的数字

的小数位数应一致,位次对齐,表中不宜留空项;

⑤备注一般不列入表内,而写在表的下方。

13.绘制统计图有哪些总要求?①要根据资料的性

质以及分析目的,选择合适的图形;②统计图要

有标题,要求能简明扼要的说明图的内容,一般

写在图体下方的中央位置;③对于有横纵坐标轴

的图形,要说明横纵轴分别代表的事物的名称,

并标注单位。横纵轴的长度比例通常为7:5;④

在同一张图内比较不同事物时,要用不同颜色或

线条区别它们,并附图例说明,图例的摆放位置

要与图体协调。

15.普通线图与半对数线图在绘制方法上的主要

区别是什么?普通线图与半对数线图都是有横纵

坐标轴的图形,在绘制普通线图时,横纵轴均采

第 1 页

用普通算术尺度,而绘制半对数线图时,横轴为算术尺度,纵轴为对数尺度。

17.t分布与u分布有何联系?t分布曲线是一簇曲线,随自由度υ不同,曲线的形状不同。当自由度υ很大,即n很大时,t分布近似u分布。18.t分布的特征是什么?t分布的特征:①以0为中心,左右对称的单峰分布。②自由度υ=n一1越小,曲线变得越低平,尾部翘得越高;③随着自由度υ逐渐增大时,t分布逐渐逼近标准正态分布;当υ趋于∞时,t分布就完全成为标准正态分布。

19.如何理解可信区间的意义?用x±1.96s x、x±2.58s x及p±1.96S p、p±2.58s p计算的结果各说明什么问题?总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。x±1.96s x 与x±2.58s x适用于σ未知但n足够大时(n>50)总体均数的区间估计,x±1.96s x表示总体均数有95%的概率落在此范围内;x±2.58s x表示总体均数有99%的概率落在此范围内。p±1.96s p 郎与p±2.58s p,适用于n足够大,且np与n(1一p)均大于5时总体率的区间估计,p±1.96s p 表示总体率有95%的概率落在此范围内;p±2.58s p表示总体率有99%的概率落在此范围内。

21.为什么要做假设检验?假设检验可以回答什么问题?假设检验的目的是通过样本推断总体,即通过两个样本均数的比较来判断两个总体均数是否相等(以完全随机设计类型为例)。通过假设检验,可以回答两个样本均数的差异是由于抽样误差造成,还是由于两个总体均数不相等造成。22.t检验和甜检验有何区别与联系? t检验与“检验的适用条件不同。t检验的适用条件:当总体标准差σ未知,样本含量n较小(n≤50)时,理论上要求样本来自正态分布的总体。完全随机设计的两个小样本均数比较时还要求两总体方差相等。甜检验的适用条件:当总体标准差一未知,但样本含量咒较大(一般n>50)或总体标准差口已知时,选用“检验。

23.t检验,P<0.001,是否能说明两总体均数之间差别很大,为什么? t检验,P<0.001,说明差别有统计学意义,可以认为两个总体均数不同;但是假设检验的结论不能直接回答差异的大小,“差别有统计学意义”并不意味着两个总体均数相差很大。差别的大小及差别有无实际意义只能进一步根据专业知识来确定。例如:当样本量足够大时,即使两个样本均数间相差很小也可能得出P≤0.05,此时差别虽有统计学意义,但不一定有实际意义。

24.怎样正确使用单侧检验与双侧检验?应该根据专业知识来确定选择单侧检验或双侧检验。如果从专业知识的角度,判断一种方法的结果不可能低于或高于另一种方法的结果,则可以采用单侧检验。在不能根据专业知识判断两种结果谁高谁低时,则用双侧检验。

25.假设检验的结论为什么不能绝对化?假设检验的结论不能绝对化,因为无论拒绝H。或不拒绝H。,假设检验的结论都有犯错误的可能。假设检验通常可能发生下面两类错误。I型错误:拒绝了实际上成立的H。.犯I型错误的概率是α,α通常为0.05。Ⅱ型错误:接受了实际上是不成立的H。.犯Ⅱ型错误的概率是β,一般情况下β的大小是未知的。

26.完全随机设计的两样本均数比较的t检验与方差分析之间的关系如何?两个样本均数比较可以看作为多个样本均数比较的特例,因此完全随机设计的两个样本均数比较的t检验,可以用完全随机设计的方差分析代替。两者的计算结果有如下关系:。反之,则不成立,即多个样本均数比较的方法,应该用方差分析,而不能用两个样本均数比较的t 检验代替,否则会增大犯工型错误的概率。27.完全随机设计的两个大样本均数比较(总体标准差σ未知),可以考虑用哪几种方法?可以考虑三种方法:完全随机设计的t检验和“检验以及完全随机设计的单因素方差分析。

28.请简述方差分析的基本思想。方差分析的基本思想就是将总变异分解成两个或多个部分。除随机误差外,其余每个部分的变异可以由某因素的作用来解释,通过比较可能由某因素所致的变异与随机误差的均方,由F检验作出统计推断,从而了解该因素有无作用。

29、率的u检验和x2检验应用有何异同?率的u 检验主要用于:(1)一个样本率和一个总体率的比

较。(2)两个样本率的比较。应用条件见相应的章

节。x2检验应用更为广泛,可用于:(1)两个样本

率的比较。(2)多个样本率或构成比的比较。(3)列

联表资料两个变量间关系的独立性检验。(4)配对

计数资料差别的检验。(5)频数分布拟合优度的检

验(参见有关统计学专著)。对于两个样本率的

比较,样本量较大时,用x2检验和u检验所得的

统计结论一致,且u2= x2。

30、四格表资料x2检验的适用条件?四格表资料

x2检验的适用条件:(1)当n>40,且所有T≥5时,

用x2检验的基本公式或四格表专用公式。(2)当

n>40,但有1

公式。(3)若n≤40,或T≤1时,不能计算x2值,

需用确切概率计算法。

31、行×列表资料二般包括哪些资料,它们的检验

目的有何不同?行×列表资料一般包括多个样本

率、多个构成比资料,其基本数据可整理成尺行

C列,称为R×C表,又称行×列表。多个样本率

或构成比x2检验目的是推断其总体率或构成比是

否不同。对同一样本资料按其两个无序分类变量

(行变量和列变量)归纳成双向交叉排列的统计表,

其行变量可分为R类,列变量可分为C类,这种

表称为R×C列联表。列联表资料x2检验的目的是

推断两变量(行变量、列变量)之间分布是否相互独

立,用列联表的独立性x2检验。尽管这两种行×

列表检验目的和检验假设方面有所不同,但计算

x2值和自由度的公式完全相同。

32、作多个样本率或多组构成比资料比较的x2检

验,下结论时应注意什么?作多个样本率或多组构

成比资料比较的x2检验,其结论若是拒绝H。

(P≤0.05),只能认为各总体率之间(各总体构成比)

总的说来有差别,但不能说明各两组率(或各两组

构成比)之间均有差别。

33.非参数检验与参数检验的区别何在?各有何优

缺点?区别在于:①参数检验要求样本来自正态总

体,而非参数检验则不对总体分布有任何要求;

②参数检验是对总体参数(如总体均数)进行的检

验,而非参数检验考察的是总体的分布情况。参

数检验的优点是能充分利用所提供的信息,检验

效率较高。缺点是对样本所对应的总体分布有比

较严格的要求,因此适用资料有限。非参数检验

的优点是不受总体分布类型的限制,适用于任何

分布的资料。其缺点是不直接对原始数据作检验,

从而有可能会损失信息并降低其检验效率。

34.秩和检验适用哪些情况?⑴秩和检验不受总体

分布类型的限制,适用于偏态分布或分布类型不

清的资料。⑵秩和检验是将原始数据转化为秩次

来研究的,适用于不能准确测量,只能以严重程

度、优劣等级、次序先后表示的等级资料;或者

末端无确定值,如“>50mg”等资料。⑶它对样本

例数没有要求,适用于小样本资料。

35.假如对同一批资料。用参数检验和非参数检

验所得结果不一致时,宜以何者为准。对同一

批资料,在资料满足参数检验条件的前提下,参

数检验的检验效率高于非参数检验。因此当两者

所得结果不一致时,宜以参数检验结果为准。若

资料是严重偏态分布,则非参数检验的检验效率

不一定比参数检验低,此时需要结合资料的实际

情况,综合予以考虑。

36.直线相关与回归分析对资料的要求是什么?

直线相关与回归分析要求所处理的资料为双变量

资料,即对同一名研究对象要求同时测量x、y两

个数值变量,并且x、y还应服从双变量正态分布。

37.直线相关分析中散点图与相关系数r的关系

如何?由散点图可以知道相关系数r的正负,此外

根据散点排列的疏密程度能够粗略地对两变量的

相关密切程度做出判断。

38.比较直线相关分析与直线回归分析的研究目

的有何不同?直线相关分析的分析目的是:(1)首先

研究两变量间有无直线相关关系,即x变化时y

是否有相应改变;(2)如果有相关,则进一步回答

相关的方向,即当x增大,y的变化趋势是增加

还是减小,以及两者的相关密切程度有多大的问

题。直线回归分析的研究目的则是通过建立直线

回归方程,定量地描述并分析两变量间的线性依

存关系,即用x估计y。

39.为什么计算得到的相关系数r和回归系数6

都要做显著性检验?由于r与b都是根据样本资料

求得的,而在由变量x与y组成的总体中作随机

抽样,获取样本的过程中,不可避免地会存在有

抽样误差。因此当算得的r或b不为零时,有可

能实际情况是x与y之问是不相关或不存在直线

回归关系的,只是由于抽样误差,r与b才会不为

零。作显著性检验的目的正是对这种情况作出判

断,看r或b是否确实由总体相关系数ρ或总体

回归系数β不为零的总体中抽得。

40.统计中的回归关系与数学上的函数关系有何

区别?数学上的函数关系式y=a+bx,是表示变量x

与y是严格意义上的一一对应关系。每一个x值,

都会有一个确定并且唯一的y值与之相对应。在

坐标系中,所有的点(x,y)形成一条直线。而统计

中的回归式,其因变量是y的估计值,它的数值

大小与实际的y值是存在一定差距的。从散点图

来看,所有的点(x,y)不会全部落在回归直线上,

而只能是围绕其较均匀地分布。

41.直线回归分析时怎样确定自变量和应变量?

通常我们都是选取一个容易测量的变量值作为自

变量x,来估计另一个难测量的变量值(y)。与直

线相关分析不同,自变量和应变量的如何确定是

非常关键的,因为它将会影响到最终怎样解释直

线回归方程的意义。

42.请总结直线相关系数r与直线回归系数b

的意义及特点?直线相关系数r是说明具有直线关

系的两个变量间,相关关系的密切程度与相关方

向的统计指标。总体相关系数用ID表示,样本相

关系数用r表示,r是ID的估计值。相关系数没

有单位,取值范围是-1≤r≤1。r值为正,表示两变

量呈正相关,X与y变化趋势是正向的。r值为负,

表示两变量呈负相关,X与y呈反向变化,通常

r的绝对值越大,表示两变量相关关系越密切。直

线回归系数b即回归直线的斜率,b>0表示直线

从左下方走向右上方,y随x增大而增大;b<0表

示直线从左上方走向右下方,y随x增大而减小;

b=0则直线与x轴平行,x与y无直线关系。b的

统计学意义是x每增加(减)一个单位,y平均改变

x个单位。

43.直线相关与直线回归分析有何联系与区别? ⑴

区别:如果作直线相关分析,是要看两变量之间

的相关关系如何,当X值增大,Y值随之增大还

是减小。而若想了解两变量之间的依存关系,即

由自变量X来估计因变量Y,则要进行直线回归

分析。相关分析时,无论是将哪个作为自变量X

或Y,算得的相关系数的数值相等。但是回归分

析时,则必须要求利用自身的专业知识事先将自

变量X和因变量Y确定好,再建立直线回归方程,

否则将很难参回归系数b值作出正确解释。⑵联

系:对同一批资料,相关系数r为正(或负)则b

为正(或负),均表示X与Y呈同向(或反向)

变化。对同一批资料,相关系数r与回归系数b

显著性检验结果是等价的,有t r=t b的关系。

44.应用直线相关与回归分析时应注意哪些问题?

⑴作相关与回归分析要有实际意义。⑵在医学中,

许多现象之间都存在相互联系,为此我们引入相

关与回归的统计分析方法。⑶作相关分析时还应

注意以下两点:⑴在求出相关系数r的值的同时,

应作假设检验。⑵两变量相关的密切程度,是根

据相关系数的大小来判定的。⑷概率P值的理解。

⑸直线回归的适用范围一般以自变量取值范围为

限,其分析的结果不能随意外推,即不能随意地

将超过自变量取值范围的变量值X代入回归方程

求Y值。

45.为什么要做综合评价?所谓评价,是通过对照

某些标准来判断观测结果,并赋予这种结果以一

定的意义和价值的过程。单一因素的评价较易于

实现。只要分别依据该因素给研究对象一个评价

等级或分数,依等级或分数高低,便可排出优劣

顺序;但是,在现实生活中和医疗卫生实际工作

中,由于复杂的条件和状况的影响,必须综合考

察多个有关因素,依据多个有关指标进行评价,

排出优劣顺序,这就是综合评价过程。

46.为什么要对评价指标进行权重估计?在利用挑

选出来的评价指标建立评估模型时,还应当考虑

各指标对评价结果的影响大小,即各个评价指标

在评价模型中的权重问题,就是说各指标的重要

程度,因此要对评价指标进行权重估计。

47.层次分析法与其他三种方法在资料形式上有

何不同?在社会、经济以及科学管理领域,人们常

面临由相互关联、相互制约的众多因素构成的复

杂系统,对于这类由多层因素组成的复杂的资料,

用一般的综合分析方法显得无能为力。20世纪70

年代出现的层次分析法为分析这类复杂的问题提

供了一种新的、简洁并且实用方法。

48.请对四种综合评价方法进行比较它们的各自

特点是什么?综合评分法是在专家进行指标权重

估计的基础上对所有待评方案在每一个评价指标

第 2 页

计算其得分,然后累加总分后进行分析和评价的方法。本法对样本数据无特殊要求。优序法的特点是把所有待评价方案按照相同评价指标进行单指标排序,并按特定赋值原则给予优序数,最后综合所有评价指标,并分别计算各方案的总优序数,然后再进行分析评价的方法。本法对样本数据无特殊要求。Topiis法是基于归一化的数据矩阵,计算待评方案中的最优和最劣方案的最优值向量和最劣值向量,通过计算待评价方案与最优和最劣方案的距离,获得各评价方案与最优方案的接近程度,最终达到评价的目的。本法对数据无特殊要求。层次分析法的特点是把评价目标分解为不同层次的目标,对原始资料按不同层次建立目标树图,并根据经验对各层子目标的重要程度做两两对比打分,用计算得到的各层子目标的权重系数计算组合权重,最后用累加法等方法计算加权总分并进行综合评价。

50.某病病死率和某病死亡率的区别。某病病死率表示在规定的观察期间内,某病患者中因该病而死亡的频率;某病死亡率表示一定时期内某人群因某病而死亡的频率。病死率常用来说明某疾病对病人生命的威胁程度,它常受疾病的严重程度及医疗水平的影响,一般用百分率表示。某病死亡率反映了某种疾病对居民生命的危害程度,一般用10万分率表示。

51.疾病的统计对象有哪些?疾病的统计对象有①门诊疾病的统计对象:指患者去医疗机构就诊,并经医师诊断为患病者。②住院疾病的统计对象:诊断为有病的住院病人。③疾病调查的研究对象:与门诊和住院疾病的统计对象不同,疾病调查常以特定人群(包括健康人和病人)作为研究对象,探讨疾病在人群中的分布。应根据调查目的确定观察对象。并根据研究目的确定研究的疾病及诊断方法和诊断标准。

52.疾病的统计单位有哪些?什么是新发病例和现患病例?有“病人”和“病例”的不同统计单位。新发(生)病例:指在观察期间(通常为一年内)新发生的疾病,以第一次诊断为准。一些急性病,在观察期间内发病,在此期间内治愈,愈后又发生同一种病,则算作2个新病例。现患病例:疾病调查或健康检查时的现患病例,是指在调查时点或调查期间(一般很短的期间)内的检查出的疾病,包括在此之前发生而未愈的病例及本次调查新发现的病例。

53.什么是国际疾病分类?有什么用途?国际疾病分类(International Classification of Diseases,ICD)是将有关疾病与其他健康问题的医学描述与诊断,转化为由字母数字所组成的编码,该编码已成为国际公认的疾病统计标准分类。主要用途①使用国际疾病分类便于信息贮存、统计分析。②不同国家、不同地区或相同国家、地区的不同医院之间按照这一国际标准,对疾病、损伤中毒和死亡原因等健康问题进行编码与分类,获得的疾病与死因统计资料可以相互比较。

54.什么是根本死因?为什么死因统计要选择根本死因?WHO规定,根本死因是指:“(a)引起直接导致死亡的一系列病态事件的那些疾病或损伤,或者(b)造成致命损伤的事故或暴力的情况”。制定根本死因的想法是从预防死亡的角度出发,去寻找带有根本性的、引起一系列疾病并最终导致死亡的那个原因,不管它发生在死前多长时间都应给予记录。根本死因可以是一个明确的疾病诊断,可以是一个无明确诊断的医学情况(如:症状、体征、临床表现),也可以是一个意外的损伤和中毒。56.卫生服务调查资料的来源有哪些?卫生服务调查资料的来源同一般的统计资料来源相同,主要来自常规报表、卡、册和专题调查,从卫生服务供需的两方面考虑,卫生服务调查资料的来源主要包括卫生机构调查和家庭卫生询问调查。57.描述性调查和分析性调查需要的资料有何不同?描述性卫生服务调查旨在掌握卫生服务的现状与历史,并用文字、数字描述疾病、健康的基本情况。通过对健康的现状和历史的描述,还可对近期、远期的卫生服务状况及其变动趋势进行预测。分析性卫生服务调查是对卫生服务状况的原因进行探讨。描述性调查回答了某问题是什么样的,即它的状态;分析性调查则回答了该问题为什么是这样的,即它的原因。分析性调查主要探讨事物及其现象间的内在联系,通过对大量现象的观察,从总趋势中分析出事物之间的联系及其联系程度。

59.家庭卫生服务调查中常用抽样方法有哪些?常用的抽样方法有单纯随机抽样、整群抽样、系统抽样和分层抽样。发展中国家大多数采用整群抽样和系统抽样,发达国家多采用分层随机抽样方法或多阶段随机抽样方法。

60.在调查表的内容设计上应注意哪些?在调查表的内容设计上必须注意以下几点:(1)符合研究目的的需要,指标不宜设置得太多或太少。(2)针对所研究事物的性质选择合适的问卷,以免收集的资料不完整或存在偏倚。(3)应避免项目含糊不清。(4)不要涉及社会禁忌与爱好,如正面提问敏感的道德问题或个人隐私等,这样就无法得到准确的回答。(5)不应有暗示作用,暗示会诱导被调查者趋向于某种答案。(6)不要超出被调查者的知识和能力,概念不要太抽象、太笼统。62.静态人口统计都有哪些指标,分别用来说明什么问题?静态人El统计的常用指标有人口总数、性别比、年龄中位数、老年人口系数、少年儿童人口系数、老少化、负担系数、人口金字塔。其中人口总数用来说明一个国家或地区的人口规模;性别比说明人口的性别特征,计算不同年龄段的性别比较有意义;年龄构成指标说明人口所占比例,用于反映人口类型。人口金字塔将人口的性别和年龄资料结合起来,形象直观地反映现有男女性别人口的年龄构成,而且也可以分析过去人El的出生死亡情况以及今后人口的发展趋势。

64.总和生育率是如何计算的?为什么是测量生育水平较理想的指标?年龄分组为5岁一组时,则年龄别生育率之和再乘5,即得总和生育率。表示每1000名妇女一生平均生多少个孩子,或每个妇女一生平均生多少个孩子。总和生育率是用某年横断面的年龄别生育率资料计算的,因此消除了人口的年龄性别构成对生育水平的影响,不同时间、不同地区的总和生育率可以直接进行比较。66.什么是寿命表,其最大优点是什么?寿命表是根据某一人群的年龄组死亡率编制出来的,说明人群生命过程及死亡过程的一种统计表。其优点是寿命表中的各项统计指标不受人口年龄结构的影响,不同地区或时期的寿命表指标可以直接比较。

67.寿命表的基本思想是什么?其基本思想是假定有同时出生的一代人,按照某个时期当地人口实际年龄组死亡率而陆续死亡,用寿命表方法计算出一系列统计指标,其中尚存人数(l x)、死亡人数(n d x)、死亡概率(n q x)及平均预期寿命(e x)是主要寿命表指标。

68.现时寿命表和定群寿命表的主要区别是什么?主要区别为现实寿命表是用某一时间的横断面资料进行编制。按五岁或十岁一组计算出来的寿命表称简略寿命表。定群寿命表是用纵向随访资料进行编制。

69.编制简略寿命表必须具备哪些原始资料?原始资料中的哪些问题可能影响寿命表指标的准确性?编制简略寿命表必须有分性别、年龄组的平均人口数和死亡数,或分性别、年龄组死亡率资料,这些都是来自某时某地人口及死亡统计的实际资料。在此基础上再用假定的10万人去计算一系列的寿命表指标。我国在收集人口出生、死亡资料过程中,很多地方存在的问题是新生儿出生与死亡数字的漏报,对计算婴儿死亡率的影响较大,进而影响到寿命表指标的准确性。

70.哪两个指标在寿命表编制中起到重要和关键的作用?为什么?n m x和n q x,因为简略寿命表中的年龄组死亡率是根据原始资料中某年龄组的死亡人数和该年龄组的平均人口数计算的,是编制寿命表的基础,而死亡概率又是计算其他寿命表指标的关键。

71.去死因寿命表的基本原理是什么?其用途是什么?其基本原理是:先编制消除某病死亡后的寿命表,计算其平均预期寿命。然后,和全死因的平均预期寿命,即用简略寿命表计算的未消除该死因的平均预期寿命相比,通过两表的寿命(以)差数来说明该病对居民生命的危害程度。其作用是求得消除某种死因后的平均预期寿命的增量,综合说明某种死因对人类寿命的影响。

第 3 页

卫生统计学简答题

卫生统计学简答题 方差分析的基本思想和应用条件是什么? 答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。其应用条件是,①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性。 多组定量资料比较时,统计处理的基本流程是什么? 答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。若方差齐性,且各样本均服从正态分布,选单因素方差分析。若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。 简述秩和检验的优缺点 秩和检验的优点是(1)不受总体分布限制,适用面广;(2)适用于等级资料及两端无确定值的资料;(3)易于理解,易于计算。缺点是符合参数检验的资料,用秩和检验,则不能充分利用信息,检验效能低。 试述假设检验与置信区间的联系与区别。 答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。 试述两类错误的意义及其关系。 答:Ⅰ类错误(typeⅠerror):如果检验假设0H实际是正确的,由样本数据计算获得的检验统计量得出拒绝0H的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为Ⅰ类错误。Ⅱ类错误(type Ⅱerror):假设检验的另一类错误称为Ⅱ类错误(type Ⅱerror),即检验假设0H原本不正确(1H正确),由样本数据计算获得的检验统计量得出不拒绝0H(纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用β表示。在假设检验时,应兼顾犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)。犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)成反比。如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。为了同时减小α和β,只有通过增加样本含量,减少抽样误差大小来实现。 什么资料适合用秩和检验进行检验?简述秩和检验步骤。 答:提示:进行有序资料的比较时宜采用秩和检验。 (1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性;(5)一端或两端无界。 秩和检验步骤为:①建立假设H0和H1,并确定检验水准α;②根据不同的设计类型对

统计学名词解释简答

名词解释 统计总体:指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。统计总体的特征:同质性、差异性、大量性。 总体单位:个体,指构成总体的各个单位。 统计指标:简称指标,用来反映社会经济现象总体的数量特征的概念及其数值。任一概念都包含指标名称和指标数值。特征有总体性、数量性、综合性、具体性。 统计标志:在统计中,总体单位所具有的属性或特征的名称。标志是统计研究的起点,总体单位是标志的载体,是标志的承担者,统计研究是从登记标志开始的,并通过对标志的综合来反映总体的数 量特征。可分为品质标志和数量标志,或不变标志和变异标志。 统计调查:就是根据统计研究的预定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的原始资料的工作过程。 统计调查是整个统计工作的基础环节。统计调查的好坏,将影响统计资料的正确与否,从而影 响统计质量。统计调查的要求:准确性、及时性、全面性、系统性。 普查:是根据统计任务的特定目的而专门组织的一次性全面调查。调查范围:1.属于一定时点的社会经济现象的总量(如人口普查)。2.反映一定时期现象的总量(如出生人口总数)。优点:所获资料 更详细,有较高的准确性和时效性。缺点:工作量大,花费时间长,耗费大量的人力、物力和 财力。主要作用:在于掌握某些关系国计民生、国情国力的数据,获得比较准确的信息。 抽样调查:指从所要研究的总体中,按照随机原则,抽取部分单位进行调查,并将调查整理得出的数量特征,用以推断总体综合数量特征的一种非全面调查组织形式。特点:随机性、推断性。优点: 经济性、时效性、准确性、灵活性。应用范围:①对总体不可能或不必要进行全面调查,但要 掌握总体某些现象的全面数值②用抽样调查资料修正全面调查资料。作用:①承担全面调查无 法或很难承担的调查任务。如气象调查。②与全面调查结合,可以发挥相互补充、校对的作用。 ③进行生产过程的质量控制。④用来检验总体特征的某些假设,为行动决策提供依据。抽样调 查的组织形式:纯随机抽样、机械抽样、类型抽样、整群抽样、阶段抽样。 典型调查:根据调查目的和要求,在对研究总体作全面分析后,有意识地从中选取少数具有代表性的单位进行深入调查研究的一种非全面调查。优点:节省人力、物力,既可搜集统计资料,又可分析 研究问题。缺点:资料不齐全,缺乏代表性。主要作用:1.弥补全面调查不足(获取其它统计调 查方法不能得到的统计资料;补充完善统计报表;验证全面调查数据的真实性。2.进行估算某些 指标数值。 重点调查:是一种非全面调查,是在调查对象中选择重点单位进行的调查,但这部分重点单位占总体的绝大比重。优点:省事、省力,能用较少的代价及时搜集到总体的基本情况和基本趋势。缺点: 资料受重点单位影响大,资料一般不齐全。 统计整理:就是根据统计研究的预定目的,对所搜集到的资料进行科学加工,使之条理化、系统化,建立统计数据库,以满足多方面、多层次的反复需要的工作过程。作用:统计整理是统计工作过程 的重要阶段,它是实现从个体单位标志值过渡到总体数量特征值的必经阶段,是统计分析的前 提。其质量的好坏会直接影响统计分析的效果。 绝对指标:又称总量指标,有时也称绝对数。是用来说明一定社会经济现象的规模、水平的总量。它包括总体总量和标志总量。 相对指标:又称相对数,是两个相联系指标的比值。作分母的指标为基数,分子为表数。通过相对指标可反映现象间的相互关系和对比关系。一般分为有名数和无名数。种类有:计划完成相对指标、 结构相对指标、比较相对指标、动态相对指标、强度相对数。 平均指标:又称统计平均数,它是度量频率分布集中趋势或中心位置的指标。也是社会经济统计中最常用的综合指标。它是在同质总体内各总体单位某一数量标志的一般水平。一般有两种分类:静态 平均数、动态平均数。

卫生统计学名词解释

卫生统计学health statistics:卫生统计学是运用概率论、数理统计原理和方法,研究医学事物或现象的群体数量特征的科学。 总体population:总体是根据研究目的而确定的同质个体的全体。 样本sample:样本是从总体中随机抽取的一部分个体或个体值的 集合。 数值变量numerical variable:其变量值是定量的,表现为数值的大小,通常有度量衡单位。 分类变量categorical variable:其变量值是定性的,表现为互不 相容的类别或属性,没有度量衡单位。 同质homogeneity:指观察单位(研究个体)间被研究指标的影 响因素。 概率probablity:概率是描述随机事件可能发生的量度,用P表示,其波动在0~1之间。不可能事件发生的概率为0,必然事件发生的 概率为1. 抽样误差sampling error:抽样误差是指由抽样造成的样本统计量和总体参数的差别。 中位数median:是指把一组观察值,按大小顺序排列,位置居中 的变量值(n为奇数)或位置居中的两个变量值的均数(n为偶数)。 标准差standard deviation:是描述一组计量资料离散趋势的指标,说明数据间参差不齐的程度。 正态分布normal distribution:是指频数分布以均属为中心,左 右两侧基本对称,靠近均属两侧频数较多,离均数越远,频数越少,形成一个中间多、两侧逐渐减少、基本对称的分布。

区间估计interval estimation:是根据选定的置信度(用概率表示)估计总体参数所在的区间。 率rate:又称频率指标,表示一定时间内,实际发生某现象的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发 生的频率或强度。 构成比constituent ratio:指事物内部某一组成部分的观察单位数与该事物各组成部分观察单位总数之比,常用来说明事物内部各组 成部分所占的比重或分布情况。 相对比relative ratio:至两个有联系的指标之比,常用百分数或 倍数表示。 标化法比standardization:是指在进行几个总率比较时,先采用 统一的标准对几个总率的内部够成作调整,然后进行比较。这种按 统一标准调整两个率内部构成使之具有可比性的方法称标准化法。 生存分析surival analysis:是将事件的结局和出现这一结局所经 历的实践结合起来分析的一种统计分析方法。 失效事件(死亡事件或终点事件):标志某种处理措施失败或失效 的特征事件,即研究者所关心的特定事件,一般在设计阶段根据研 究目的确定。 生存时间survival time:指观察到的存活时间,可用小时、天、周、月、年等时间单位记录,常用符号t表示。 完全数据complete date:指从观察起点到发生死亡事件所经历的时间。 截尾数据:简称截尾值,又称删失值或终检值,指生存时间观察过 程的截止不是由于死亡事件,而是由于其他原因引起的,称为截尾。截尾的主要原因有失访、退出和终止。

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

统计学名词解释

1、统计学 统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。 2、指标和标志 标志是说明总体单位属性或特征的名称。指标是说明总体综合数量特征和数量关系的数字资料。 3、总体、样本和单位 统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。简称总体。构成总体的个体则称为总体单位,简称单位。样本是从总体中抽取的一部分单位。 4、统计调查 统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。它是取得统计数据的重要手段。 5、统计绝对数和统计相对数 反映总体规模的绝对数量值,在社会经济统计中称为总量指标。统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。 6、时期指标和时点指标 时期指标是反映总体在一段时期内累计总量的数字资料,是流量。时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。 7、抽样估计和假设检验 抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。 8、变量和变异 标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。数量标志和指标在统计中称为变量。 9、参数和统计量 参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。 10、抽样平均误差 样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。重复抽样的抽样平均误差为总体标准差的1/n。 11、抽样极限误差 抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。 12、重复抽样和不重复抽样 重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。13、点估计和区间估计 点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。 14、统计指数 广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。 15、综合法总指数 凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指

卫生统计学试题汇总(印)

最佳选择题 1.收集资料的方法是:E A.收集各种报表 B.收集各种工作记录 C.进行专题调查 D.进行科学实验 E.以上都对 2.统计工作的基本步骤是:D A.调查资料、审核资料、整理资料 B.收集资料、审核资料、分析资料 C.调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E.以上都对 3.在抽样研究中样本是:D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D.总体中有代表性的一部分 E.总体中有意义的一部分 4.计量资料、计数资料和等级资料的关系是:C A.计量资料兼有计数资料和等级资料的一些性质 B.计数资料兼有计量资料和等级资料的一些性质 C.等级资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.以上都不是 5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制D : A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6.直方图可用于: A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D.某现象的频数分布 E.某现象的发展速度 7.统计图表的要求是: A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8.在列频数表时,分组数目一般为: A.5-10 B.8-15 C.10-30 D.15-20 E.>20 9.平均数作为一种统计指标是用来分析: A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E.以上都不对 10.表示变量值变异情况的常用指标是: A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11.确定正常人某个指标正常值范围时,调查对象是: A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12.标准误: A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13. x σ是指: A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C.所有样本均数对总体均数的离散程度 D.某些样本均数对总体均数的离散程度 E.所有含量相同的样本均数对总体均数的离散程度 14. 2.58X X S ±表示: A.95%的正常值范围 B.95%的可信区间 C.99%的正常值范围

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

卫生统计学名词解释

1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 2.概率是描述随机事件发生可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。习惯上将P≤0.05的事件,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不发生。 6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 7.系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 8.随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 9.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 10.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。 13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 15.极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。 16.百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

实用卫生统计学复习题与答案2

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 21.假设检验中P的含义 22.I型和II型错误 23.检验效能 24.检验水准 25.方差分析 26.随机区组设计 27.相对数

28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 44.灵敏度 45.特异度 46.误诊率 47.漏诊率 48.阳性似然比 49.阴性似然比 50.Youden指数 51.ROC曲线 52.统计图 二、单项选择题 1.观察单位为研究中的( )。 A.样本B.全部对象C.影响因素D.个体2.总体是由()。

A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是()。 A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量 4.参数是指()。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后()。 A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用()。 A.变异系数B.方差 C.极差D.标准差 8.以下指标中()可用来描述计量资料的离散程度。 A.算术均数B.几何均数 C.中位数D.标准差 9.血清学滴度资料最常用来表示其平均水平的指标是()。A.算术平均数B.中位数 C.几何均数D.平均数 10.两样本均数的比较,可用()。 A.方差分析B.t检验 C.两者均可D.方差齐性检验 11.配伍组设计的方差分析中,ν配伍等于()。 A.ν总-ν误差B.ν总-ν处理

卫生统计学试题汇总

医学统计学复习题 一、名词解释 1、总体 2、样本 3、随机抽样 4、变异 5、概率 6、随机误差(偶然误差) 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、几何均数 14、四分位数间距 15、方差 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数 二、单项选择 1.观察单位为研究中的()。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2.总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标 3.抽样的目的是()。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征 4.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样,下列哪一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.选择符合研究者意愿的样本 6.反映计量资料平均的指标是()。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M 8.下列指标中,不属于集中趋势指标的是()。 A.均数 B.中位数 C.百分位数 D.几何均数 E.众数 9. ( )分布的资料,均数等于中位数。 A.对称分布 B.正偏态分布 C.负偏态分布 D.对数正态分布 E.正态分布 10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选()。 A.中位数 B.算术均数 C.几何均数 D.平均数 E.百分位数末端有确定数据

统计学名词解释及简答题 .

名词解释 一、分类数据(categorical data )是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的。 二、顺序数据(ran k data )是只能归于某一有序类别的非数字型数据。 三、数值型数据(metric data )是按数字尺度测量的观察值,其结果表现为具体的数值。 四、系统抽样(systematic sampling )将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。 五、非概率抽样(non-probability sampling )是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。 六、抽样误差(sampling error )是由于抽样的随机性引起的样本结果与总体真值之间的误差。 七、四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。 八、离散系数也成为变异系数(coefficient of variation ),它是一组数据的标准差与其相应的平均数之比。其计算公式为: s s v x = 离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。 九、泊松分布(Poisson distribution )是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。 十、中心极限定理(central limit theorem ):设从均值μ、2σ(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值X 的抽样分布近似服从均值为μ、方差2σ/n 的正态分布。 十一、置信区间(confidence interval )在区间估计中,有样本统计量所构造的总体参数的估计区间称为置信区间,其中区间的最小值称为置信上限。 十二、显著性水平(significant level)是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们根据检验的要求确定的,通常取0.05α=或0.01α=,这表明,当做出接受原假设的决定时,其正确的概率为95%或99%。 十三、方差分析(analysis of variance, ANOV A )就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。 十四、相关系数(correlation coefficient )是根据样本数据计算的度量两个变量之间线性关系强度的统计量。 十五、回归模型(regression model )对于具有线性关系的两个变量,可以用一个线性方程来表示他们之间的关系。描述因变量y 如何依赖于自变量x 和误差项ε的方程称为回归模型。 十六、点估计 利用估计的回归方程,对于x 的一个特定值0x ,求出y 的一个估计值就是点估计。点估计可分为两种:一是平均值的点估计;二是个别值的点估计。 十七、时间序列(time series )是同一现象在不同时间上的相继观察值排列而成的序列。 十八、指数平滑法(exponential smoothing )是通过对过去的观察值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t 期的实际观察值与t 期的预测值的加权平均值。 十九、指数,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法。指数是测定多项内容数量综合变动的相对数。这个概念中包含两个重点:第一个要点是指数的实质是测定多项内容;指数概念的第二个要点是其表现形式为动态相对数,既然是动态相对

相关文档
相关文档 最新文档