文档库 最新最全的文档下载
当前位置:文档库 › 卫生统计学总复习(刘桂芬主编-研究生使用)

卫生统计学总复习(刘桂芬主编-研究生使用)

卫生统计学总复习(刘桂芬主编-研究生使用)
卫生统计学总复习(刘桂芬主编-研究生使用)

卫生统计学简答题

卫生统计学简答题 方差分析的基本思想和应用条件是什么? 答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。其应用条件是,①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性。 多组定量资料比较时,统计处理的基本流程是什么? 答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。若方差齐性,且各样本均服从正态分布,选单因素方差分析。若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。 简述秩和检验的优缺点 秩和检验的优点是(1)不受总体分布限制,适用面广;(2)适用于等级资料及两端无确定值的资料;(3)易于理解,易于计算。缺点是符合参数检验的资料,用秩和检验,则不能充分利用信息,检验效能低。 试述假设检验与置信区间的联系与区别。 答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。 试述两类错误的意义及其关系。 答:Ⅰ类错误(typeⅠerror):如果检验假设0H实际是正确的,由样本数据计算获得的检验统计量得出拒绝0H的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为Ⅰ类错误。Ⅱ类错误(type Ⅱerror):假设检验的另一类错误称为Ⅱ类错误(type Ⅱerror),即检验假设0H原本不正确(1H正确),由样本数据计算获得的检验统计量得出不拒绝0H(纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用β表示。在假设检验时,应兼顾犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)。犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)成反比。如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。为了同时减小α和β,只有通过增加样本含量,减少抽样误差大小来实现。 什么资料适合用秩和检验进行检验?简述秩和检验步骤。 答:提示:进行有序资料的比较时宜采用秩和检验。 (1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性;(5)一端或两端无界。 秩和检验步骤为:①建立假设H0和H1,并确定检验水准α;②根据不同的设计类型对

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

实用卫生统计学复习题及答案2013.1

实用卫生统计学期末复习题2013.1 一、名词解释 1.构成比:又称构成指标,它表示事物内部各组成部分所占的比重或分步。 2.综合评价:是指人们根据不同的评价目的,选择相应的评价形式,据此选择多个因素或指标,并通过一定的数学模型,将多个评价因素或指标转化为能反映评价对象总体特征的信息。 3.可比性:指除了处理因素外,其他可能影响结果的非处理因素在各组间应该尽可能相同或相近,即“齐同”。 4.参数检验:是一种要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行统计推断的假设检验。 5.非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。 6.抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。7.变异:是指同一性质的事务,其观察值之间的差异,在统计学上就称作变异。 8.卫生统计学:是运用数理统计的基本原理和方法,通过数据的收集,整理和分析,研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。 9.随机抽样:就是按照随机的原则获得样本,保证总体中每个个体都有同等机会被抽取,使样本对总体有较好的代表性。 10.频率:若随机事件在n次重复中出现m次,则n/m比值成为随机事件出现的频率。 11.区间估计:按一定的概率估计总体参数所在的可能范围的方法。 二、简答题 1. 完全设计的两样本均数比较的t检验与方差分析之间的关系如何? 2. 假设检验的结论为什么不能绝对化? 3请总结直线相关系数r与直线回归系数b的意义及特点? 4. 应用相对数时有哪些注意事项? 答案: 3.答:直线相关系数r是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统计指标。总体相关系数用ρ表示,样本和相关系数用r表示,r是ρ的估计值。相关系数没有单位,取值范围是-1≤r≤1。r值为正,表示两变量呈正相关,x与y变化趋势是正向的。r值为负,表示两变量呈负相关,x与y呈反向变化。通常r的绝对值越大,表示两变量相关关系越密切。 直线回归系数b即回归直线的斜率,b>0表示直线从左下方走向右上方,y随x增大而增大;b<0表示直线从左上方走向右下方,y随x增大而减小;b=0则直线与x轴平行,x与y无直线关系。b的统计学意义是x每增加(减)一个单位,y平均改变b个单位。 4. (1)构成比与率是意义不同的两个统计指标,应用时不能相互混淆。(2分)构成比说明事物内部各组成部分所占的比重,而率说明某事物或现象的发生频率或强度,不能以构成比代替率来说明问题。 (2)样本含量太小时,不宜计算相对数,最好用绝对数来表示。 (3)对各组观察例数不等的几个率,不能直接相加求其总率。 (4)在比较相对数时应注意资料的可比性。 三.计算题 1.某医院对医院的医生和护士的年龄分布进行了调查,整理得到下表,请根据统计表制表原则和注意事项指出问题所在并予以修改。 (1)标题不确切改标题。(2分) (2)标目设置不当(2分),增加构成比。(2分) (3)表中数字不明,应增加“人数”。(2分) (4)线条不规范。(2分) 建议修改的表如下表(5分)

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

卫生统计学复习题5

卫生统计学复习题 选择题 一、A1型:每一道题下面有A、B、C、D、E五个备选答案,请从中选择一个最佳答案。(1′) 1、统计工作的基本步骤是: A.设计、调查、审核、整理资料 B.收集、审核、整理、分析资料 C.设计、收集、整理、分析资料 D.调查、审核、整理、分析资料 E.以上都不对 2、统计学中所说的样本是指 A.从总体中随意抽取一部分 B.依照研究者的要求选取有意义的一部分 C.有意识地选择总体中的典型部分 D.从总体中随机抽取有代表性的一部分 E.以上都不对 3、统计学上的系统误差、测量误差、抽样误差在实际工作中: A.均不可避免 B.系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免 E.只有抽样误差不可避免 4、μ确定后,δ越大,则正态曲线: A.越陡峭 B.形状不变 C.越平缓 D.向左移动 E.向右移动 5、抽样误差指的是: A.个体值和总体参数值之差 B.个体值和样本统计量值之差 C.样本统计量值和总体参数值之差 D.不同的总体参数之差 E.以上都不是 6、治疗效果判定资料属于: A.计量资料 B.技术资料 C.等级资料 D.无序分类资料 E.以上都不是 7、平均数可用于分析下列哪种资料: A.统计资料 B.等级资料 C.计数资料 D.计量资料 E.调查资料 8、一组正态或近似正态分布资料的平均水平用: A.算术均数 B.几何均数 C.中位数 D.平均数 E.以上均是 9、对于同一份正偏峰的资料,求得的几何均数与算术均数: A.几何均数大于算数均数 B. 几何均数小于算数均数 C. 几何均数等于算数均数 D. 几何均数可以大于算数均数,也可以小于算数均数 E. 以上说法都不对 10、原始数据加上一个不为0的常数后: A.x不变,CV变 B. x变或CV变 C. x不变,CV不变 D. x变,CV不变 E. x、CV均改变 11、血清学滴度资料最常计算______以表示其平均水平 A.均数 B.中位数 C.几何均数 D.全距 E.标准差 12、表示变量值变异情况的指标最常用的是: A.四分位数间距 B.全距 C.标准差 D.变异系数 E.方差 13、变异系数CV的数值 A.一定小于1 B.一定大于1 C.可大于1;也可小于1 D.一定不会等于零 E.一定比S小 14、若成年人血铅含量近似对数正态分布,拟用300名正常成人血铅确定99%正常值范围,最好采用下列哪个公式: A. x+2.58S B.lg-1(x lgx+2.58S lgx) C. x±2.58S D.P99=L+i/f99(300*99/100-f L) E. lg-1(x lgx+2.33S lgx) 15、_______小,表示用该样本均数估计总体均数的可靠性大。 A.CV B.S C.σx D.R E.四分位数间距 16、两样本均数比较时,分别取以下检验水准,以_______所对应的第二类错误最小。 A.α=0.01 B.α=0.05 C.α=0.10 D.α=0.20 E.α=0.25 17、方差分析中,当P﹤0.05时,结果_________。 A.可认为各样本均数都不相等 B.可认为各总体均数不等或不全等 C.可认为总体均数都不相等 D.证明总体均数不等或不全相等 E.以上都不对 18、正态性检验中,按α=0.10水准,认为总体服从正态分布,此时若推断有错,此错误的概率为__________。

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

卫生统计学考试复习题及参考答案

中南大学现代远程教育课程考试复习题及参考答案 《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 21.假设检验中P的含义 22.I型和II型错误 23.检验效能 24.检验水准 25.方差分析 26.随机区组设计

27.相对数 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 44.灵敏度 45.特异度 46.误诊率 47.漏诊率 48.阳性似然比 49.阴性似然比 50.Youden指数 51.ROC曲线 52.统计图 二、单项选择题 1.观察单位为研究中的( )。 A.样本B.全部对象C.影响因素D.个体

2.总体是由()。 A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是()。 A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量 4.参数是指()。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后()。 A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用()。 A.变异系数B.方差 C.极差D.标准差 8.以下指标中()可用来描述计量资料的离散程度。 A.算术均数B.几何均数 C.中位数D.标准差 9.血清学滴度资料最常用来表示其平均水平的指标是()。A.算术平均数B.中位数 C.几何均数D.平均数 10.两样本均数的比较,可用()。 A.方差分析B.t检验 C.两者均可D.方差齐性检验 11.配伍组设计的方差分析中, 配伍等于()。

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

卫生统计学1复习参考资料

(一).单选题(共”题,每题2 分) 1 ,某次研究进行随机抽样,测量得到该市110 名健康成年男子的血清总胆固醉值,则研 究总体为( D ) A .所有成年男子 B .该市所有成年男子 C . 110 名该市健康成年男子 D .该市所有健康成年男子 2 .关于随机抽样,下面说法正确的是( D ) A .抽样时样本量越大越好 B .选取符合研究者意愿的样本 C .抽样时应精心挑选个体,使得样本更好地代表总体 D .抽样时要求总体中每一个个体都有同等机会被抽取 3 .下列选项中,属于计数资料类型的是( C ) A .身高资料 B .舒张压资料 C .某病患病率资料 D .血清总胆固醉资料 4 .要全面描述正态总体分布或近似正态总体分布资料的分布特征,可采用( A ) A .均数和标准差 B .中位数和四分位间距 C .极差和中位数 D .均数和变异系数 5 .均数X 是描述一组同质数值变量数据(A)的统计指标 A .集中趋势 B .离散趋势 C .变化范围 D .频数分布 6 .标准差S 是描述一组同质数值变量数据(C)的统计指标 A .集中趋势 B .变化范围 C.变异程度 D. 频数分布 7 .一组观察值15 , 20 , 30 , 50 , 40 , 90 , 20 ,95. 其中位数为( B ) A . 30 B . 35 C .40 D 70 8 ·某组织资料共15 例,∑X2=1535, ∑X=45 , 则标准差S 为( D ) A . 100 . 00 B . 93 . 33 C . 9 . 66 D . 1 0 . 00 9 .将75 个观测值从小到大排列后,这75 个观测值中有10 %的观测值比50 小,有90 % 的观测值比50 大,则50 是( A )

卫生统计学最好的复习资料

一、名词解释 1. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的 资料称为计量资料(measurement data )。计量资料亦称定量资料、测量 资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。 2. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计 数资料(count data )。计数资料亦称定性资料或分类资料。其观察值是 定性的,表现为互不相容的类别或属性。 3. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组 的观察单位数,称为等级资料(ordinal data )。等级资料又称有序变量。 4. 总体:总体(population )指特定研究对象中所有观察单位的测量值。 5. 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本 (sample )。 6. 抽样误差:抽样误差(sampling error )是指样本统计量与总体参数的差 别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数 附近波动的随机变量。 7. 频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频 数)。 8. 算术均数:描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。 9. 中位数:将一组观察值由小到大排列,位次居中的那个数。 10. 极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算 简便但稳定性较差。 11. 方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个 数得到。 12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态 分布的资料,大样本、小样本均可,最为常用。 13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的 比较。 14. 正态分布:若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服 从正态分布。通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布。 15. 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布, 通常记为2(0,1)N 。 16. 统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信 息的过程称为统计推断。 17. 抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的 差异,称为抽样误差。 18. 标准误:通常将样本统计量的标准差称为标准误。 19. 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。 20. 参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计 和区间估计。

卫生统计学试题汇总

医学统计学复习题 一、名词解释 1、总体 2、样本 3、随机抽样 4、变异 5、概率 6、随机误差(偶然误差) 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、几何均数 14、四分位数间距 15、方差 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数 二、单项选择 1.观察单位为研究中的()。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2.总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标 3.抽样的目的是()。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征 4.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样,下列哪一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.选择符合研究者意愿的样本 6.反映计量资料平均的指标是()。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M 8.下列指标中,不属于集中趋势指标的是()。 A.均数 B.中位数 C.百分位数 D.几何均数 E.众数 9. ( )分布的资料,均数等于中位数。 A.对称分布 B.正偏态分布 C.负偏态分布 D.对数正态分布 E.正态分布 10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选()。 A.中位数 B.算术均数 C.几何均数 D.平均数 E.百分位数末端有确定数据

200X级硕士研究生卫生统计学试卷(答案)

2007级硕士研究生卫生统计学试卷(答案及评分标准) 学号班级姓名考试成绩 一、名词解释(每小题2分,共12分) 1. 复相关系数 用R表示,R=2 R,度量应变量Y与多个自变量间的线性相关程度的指标,即观察值Y 与回归估计值y?之间的相关程度。 2. 统计描述 指由统计指标、统计表、图等方法,对资料的数量特征及分布规律进行测定和描述,不涉及由样本推论总体的问题。 3.主效应 在析因设计资料的方差分析种,指某一因素各水平间的平均差别。 4. 非参数检验 不依赖于总体分布的类型,对总体分布不做严格规定,对两个或多个总体分布的位置进行假设检验的方法。 5. 假设检验 是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。这一过程称为假设检验。 6. 平均发展速度 是各环比发展速度的几何均数,说明某事物在一个较长时期中逐期平均发展的程度。 二、填空(每空0.5分,共10分)

1. 调查144名30-40岁男子的血清胆固醇值近似服从正态分布,其均数为90 .3mg/dl ,标准差为3 2.7mg/dl ,则可推出该地30-40岁男子中约有__0.5 _%胆固醇在174.7mg/dl 以上,共有多少人 0.72(或1) 。 2. 拒绝H 0,只可能犯 第一类 错误,“接受” H 0只可能犯 第二类 错误。 3. 甲、乙、丙三地某两种传染病的发病率时,宜绘制_复式直条条__图. 4. 男、女两组儿童,人数分别为300及时250人,蛔虫感染率分别为35%及24%,其总感 染率为 30% ,总感染率的95%的置信区间为??? ? ? ??+?-550 7.03.096.13.0,550 7.03.096.13.0。 5.多个样本均数比较的方差分析其应用条件 各独立样本正态分布 和 方差齐性 。 6. 等级相关适用的条件是 双变量非正态分布 , 总体分布型未知 , 等级资料 。 7. 两因素析因设计实验方差分析将处理组间变异分解为 A 因素的主效因、 B 因素的主效因 和 AB 的交互效应 。 8. R ?C 表的2 χ检验,若表格中有一个方向按多个等级分类时,则称之为单向有序行列表, 当等级数大于3时,如检验各处理组各等级下的构成比有无差别时采用 2 χ检验 ,如检验各处理组各等级下的程度上有无差别时采用 秩和检验 。 9. 多元线性回归分析中自变量的选择方法有 全局择优法 和 逐步选择法 。 10. r 是 直线相关系数 (或称Pearson 积差相关系数) ,表示 具有直线关系的两变量间相关的密切程度与相关方向 。 三、最佳选择题(每小题1分,共20分) 1. 要表示某地区2003年SARS 患者的职业分布,可以绘制( C ) A 直条图 B 散点图 C 圆图 D 直方图 E 线图 2. 关于频数表的说法正确的是( C )

卫生统计学试题6含答案

统计试题题库 1、下列那个就是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2、两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3、四格表资料的卡方检验时无需校正,应满足的条件就是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4、总体应该就是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5、两样本均数比较的t检验中,结果为P<0、05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6、抽样误差就是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7、抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8、以舒张压≥12、7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9、实验设计中要求严格遵守四个基本原则,其目的就是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少与抵消非实验因素的干扰 E.以上都不对 10、两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件就是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11、同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV E.S2

2007级硕士研究生卫生统计学试卷(答案)

2007级硕士研究生卫生统计学试卷(答案及评分标准) 学号班级姓名考试成绩 一、名词解释(每小题2分,共12分) 1、复相关系数 R,度量应变量Y与多个自变量间得线性相关程度得指标,即观察值Y与回用R表示,R=2 归估计值y?之间得相关程度。 2、统计描述 指由统计指标、统计表、图等方法,对资料得数量特征及分布规律进行测定与描述,不涉及由样本推论总体得问题。 3.主效应 在析因设计资料得方差分析种,指某一因素各水平间得平均差别。 4、非参数检验 不依赖于总体分布得类型,对总体分布不做严格规定,对两个或多个总体分布得位置进行假设检验得方法。 5、假设检验 就是利用小概率反证法思想,从问题得对立面(H0)出发间接判断要解决得问题(H1)就是否成立。然后在H0成立得条件下计算检验统计量,最后获得P值来判断。这一过程称为假设检验。 6、平均发展速度 就是各环比发展速度得几何均数,说明某事物在一个较长时期中逐期平均发展得程度。 二、填空(每空0、5分,共10分) 1、调查144名30-40岁男子得血清胆固醇值近似服从正态分布,其均数为90 、3mg/dl,标准差为3 2、7mg/dl,则可推出该地30-40岁男子中约有__0、5 _%胆固醇在174、7mg/dl

以上,共有多少人 0、72(或1) 。 2、 拒绝H 0,只可能犯 第一类 错误,“接受” H 0只可能犯 第二类 错误。 3、 甲、乙、丙三地某两种传染病得发病率时,宜绘制_复式直条条__图、 4、 男、女两组儿童,人数分别为300及时250人,蛔虫感染率分别为35%及24%,其总感染 率为 30% ,总感染率得95%得置信区间为??? ? ? ??+?-550 7.03.096.13.0,550 7.03.096.13.0。 5、多个样本均数比较得方差分析其应用条件 各独立样本正态分布 与 方差齐性 。 6、 等级相关适用得条件就是 双变量非正态分布 , 总体分布型未知 , 等级资料 。 7、 两因素析因设计实验方差分析将处理组间变异分解为 A 因素得主效因、 B 因素得主效因 与 AB 得交互效应 。 8、 R ?C 表得2 χ检验,若表格中有一个方向按多个等级分类时,则称之为单向有序行列表, 当等级数大于3时,如检验各处理组各等级下得构成比有无差别时采用 2 χ检验 ,如检验各处理组各等级下得程度上有无差别时采用 秩与检验 。 9、 多元线性回归分析中自变量得选择方法有 全局择优法 与 逐步选择法 。 10、 r 就是 直线相关系数 (或称Pearson 积差相关系数) ,表示 具有直线关系得两变量间相关得密切程度与相关方向 。 三、最佳选择题(每小题1分,共20分) 1、 要表示某地区2003年SARS 患者得职业分布,可以绘制( C ) A 直条图 B 散点图 C 圆图 D 直方图 E 线图 2. 关于频数表得说法正确得就是( C ) A 都分为10个组段 B 每一个组段必须组距相等 C 从频数表中可以初步瞧出资料得频数分布类型 D 不就是连续型得资料没有办法编制频数表 E 频数表中得每一个组段不一定就是半开半闭得区间,可以任意指定

卫生统计学复习题库

1.完全随机设计方差分析的目的是检验 A、多个样本方差的差别有无统计学意义 B、多个总体方差的差别有无统计学意义 C、多个样本均数是否相同 D、多个总体均数是否相同 E、以上都不对 正确答案:D 方差分析中,当P<0.05时,结论为 A、可认为各样本均数都不相等 B、可认为各总体均数不等或不全相等 C、可认为总体均数都不相等 D、证明总体均数不等或不相等 E、以上都不对 正确答案:B 完全随机设计的方差分析中,若处理因素无作用,理论上 A、F=1 B、F=0 C、F<1.96 D、F=1.96 正确答案:A 方差分析中,组间变异主要反映了 A、随机误差

B、处理因素的作用 C、抽样误差 D、测量误差 E、个体差异 正确答案:B 方差分析中对数据的要求有 A、任何两个观察值之间不相关 B、每一水平下的观察值分别服从正态分布 C、各总体的方差齐性 D、只需B和C E、每组样本含量均较小 正确答案:ABC 职业病防治院测定了11名石棉肺患者、9名石棉肺可疑患者和11名非患者的用力肺活量,求得其均数分别为1.79L、2.31L和3.08L。能否据此认为石棉肺患者、石棉肺可疑患者和非患者的用力肺活量不同? A、能,因3个样本均数不同 B、需对3个均数作两两t检验才能确定 C、需对3个均数作两两Z检验才能确定 D、需作完全随机设计3个均数比较的ANOVA才能确定 E、需作随机区组设计3个均数比较的ANOVA才能确定 正确答案:D

某研究者在5种不同的温度下分别独立地重复了10次试验,共测得某定量指标的50个数据。根据资料的条件,可用单因素方差分析处理此资料。其组间的自由度是 A、49 B、45 C、36 D、9 E、4 正确答案:E 某医师用A、B、C三种方案分别治疗7例、6例和8例婴幼儿贫血患者。治疗1月后,记录Hb的增加量(g/L),求得其均数26.0,18.0,6.0。若ANOVA分析推断3种治疗方案对婴幼儿贫血的治疗效果是否不同,其检验假设H0为 A、3个样本均数不同 B、3个样本均数全相同 C、3个总体均数全相同 D、3个总体方差全相同 E、3个总体方差不全相同 正确答案:C 64只大鼠被随机地均分到4个不同的饲料组中去,饲养一段时间后,观察每只鼠的肝重比值(即肝重/体重),希望评价4种饲料对肝重比值的影响大小。如果资料满足正态的前提条件,正确的统计方法应当是 A、进行6次t检验

卫生统计学简答题

卫生统计学简答题 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

卫生统计学简答题 方差分析的基本思想和应用条件是什么? 答:方差分析的基本思想是,对于不同设计的方差分析,其思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。具体来讲,根据试验设计的类型和研究目的,将全部观测值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F分布作出统计推断,从而推论各种研究因素对试验结果有无影响。其应用条件是,①各样本是相互独立的随机样本,均服从正态分布;②各样本的总体方差相等,即方差齐性。 多组定量资料比较时,统计处理的基本流程是什么? 答:多组定量资料比较时首先应考虑用方差分析,对其应用条件进行检验,即方差齐性及各样本的正态性检验。若方差齐性,且各样本均服从正态分布,选单因素方差分析。若方差不齐,或某样本不服从正态分布,选Kruskal-Wallis秩和检验,或通过某种形式的数据变换使其满足方差分析的条件。若方差分析或秩和检验结果有统计学意义,则需选择合适的方法(如Bonferonni、LSD法等)进行两两比较。 简述秩和检验的优缺点 秩和检验的优点是(1)不受总体分布限制,适用面广;(2)适用于等级资料及两端无确定值的资料;(3)易于理解,易于计算。缺点是符合参数检验的资料,用秩和检验,则不能充分利用信息,检验效能低。 试述假设检验与置信区间的联系与区别。

答:区间估计与假设检验是由样本数据对总体参数作出统计学推断的两种主要方法。置信区间用于说明量的大小,即推断总体参数的置信范围;而假设检验用于推断质的不同,即判断两总体参数是否不等。 试述两类错误的意义及其关系。 答:Ⅰ类错误(typeⅠerror):如果检验假设0H实际是正确的,由样本数据计算获得的检验统计量得出拒绝0H的结论,此时就犯了错误,统计学上将这种拒绝了正确的零假设0H(弃真)的错误称为Ⅰ类错误。Ⅱ类错误(type Ⅱ error):假设检验的另一类错误称为Ⅱ类错误(type Ⅱ error),即检验假设0H原本不正确(1H正确),由样本数据计算获得的检验统计量得出不拒绝0H(纳伪)的结论,此时就犯了Ⅱ类错误。Ⅱ类错误的概率用β表示。在假设检验时,应兼顾犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)。犯Ⅰ类错误的概率(α)和犯Ⅱ类错误的概率(β)成反比。如果把Ⅰ类错误的概率定得很小,势必增加犯Ⅱ类错误的概率,从而降低检验效能;反之,如果把Ⅱ类错误的概率定得很小,势必增加犯Ⅰ类错误的概率,从而降低了置信度。为了同时减小α和β,只有通过增加样本含量,减少抽样误差大小来实现。 什么资料适合用秩和检验进行检验?简述秩和检验步骤。 答:提示:进行有序资料的比较时宜采用秩和检验。 (1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性;(5)一端或两端无界。 秩和检验步骤为:①建立假设H0和H1,并确定检验水准α;②根据不同的设计类型对资料进行编秩并计算秩和;③根据计算的秩和直接查表或计算相应的统计量再查表,确定P值下结论。进行有序资料的比较时宜采用秩和检验。 服从二项分布及Poisson分布的条件分别是什么?

相关文档
相关文档 最新文档