文档库 最新最全的文档下载
当前位置:文档库 › 医学统计学 第一章 绪论

医学统计学 第一章 绪论

医学统计学 第一章  绪论
医学统计学 第一章  绪论

第一章绪论

第一节医学统计学的地位和作用

当人们研发了一种治疗高血压病的新药,应该怎样评价该新药的疗效?最基本的方法就是比较。通常将患者以随机的方式分成两个组,一组服用该新药,另一组服用对照药物,观测并记录两种药物的疗效,最后统计分析该新药的有效性和安全性,这就是一个常见的临床试验。其中,统计学扮演什么角色?在这个临床试验中有诸多问题需要回答:需要多少名患者参加试验?如何随机地将患者分为两个组?哪些措施可以保证两组患者除了接受不同药物治疗外,其他影响疗效的因素在两组的分布是一致的?如果分布不一致,如何在诸多的影响因素中,分离出药物因素的效应?应采用什么样的指标来反映新药的有效性和安全性?怎样测量这些指标以保证数据的准确性和可靠性?如何控制临床试验的误差?如果两组疗效存在一定差别,怎样比较两个药物的疗效到底是否存在差别?换言之,我们需要了解这种差别是机会造成的,还是真实存在的?统计学可以回答上述问题。

我们再看另一种情形,假定为了解一个城市居民高血压病的患病现状,通常的做法是在这个城市调查一部分个体,利用这一部分个体的高血压病患病状况来反映整个城市的患病状况。那么,如何在这个城市选取这一部分个体?因为只有这部分个体能够很好地代表整个城市人群,用这种部分推论全体的做法才是准确的。此外,需要选取多少人进行调查?如何保证收集到的资料是准确和可靠的,又如何评价这种准确性和可靠性?几百人的血压值(如收缩压值)各不相同,看上去是一堆“杂乱无章”的数据,如何描述高血压病的患病状况,如何才能推论到整个城市人群?我们对于这种推论的正确性抱有多大的信心?统计学也可以回答上述问题。

每个人的血压都不一样,每个高血压病患者对同一种药物治疗的反应也存在着差别,这就是所谓的个体差异和不确定性。个体差异是自然界普遍存在的现象,个体结构和功能千差万别,机体反应受到各种自然和社会环境因素的影响和制约,对内外环境刺激的反应同样千差万别。在统计学中,我们将这种差异称为变异(variation)。由于变异的存在,同样条件下对同一个体的重复观测结果就具有不确定性。William Osler爵士曾指出“医学就是关于不确定性的科学和概率的艺

术(Medicine is a science of uncertainty and an art of probability)”。生物医学中充满了个体变异和不确定性,其原因有些是已知的,有些是未知的,有的是可以人为控制的,有的则是无法控制的。事实上,客观事物在数量上所表现出来的现象既受到本质规律的制约,又受到诸多偶然因素的影响,这就妨碍了我们对事物规律性的认识。统计学正是处理数据中变异和不确定性的一门科学和艺术。它透过具有偶然性的现象来探测和揭示那些令人困惑的医学问题的规律性,对不确定性的数据作出科学推断,它是认识客观世界的重要工具和手段。因此,医学与统计学的结合是必然的,它们的联姻就催生了医学统计学。更准确地说,医学统计学就是运用统计学的基本原理和方法来研究医学问题的一门学科,它包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。

医学统计学在整个医学科学研究中的地位和作用是举足轻重的,但这一点并非从一开始就被人们所认识。历史经验表明,它是在人类社会近百年的探索和实践中逐步形成,甚至是在付出了若干生命代价后才逐步达成共识的。现实中,由于研究设计、数据收集、统计分析、结果解释以及结论报告任何一个环节中的缺陷或错误,已经断送了许多先进的甚至非常前沿的医学研究成果,而且即使是已经发表的研究成果也存在着大量的统计学缺陷或错误。现在,人们已逐步认识到了统计学在医学和公共卫生科学研究中的极端重要性,越来越多的临床医师、公共卫生专业人员以及实验室科学家主动寻求与统计学家合作,许多医学专业期刊邀请统计学家审稿,医学科研基金评审邀请统计学家参加,基金申请要求有统计学家合作等等,这些都彰显了医学统计学蓬勃的生命力和广阔的应用空间。

第二节医学统计学基本内容和统计工作基本步骤在统计设计的基础上,对数据收集、整理、分析以及对分析结果的正确解释和表达是医学统计学的基本内容以及统计工作的基本步骤。值得强调指出的是,医学科研的统计设计是医学统计学的重要内容,也是统计工作的第一步和最关键的一步。一个常见和普遍的误解认为“统计”就是分析数据。我们经常会遇到这样的情形,医生或研究人员在研究结束后拿着数据咨询统计学专业人员或请其代为分析,但其研究的统计设计却存在着缺陷甚至错误。现代统计学的奠基人之一、著名统计学家Fisher曾精辟地指出,“做完实验后才找统计学家无异于请他作尸体解剖,他能做的全部事情就是告诉你这实验死于什么原因”。没有科学严谨的

统计设计,数据的收集以及分析常常是没有价值的。对于不准确或不可靠的数据,试图寻求统计方法加以弥补亦是徒劳无益的,即使再高深的统计方法也一样于事无补,基于这些不准确或不可靠数据的统计分析所得出的结论常常是站不住脚的,甚至是误导的。因此,研究的统计设计和统计分析是统计学不可分割的两个重要组成部分。

研究的统计设计按照是否对研究对象施加干预措施常区分为观察性研究(observational study)和实验性研究(experimental study)两大类,前者又可区分为横断面研究(cross-sectional study)、病例对照研究(case-control study)和队列研究(cohort study);后者又可根据研究对象的不同区分为动物实验(animal experiment)、临床试验(clinical trial)和社区干预试验(community intervention trial)。对于不同研究设计所获得的数据,采用的统计分析方法常常是不同的,而且所得研究结论也存在差异。这在后面的相关章节将详细讲述。

数据的统计分析(statistical analysis)主要包括两个方面的内容:一是统计描述(statistical description),主要是运用一些统计指标诸如均数、标准差、率以及统计表和统计图等,对数据的数量特征及其分布规律进行客观地描述和表达,不涉及样本推断总体的问题;二是统计推断(statistical inference),即在一定的置信度或概率保证下,根据样本信息去推断总体特征。统计推断通常包括参数估计和假设检验两个内容:参数估计是指用样本指标推断总体相应的指标,例如根据部分城市人群的原发性高血压患病率去估计整个城市的原发性高血压病患病率;假设检验是指由样本之间的差异推断总体之间是否可能存在差异,例如原发性高血压治疗药物在两组的疗效存在一定差别,假设检验回答这种差别是机会造成的,还是真实存在的。

第三节统计学的若干基本概念

一、总体与样本

上面已屡屡提及总体与样本的概念。什么是总体与样本?人们通常需要了解或研究整个的一类个体,简单地说这个类就是总体(population)。但是,研究整个总体一般并不现实,能研究的通常只是它的一个部分,这个部分就是样本(sample)。人们再根据部分对整体进行推断,用统计学专业术语就是根据样本信

息对总体特征作出统计推断。

更准确地讲,总体就是所有同质观察单位某种观察值(即变量值)的全体,例如调查某地2007年正常成年男子的红细胞数,则观察对象是该地2007年的正常成年男子,观察单位是每个人,观察值是每个人测得的红细胞数,该地2007年全部正常成年男子的红细胞数就构成一个总体。样本是总体中随机抽取部分观察单位的观测值的集合,如从该地2007年正常成年男子中,随机抽取300人,分别测得其红细胞数就组成样本。注意,个体间的同质性是构成总体的必备条件,也是进行研究的基本前提。

总体是根据研究目的所确定的,一般有无限总体和有限总体之分。前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体;后者指总体中的个体是有限的,它是指特定时间、空间中有限的研究个体。在医学研究中,多数情况总体是无限的,直接研究总体是不可能的。即使是有限总体,直接研究总体也是不现实的,它既无必要,有时也不可能。这里值得注意的是,总体中的个体在多数情形下是人,但也可以是其他个体(individual),如动物、家庭、学校、工厂、地区等,还可以是一个器官、一个细胞等。这里的个体是研究的基本单位,也是统计分析的基本单位。注意鉴别基本单位到底是什么,这在统计分析以及结果解释中都是十分重要的。

医学研究通常都想了解关于总体的某些数值特征,这些数值特征称为参数(parameter),如整个城市的原发性高血压患病率;根据样本算得的某些数值特征称为统计量(statistic),如根据几百人的调查数据所算得的样本人群原发性高血压患病率。后者是研究人员知道的,而前者是研究人员想知道的。显而易见,只有当样本代表了总体时,根据样本统计量所估计的总体参数才是准确的。

因此,选择样本的方法至关重要。机会是没有偏袒的,因而正确的方法就是采用客观的概率抽样方法选择样本。在实验设计中,将实验对象分配到处理组或对照组也应该采用随机分配的方法(详见第三章实验设计部分)。将具有某一类特征的个体排除在样本之外所表现出的系统倾向性称为选择偏性。当存在选择偏性时,抽取一个更大的样本无助于统计推断。相反,它只是在一个更大的规模上去重复错误。概率抽样方法的最重要标志就是总体中的每一个体都有同样的机会被选入样本,在理论上可计算出总体中任一个体被选入样本的机会大小。样本包含的观察单位数称为样本含量或样本大小(sample size)。

即便采用概率抽样方法抽取样本,但毕竟样本只是总体的一部分,这就存在着误差,统计学上将其称为抽样误差(sampling error)。那么,对于一次具体的概率抽样,抽样误差可能有多大?它对样本含量的依赖程度怎样?为了将抽样误差置于控制之下,样本含量需取多少?这时用样本统计量去估计总体参数时,将会达到怎样的接近程度?这些都是统计学中十分重要的问题,大家将在后面的相关章节学习。

二、变量

变量(variable)是观测单位的某种特征或属性,变量的观测值就是所谓变量值,有时也称数据或资料(data)。更准确地讲,数据或资料是由具有若干变量值的观测单位所组成的。例如在调查中常规问及的问题:你年龄多大?是什么学历?结婚了吗?有工作吗?家里有多少人?对应的变量就是:年龄、学历、婚姻状况、就业情况、家庭人口数。有些问题的答案如年龄、家庭人口数是具体的数值,所对应的变量是定量的,称为定量变量。有些问题的答案如学历(文盲、小学、初中、高中、大学、研究生)、婚姻状况和就业状况是用语言来描述的,对应的变量是定性的,称为定性变量。

定量变量有连续和离散之分。年龄就是一个连续变量,因为不同人的年龄差异在理论上可以任意地小,如1年、1个月、1天、1小时等,它一般有度量衡单位。而家庭人口数就是一个离散变量,不同家庭的人口数可相差0、1、2等,在这些量之间不可能取其他量。当然,一个定量变量要么是连续的,要么是离散的。而对于定性变量,其取值是定性的,往往表现为互不相容的类别或属性。根据其取值特征,定性变量又可以区分为有序和无序分类的变量。所谓有序分类变量,是指其取值的各类别之间存在着程度上的差别,给人以“半定量”的感觉,因此也称为等级变量,如学历;无序分类变量又可区分为二项分类变量和多项分类变量,前者取值为相互对立的两类,如性别;后者取值为互不相容的多个类别,如血型。

上述对变量类型的区分在统计学中至关重要,因为它在很大程度上决定了统计分析方法的选择。当然,出于某些研究目的,各种类型变量间可以进行转换,如血压值为定量变量,可按照一定的临床标准,将其转换为高血压、正常血压和低血压。这种变量的转换通常具有方向性,一般从定量到半定量,再到定性,但

须知这种转换后的数据,其信息量将减少。另一方面,为了对定性变量进行统计学处理,往往需要对其进行编码,例如性别的编码:男为1、女为0。这里,值得再次指出,变量类型的区分也与分析的基本单位有关。例如,患病与否的问题,若以人为基本测量和分析单位,它是二项分类变量,但若以乡为基本测量和分析单位,患病率则为定量变量。

三、误差

误差(error)泛指实测值与真实值之差,一般可区分为随机误差和非随机误差两大类。随机误差是一类不恒定的、随机变化的误差,往往使实测值无方向性地围绕着某一数值左右波动。抽样误差即为随机误差,即由于随机抽样造成的实测值与真实值之差。随机误差在随机抽样和观测中是不可避免的,但一般服从正态分布,可以通过统计学方法进行分析。

最常见的非随机误差即所谓系统误差,是指实测值系统偏离真实值的、具有方向性的误差,因此也常称为偏性或偏倚(bias)。其产生的原因往往是可知的或可掌握的,例如仪器未校正,操作不规范等。因此,通过完善研究设计、规范操作流程、改进技术手段等方式,可以降低或消除系统误差。此外,还有一些非随机误差是在研究过程中由于研究者的偶然失误造成的,例如误读检验结果、记录失误等,即所谓过失误差。

四、概率

概率(probability)是统计推断中最为重要的概念之一。生活中,人们经常谈论诸如中奖的机会是多少或毕业后找到工作的机会是多少?数学家们为了给“机会”这个词一个确切和清晰的解释而奋斗了几个世纪。机会的含义可以用简单的抛硬币游戏加以说明,如获得反面的机会是50%,那么最终结果大约就有50%的次数反面向上。因此,当某一实验是在相同条件下独立地一次又一次重复进行时,某事件发生次数的百分数就是该事件的机会,这就是机会的频数理论。一个事件机会的大小,取决于该事件的可能发生机会数与这一事件的可能发生及不发生的全部机会数之比,这个比值就是这一事件发生概率的表示。如一个事件有4次机会发生和6次机会不发生,4/10就恰当地表示了这一事件发生的概率,并且可取作该概率的度量值。概率论和数学的其他组成部分一起组成了推理艺术的重要基础,统计学的重要组成部分统计推断就是建立在此基础上的。

医学研究的现象,大多是随机现象。根据某一研究目的,在一定条件下对某一随机现象(不确定现象)进行观测,其结果在事先是不确定的,将其称为随机事件(random event),在统计学中简称事件。如同一药物治疗同一疾病,治疗后究竟会产生什么结果是不确定的,可能治愈、好转,也可能无效、死亡。这里的每一种可能发生的结果都是一个随机事件。概率是度量随机事件发生可能性大小的数值。治疗200例患者,120名患者治愈,治愈率为60%,这是一个频率(frequency)。在现实中,概率是难以获得的,在观测单位足够多时,可以将其频率作为概率的估计值。但在观测单位较少时,用频率估计概率是不可靠的。

概率通常用P表示,如果某事件不可能发生,其发生概率为0,另一个极端就是,如果某事件肯定要发生,那么其发生概率为1,概率取值界于0与1两个极端之间。当某事件发生的概率小于或等于0.05时,统计学习惯上称该事件为小概率事件(small probability event),其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。

第四节统计思维的培养和本书内容的安排

一、统计思维的培养

医学生学习统计学,并非要成为医学统计学的专业人员,其目的是培养统计思维,掌握基本的统计设计方法和收集准确可靠的数据,运用基本的统计分析方法来正确分析数据,掌握操作统计软件的技能,正确解释和表达分析结果。

学习统计学的关键是通过统计思维的培养,提高科学素养和科研能力。所谓统计思维就是指统计学独特的逻辑思维方法。由于存在个体差异,用样本推断总体就会出现误差,但这种误差是有规律的,它构成了统计推断的理论基石。理解了假设检验的推理逻辑,也就理解了统计结论的概率性。因此,学习统计学就需要牢固树立起个体变异和不确定性的观念、抽样误差的观念、假设检验结论的概率性观念等。前面反复提及的一个例子就是如果两种药物疗效存在差别,那么这是机会造成的,还是真的存在?统计学用假设检验的方法来回答这一问题(这在后面的相应章节将进行详细讲解)。现在阅读一篇医学科研论文,不遇到假设检验和P值几乎是不可能的。因此,弄清楚假设检验和P值的真实含义是学习统

计学和培养统计思维的核心问题之一,尚需结合后面的学习内容加以细心体会和领悟。

此外,值得指出的一个重要问题就是,医学统计学与数学和计算机运用联系密切,但作为一门应用学科,学习它不能脱离医学背景,必须紧密结合医学专业的实际问题。学习医学统计学的最终目的是运用统计思维和统计方法去分析和解决医学实际问题。医学生由于习惯于观察、记忆、判断和操作,逐步淡化了抽象思维和逻辑思维,但这并不意味着学习医学统计学一定要具备高深的数学知识,事实上,医学统计学的许多先驱并非数学家。对于统计公式,我们认为不必深究其数学推导,重要的是要了解其意义、用途和应用条件。随着计算机技术的迅速发展和普及,带来了统计计算的简化并推动了统计学的发展,但与此同时也出现了诸如多因素统计方法的误用甚至滥用的问题。须知,医学统计中的每个数据都有其特定的专业含义,而不是抽象的数字,但计算机并不能识别这是什么含义的数据,数据是否准确可靠,也不知道如何进行分组和分析等。如果不紧密结合医学专业背景,将会导致统计方法的误用或滥用,以及统计结果的错误解释。

二、本书内容的安排

简要概述本书的框架结构和章节安排,有助于学生从整体上把握本书的内容及其逻辑关系。

第一章绪论讲解了医学统计学的基本内容以及统计学的若干基本概念,它是后面章节的重要基础;第二、三章是医学科学研究的统计设计,包括调查和实验研究设计两个部分,主要内容包括两种设计类型的区别与特点、基本内容和原则,在调查研究设计部分介绍了常用的抽样方法,在实验设计部分介绍了常用的实验设计类型,尤其较为详细的介绍了临床试验设计。样本含量估计属于统计设计部分内容,但由于涉及若干尚未学习的统计学概念,故放在第十九章介绍,该章包括了两种设计类型常用的样本含量估计方法。

第四、五章为数据的统计描述,主要涉及描述定量和定性资料的常见统计指标等;第六、七章为统计推断的基本内容,包括参数估计和假设检验两个部分,主要涉及其基本思想、概念及原理,如抽样误差的概念与标准误、假设检验的基本思想、I型与II型错误、总体均数估计的方法和假设检验的基本步骤等;第八至十二章为基本的和常用的单变量统计推断方法,针对不同类型的资料和不同类

型的设计,分别介绍了常用的各种t检验、方差分析、2 检验和秩和检验等,主要涉及组间比较的假设检验;第十三、十四章介绍了双变量的相关和回归分析,亦包括统计推断的内容。

第十五章介绍了针对生存资料的一类统计分析方法(即生存分析),主要涉及生存资料的特点、生存分析的基本概念,以及生存分析中统计描述和推断的内容;第十六章对于最常用的多重线性回归、logistic回归和Cox比例风险回归等多变量统计方法进行了简介;第十七章主要介绍了诊断和筛检试验的评价指标体系及其应用;第十八章主要介绍了Meta分析的基本原理、基本方法及其注意事项;第二十章主要介绍了效度和信度的概念及其评价方法;第二十一章介绍了医学人口和疾病统计常用指标、寿命表及其应用。

第二十二、二十三章阐述了统计方法的正确选择、结果的正确解释和表达。增加这两章的目的是针对在统计方法选择、结果解释和表达中大量存在的问题和常见错误,帮助学生梳理正确选择统计方法的基本思路和原则、阐释在结果理解和解释上容易发生的错误,介绍了医学论文统计报告的基本要求。

最后两章(即第二十四、二十五章)简介了常用的数据管理和数据分析软件。增加这两章的目的是使学生在学习了基本的统计分析方法后,能够了解或掌握基本的数据管理和分析技能。

小结

1.从医学科学研究中的个体差异和不确定性出发,介绍了什么是医学统计学、医学统计学在医学科研中的地位和作用、医学统计学的基本内容和统计工作的基本步骤。尤其强调了医学科研的统计设计是医学统计学的重要内容之一,统计设计和统计分析是统计学不可分割的两个重要组成部分。

2.介绍了统计学的若干基本概念,包括总体与样本、参数和统计量、概率抽样和抽样误差、定量与定性变量、随机与非随机误差、概率与频率等,它们是学习医学统计学的重要基础。

3.学习医学统计学的目的是培养独特的统计学逻辑思维方法,掌握统计设计方法和收集准确可靠的数据,运用统计分析方法正确分析数据,掌握操作统计软件的技能,正确解释和表达研究结果。关键是运用统计思维和统计方法去分析和解决医学科研问题,提高科学素养和科研能力。

(李晓松)

医学统计学题库1

绪论知识点 1. 只要增加例数就可以避免抽样误差。 A. + B. – 2. 等级资料也可认为是一种计数资料。 A. + B. - 3. 概率的取值一定在0~1范围内,频率的取值则不一定。 A. + B. - 4. 客观事物中同质是相对的,变异是绝对的。 A. + B. - 5. 观察单位数不确定的总体称为有限总体。 A. + B. - 6. 统计量针对于样本,参数针对于总体。 A. + B. - 7. 统计描述就是用样本推断总体的统计过程。 A. + B. - 8. 有序分类资料就是等级资料。

A. + B. - 9. 统计分析一般包括统计描述和统计推断。 A. + B. - 10. 如果对全部研究对象都进行了调查或测定就没有抽样误差。 A. + B. - 11. 对于统计资料的描述可用统计指标和统计图表两种手段。 A. + B. - 12. 有序变量也称连续型变量,变量值可取连续不断的实数。 A. + B. - 13. 分类资料中的各类别必须互相排斥,不能相互包含。 A. + B. - 14. 离散变量在数值很大时可以取小数值,可近似地看成连续型变量。 A. + B. - 15. 统计指标是用来综合说明总体某一特征的,而标志是说明个体某一特征的。

A. + B. - 16. 若以舒张压>90mmHg为高血压,调查某地1000人中有多少个高 血压患者, 这是________。 a.计量资料b.还不能决定是计量资料还是计数资 料 c.计数资料d.既可作计量也可作计数资料 e.等级资料 17. 某医院用一种中草药治疗9名高血压病人,治疗前后的舒张压见 下表。 病 人号 1 2 3 4 5 6 7 治疗前 11 5 11 12 9 11 11 6 10 9 10 9 治疗后 11 6 90 10 8 92 90 11 0 87 欲比较治疗前后有无差异, 这是_________。 a.计量资料b.还不能决定是计量资料还是 计数资料 c.计数资料d.既可作计量也可作计数资料e.等级资料 18. 一批病人的血球沉降率(%)是________。 a.计量资料b.还不能决定是计量资料还是

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

医学统计学题库

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A . 调查、录入数据、分析资料、撰写论文 B . 实验、录入数据、分析资料、撰写论文 C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据设计的不同特点,选择相应的统计分析方法对资料进行分析

预防医学及医学统计学总结

绪论 一?预防医学:是医学的一门应用学科,它以个体和确定的群体为对象,目的是保护、促进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1?工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3?采取的对策 更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质 环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2?第二级预防:在 疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发 展和恶化。3?第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 一?流行病学]:是研究人群中疾病与健康状况的分布及其影响因素,并研究防治疾病及促进健康的策略和措施的科学。流行病学定义内涵:1.流行病学的研究对象时人群。2?流行病学关注的事件包括疾病与健康 状况。3?流行病学主要研究内容是:(1)揭示现象(2)找出原因(3)评价效果。4?流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1?分布论。2.病因论。3?健康-疾病连续带。4预防控制理论(三级预防理论)5?数理模型。6?流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2?探讨疾病的病因。3?研究疾病自然史,提高临床诊断、治疗水平和预后评估。4?疾病的预防控制及其效果评价。5?流行病学分支。 第二章疾病分布 一.疾病的分布即疾病的群体现象或称疾病的三间分布,是指疾病在时间、空间和人间的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间内(一般为1年)特定群中某病新病例 出现的频率。 2?罹患率|:与发病率一样,也是测量人群新病例发生频率的指标。使用与小范围、短时间内疾病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 3患病率|:也称现患率,指某特定时间内,总人口中现患某病者(包括新、旧病例)所占的比例。患病率=发病率*病程。 4续发率I:也称二代发病率,指某传染病易感接触者中,在最短潜伏期与最长潜伏期之间发病的人数占所有易感接触者总数的百分率。 5?死亡率:指在一定时间期间(通常为1年)内,某人群中死于某病(或死于所有原因)的 频率。死亡率是测量入群死亡危险最常用的指标。 6?病死率:表示一定时期内,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1?地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2?时间分布 3?人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组中 发病率均高,并随年龄增长而上升。(2)在其他地区居住的相似的人群组中,该病的发病率 均低,甚至不发病(3)外来的健康人,到达当地一定时间后发病,其发病率逐渐与当地具名接近(4)迁出该地区的

《医学统计学》习题册

上海交通大学网络教育学院医学院分院 医学统计学课程练习册 第一章绪论 一、单选题 1. 小概率事件是指P () B.P<0.05 2. 从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A总体中个体值存在差别 3. 调查中国放射科医生接触射线情况,全国放射科医生的全部组成为 A.研究总体 4. 若以舒张压90mmHg、收缩压130 mmHg为高血压阳性临界点,调查3000人 中有300名血压超过临界值,这份资料属于:B. 分类资料 5. 下列属于统计量的指标是 C 样本标准差 6. 调查某地区高血压的患病情况,抽样调查了2000名居民,得到了2000对舒 张压与收缩压的数据,请问此资料是: C 定量资料 7. 下列属于参数的指标是D总体标准差 8. 用样本做统计推断,样本应是B. 总体中有代表性一部分 9. 统计推断的内容为 D. A和B均是 10. 随机调查社区2000人,得到平均体重为60公斤,则该资料属于 A. 计量资料 二、名词解释 1.抽样误差:由于总体中各观察单位间存在个体变异,抽样研究中抽取的样本,只包含总体的一部分观察单位,因而样本指标不一定恰好等于相应的总体指标。样本指标与总体指标的差异称为抽样误差。 2.总体:根据研究目的性质相同的观察单位的全体。 3.分类变量:用定性方法测得,表现为互不相容的类别或属性,如性别等。 4. 数值变量:用定量方法测量得到,表现为数值大小,一般有计量单位,如身高、体重。 三、问答题 1.什么叫计量资料,它的统计分析方法有哪些(包括统计描述和统计推断)?

在科研中,用测量方法获得数据,对各观察单位用定量方法测定某项指标量的大小,这类资料一般有度量衡单位。 计量资料的统计分析包括统计描述和统计推断:统计描述主要是统计图表、集中趋势和离散趋势的描述,集中趋势中可以计算算术均数、几何均数、中位数和众数,离散趋势可以计算极差、标准差、方差和变异系数。统计推断包括点估计、区间估计和假设检验。常用的假设检验方法包括:t检验、u检验、方差分析(F检验)和秩和检验。 2.举例说明总体与样本的关系。 总体是根据研究目的确定的同质的所有观察单位某项观察值(变量值)的集合。例如研究某地2002年正常成人白细胞数,观察对象是该地2002年全部正常成人,观察单位是每个人,观察值是每人测得的白细胞数,则该地2002年全部正常成人的白细胞数就构成了一个总体;从总体中随机抽取部分观察单位其某项指标的实测值组成样本。从上述的某地2002年正常成人中随机抽取150人,这150正常成人的白细胞数就是样本。抽取样本的目的是用样本的信息推论总体特征。 第二章定量数据的统计描述 一、单选题 1. 若资料为偏态分布,最好计算下列哪个指标来衡量集中程度D 中位数 2. 若资料为正态分布,最好计算下列哪个指标来衡量集中程度 B 算术均数 3. 对数正态分布资料计算集中趋势应该用 A 几何均数 4. 抗体滴度资料通常使用哪个集中趋势指标 B 几何均数 5. 平均数指标体系中不包括A 全距 6. 抽样调查了10名居民体重资料,请问平均体重该用哪个指标计算C 算术 均数 7. 样本标准差的的取值情况是 A 大于或等于零 8. 若资料为正态分布,最好计算下列哪个指标来衡量离散程度 C 标准差 9. 若资料为偏态分布,最好计算下列哪个指标来衡量离散程度() B 四分位间距 10. 若资料末端没有截尾值,最好计算下列哪个指标来衡量离散程度() D 四分位间距 11. 一组资料的例数等于25,方差等于16,标准差等于A 4 12 一组资料的标准差等于5,变异系数等于10%,样本均数等于 B 50 13. 标准差与算术均数的使用条件( ) B 相同 14. 比较两组正态分布数据离散度大小的指标,如果单位不同该用( )

医学统计学课后习题与答案

医学统计学 第一章绪论 答案 名词解释: (1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。 (2)总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。 (3)参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。 (5)概率:是描述随机事件发生的可能性大小的数值,用p表示 (6)计量资料:由一群个体的变量值构成的资料称为计量资料。 (7)计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。。 (8)等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。 是非题: 1.× 2.× 3.× 4.× 5.√ 6.√ 7.× 单选题: 1.C 2.E 3.D 4.C 5.D 6.B 第二章计量资料统计描述及正态分布 答案 名词解释: 1. 平均数是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1.计量,计数,等级

2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99% 5. 47.5% 6.均数、标准差 7. 全距、方差、标准差、变异系数 8. σμ96.1± σμ58.2± 9. 全距 R 10. 检验水准、显著性水准、0.05、 0.01 (0.1) 11. 80% 90% 95% 99% 95% 12. 95% 99% 13. 集中趋势、离散趋势 14. 中位数 15. 同质基础,合理分组 16. 均数,均数,μ,σ,规律性 17. 标准差 18. 单位不同,均数相差较大 是非题: 1. × 2. √ 3. × 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √ 11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √ 21. √ 单选题: 1. B 2. D 3. C 4. A 5. C 6. D 7. E 8. A 9. C 10. D 11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C 21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D 31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B 41. C 42. B 43. D 44. C 45. B 问答题: 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5.

医学统计学重点Word版

医学统计学重点 第一章绪论 1.基本概念: 总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。 样本:从总体中随机抽取部分个体的某个变量值的集合。 总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。 统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。 抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。 频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。 概率:频率所稳定的常数称为概率。 统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。 统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 2.样本特点:足够的样本含量、可靠性、代表性。 3.资料类型: (1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。 (2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料) ①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由 各分组标志及其频数构成。包括二分类资料和多分类资料。 二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。 多分类:将观察对象按多种互斥的属性分类 ②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单 位的个数所得的资料。

医学统计学绪论完整课件

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学绪论完整课件 医学统计学(( Medical Statistics))绪论(( Instruction )) 3 工作和生活中常见的统计学问题明天是否下雨?体育彩票能否中奖?( 概率论子女为什么象父母,其强度有多大?( 相关与回归归人口普查、疾病调查是如何进行的?( 调查设计,抽样如何判断药物的疗效?( 假设检验统计学是对令人困惑费解的数字问题做出设想的艺术。 4 统计是一种对客观现象数量方面进行的调查研究和分析; 是收集、整理、分析、推断、判断等认识活动的总称。 统计学(Statistics )的定义 A science dealing with the collection, analysis, interpretation, and presentation of masses of numerical data ( Webster International Dictionary ) The science and art of dealing with variation in data through collection, classification, and analysis in such a way as to obtain reliable results (A Dictionary of Epidemiology) 统计学:是关于数据收集、整理、表达、分析与推断的普遍原理和方法,是一门处理数据变异性的科学与艺术,其目的是求得可靠的结果。 统计学是工具学科,指导专业学科的学习和应用。 7 医学统计学是应用统计学基本原理 1 / 12

医学统计学复习重点

医学统计学复习重点 统计设计:调查设计、实验设计 第一章绪论 1.基本概念: 总体——根据研究目的确定,所有同质观察单位某种观察值的全体。 样本——总体中抽取的一部分具有代表性的个体组成的集合。 参数——刻画总体特征的统计指标。一般用希腊字母表示、、π 统计量——刻画样本特征的统计指标。抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示X、S、p 抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。抽样误差是不可避免的。属于随机误差,无方向性,重复抽样可以呈现一定的规律性。 小概率事件 P≤0.05 2.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。(用工作实例解释) 第二章调查研究设计 第三章实验研究设计 1.调查研究 (观察性研究): 特点:无人为施加处理因素 调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查 注意:收集的资料要有可比性 *随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样 非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等 2.实验研究 特点:与调查研究最本质的区别:根据研究目的主动施加干预措施

实验设计的三个基本要素:受试对象、处理因素、实验效应

实验设计的基本原则:对照原则、随机化原则、重复原则 第四章定量资料的统计描述 第五章定性资料的统计描述 1.定量资料 (1)定量资料——*频数分布表、直方图、箱式图——判断分布类型—— 集中位置离散趋势(变异程度)*对称分布 (正态分布) X±S均数X标准差S *偏态分布M(P 25~P 75 )中位数M=P 50 四分位数间距Q=P 25 ~P 75 对数正态分布几何均数G对数标准差S lgX (2)描述离散趋势的统计指标: ?极差R=最大值-最小值、 ?四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料 ?方差(总体、样本S2)&标准差(、S):*正态或近似正态分布 ?变异系数 % 100 ? = X S CV (3) (4)正态分布及其应用:**制定医学参考值范围 步骤:判断分布类型——正态分布——*双侧95%参考值范围:X±1.96S、 单侧95%参考值范围:下限为X-1.64S、上限为X+1.64S ——偏态分布——*双侧95%参考值范围:(百分位数法)P 2.5~P 97.5 单侧95%参考值范围:下限为P 5、上限为P 95 2.定性资料 *率:指某现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比。用以说明该现象发生的频率或强度。

医学统计学课后习题答案解析

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝 大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99% 5. 47.5% 6.均数、标准差

医学统计学知识点讲课讲稿

医学统计学知识点

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。

《医学统计学》案例版 教案

教案首页 课程名称医学统计学章节(课题)第1章绪论授课对象授课时间 授课学时授课地点 教学目的与要求1.了解医学统计学的内容。 2.掌握医学统计工作的基本步骤。3.掌握统计资料的类型。 4. 掌握医学统计学的基本概念。5.熟悉统计学习的目标与方法 教学重点与难点重点:同质和变异、总体和样本、概率、参数与统计量、抽样误差、计量资料、计数资料、等级资料。医学统计工作的基本步骤。 难点:总体和样本;概率、抽样误差、资料的分类 教学 方法 以课堂讲授为主,督导式教学教具电脑多媒体幻灯片 板书提纲 第一章绪论 第一节概述 统计学(statistics)是应用概率论和数理统计的基本原理和方法,研究数据的收集、整理、分析、表达和解释的一门科学。 医学统计学(Medical Statistics)是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的收集、整理、分析、表达和解释的一门科学。 医学统计学的主要内容 第二节医学统计工作的步骤 ?研究设计(research design) ?收集资料(collection data) ?整理资料(sorting data) ?分析资料(analysis data) 第三节统计资料的类型 ?变量(variabal) ?变量值(variabal value) ?计量资料(measurement data) ?计数资料(enumeration data ) ?等级分组资料( ordinal data ) 第四节医学统计学的基本概念 1.随机事件(random event)与必然事件(certain event)

2.同质(homogeneity)与变异(variation) 3.总体(population)与样本(sample) 4.抽样研究(sampling reaserch)与抽样误差(sampling error ) 5.参数(parameter)与统计量(statistic) 6.概率(probability ) 教学步骤1.介绍统计学及医学统计学的概念、学科特点。10分钟2.统计工作的基本步骤。30分钟 3.统计资料的类型。15分钟 4.医学统计学的基本概念。43分钟 5.小结2分钟。 思考题或作业1.总体与样本是什么样的关系? 2.统计资料分为几种类型?他们之间有何不同? 3.简述统计工作的四个基本步骤。 4.收集资料时对统计资料有何要求? 5.判断下列变量类型:大学教授的年收入,欧洲的国家数,血红蛋白含量,患病人数等。 6.为了了解某地20~29岁健康女性血红蛋白的正常值范围,现随机调查了该地2000名20~29岁的健康女性,并对其血红蛋白进行测量,请问本次调查的总体是() A.该地所有20~29的健康女性 B.该地所有20~29的健康女性的血红蛋白测量值 C.抽取的这2000名20~29岁女性 D.抽取的这2000名20~29岁女性的血红蛋白测量值 课后记

医学统计学第三版深刻复习归纳

第一章绪论 统计的三大特征:实用性、丰富性、公平性 总体(population): ●是根据研究目的确定的、同质的全部研究对象中所有观察单位某种变量值的集合。 ●同质基础:时间、空间、条件等 ●(1)有限总体(finite population):有限观察单位 ●(2)无限总体(infinite population):很多为无限总体。 样本 ●根据随机化原则从总体中抽取的一定数量(sample size)的个体,称为样本 (sample),用样本信息来推断总体特征。 ●从总体中抽取部分个体的过程称为抽样(sampling)。 同质(homogeneity) ●是指影响被研究指标的非实验因素相同。 变异(variation, variablility ) ●同质基础上的各观察单位(亦称为个体)之间的差异为变异。如同性别、同年龄、 同民族、同地区儿童的身高有高有低,称为身高的变异。 参数(parameter)和统计量(statistic) ●总体的统计指标称为参数。 如:总体均数(μ),总体发病率,总体死亡率,等, ●样本的统计指标称为统计量 如:样本均数(x),样本发病率,样本死亡率,等, ●统计学上用不同的符号表示。

误差(error) 观察值与实际值的差异,成为误差。 分为:过失误差;系统误差;随机测量误差;随机抽样误差; (1)过失误差(mistaken error):过失所致的误差(不认真,错误判断,记录等原因);(2)系统误差(systematic error):仪器未校准所致的误差(统一偏高,或偏低); 这两类误差可以避免。 (3)随机测量误差(random measurement error):不同观察者或同一观察者多次观察值的不相同。 这种误差不可避免。 (4)抽样误差(sampling error):总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,因而样本均数(或率)往往不等于总体均数(或率),表现为多次抽样的样本均数或率不同。这种由抽样引起的差异称为抽样误差。 抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 由于生物的个体变异是客观存在的,因而抽样误差是不可避免的,但抽样误差有一定的规律性。 小概率事件定理: “小概率事件一次抽样不可能发生” 变量及变量值 ●变量(variable):观察对象的特征或指标。对变量进行取值所采用的工具或标准成 为测量尺度(scale)。 ●测量的结果称为变量值(value of variable) 或观察值(observed value, measurements)。

医学统计学最佳选择题1

医学统计学最佳选择题 一、绪论 1.下面的变量中,属于分类变量的是 A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血压 2.下面的变量中,属于数值变量的是 A.性别 B.体重 C.血型 D.职业 E.民族 3.下列有关个人基本信息的指标,其中属于有序分类变量的是 A.学历 B.民族 C.职业 D.血型 E.身高 4.若要通过样本作统计推断,样本应是 A.总统中典型的一部分 B.总体中任意部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 5. 统计量是指 A.是统计总体数据得到的量 B.反映总体统计特征的量 C.是根据总体中的全部数据计算出的统计指标 D.是用参数估计出来的量 E.是由样本数据计算出来的统计指标 6.下列关于概率的说法,错误的是 A.通常用P表示

B.大小在0~1之间 C.某事件发生的频率即概率 D.在实际工作中,概率是难以获得的 E.某事件发生的概率P≤0.05时,称为小概率事件。 7.减少抽样误差的有效途径是 A.避免系统误差 B.控制随机测量误差 C.增大样本含量 D.减少样本含量 E.以上都不对 二、定量资料的统计描述 1.用均数和标准差能用于全面描述下列哪种资料的特征 A.正偏态分布 B.负偏态分布 C.正态分布 D.对数正态分布 E.任意分布 2.当各观察值呈倍数变化(等比关系)时,平均数宜用 A.均数 B.几何均数 C.中位数 D.相对数 E.四分位数间距 3.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的 统计指标是 A. M B. G C. X D. P95 E. CV 4. 对于正态分布的资料,理论上 A. 均数比中位数大

医学统计学知识点

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB 等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。

抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 、或P(A)≤ 。 医学科研中,P(A)≤ 作为事物差别有统计意义,P(A)≤ 作为事物差别有高度统计意义。 第二章定量数据的统计描述 定量数据的统计描述方法:频数表、直方图、统计指标。 (1)频数分布 频数分布的目的:了解数据的分布范围、集中位置以及分布形态等特征,以便根据资料分布情况选择合适的统计方法。 频数分布的用途: ①作为陈述资料的形式; ②便于观察数据的分布类型;

医学统计学总结

医学统计学总结 一 .绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3 )医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic 回归与 Cox 回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预 期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a 检查核对b 设计分组c 拟定整理表d 归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。变异(variation):同质基础上的各观察单位间的差异。 变量(variable) :收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项特 征进行测量或观察,这种特征称为变量 体具有的基本特征是:同质性 样本( sample ) 从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代表性。代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标( 样本率,样本均数,样本标准差)。

相关文档
相关文档 最新文档