文档库 最新最全的文档下载
当前位置:文档库 › keyuan统计学_期末复习重点

keyuan统计学_期末复习重点

keyuan统计学_期末复习重点
keyuan统计学_期末复习重点

●统计学:收集、处理、分析、解释数据并从中得出结论的科学。研究对象:客观现象总体的数量特征和数量关系,及通过数量方面反映的客观现象发展变化规律性。

统计工作:关于数据采集、整理、分析、发布、使用全过程的活动总称。

统计工作过程:统计设计,统计数据收集,统计整理,统计分析,统计发布,统计资料的整理,开发与应用。

●统计分析方法:描述统计,推断统计。

描述统计:研究如何取得反映客观现象的数据,通过图表形式对收集的数据进行加工处理和显示,综合、概括与分析得出反映客观现象的规律性数量特征。

推断统计:在对样本数据进行描述的基础上,利用一定方法根据样本数据估计活对端总体的数量特征(部分→总体)。

●数据类型:⑴定型(品质)数据:分类数据(eg购买商品支付方式,职业)、顺序数据(eg评价教育质量);定量:数值型数据(eg收入,年龄)⑵观测数据(eg电视收视率)、实验数据。都在没有对事物进行人为控制的条件下得到的⑶时间序列数据(又称动态数据,在不同时间或时点收集的数据)(eg就业人数逐年变化情况)、截面数据(又称静态数据,在相同时间下收集的数据,反映不同空间或主体在同一时间下的数量特征)、面板数据(时间序列和截面数据的综合,有空间时间两个维度,综合反映不同时间空间的数据分布情况)。

●总体N:根据一定目的确定的所要研究事物的全体。

个体:组成总体的各单位。

样本:总体部分单位组成的集合。样本单位必须取自同一总体。样本个数多少和样本量与抽样方法有关。样本抽取必排除主观因素影响,确保样本客观性代表性。

样本容量n:样本所包含的元素。

总体参数:描述总体特征的概括性数字度量。总体均值μ总体方差σ方,总体标准差σ总体比例π。参数对应总体。

统计量:描述样本特征的概括性数字度量。样本均值x拔,样本方差s2样本标准差s样本比例p。统计量对应样本。

变量:说明总体或样本数量特征的属性。分类:⑴分类、顺序、数值型变量⑵连续型、离散型变量。

方便抽样:根据调查方便性,以无目标、随意的方式自行确定调查单位。

志愿者抽样:被调查者自愿参加冰箱调查者提供有关信息。

滚雪球抽样:先对随机选择的一些被调查者实施访问,然后请他们推荐具有研究目标总体特征的调查单位。

配额抽样:根据一定标准对总体分层分类后,从各层各类中主管选取一定比例调查单位。

判断抽样:根据经验判断了解的基本情况有目的地选择单位。

统计指标:说明现象总体数量特征的属性。

统计指标体系:若干相互联系的统计指标构成的有机整体。

●统计调查方式:⑴普查:为某特定目专门组织的一次性全面调查。特点:一次性,周期性;规定统一标准调查时间;数据规范化程度较高;适用范围较窄⑵统计报表⑶抽样调查:从总体中随机抽取部分个体作为样本进行调查。特点:经济性,时效性强,适应面广,准确性高。

●调查方案设计:明确调查目的,确定调查对象和单位,确定调查项目,确定调查时间和方法,调查工作的组织实施。

调查问卷设计:引言,被调查者基本情况,问题和答案,结语。问题:⑴开放式问题:优:被调查者有机会进行自我表达或详细描述。缺:开放式要求更高,被调查者须在没有选项帮助情况下确定问题意图;调查机构数据录入较困难;费用更高⑵封闭式:优:答案已设计好,被调查者只需简单地选择合适选项,不需用自己语言陈述答案,回答问题更快更容易;被调查者更可能按设计者希望的意图回答;数据更易分析;编码和数据录入更容易,花费更省;若一问题被用于多项调查,相同回答选项有助于对结果进行比较。

●数据误差分类:抽样、非抽样误差。

●数据预处理:⑴数据审核:检查数据错误。审核准确性:逻辑检查,计算检查⑵数据筛选⑶数据排序。

●统计表:构成:表头,行标题列标题,数字资料,表外附加。注意:总标题简明扼要;上下两端端线粗线绘制,其他线细线,左右两端开口式不划线;数字资料应有计量单位;“合计”置于最后一列;没有数字的单元格用“—”表示;填好的统计表无空白单元格。

●异众比率Vr:非众数组频数占总频数的比率。衡量众数对一组数据代表性程度大小。

Vr=(Σfi-fm)/ Σfi=1-fm/Σfi

●频数:落在某一类别或组中的数据个数。

频率:各类别频数与总频数之比。

累积频数:各类别或组的频数逐级累加得到的频数。

帕累托图:把各类别数据的频数由大到小排序并计算累积频率绘制条线

图。

●极差R:一组数据最大值最小值之差。R=max(xi)-min(xi)

●四分位差Qd:上四分位数与下四分位数之差,亦称内距、四分间距。反映中间50%数据离散程度。衡量中位数代表性。Qd=Q U-Q L

●抽样分布:样本统计量的概率分布。设总体变量X,X1到XN;样本变量x,x1到xn:⑴数学期望:E(x拔)=E[(x1+…+xn)/n]=1/n[E(x1)+…+E(xn)],重复抽样x1到xn相互独立,且都是从X1到XN抽取的,每单位机会相等,概率均为1/N所以E(x1)=…=E(xn)=Σ(上n下i=1)XiPi =μ,E(x拔)=1/n[E(x1)+…+E(xn)]= 1/n(nμ)=μ⑵方差:σ2(x 拔)=σ2[(x1+…+xn) /n]=σ2/n方(x1+…+xn)=1/n2[σ2(x1)+…+σ2(xn)]重复抽样x1到xn相互独立,且都是从X1到XN抽取的,所以xi 与总体同分布σ2(x1)=…=σ2(xn)=σ2,σ方(x拔)= 1/n方(σ2+σ2+…+σ2)=σ2/n,σ2(x拔)=σ/根n。

●大样本:⑴大样本且σ已知:任何服从正态分布的随机变量95%值

在“均值±1.96个标准差”之内。Z=(x拔-μ)/σx拔~N(0,1),P(|z|≤Zα/2)=1-α,P(|x拔-μ|/σx拔≤Zα/2)=1-α,P(|x拔-μ|≤Zα/2σx拔)=1-α,x拔- Zα/2σx拔≤μ≤x拔+ Zα/2σx拔,边际误差Zα/2*σ/根n=E。σ越大,可靠性越低,区间越窄。⑵σ未知:σx拔=s/根n。

●假设:检验为目的对单或多个总体分布或分布中所含参数具体数值所作的陈述。总体参数:总体均值、比例、方差。

假设检验:对总体参数提出某种假设,利用样本信息判断该假设是否成立的方法。采用逻辑上反证法,统计学上小概率原则。

假设检验—古典方法:⑴提出假设:原假设(待检验的假设,又称零假设)、备择假设(与原假设对立的假设,又称研究假设)。备择假设常是研究者搜集证据予以支持的假设,原假设常是研究者搜集证据予以反对的假设⑵确定检验统计量及其分布⑶确定显著性水平及拒绝域:原假设为真时拒绝原假设所犯错位称为I类错误,又叫弃真错误;原假设为假时喂拒绝原假设,II类错误,取伪错误;原假设被拒绝时才可能犯I 错误,未被拒绝时犯II错误。⑷构选取决规则:①双侧检验:|检验统计量|>|检验临界值|拒绝H0,否则不拒绝②左侧检验:统计量<临界值,拒绝H0,否则不拒绝③右侧检验:检验统计量>临界值,拒绝H0,否则不拒绝⑸计算检验统计量值作出决策(不能拒绝)。

●总体均值检验:⑴大样本:根据抽样分布理论,x拔~N(μ,σ2/n),

将x标准化得到检验统计量z,z服从标准正态分布。总体方差σ2已知z =(x拔-μ0)/(σ/根n),σ2未知z=(x拔-μ0)/(s/ 根n)⑵小样本:总体方差σ2已知,=大样本;σ2未知,样本方差s2代替总体方差σ2,统计量不服从标准正态分布,服从自由度n-1的t分布,tc表示有样本数据计算检验统计量具体数值t=(x拔-μ0)/(s/根n)~t(n-1)。

总体比例检验:检验统计量z=(p-π0)/根π0(1-π0)/n结~N(0,1)。双侧检验:H0:π=π0 ,H1:π≠π0,|z|>za/2;左侧检验:H0:π≥π0 ,H1:π<π0,z<za;右侧检验:H0:π≤π0 ,H1:π>π0,z>za。

●散点图:水平轴代表自变量x纵轴代表因变量y, (xi,yi)表示点,n 组数据在坐标系中形成的n个点为散点,坐标及散点构成的二维数据图。正线性相关,负线性相关,非线性相关,不相关。

●相关系数r:根据总体全部数据计算的为总体相关系数ρ。根据样本数据计算的为样本相关系数。r=s上方下xy/SxSy=Σ(x-x拔)(y-y拔)/根Σ(x-x拔)方 结 根Σ(y-y拔)方 结=(nΣxy-ΣxΣy)/根[nΣx2-(Σx)2][ nΣy2-(Σy)2]结。度量两个变量线性关系强度的统计量;是随机变量;绝对值小于1。

相关系数显著性检验:步骤⑴提出假设:H0:ρ=0,H1:ρ≠0 ⑵计算检验统计量t值:t=r根(n-2)/(1-r2)结~t(n-2) ⑶作出判断:根据显著性水平α自由度df=n-2查出t-检验临界值tα/2(n-2),t绝对值>临界值绝对值,拒绝原假设,表明总体两变量间存在显著线性关系。

●一元线性回归模型:⑴回归分析中,被解释变量为因变量y。

y=β0+β1x+ε。假定1:误差项期望值为0,E(ε)=0,E(β0)= β0,E(β1)= β1,E(y)= β0+β1x。假2:对所有x误差项ε方差都相同,为常数σ2,即给定x,y方差σ2。假3:误差项ε是一个服从正态分布随机变量,ε~N(0,σ2),且独立,所以对特定x所对应y和其他x所对应y不相关;对于任何一个给定的x,y都服从期望值β0+β1x方差σ2的正态分布⑵一元线性回归方程也称直线回归方程,形式为

E(y)=β0+β1x,β0回归直线在y轴上的截距,x=0时期望值;β1直线斜率,表明自变量每变动一单位因变量平均变化量⑶样本回归直线(估计的回归方程):根据样本数据拟合的直线,yi约=β0约+β1约xi。样本模型yi约=β0约+β1约xi+ei,ei残差,总体误差估计。

●最小二乘估计:用因变量观测值yi约 与估计值yi约 间的离差平方和最小方法估计β0约和β1约。ei=yi-yi约,y约=β0约+β1约x。Q=∑e 下i上2=∑(yi-yi约)2=∑(yi-β0约-β1约xi)2,将Q对β0约 和β1约

求偏导数,并令其等于0,∑yi=nβ0约+β1约∑xi,∑xiyi=β0约∑xi +β1约∑xi2解得β1约=(n∑xiyi-∑xi∑yi)/[n∑xi2-(∑xi)2],β0约=y-β1约x。

●回归直线拟合优度:⑴判定系数:对估计回归方程拟合优度优劣的度量,又称可决系数。因变量y取之不同,y取值的波动称为变差。变差大小可用实际观测值y与其均值y只差y-y平均表示。n次观测值总变差由变差平方和表示,称为误差SST。SST=∑(yi-y平均)2,yi-y平均=( yi-y 约)+(yi约-y),∑(yi-y平均) 2=∑(yi-yi约)2+∑(yi约-y平均)2。回归平方和SSR,和SSE:SST=SSR+SSE,1=SSR/SST+SSE/SSR,判定系数R2=SSR/SST=1-SSE/SST越大越好,R2取值 [0,1]。⑵估计标准误差s上2下y=ei方/(n-k-1),sy= ∑(yi-yi约)2/(n-2)= ∑e2/(n-2)。

●回归方程估计预测:y0=β0+β1x0

●时间序列:按照时间顺序取得一系列同一现象的观测值。若时间序列无季节变动和循环波动有线性趋势,则变化轨迹为一条直线。

时间序列构成要素:长期趋势T季节变动S循环变动C不规则变动I。

长期趋势:时间序列在长时期内呈现出来的某种持续向上或下降的变动;

季节变动:时间序列在一年内重复出现的周期性波动;

周期变动:时间序列中呈现出来围绕长期趋势的波浪形或振荡式变动;不规则变动:时间序列中除去趋势、周期性和季节性变动的偶然性波动。

分解模型:乘法模型Y=TCSI加法模型Y=T+C+S+I。

模型:移动平均模型,指数平滑模型,线性模型,指数模型等。

季节指数:移动平均比率法:原始序列中心移动平均,移动平均期数为季节变动周期;计算原始序列数值与中心化移动平均列对应值比率;根据求的比率值计算季节指数;对季节指数左边准化修正。

●指数平滑法:St=αYt+(1-α)St-1,Yt时间序列观测值,St平滑后数值,α平滑系数0<α<1,α越小越适用于变动明显的时间序列数据(不规则效应越明显的时间序列数据)。指数平滑系数越大,指数平滑列越光滑。

移动平均预测:军方误差MSE=预测误差平方和/预测误差个数。

指数平滑预测:Ft+1=St,t最近一个时期St指数平滑值即t+1期预测值。

◆统计学是一门方法论科学。

◆描述统计问题:了解数据分布特征;分析感兴趣的总体特征;利用图表或其他数据汇总工具分析数据。

◆推断统计:从一果园摘36橘子,利用36橘子平均重量估计果园橘子平均重量。

◆工业企业的职工人数、职工工资:前离散型,后连续型变量。

◆民意调查,确定年轻人愿意与父母讨论的话题,45%年轻人愿与父母讨论家庭财务状况…:分类数据

◆某地有800家独立核算工业企业,研究这些企业产品生产情况,个体:每个工业企业。

◆估计某市有车家庭比例,抽500样本,有车家庭比例35%,35%指:变量。

◆在统计指标和指标体系中,统计指标体系是相互联系的指标所构成的整体。

◆由150新车组成样本表明外国新车价格明显高于本国新车,结论属于:对总体的推断。

◆人口普查规定统一标准时间为了:避免登记的重复和遗漏。

◆非概率抽样缺点:无法使用样本结果对总体相应参数进行判断。

◆统计调查方案首要问题:确定调查任务与目的;核心:调查表。

◆调查某校学生状况,调查对象:该校全部学生。

◆确定调查对象和单位:向谁调查,由谁来具体提供统计资料。

◆企业生产设备状况普查,调查单位:每台生产设备;报告单位:企业。

◆制造商称产品不合格率低于10%,从一批产品中抽100个,6%不合格。总体:制造商生产的一批产品。样本:100个产品。参数:总体不合格率。统计量:样本的不合格。

◆消费者每月网购平均花费200,其选择在网购主要原因是价格便宜。总体:网购消费者。“消费者网购原因”是分类变量。参数:所有网购消费者每月网购平均花费。“消费者每月网购平均花费200”是统计量。

◆饼图:结构性问题。

雷达图:多变量比较。

环形图:比较两或多个总体结构性问题。

直方图:分组数据分布。茎叶图:未分组数据分布。

线图:时间序列数据变化趋势。

◆一个数据标准分数-2表明该数据:比平均数低2个标准差。

◆离散系数:比较两组数据的离散程度。

◆一组数据分布对称,偏度系数=0。

◆几何平均数:计算平均发展速度。

◆两组数据均值不等标准差相等:均值小的离散程度大。

◇偏度系数SK:绝对值越大,偏斜程度越大。右偏分布SK>0,均值>中位数>众数。

◆某班学生英语平均成绩70标准差10分数对称分布,60~80分学生约占68%。

◆组中值计算均值假定各组内变量值均匀分布,计算结果不准确。

◆收入差距:分布偏态,存在极端值,中位数表示中等收入。收入是偏态分布,为了解收入水平应该选择众数。

◆参数估计用t分布构造置信区间条件:总体正态分布,方差未知且为小样本。

◆根据一个具体样本求出总体均值95%的置信区间,要么包含、要么不包含总体均值。

◆总体参数置信区间由样本统计量点估计值+-边际误差得到的。

◆置信水平一定时,置信区间宽度:随着样本容量的增大而减小。

◇同一总体两个无偏估计量θ1和θ2,若Var(θ1)

◆正态总体方差估计应使用x2分布;正态总体方差未知,小样本,估计总体均值应使用t分布;正态总体方差未知,大样本,…使用正态分布;正态总体方差已知,小样本,…使用正态分布;非正态总体,大样本,…使用正态分布;大样本,估计总体比例使用正态分布;总体服从正态分布,大小样本均值抽样分布都服从正态分布。

◆样本统计量是随机变量,取值随抽取样本不同而不同。

◆对于正态分布总体,即使方差未知,也可用正态分布计算总体均值估计区间。

◆样本方差是总体方差无偏估计量。

◆某药品广告:总有效率90%边际误差为3%,隐瞒了置信度和样本量。

◆假设检验中=放在原假设上。假设检验中计算出的P越小,不利于原假设证据越强。假设检验中样本容量不变,ⅠⅡ类错误概率不能同时减小。

◆常希望将方差或标准差控制在某水平之下,因此对方差检验多是单侧。

◇方差分析:检验多个总体均值是否相等,研究分类型自变量对数值型因变量影响。假定:总体服从正态分布;各总体方差相等;观测值独立。数据误差用平方和表示,组间平方和反映各样本均值间误差大小。因素水平个数k全部观测值个数n,组内平方和自由度n-k。检验的统计量:F统计量。

◇单因素方差分析:一个分类型自变量。

◆xy相关系数0.8,回归直线判定系数0.64。

◆回归模型构造评价后,可以以给定自变量值估计因变量值。

◆多元与一元线性回归模型区别:多元不止一个自变量。

◆两变量线性相关系数0,两变量不存在线性关系。

◆身高y体重x是相关关系。

◆相关分析要求2变量都是随机变量。

◆两变量相关系数相同,两变量高度正相关。两变量线性相关系数-1,完全负相关。

◆判定系数r方:回归平方和占总平方和的比例。评价回归直线方程拟合优度。

◆回归分析F检验线性关系的显著性。

◆多元线性回归分析:t检验各回归系数显著性;计算修正多重判定系数,避免值由于模型自变量个数增加而接近1 ;F检验线性关系显著,则在多个自变量中至少有一个与因变量线性关系显著。

◆移动平均法:通过对时间序列逐期递移求得平均数作为预测值的预测方法。

◆指数平滑法得的t+1期预测值=t期实际观察值与第t-1期指数平滑值加权平均值。

◆数学模型法:对含有长期趋势成分时间序列进行预测。

线性模型法:现象随时间推移呈现增长量相对稳定增长。

移动平均模型:时间序列逐期观测值按一定增长率增长或衰减。

◆指数:广义:动态的各种相对数。统计实践和理论:狭义指数概念,用于测定多个事物在不同场合下综合变动的特殊相对数。总量指数=各因素指数之积。销售量指数:数量指数;单位产品成本指数:质量指数。

消费价格指数:反映城乡居民购买生活消费品和服务项目价格变动趋势和程度。

◆p商品价q 销售量,Σq1p0/Σq0p0实际意义是反映商品价格变动对销售额影响程度。

◆商品价格提高10%销售量下降10%商品的销售额下降。

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

统计学期末复习-公式汇总

统计报表 专门调查 普查 抽样调查 典型调查 重点调查 按调查的组织方式不同分为 按调查时间是否连续分为 按调查单位的范围大小分为 全面调查 非 全面调查 一次性调查 经 常性调查 统计学复习 第一章 1.“统计”的三个涵义:统计工作、统计资料、统计学 2.三者之间的关系:统计工作和统计资料是工作与工作成果的关系; 统计资料和统计学是实践与理论的关系 3.统计学的特点:数量性,总体性,具体性,社会性(广泛性) 4.统计工作的过程一般分为统计调查、统计整理和统计分析三个阶段 5.总体与总体单位的区分:统计总体是客观存在的,在同一性质基础上结合起来的许多个别单位的整体,构成总体的这些个别单位称为总体单位。(总体或总体单位的区分不是固定的:同一个研究对象,在一种情况下是总体,在另一种情况下可能成了总体单位。) 6.标志:总体单位所具有的属性或特征。 A 品质标志—说明总体单位质的特征,不能用数值来表示。如:性别、职业、血型色彩 B 数量标志—标志总体单位量的特征,可以用数值来表示。如:年龄、工资额、身高 指标:反映社会经济现象总体数量特征的概念及其数值。 指标名称体现事物质的规定性,指标数值体现事物量的规定性 第二章 1.统计调查种类 2.统计调查方案包括六项基本内容: 1)确定调查目的;(为什么调查) 2)确定调查对象与调查单位;(向谁调查) 调查对象——社会现象的总体 调查单位——调查标志的承担者(总体单位) 填报单位——报告调查内容,提交统计资料 3)确定调查项目、拟定调查表格;(调查什么) 4)确定调查时间和调查期限 5)制定调查的组织实施计划; 6)选择调查方法。

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

统计学期末复习

第一章 1.应用统计设计是应用统计调查潜的的准备工作。(对) 2.应用统计应该遵守的原则有(ABCD ) A 真实性B准确性C时效性D经济性E实践性 3.调查对象——符合调查目的的、若干具有相同性质的调查单位组成的集合。 4.调查单位——统计调查登记的项目和标志资料的承担者 5.填报单位——负责向调查机关报送调查资料的单位。 6.调查单位与填报单位可以是同一单位,也可以是不同单位。(对) 7.应用统计调查的要求(ABCD)A 准确性B及时性C 系统性D 全面性E条件性 8.非抽样调查包括(ABCD) A普查B重点调查C 典型调查 D 固定样本调查 E 分类调查 9.典型调查和重点调查是属于抽样调查(错) 10.典型调查和重点调查的结果可以用于推断总体(错) 11.调查时间包括两层意思,一是调查工作进行的时间,二是调查的事件所发生的时间。 12.总体——统计对象的全体 13.总体单位——组成总体的个体 14.样本——在总体中被抽取的部分总体单位 15.样本单位——组成样本的个体 16.样本框——可以选择作为样本的总体单位列出的名册或排序编号。 17.样本容量——样本所包含的样本单位数。 18.抽样比——样本单位数与总体单位数之比 19.样本框可能与总体一致,也可能与总体不一致。(对) 20抽样调查和非抽样调查都是在总体中抽取一部分来进行调查。(错) 21.非随机抽样调查选择调查样本调查者带有(A ). A较强的主观性B 较强的客观性 C 较强的灵活性D自由性 22.非抽样调查适用于(A) A 探索性研究B前沿性研究 C 事后研究 D 事前研究 23.非随机抽样调查(C) A、可以确定抽样误差 B 可以用数理方法估计误差 C 无法确定抽样误差D 能定量地推断总体 24.任意抽样是(B)A随机抽样B非随机抽样 C 典型抽样D 全面抽样 25.判断抽样是(C)A随机抽样B典型抽样C非随机抽样D 全面抽样 26.配额抽样与分层抽样() A 相同 B 都是随机抽样 C 是不同的抽样 D 是不同的类型 27.随机抽样调查的结果() A可以用于推断总体 B 不可用于推断总体 C 可随意确定样本D 不可随意确定样本 28.随机抽样对总体中每个单位被抽取的概率(A)A相等B不相等 C 较大 D 较小 29.纯随机抽样与任意抽样(B )A相同B不同C 整体抽样D 部分抽样 30.分层抽样层与层之间的差异(A)A大B小 C 不定 D 平均 31.分层抽样层的内部差异(B )A 大B小 C 不定 D 平均 32.整群抽样,群与群之间的差异(B)A 大B小 C 不定 D 平均 33.整群抽样,群的内部差异(A)A大B小 C 不定 D 平均 34.多阶段抽样就是分层抽样(错) 35.登记性误差和系统性误差是(A )

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

《统计学原理》期末复习资料(1)

2015秋季学期《统计学原理》复习资料 一、单选题 1. 某厂4月份产量与1月份产量相比增长了10%,若已知4月份产量为1000,那么1月份的产量为(A )。 A.909.09 B.976.45 C.968.73 D.1032.28 2.以下各项属于品质标志的有(B )。 A.工龄 B.健康状况 C.工资水平 D.劳动时间利用率 3.连续变量( C)。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.了解某公司职工文化程度情况,总体单位是( B)。 A.该公司全体职工 B.该公司每一位职工 C.该公司全体职工文化程度 D.该公司每一位职工文化程度 5.在某市工业设备普查中,调查单位是(D )。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商 场、超市随机调查了200 名顾客。该公司采用的调查方法是(C )。 A. 直接观察法 B. 报告法 C. 访问调查法 D.很难判断 7.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调 查组织方式是( D)。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 8. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。 A. 组距

C. 组限 D. 组中值 9.统计分组的核心问题是(A )。 A.选择分组的标志 B.划分各组界限 C.区分事物的性质 D.对分组资料再分组 10. 在分组的情况下,总体平均指标数值的大小(C )。 A. 只受各组变量值水平的影响,与各组单位数无关 B. 只受各组单位数的影响,与各组变量值水平无关 C. 既受各组变量值水平的影响,又与各组次数有关 D. 既不受各组变量值水平的影响,也部受各组次数的影响 11. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 12. 标志变异指标反映了总体各单位变量值分布的(B )。 A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 13. 抽样误差( D)。 A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 14. 抽样平均误差反映了样本估计量与总体参数之间的(C )。 A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 15.凡是用来反映现象数量对比关系的相对数被称为( C)。 A. 增(减)量 B. 增加速度 C. 广义指数 D. 狭义指数 16.用来反映个别事物数量对比的相对数称为( C)。 A. 总指数 B. 类指数 C. 个体指数 D. 平均指数 17.在综合指数的变形中,加权算术平均指数所用权数是(D )。

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

统计学期末复习重点

统计总体:统计总体是根据一定目的确定的所要研究事物的全体,它是客观存在,并在某一相同性质基础上结合起来的由许多个别事物组成的整体,简称总体。 样本:是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。 算术平均数:算术平均数是统计中最基本、最常用的一种平均数,它的基本计算形式是用总体的单位总数去除总体的标志总量。 调和平均数:是根据变量值的倒数计算的,是变量值倒数的算术平均数的倒数,也叫倒数平均数。 简单分组:是指对所研究的总体按一个标志进行分组。 复合分组:复合分组是指对所研究的总体按两个或两个以上的标志进行的多层次分组。 结构相对指标:结构相对指标是表明总体内部的各个组成部分在总体中所占比重的相对指标,也叫比重指标。 强度相对指标:是指两个性质不同,但有一定联系的总量指标数值之比。 类型抽样:又称分类抽样或分层抽样,它是先将总体按某个主要标志进行分组(或分类),再按随机原则从各组(类)中抽取样本单位的一种抽样方式。 机械抽样:它是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。 综合指数:凡是一个总量指标可以分解为两个或两个以上的因素指标时,为观察某个因素指标的变动情况,将其他因素指标固定下来计算出的指数称为综合指数。 平均指数:平均指数法是以个体指数为基础来计算总指数,根据选用的权数不同,平均指数法可以进一步分为加权算术平均法,加权调和平均法,固定权数加权平均法。 相关关系:是指现象之间客观存在的,在数量变化上受随机因素的影响,非确定性的相互依存关系。 回归分析:现象之间的相关关系,虽然不是严格的函数关系,但现象之间的一般关系值,可以通过函数关系的近似表达式来反映,这种表达式根据相关现象的实际对应资料,运用数学的方法来建立,这类数学方法称为回归分析。 统计调查:就是根据统计研究的目的、要求和任务,运用各种科学的调查方法,有计划、有组织的搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的调查资料的活动过程。 统计指数:广义指数泛指社会经济现象数量变动的比较指标,及用来表明同类现象在不同空间、不同时间,实际与计划对比变动情况的相对数。狭义指数仅指反应不能直接想家的复杂社会经济现象在数量上综合变动情况的相对数。 简单随机抽样:简单随机抽样也叫纯随机抽样,它对总体单位不做任何分类排队,而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。 季节分析的含义:是指某些现象由于自然因素和社会条件的影响在一年之内比较有规律的变动。 总量指标:是指反映一定时间、地点和条件下某种现象总体规模或水平的统计指标。 相对指标:是指说明现象之间数量对比关系的指标,用两个或两个以上有联系的指标数值对比来求得,其结果表现为相对数,故也将相对指标称为相对数。 平均指标:是同类社会经济现象总体内,各单位某一数量标志在一定时间、地点和条件下,数量差异抽象化的代表性水平指标,其数值表现为平均数。 1计算运用总量指标的原则。 (1)在计算实物指标时,应注意现象的同类性 (2)统计总量指标时要有明确的统计含义和合理的统计方法

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

统计学期末复习重点知识

P11 1.3统计数据可以分为哪几种类型?不同类型的数据各有什么特点? 答:①按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。 分类数据和顺序数据说明的是事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此统称定性数据或品质数据。数值型数据说明的是现象的数量特征,通常是用数值来表现,因此也可称为定量数据或数量数据。 ②按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。 观测数据是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。实验数据则是在实验室中控制对象而收集到的数据。 ③按照被描述的现象与时间的关系,可以将统计数据分为截面数据和时间序列数据。 截面数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。时间序列数据是按时间顺序收集到的,用于描述现象随时间变化的情况。 1.5举例说明总体,样本、参数,统计量变量这几个概念 总体是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。样本是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量是说明现象某种特征的概念。比如商品的销售额是不确定的,这销售额就是变量。 P40 2.2比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样?什么情况下适合非概率抽样? 答:概率抽样的特点: ①抽样时是按一定的概率以随机原则抽取样本。 ②每个单位被抽中的概率是已知的,或是可以计算出来的。 ③当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率。 非概率抽样的特点: 操作简便,时效快,成本低,而且对于抽样中的统计学专业技术要求不高。 非概率抽样适合探索性的研究,调查的结果用于发现问题,为更深入的数量分析提供准备。同时也适合市场调查中的概念测试,如产品包装测试、广告测试等。 概率抽样适合调查的目标是用样本的调查结果对总体相应的参数进行估计,并计算估计的误差,得到总体参数的置信区间。 P109

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

统计学原理期末复习重点

。 统计学原理例题分析 一、判断题(把“√”或“×”填在题后的括号里) 1. 社会经济统计的研究对象是社会经济现象总体的各个方面。() 参考答案:× 2. 总体单位是标志的承担者,标志是依附于单位的。() 参考答案:√ 3. 标志通常分为品质标志和数量标志两种。() 参考答案:√ 4. 当对品质标志的标志表现所对应的单位进行总计时就形成统计指标。() 参考答案:√ 5. 调查方案的首要问题是确定调查对象。() 参考答案:√ 6. 我国目前基本的统计调查方法是统计报表、抽样调查和普查。() 参考答案:√ 7. 调查单位和填报单位在任何情况下都不可能一致。() 参考答案:× 8. 按数量标志分组,各组的变量值能准确的反映社会经济现象性质上的差别。() 参考答案:× 9. 在确定组限时,最大组的上限应低于最大变量值。() 参考答案:× 10. 按数量标志分组的目的,就是要区别各组在数量上的差别。() 参考答案:× 11. 离散型变量可以作单项式分组或组距式分组,而连续型变量只能作组距式分组。() 参考答案:√ 12. 对于任何两个性质相同的变量数列,比较其平均数的代表性,都可以采用标准差指标。()

参考答案:× 13. 样本成数是指在样本中具有被研究标志表现的单位数占全部样本单位数的比重。() 参考答案:√ 14. 样本容量指从一个总体中可能抽取的样本个数。() 参考答案:× 15. 在抽样推断中,作为推断对象的总体和作为观察对象的样本都是确定、唯一的。() 参考答案:× 16. 产量增加,则单位产品成本降低,这种现象属于函数关系。() 参考答案:× 17. 在直线回归方程Y=a +bx中,b值可以是正的,也可以是负的。() 参考答案:√ 18. 回归系数b和相关系数γ都可用来判断现象之间相关的密切程度。() 参考答案:× 19. 平均指标指数是综合指数的一种变形。() 参考答案:× 20. 序时平均数与一般平均数完全相同,因为它们都是将各个变量值的差异抽象化了。() 参考答案:× 二、单项选择题(从下列每小题的四个选项中,选出一个正确的,请将正确答案的序号填在括号内) 1.以产品的等级来衡量某种产品的质量好坏,则该产品等级是()。 A.数量标志B.品质标志 C.数量指标D.质量指标。 参考答案:B 2.某地区有15家生产同种产品的工厂,要研究它们的产品生产情况,总体单位是()。 A.每一个工厂B.每一件产品 C.所有15家工厂D.每个工厂的产品 参考答案:B

卫生统计学重点整理资料东大

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本 均数?x 、样本率ρ等。 ⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变 量;变量值的集合成为资料。 ⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料;②等级资料第二章调查研究设计

★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数 字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一 顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若 干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 ⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组 成,随机抽取一部分群,调查抽中群的全部次级观察单位。 第三章实验设计 ★1、实验设计的特点(注意与调查研究的特点的区别): ⑴研究者可人为设置处理因素; ⑵受试对象接受何种处理因素或处理因素的何种水平是随机的。 ★2、实验设计的三要素、四原则: ⑴基本要素:①处理因素②受试对象③实验效应 ⑵基本原则:①对照原则②随机原则③重复原则④均衡原则 4、实验设计的基本步骤: ⑴明确实验目的;⑵确定研究对象;⑶确定可比的实验组和对照组; ⑷确定把受试对象分配到各处理组中的原则;⑸确定样本含量; ⑹确定方法和指标;⑺偏倚及其控制 5、常用的实验设计方案:主要掌握完全随机设计和配对设计。 第四章定量资料的统计描述 ★1、频数表的编制:①求极差②确定组数和组距(一般8~15组)

相关文档
相关文档 最新文档