文档库 最新最全的文档下载
当前位置:文档库 › 随机序列的统计检验之卡方检验

随机序列的统计检验之卡方检验

随机序列的统计检验之卡方检验
随机序列的统计检验之卡方检验

随机数序列的统计检验之χ2检验

论文摘要:

本文主要介绍了随机数序列的一种统计检验方法——卡方检验(2χ检验)。文章对随机数的定义以及随机数序列的分类进行了说明介绍,并介绍了两种应用最为广泛的2χ拟合优度检验法。进一步地介绍了2χ检验在农业及医学方面的应用,并客观评价了2χ检验方法的优劣性。

引言 关于随机数的研究,从很早以前就有。以前对于随机数的产生基本都是一些比较古老的方法,例如古人喝酒时玩的掷骰子的游戏,其实就是一个产生随机数的过程。直到现在,仍然有很多统计学者,在前人的基础上发展创新,致力于随机数的产生及检验的研究。在当下,随机数的应用范围更为广泛,不仅是类似于古人掷骰子的购买彩票的研究,更是广泛地应用到医学、农业等各个领域。并且随着计算机的应用与发展,计算机模拟的技术也逐步被深入研究和广泛应用。利用计算机来产生随机数已经成为一个新的课题。相比于之前,计算机产生的随机数在均匀性和随机性方面都更好,且模拟处理的问题更为广泛。随着随机数应用范围的扩大,对于随机数的均匀性、独立性、随机性等的检验也不可或缺,只有通过了检验的随机数才能有更广大的利用空间。本文介绍的就是随机数序列统

计检验的其中一种方法——2

χ检验。

(一) 随机序列的定义及分类

在介绍随机数序列的2χ检验之前,在这里先介绍一下随机数序列的定义和

分类[2]。

在连续型随机变量的分布中,最简单而且最基本的分布是单位均匀分布。由该分布抽取的简单子样称随机数序列,其中每一个体称为随机数。其分布密度函数为:

1,01()0,x f x ≤≤?=?

?其他

分布函数为 :

随机数列可以分为三种不同的类型:真随机数列,准随机数列,伪随机数列。 真随机数数列是不可预计的,所以不可能重复产生两个相同的真随机数数列。真随机数只能用某些随机物理过程来产生,如放射性衰变等。

准随机数序列并不具有随机性质,仅仅是它用来处理问题时能够得到正确结果。准随机数的概念是来自如下的事实:对伪随机数来说,要实现其严格数学意义上的随机性,在理论上是不可能的,在实际应用中也没有这个必要。关键是要保证“随机”数数列具有能产生出所需要的结果的必要特性。

伪随机数序列是我们通常在实际应用的,是通过某些数学公式计算而产生的。这样的伪随机数从数学意义上讲已经一点不是随机的了。但是,只要伪随机数能够通过随机数的一系列的统计检验,我们就可以把它当作真随机数而放心地使用。这样我们就可以很经济地、重复地产生出随机数。

(二)χ2拟合优度检验法

χ2检验的方法中,最简单也用得最为广泛的是χ2拟合优度检验法[1]。该方

法可分为两种类型进行讨论:

1.多项分布的χ2检验

设总体X 是仅取k 个可能值的离散型随机变量,设X 的可能值为1,2,…,k ,

且1(),1,2,...,,1

i k

i i P X i p i k p =====∑。又设

12(,,...)

n X X X 是从总体X 抽得的简单

随机样本;NI 表示样本观察值中取值为i 的个数,即样本中出现事件()X i =的频数。

定理

1 当

000:,1,2,...,()

i i i H p p i k p ==已知成立时,按

2

2

1

=()k

i i i i np χ=÷∑(N -np )规定的检验统计量2

2(1),L

k n χχ??

→-→∞。 则由定理1知,对给定的检验水平α,可以取临界值2(1)k αχ-,当

0,

0(),01

1,1x F x x x x ?

2

2

21

=()(1)k

i i i i np k αχχ=÷>-∑(N -np )时拒绝H 0。 2.分布中含有未知参数的χ2检验

在实际问题中,更常见的一类问题是要检验总体分布是否具有确定的类型,即检验假设

001,21,2:()(;,...,),,...,m m H F x F x θθθθθθ=∈Θ

其中函数0F 的形式已知,参数空间Θ也已知。 把

k 个互不相交的区间

11212112(,],(,],...,(,),,,...,k k k A a A a a A a a a a -=-∞==+∞是视具体情况选取的1k -个

实数,且记

01011?????(;,...,)(;,...,)i i m i m p F a F a θθθθ-=-,2,3,...,1i k =- 用i N 表示样本1,2,,...,n X X X 中落在i A 内的个数。

定理2 若假设0H 成立,则按式2

2

1???()k

i i i i np

χ==÷∑(N -np )给出的检验统计量22

?(1)L n n k m χχ→∞

???→--。 则按定理2知对给定的检验水平α,取临界值2(1)k m αχ--,当2?χ

≥2(1)k m αχ--时拒绝假设0H ,反之接受假设0H 。

这里需要注意的是χ

2

拟合优度检验法是在n 充分大时推导出来的,所以在

使用是必须注意n 要足够的大,以及i np 不太小这两个条件。我们一般的要求是n 不小于50,并且每个i np 都不小于5(最好是大于10)。

对于随机数的χ2

检验,只用把{}1d

i c

p p c x d dx =<<=?带入公式即可。

(三)卡方检验的应用及评价

关于随机数序列代表的实际意义,使用卡方检验的方法,在实际生活中有相当广泛的应用,这里介绍的,是使用EXCEL 软件建立卡方检验的一些应用,包括在农业统计[3]和临床数据分析[4]等方面。而Microsoft Excel 软件具有易学、易用、易懂的特性,并且还提供了很多基本和经典的统计分析方法。可通过添加“分

析工具库”后利用“工具”菜单的“数据分析”功能来实现,但没有提供现成的卡方检验。在农业统计的遗传学分析中,常用2χ来检验所得实际结果是否与孟德尔遗传的分离比例相符,如检测其与某种理论比例的适合性,其2χ值可以直接用如下简式求出,见表1。

表1 检验两组资料与某种理论比例符合度的2χ值公式

1:1 2

((||)1)/

A a n

--

2:1 2

((|2|) 1.5)/2

A a n

--

3:1 2

((|3|)2)/3

A a n

--

15:1 2

((|15|)8)/15

A a n

--

9:7 2

((|79|)8)/63

A a n

--

13:3 2

((|313|)8)/63

A a n

--

r:1 2

[(||)(1)/2]/

A ra r rn

--+

在农业统计中,2χ检验还可用于独立性检验。例如研究小麦种子灭菌和麦穗发病两个变数之间是否独立。若相互独立,表示种子灭菌和发病高低无关,灭菌处理对发病无影响;若不相互独立,则表示种子灭菌和发病高低有关,灭菌处理对发病有影响。这主要是采用R C

?表进行独立性检验计算。常用的有2x2表、2x3表和3x3表等,在这里就不做介绍了。

而2χ检验在临床数据分析方面,只需在四格表内填入数字即可,操作方便

快捷,可直接给出

2

χ检验的统计量和P值。

虽然随机序列的卡方检验具有很广泛的应用,但是其依然具有片面性[5]。那是因为现有随机性检测规范没有系统地讨论统计检验和随机本质的联系, 也没有严格论证样本量和结论可信度的联系,使其可操作性不强,难以指导实际的安理论比例(显性:隐形)2χ公式

全性评估工作,甚至有可能误导实际的测试工作。所以我们还有待对卡方检验进行改进[6]。

在随机数的卡方检验的广泛应用上,可以看出来数理统计知识内容在生活和生产中都有着极其广泛而重要的应用。而关于卡方检验,其实关于它的所有知识内容都是起步于对卡方分布的定义。所以说,数学知识的内容都可以由浅入深逐步扩展,有待我们所有的学者去探索和发展,不要止步于前人的经验和理论,探索无极限。

参考文献

[1]朱燕堂,赵选民,徐伟.概率论与数理统计.西安:西北工业大学出版社,1997.8:140-142

[2]张咏.随机数发生器和随机数检验性能研究.电子科技大学,2006.1:11-15

[3]谭永强,余华强,陈桥生,刘莹.利用EXCEL软件建立卡方检验分析模版在农业统计

中的作用.湖北农业科学,49卷12期,2010.12:

[4]冯松,郑斌.利用EXCEL进行卡方检验为临床数据分析提供支持,2011.9

[5]石竑松,张翀斌,杨永生,高金萍.随机性检测及其片面性.清华大学学报(自然科

学版),51卷10期,2011

[6]DAI Jia Jia,YANG Ai JunA.Modified Chi-Squared Goodness-of-Fit Test.College of Appilied

Sciences,Vol.29,No.1,2009.1

SPSS170在生物统计学中的应用实验七卡方检验汇总

SPSS在生物统计学中的应用 ——实验指导手册 实验七:卡方检验 一、实验目标与要求 1.帮助学生深入了解卡方检验的基本概念,掌握卡方检验的基本思想和原理 2.掌握卡方检验的过程。 二、实验原理 卡方检验适用于次数分布的检验,比如次数分布是否与某种理想的分布一致,或者不同样本同类测量分数次数分布是否一致。对于前者,先要确定一个理想的次数分布比例,然后将观测的某一次数分布与其比较,确定二者的差异性,并用X2来反映。X2 越小,则差异越小,该样本的观测分布越有可能适合于理想分布;X2 越大,则差异越大,其服从于理想分布的可能性就越小。当服从理想分布的伴随概率小于0.05时,就认为该次数分布与理想的分布有显著性差异。 不同样本中测量分数的次数分布使用卡方检验时,如果卡方足够大,该观测在两个样本中的次数分布服从于同一总体的概率小于0.05时,则认为样本间存在显著性差异。 三、实验演示内容与步骤 ㈠适合性检验 比较观测数与理论数是否符合的假设检验(compatibility test),也称吻合性检验或拟合优度检验(goodness of fit test).。 【例】有一鲤鱼遗传试验,以红色和青灰色杂交,其F2代获得不同分离尾数,问观测值是否符合孟德尔3:1遗传定律. 1. 定义变量:

2. 输入变量值 3. 选择菜单1:点击菜单【数据】→【加权个案】→弹出“加权个案”对话框 → 4. 选择菜单2:点击菜单【分析】→【非参数检验】→【卡方】→弹出“卡方检验”对话框

点击【选项】按钮,弹出“卡方检验:选项”对话框,选择“描述性”,点击【继续】 点击【确定】在输出结果视图中看分析结果

常用统计方法:T检验、F检验、卡方检验

常用统计方法:T检验、F检验、卡方检验 介绍常用的几种统计分析方法:T检验、F检验、卡方检验 一、T检验 (一)什么是T检验 T检验是一种适合小样本的统计分析方法,通过比较不同数据的均值,研究两组数据是否存在差异。主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。 (二)T检验有什么用 1.单样本T检验用于比较一组数据与一个特定数值之间的差异情况。 样例:难产儿出生数n = 35,体重均值 = 3.42,S = 0.40,一般婴儿出生体重μ0= 3.30(大规模调查获得),问相同否? 求解代码:from scipy import statsstats.ttest_1samp(data,sample) 检验一列数据的均值与sample的差异是否显著。(双侧检验) 若为单侧检验,则将p值除以2

2.配对样本的T检验(ABtest)用于检验有一定对应关系的样本之间的差异情况,需要两组样本数相等。常见的使用场景有: ①同一对象处理前后的对比(同一组人员采用同一种减肥方法前后的效果对比); ②同一对象采用两种方法检验的结果的对比(同一组人员分别服用两种减肥药后的效果对比); ③配对的两个对象分别接受两种处理后的结果对比(两组人员,按照体重进行配对,服用不同的减肥药,对比服药后的两组人员的体重)。 AB测试时互联网运营为了提升用户体验从而获得用户增长而采用的精细化运营手段,简单的说就是分为A版本和B版本哪个更能吸引用户使用。 目的:检验两个独立样本的平均值之差是否等于目标值样例:比较键盘A版本和B版本哪个更好用,衡量标准:谁在规定时间内打错字少,或者两者差异不大 求解代码:ttest_rel(data1,data2) (得出的p值是双侧检验的p值) 3.独立样本的T检验(要求总体方差齐性) 独立样本与配对样本的不同之处在于独立样本T检验两

生物统计学

平均数:average中位数:median众数:mode几何平均数:geomean 极差:R=max-min方差:var标准差:stder 绘制频数分布图: 1)找最大值,最小值,计算极差 2)决定划分的组数L 3)据极差与组数,确定组距i 4)确定组中值(样本最小值+1/2组距) 5)确定接受区域(第一个接受区域=第一个组中值+1/2组距) 6)调用函数FREQUENCY。频数=frequency(A2:A129观测值,H2:H11接受区域) 7)ctrl+shift+Enter得到结果 茎叶图: Minitab:图形→茎叶图 SPSS:导入数据→分析→描述统计→探索→将“XX”选入因变量列表→绘制→茎叶图 分析(结果中,第一个频数是5,茎是2,叶是01234,表明20~24范围内的观测值有5个,分别为20,21,22,23,24;……) 描述性统计: Excel:工具→加载宏→分析工具库→工具→数据分析→描述统计→标志位于第一行→输出 Minitab:输入数据→统计→基本统计量→显示描述性统计→添加变量→输出 SPSS:选中数据鼠标右键→基本参数→正态性检验或者数据分析→基本参数估计DPS:分析→描述统计→描述→添加变量→输出 数据中异常值分析: DPS:复制,选中数据→数据分析→异常值检验(3S法,Dixon检验法,Grubbs检验法)Excel:6SQ统计→基本统计→正态异常检验 箱线图 SPSS:图形→旧对话框→箱图→“简单”“各个变量的摘要”→定义:添加框的表征→确定:输出结果 Minitab:统计→基本统计量→显示描述性统计→选择图形→勾选“数据箱线图→确定”DPS:数据分析→统计图表→box图→保存图形 概率图法 Minitab:图形→概率图→“单一”→确定→“概率图-简单”→添加“图形变量”→确定,输出结果 第三章概率分布: 二项分布:BINOMDIST(i,n,p,0或1) (事件发生次数,总次数,发生的概率,0或1) eg.某批鸡蛋的孵化率是0.90,今从该批鸡蛋中任选5个进行孵化,试求(1)孵出3只小鸡的概率(2)至多孵出3只小鸡的概率(3)至少孵出3只小鸡的概率。 ①BINOMDIST(3,5,0.9,0)②BINOMDIST(3,5,0.9,1) ③1-BINOMDIST(3,5,0.9,1) 泊松分布:poisson(k,λ,0或1) (事件发生次数,平均数,0或1)描述和分析在单位空间和时间里随机发生的事件eg.某城市平均每天发生交通事故2.5起。试求在一天内发生5起交通事故的概率。poisson(5,2.5,0) Eg.某杂交水稻瓶中在田间出现变异植株的概率为0.0045,试计算:①调查100株,至少获得两株变异植株的概率是多少?②期望有0.99的概率至少获得3株变异植株,至少应该调查多少株? ①P(x≥2)=1-P(x≤1)=1-BINOMDIST(1,100,0.0045,1) ②P(x≥3)=1-P(x≤2)=1-BINOMDIST(2,n,0.0045,1)=0.99BINOMDIST→(2,n,0.0045,1)

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卡方检验法

第八章记数数据统计法—卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数 (f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布, 可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况:

卡方检验模型验证方法

卡方检验模型验证方法模型参数的验证方法主要使用卡方拟合度检验( Chi-square Goodness-of-fit Test )结合最大似然 估计( Maximum Likelihood Estimation ),并且使用QQ图(Quantile-Quantile Plot)证明验证结果。 具体的说,就是先假定采集的样本数据符合某一分布,通过最大似然估计方法估计出该分布的参数,然后代入并用卡方检验计算相对于该分布的偏差。实践中我们对于一组样本数据,计算所有常见分布的偏差值,选取偏差最小的分布做为该样本的拟合结果。另外,从QQ图直观上看,该分布做为拟合结果描绘出的曲线 必须近似为接近参考线的直线(见3.3),否则我们就将数据拆分为多个部分进行分段的拟合(如对终端请求包大小的拟合)。 1.1 卡方拟合度检验卡方检验是一种大样本假设检验法,用于检验随机事件中提出的样本数据是否符合某一给定分布。 它需要较 大量的样本数据及已知的待检验概率分布函数。 1.1.1 卡方检验原理对于一个服从二项分布的随机变量Y服从Binomial( n, p) ,均值为,方差 。 由中心极限定理,符合标准正态分布N (0, 1),所以服从自由度为1的卡方分布。 设服从Binomial( n, p1 ), , , 则 有 所以 同理对于k个随机变量,均值分别为 , 在数据拟合时,先对数据分组,每组数据的实际个数即为随机变量

,,,则数据拟合即为判断 是否符合分布, 该卡方分布的自由度为k-1-nep(k为随机变量个数,nep为估计参数的个数)。 1.1.2 卡方检验步骤:假定样本服从某一给定分布。根据样本数据用最大似然法估计分布的密度函数参数。设定置信度,对n个样本数据排序。 把排序后的数据分成k组,确定每组的上下限,(上下限确定方法不同对验证能力有影响, 每组数据不少于5个),为了方便起见,本项目中采用平均划分分组间隔,即使为常数, 对于所有的成立。 计算每组数据实际个数,第i组实际个数为。 计算每组数据期望个数,第i组期望个数为: 连续:,其中F(x)为待验证的概率分布函数, 离散:。 计算。 理论上说如果,则数据符合分布函数为F(x)的分布, 其中,nep为估计的参数的个数。但是由于实际采集的数据并非完全地符合某一分布, 总存在一定的偏差,计算出的值并不满足这个条件, 所以我们使用的拟合标准为采用卡方估计值最小的分布作为验证结果。

卡方检验法

记数数据统计法—卡方检验法 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。 第一节卡方拟合性检验 一、卡方检验的一般问题 卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。它由统计学家皮尔逊推导。理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。它主要应用于两种情况: 卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得多的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。

统计方法卡方检验

卡方统计量 卡方检验用途: 可以对两个率或构成比以及多个率或构成比间的差异做统计学检验 第一节. 四格表资料的χ2检验 例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别? 表8.1 两组人群尿棕色素阳性率比较 组别阳性数阴性数合计阳性率% 病人29(18.74) 7(17.26) 36 80.56 对照9(19.26)28(17.74) 37 24.32 合计38 35 73 52.05 卡方检验的基本思想 表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料 四格表卡方检验的步骤 以例8.1为例 1.建立假设: H0:π1 = π2 H1:π1≠π2 α=0.05 四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。 若H0:π1=π2成立→p1=p2=p 即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么 铅中毒病人36人,则理论上有 36 ╳52.05%=18.74人为阳性; 对照组37人,则理论上有 37 ╳52.05%=19.26人为阳性。 故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。 即TRC=nR nC / n 2.计算理论数 第1行1列: T11=36×38/73= 18.74 依次类推T12 = 17.26 T21 = 19.26 T22 = 17.74 四格表中理论数的两大特征: (1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同; (2)各个基本格子实际数与理论数的差别(绝对值)相同。 一、卡方检验基本公式

卫生统计学-卡方检验

卫生统计学之卡方检验 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。 3. 行?列表的2χ检验。 (二) 熟悉内容 频数分布拟合优度的2χ检验。 (三) 了解内容 1.2χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2χ检验的用途 2χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假 设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不 应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ-= ,π为总体率,或 (8-1) n p p S p ) 1(-= , p 为样本率; (8-2) 2.总体率的可信区间

19秋福师《生物统计学》在线作业一-0002参考答案

福师《生物统计学》在线作业一-0002 试卷总分:100 得分:100 一、单选题(共32 道试题,共64 分) 1.在比较一个未知参数是否大于另一个未知参数时,根据_____,如果p(X>x)<α,就认为x是抽不到的。 A.假设检验原理 B.小概率原理 C.中心极限定理 D.概率分布律 答案:D 2.以下不是χ2 检验的用途 A.推断两个或两个以上总体率之间有无差别 B.交叉分类资料两属性间有无相关关系 C.检验频数分布与理论分布的拟合优度 D.推断两个或两个以上总体构成比之间有无差别 E.推断两个或两个以上总体均数之间有无差别 答案:E 3.四个率的比较的卡方检验,P值小于0.01,则结论为 A.四个总体率均不相等 B.四个样本率均不相等; C.四个总体率之间肯定不等或不全相等 D.四个总体率之间不等或不全相等 答案:D 4.由于所选的特征在“药有效”时可能出现、在“药无效”时也可能出现,所以除了______外,所选择的特征都不能用于判断药(或药方、或治疗方法)是否有效。 A.有一名患者在服用某祖传秘方后“病好了”,所以该祖传秘方是有效的。 B.某气功大师发功后“有许多人长高了”,所以该气功是有效的。 C.服用某预防汤药后某班级“100%未感染非典”,所以该汤药是有效的。 D.服药患者的“痊愈高于未服药患者的痊愈率”,所以该药是有效的。 答案:D 5.张三观察到10名A病患者服用B药后有8名痊愈了。张三认为:这表明B药对A病的治愈率为80%。这里,张三所“观察到的治愈率”是B药对____A病患者的治愈率,它是____特征。 A.那10名,样本 B.所有,总体 C.所有,样本 D.那10名,总体 答案:D 6.为探讨不同窝动物的出生重是否相等,随机选a窝、每窝随机抽查n只,应进行_______效应模型的方差分析,所得出的结论_______________。 A.固定,可推广到未抽到的各窝 B.固定,仅适用于所抽到的各窝 C.随机,可推广到未抽到的各窝

卫生统计学第七章卡方检验 十

卫生统计学第七章卡方检验十 一、题型:A1 题号:1 本题分数:2 四格表资料两样本率比较的χ2检验,正确的一项为 A.χ2值为两样本率比较中u值 B.P<α前提下,χ2值越大,越有理由拒绝H0 C.χ2值大小与样本含量无关 D.每个格子的理论频数与实际频数的差值相等 E.χ2检验只能进行单侧检验 正确答案:B 答案解析:根据专业知识确定四格表资料两样本率比较的χ2检验采用单侧检验或是双侧检验,(也可使用四格表专用公式),可以证明四格表计算得出的χ2值与正态近似法两率比较中u值的平方相等,其大小与样本含量有关,且每个格子的理论频数与实际频数的差的绝对值相等,P<α前提下,自由度一定时,χ2值越大,P值越小,越有理由拒绝H0,故答案为B。 做答人数:0

做对人数:0 所占比例: 0 题号:2 本题分数:2 下列能用χ2检验的是 A.成组设计的两样本均数的比较 B.配对设计差值的比较 C.多个样本频率的比较 D.单个样本均数的比较 E.多个样本均数的比较 正确答案:C 答案解析:χ2检验可用于率或构成比比较的假设检验中,不适宜于均数的比较。 做答人数:0 做对人数:0 所占比例: 0 题号:3 本题分数:2 行×列表的自由度是 A.行数-1 B.列数-1

C.行数×列数 D.(行数-1)×(列数-1) E.样本含量-1 正确答案:D 答案解析:行×列表中,行的自由度=行数-1,列的自由度=列数-1,行×列二维表资料的χ2统计量所对应的自由度=(行数-1)×(列数-1)。做答人数:0 做对人数:0 所占比例: 0 题号:4 本题分数:2 四个百分率做比较,有一个理论数小于5,其他都大于5,则 A.只能做校正χ2检验 B.不能做χ2检验 C.直接采用行×列表χ2检验 D.必须先做合理的合并 E.只能做秩和检验 正确答案:C 答案解析:四个百分率做比较,资料可整理为4×2的行×列表,多个率比较的行×列表资料不适宜采用秩和检验,当满足行×列表资料

生物统计学习题(经修改)

《生物统计学》习题 一、单项选择题 1、为了区别,统计上规定凡是参数均用希腊字母表示,如总体平均数用符号( )。 A 、σ B 、x C 、μ D 、S 2、统计分组时,在全距一定的情况下,( )。 A 、组距越大,组数越多 B 、组距越大,组数越少 C 、组距大小与组数多少无关 D 、组距大小与组数多少成正比 3、某选手打靶10次,有7次命中十环,占70%,则此70%为( )。 A 、 概率 B 、 频率 C 、 必然事件 D 、 随机事件 4、受极端值影响最大的平均指标是( )。 A 、 算术平均数 B 、调和平均数 C 、 几何平均数 D 、中位数M e 5、在一定条件下可能出现也可能不出现的现象称为( )。 A、不可能事件, B、小概率事件。 C、必然事件。 D、随机事件。 6、任何事件(包括必然事件、不可能事件、随机事件)的概率都在( )。 A、-1与+1之间。B、0与1之间(包括0、1)。 C、-1与0之间。 D、+1与-1之间。 7、应用标准差表示样本的变异程度比用全距要好得多,?因它考虑了每个数据与( )。 A、中数的离差。 B、众数的离差。 C、平均数的离差。 D、中位数的离差。 8、正态分布密度曲线向左、向右无限延伸,以 ( )。 A、y 轴为渐近线。 B、y =a 轴为渐近线。 C、x =b 轴为渐近线。 D、x 轴为渐近线。 9、对于正态分布,标准差σ的大小决定了曲线的“胖”、“瘦”程度。若σ越小,曲线越“瘦”,变量越集中在 ( )。 A、原点0的周围取值。 B、平均数μ的周围 取值。 C、x 的周围取值。 D、y 的周围取值。 10、已知x ~N(μ,σ2 ),若对x 作下列之一种变换( ),则就服从标准正态分布。 A、a=(f+μ)/σ。 B、b=(μ-x)/σ。 C、t=(x-μ)/σ2 。 D、u=(x-μ)/σ。 11、若随机变量X 服从y 正态分布记为X ~N (25,4),其标准差为( ) A 、 25 B 、 4 C 、 不确定 D 、 2 12、平均数抽样误差的大小,用( )的大小来衡量。 A 、标准差S B 、标准差σ C 、方差σ2 D 、标准误x S A x H x G x

《卫生统计学》 案例版丁元林课后思考题答案

第一章:ECDBB 第二章:BDABC 第三章:DEBCD AEA 第四章:DCCDD DCBD 第五章:DCBDB AEEEC 第六章:CBEDC DDDDA 第七章:ACCBB DACEA 第八章:ABCDD BDADB 第九章:DDBCD AEA 第十章:BDCCE BDAEA 第十一章:CAEDC DBCCD 第十二章:BCAEE BA 第十三章:DDBCC BCDE 第十四章:无 第十五章:无 第十六章:无 第十七章:DBABC BDE 第十八章:无 第十九章:BDCDC CCADC 《卫生统计学》思考题参考答案 第一章绪论 1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的? 答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。 2、统计工作可分为那几个步骤? 答:设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。 答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。 第二章调查研究设计 1、调查研究有何特点? 答:(1)不能人为施加干预措施 (2)不能随机分组 (3)很难控制干扰因素 (4)一般不能下因果结论 2、四种常用的抽样方法各有什么特点? 答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。 (2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。 (3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。

生物统计学考试总结(第1至7章)

生物统计学考试总结 第一章 生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。 内容:试验设计:试验设计的基本原则、试验设计方案的制定和常用试验设计的方法 统计分析:数据资料的搜集、整理和特征数的计算、统计推断、方差分析、回归和相 关分析、协方差分析等 生物统计学的作用: 1. 提供整理、描述数据资料的科学方法并确定其特征 2. 判断试验结果的可靠性 3. 提供由样本推断总体的方法 4. 试验设计的原则 相关概念:1.总体:研究对象的全体,是具有相同性质的个体所组成的集合 2.个体:组成总体的基本单元 3.样本:由总体中抽出的若干个体所构成的集合 n >30 大样本; n <30 小样本 4.参数:描述总体特征的数量 5.统计数:描述样本特征的数量 由于总体一般很大,有时候甚至不可能取得,所以总体参数一般不可能计算出来,而采用样本统计数来估计总体的参数 6..效应:由因素而引起试验差异的作用 7. 互作:两个或两个以上处理因素间的相互作用产生的效应 生物统计学的研究包括了两个过程: 1. 从总体抽取样本的过程——抽样过程 2. 从样本的统计数到总体参数的过程——统计推断过程 第二章 1.算术平均数:是所有观察值的和除以观察的个数 平均数(A VERAGE ) 特性:(1)样本中各观测值与平均数之差-离均差-的总和等于零 (2)样本中各观测值与其平均数之差平方的总和,比各观测值与任一数值离均差的平 方和小,即离均差平方和最小 2.中位数 :将试验或调查资料中所有观测依从大小顺序排列,居于中间位置的观测值称为 以外的任何数值为设x a

统计方法卡方检验

卡方检验用途: 可以对两个率或构成比以及多个率或构成比间的差异做统计学检验 第一节. 四格表资料的χ2检验 例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人和对照人群的尿棕色素阳性率有无差别? 表8.1 两组人群尿棕色素阳性率比较 组别阳性数阴性数合计阳性率% 病人29(18.74) 7(17.26) 36 80.56 对照9(19.26)28(17.74) 37 24.32 合计38 35 73 52.05 卡方检验的基本思想 表1中29、7、9、28是构成四格表资料的四个基本格子的数字,其余行合计和列合计以及总的合计都可以根据该四个数字推算出来,故该类资料被称为四格表资料 四格表卡方检验的步骤 以例8.1为例 1.建立假设: H0:π1 = π2 H1:π1≠π2 α=0.05 四格表的四格子里的数字是实际数,在表1中四个数字旁边括号中的四个数字为理论数,其含义是当无效假设成立的时候,理论上两组人群各有多少阳性和阴性的人数。 若H0:π1=π2成立→p1=p2=p 即假设两组间阳性率无差别,阳性率都是等于合计的52.05%,那么 铅中毒病人36人,则理论上有 36 ╳52.05%=18.74人为阳性; 对照组37人,则理论上有 37 ╳52.05%=19.26人为阳性。 故每个实际数所对应的理论数算法是,该实际数对应的行和乘列和再除以总的N样本含量。 即TRC=nR nC / n 2.计算理论数 第1行1列: T11=36×38/73= 18.74 依次类推T12 = 17.26 T21 = 19.26 T22 = 17.74 四格表中理论数的两大特征: (1)理论频数表的构成相同,即不但各行构成比相同,而且各列构成比也相同; (2)各个基本格子实际数与理论数的差别(绝对值)相同。 一、卡方检验基本公式

记数数据统计法卡方检验法.

记数数据统计法卡方检验法 第八章记数数据统计法一卡方检验法 知识引入 在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、......... , 教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。 卡方检验是专用于解决计数数据统计分析的假设检验法。本章主要介绍卡方检验的两个应用:拟

合性检验和独立性检验。拟合性检验是用于分析实际次数与理论次数是否相同,适用于单个因素分类的计数数据。独立性检验用于分析各有多项分类的两个或两个以上的因素之间是否有关联或是否独立的问题。 在计数数据进行统计分析时要特别注意取样的代表性。我们知道,统计分析就是依据样本所提供的信息,正确推论总体的情况。在这一过程中,最根本的一环是确保样本的代表性及对实验的良好控制。在心理与教育研究中,所搜集到的有些数据属于定性资料,它们常常是通过调查、访问或问卷获得,除了少数实验可以事先计划外,大部分收集数据的过程是难于控制的。例如,某研究者关于某项教育措施的问卷调查,由于有一部分教师和学生对该项措施存有意见,或对问卷本身有偏见,根本就不填写问卷。这样该研究所能收回的问卷只能代表一部分观点,所以它是一个有偏样本,若据此对总体进行推论,就会产生一定的偏差,势必不能真实地反映出教师与学生对这项教育措施的意见。因此应用计数资料进行统计推断时,要特别小心谨慎,防止样本的偏倚性,只有具有代表性的样本才能作出正确的推论。

卫生统计学试题(含答案)

医学统计方法选择题一: 医学统计方法概述 l.统计中所说的总体是指:A A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小 D某事件发生的可能性很大 E以上均不对 3.抽签的方法属于 D A分层抽样 B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫:B A计数资料 B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数 8 23 6 3 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料 6.样本是总体的 C A有价值的部分 B有意义的部分 C有代表性的部分 D任意一部分 E典型部分 7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C A统计设计 B收集资料 C整理资料 D分析资料 E以上均不对 8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断 C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料 E搜集资料、整理资料、分析资料、进行推断 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B A抽样误差 B系统误差 C随机误差 D责任事故 E以上都不对

10.以下何者不是实验设计应遵循的原则 D A对照的原则 B随机原则 C重复原则 D交叉的原则 E以上都不对 第八章数值变量资料的统计描述 11.表示血清学滴度资料平均水平最常计算 B A算术均数 B几何均数 C中位数 D全距 E率 12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E CV 13.各观察值均加(或减)同一数后:B A均数不变,标准差改变 B均数改变,标准差不变 C两者均不变 D两者均改变 E以上均不对 14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时), 问该食物中毒的平均潜伏期为多少小时? C A 5 B 5.5 C 6 D lO E 12 15.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是:D A全距 B标准差 C方差 D变异系数 E极差 16.下列哪个公式可用于估计医学95%正常值范围 A A X±1.96S B X±1.96SX C μ±1.96SX D μ±t0.05,υSX E X±2.58S 17.标准差越大的意义,下列认识中错误的是 B A观察个体之间变异越大 B观察个体之间变异越小 C样本的抽样误差可能越大 D样本对总体的代表性可能越差 E以上均不对 18.正态分布是以 E A t值为中心的频数分布 B 参数为中心的频数分布 C 变量为中心的频数分布 D 观察例数为中心的频数分布 E均数为中心的频数分布 19.确定正常人的某项指标的正常范围时,调查对象是 B A从未患过病的人 B排除影响研究指标的疾病和因素的人 C只患过轻微疾病,但不影响被研究指标的人 D排除了患过某病或接触过某因素的人 E以上都不是 20.均数与标准差之间的关系是 E A标准差越大,均数代表性越大 B标准差越小,均数代表性越小 C均数越大,标准差越小 D均数越大,标准差越大 E标准差越小,均数代表性越大 第九章数值变量资料的统计推断 21.从一个总体中抽取样本,产生抽样误差的原因是 A

x2检验或卡方检验和校正卡方检验的计算

x2检验或卡方检验和校正卡方检验的计算 x2检验(chi-square test)或称卡方检验 x2检验(chi-square test)或称卡方检验,是一种用途较广的假设检验方法。可以分为成组比较(不配对资料)和个别比较(配对,或同一对象两种处理 的比较)两类。 一、四格表资料的x2检验 例20.7某医院分别用化学疗法和化疗结合放射治疗卵巢癌肿患者,结果如 表20-11,问两种疗法有无差别? 表20-11 两种疗法治疗卵巢癌的疗效比较 表内用虚线隔开的这四个数据是整个表中的基本资料,其余数据均由此推算出来;这四格资料表就专称四格表(fourfold table),或称2行2列表(2×2 contingency table)从该资料算出的两种疗法有效率分别为44.2%和77.3%,两者的差别可能是抽样误差所致,亦可能是两种治疗有效率(总体率)确有所不同。 这里可通过x2检验来区别其差异有无统计学意义,检验的基本公式为: 式中A为实际数,以上四格表的四个数据就是实际数。T为理论数,是根据检验假设推断出来的;即假设这两种卵巢癌治疗的有效率本无不同,差别仅是由抽样误差所致。这里可将两种疗法合计有效率作为理论上的有效率,即 53/87=60.9%,以此为依据便可推算出四格表中相应的四格的理论数。兹以表 20-11资料为例检验如下。 检验步骤: 1.建立检验假设: H0:π1=π2 H1:π1≠π2

α=0.05 2.计算理论数(TRC),计算公式为: TRC=nR.nc/n 公式(20.13) 式中TRC是表示第R行C列格子的理论数,nR为理论数同行的合计数,nC 为与理论数同列的合计数,n为总例数。 第1行1列:43×53/87=26.2 第1行2列:43×34/87=16.8 第2行1列:44×53/87=26.8 第2行2列:4×34/87=17.2 以推算结果,可与原四项实际数并列成表20-12: 表20-12 两种疗法治疗卵巢癌的疗效比较 因为上表每行和每列合计数都是固定的,所以只要用TRC式求得其中一项理论数(例如T1.1=26.2),则其余三项理论数都可用同行或同列合计数相减,直 接求出,示范如下: T1.1=26.2 T1.2=43-26.2=16.8 T2.1=53-26.2=26.8 T2.2=44-26.2=17.2 3.计算x2值按公式20.12代入 4.查x2值表求P值 在查表之前应知本题自由度。按x2检验的自由度v=(行数-1)(列数-1),则该题的自由度v=(2-1)(2-1)=1,查x2界值表(附表20-1),找到x20.001

卫生统计学--卡方检验

第八章卫生统计学--卡方检 一、教学大纲要求 (一) 掌握内容 1. 2χ检验的用途。 2. 四格表的2χ检验。 (1) 四格表2χ检验公式的应用条件; (2) 不满足应用条件时的解决办法; (3) 配对四格表的2χ检验。 3. 行?列表的2χ检验。 (二) 熟悉内容 频数分布拟合优度的2χ检验。 (三) 了解内容 1.2χ分布的图形。 2.四格表的确切概率法。 二、教学内容精要 (一) 2χ检验的用途 2 χ检验(Chi-square test )用途较广,主要用途如下: 1.推断两个率及多个总体率或总体构成比之间有无差别 2.两种属性或两个变量之间有无关联性 3.频数分布的拟合优度检验 (二) 2χ检验的基本思想 1.2 χ检验的基本思想是以2 χ值的大小来反映理论频数与实际频数的吻合程度。在零假设0H (比如0H :21ππ=)成立的条件下,实际频数与理论频数相差不应该很大,即2 χ值不应该很大,若实际计算出的2 χ值较大,超过了设定的检验水准所对应的界值,则有理由怀疑0H 的真实性,从而拒绝0H ,接受H 1(比如1H :21ππ≠)。 2. 基本公式:()∑ -= T T A 2 2 χ ,A 为实际频数(Actual Frequency ),T 为理论频数 (Theoretical Frequency )。四格表2 χ检验的专用公式正是由此公式推导出来的,用专用公式与用基本公式计算出的2 χ值是一致的。 (三)率的抽样误差与可信区间 1.率的抽样误差与标准误 样本率与总体率之间存在抽样误差,其度量方法: n p ) 1(ππσ -= ,π为总体率,或 (8-1) n p p S p )1(-= , p 为样本率; (8-2) 2.总体率的可信区间

《卫生统计学》习题及答案

1.表示均数抽样误差大小的统计指标是( C )。 A)标准差B)方差 C)均数标准误D)变异系数 2.抽样研究中,s为定值,若逐渐增大样本含量,则样本( B )。 A)标准误增大B)标准误减少 C)标准误不改变D)标准误的变化与样本含量无关 3.均数标准误越大,则表示此次抽样得到的样本均数( C )。 A)系统误差越大B)可靠程度越大 C)抽样误差越大D)可比性越差 4.假设已知某地35岁以上正常成年男性的收缩压的总体均数为,标准差为mmHg,后者反映的是( A )。 A)个体变异B)抽样误差 C)总体均数不同D)抽样误差或总体均数不同 5.配对计数资料差别的卡方检验,其备择假设是( D )。 A)p1=p2 B)p1≠p2 C)B=C D)B≠C 6.下列关于总体均数可信区间的论述是正确的,除了( C )外。 A)总体均数的区间估计是一种常用的参数估计 B)总体均数可信区间所求的是在一定概率下的总体均数范围 C)求出总体均数可信区间后,即可推断总体均数肯定会在此范围内 D)95%是指此范围包含总体均数在内的可能性是95%,即估计错误的概率是5% 试题来源:【2016公卫执业医师考试宝典免 费下载】 小编教你如何快速通过公卫执业医师考试 查看其他试题,请扫描二维码,立即获得本 题库手机版详情咨询 7.总体率可信区间的估计符合下列( C )情况时,可以借用正态近似法处理。 A)样本例数n足够大时B)样本率p不太大时 C)np和n(1-p)大于5时D)p接近1或0时 8.正太近似法估计总体率95%可信区间用( D )。 A)p±B)p±σ

C)p±σ D)p± 9.统计推断的内容( C )。 A)用样本指标估计相应总体指标B)假设检验 C)A和B答案均是D)估计参考值范围 10.关于假设检验,下列哪个是正确的( A )。 A)检验假设是对总体作的某种假设 B)检验假设是对样本作的某种假设 C)检验假设包括无效假设和零假设 D)检验假设只有双侧的假设 11.两样本均数假设检验的目的是判断( C )。 A)两样本均数是否相等B)两总体均数的差别有多大 C)两总体的均数是否相等D)两样本均数的差别有多大 12.比较两种药物疗效时,对于下列哪项可作单侧检验( C )。 A)已知A药与B药均有效B)不知A药好还是B药好 C)已知A药不会优于B药D)不知A药与B药是否均有效 13.当总体方差已知时,检验样本均数与已知总体均数差别的假设检验是( B )。 A)只能用t检验B)只能用u检验 C)t检验或u检验 D)方差分析 14.完全随机设计的两样本均数t检验时,不仅要求数据来自正态分布总体,而且要求( B )。 A)两组数据均数相近,方差齐B)两组数据方差齐 C)两组数据均数相近D)两组数据的σ已知 15.配对t检验中,用药前数据减去用药后数据和用药后数据减去用药前数据,两次t检验( C )。 A)t值符号相反,结论相反B)t值符号相同,结论相同 C)t值符号相反,但结论相同D)t值符号相同,但大小不同,结论相反 16.以下正确的一项是( D )。 A)配对设计的t检验中t值的分子是两样本均数之和 B)配对设计的t检验中t值的分子是差值的和 C)配对设计的t检验中t值的分母是差值的标准差 D)配对设计的t检验中t值的分母是差值均数的标准误 17.在比较完全随机设计两个小样本的均数时,需要(校正)t检验的情况是( A )。 A)两总体方差不等B)两样本方差不等 C)两样本均数不等D)两总体均数不等

相关文档
相关文档 最新文档