文档库 最新最全的文档下载
当前位置:文档库 › 第六章统计推断

第六章统计推断

第六章统计推断
第六章统计推断

第六章 统计推断

6.1 什么是统计假设?统计假设有哪几种?各有何含义?假设测验时直接测验的统计假设是哪一种?为什么?

6.2 什么是显著水平?为什么要有一个显著水平?根据什么确定显著水平?它和统计推断有何关系?

6.3 什么叫统计推断?它包括哪些内容?为什么统计推断的结论有可能发生错误?有哪两类错误?如何克服?

6.4 若n =16,=σ15,要在=α0.01水平上测验H 0:=μ140,问y 要多大?若n =100,=σ15,要在=α0.05水平上测验H 0:=μ100,试求其否定区域?

[答案:(1)y <132.65或>147.35;(2)y <96.13或>103.87]

6.5 对桃树的含氮量测定10次,得结果(%)为:2.38,2.38,2.41,2.50,2.47,2.41,

2.38,2.26,2.32,2.41,试测验H 0:=μ 2.50(提示:将各观察值减去2.40,可简化计算)。

[答案:y =2.39%,=y s 0.02%,t =5.5]

6.6 从前作喷洒过有机砷杀雄剂的麦田中随机取4株各测定砷的残留量得

7.5,9.7,6.8,和6.4mg ,又测定对照田的3株样本,得砷含量为4.2,7.0及4.6mg 。(1)已知喷有机砷只能使株体的砷含量增高,决不会降低,试测验其显著性;(2)用两尾测验。将测验结果和

(1)相比较,并加解释。

[答案:=2e s 2.218,=-21y y s 1.14]

6.7 从一个方差为24的正态总体中抽取一个容量为6的样本,求得其平均数=1y 15,又从一个方差为80的正态总体中抽取一个容量为8的样本,并知=2y 13,试取=α0.05测验210μμ=:H 和相对应的21μμ≠:A H 。

[答案:u =0.534,接受H 0]

6.8 一个容量为6的样本来自一个正态总体,知其平均数=1y 30和均方=21s 40,一个容量

为11的样本来自一个正态总体,得平均数=2y 22,均方=22s 45,测验=-210μμ:H 4和

相对的21μμ-:A H >4,取0.05的显著水平。

[答案:=2e s 50,t =1.2,接受H 0]

6.9 历史资料得岱字棉15的纤维长度(mm )为N (29.8,2.25)的总体。试求:(1)若n =10,用=α0.05否定m m 029.8:=μH 和μ:0H ≤mm 29.8,其否定区间为何?(2)若n =100

呢?(3)现以n =20测得一株系y =30.1mm ,可否认为其长度显著比总体的纤维长度(m m 29.8=μ)为长?(4)若希望有95%置信限发现一个±0.3mm 的差数为显著,则样本容量应多大?

[答案:(1)y <28.87mm 和y >30.73mm ;y >30.58;(2)y <29.51mm 和y >30.09mm ;y >30.05mm ;(3)不显著;(4)n =96]

6.10 选面积为300平方尺的玉米小区10个,各分成两半,一半去雄另一半不去雄,得产量(斤)为:

去 雄:28,30,31,35,30,34,30,28,34,32;

未去雄;25,28,29,29,31,25,28,27,32,27。

(1) 用成对比较法=d H μ:00的假设;

(2) 求包括d μ在内置信度为95%的区间;

(3) 设去雄玉米的平均产量为1μ,未去雄玉米的平均产量为2μ,试按成组平均数比较法测验210μμ=:H 的假设。

(4) 求包括21μμ-在内置信度95%的区间。

(5) 比较上述第(1)项和第(3)项测验结果并加解释。

[答案:(1)t =3.444,否定=d H μ:00;(2)[1.1,5.1];(3)t =2.905;(4)[0.9,5.3] ]。

6.11 检查小麦品种甲200穗中有虫穗42个,品种乙150穗中有虫穗27个,试问:(1)两品种的抗虫性差异是否有显著性(2)若要有95%把握发现±0.03的真实差数,则每一品种的样本容量应为多大?

[答案:(1)t =0.698,接受H 0:P 1=P 2;(2)n 1=n 2=1350穗]

数学选修23第三章统计案例教案

第三章 统计案例 §3.1 独立性检验(1) 1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人, 不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病. 问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 为了研究这个问题,(1)引导学生将上述数据用下表来表示: 一.建构数学 1.独立性检验: (1)假设0H :患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下表: 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论. (2)卡方统计量: 为了消除样本对上式的影响,通常用卡方统计量(χ22 ()-=∑ 观测值预期值预期值 )来进行估计. 卡方χ2统计量公式: χ2() ()()()() 2 n ad bc a b c d a c b d -=++++(其中n a b c d =+++) 由此若0H 成立,即患病与吸烟没有关系,则χ2的值应该很小.把37,183,21,274a b c d ====代入计算得 χ211.8634=,统计学中有明确的结论,在0H 成立的情况下,随机事件“2 6.635χ≥” 发生的概率约为0.01,即2 ( 6.635)0.01P χ ≥≈,也就是说,在0H 成立的情况下,对统计量χ2进行多次观测, 观测值超过6.635的频率约为0.01.由此,我们有99%的把握认为0H 不成立,即有99%的把握认为“患病与吸烟有关系”. 象以上这种用2 χ统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.

第六章 从本统计量估计整体参数

第六章从样本统计量估计整体参数 学习要点 第一节点估计 第二节区间估计 第三节总体均数的估计 第四节其他总体参数的估计 本章小结 学习要点 掌握推断统计的内容和前提条件 理解统计估计的原理,掌握统计估计的方法 能够运用总体均数估计的方法解决实际问题 第一节点估计 当总休平均数或比例未知时,我们可以直接把样本平均数或比例用作它的估计值。由于样本统计量为数轴上的一个点,所以称为“点估计值” 。 科学研究不仅需要对事物特征作出一般性的描述,而且更要根据样本提供的信息去推测相应总体的情况,统计内容中的推断统计则是专门研究如何用样本去推断总体的方法。 一、什么是推断统计 一般情况下,样本统计量是不会和相应的总体参数完全相同的,两者多少都会有一定的差距,但是如果用无限多个样本的统计量来估计总体参数,平均估计误差将会等于0。 具有这一特征的统计量就无偏估计值。 例如,用样本平均数估计总体平均数时,总会有些误差,在有些样本中,它可能会大于总体平均数,而在另一些样本中它又可能会小于总体平均数,而且对于不同的样本估计误差的大小也是不同的,但是无限多个样本平均数的平均估计误差为0。换句话说,样本平均数的平均数将会等于总体平均数。 推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体,

由已知推未知的过程。 推断统计根据推测的性质不同而分为参数估计和假设检验两方面。参数估计(parameter estimation)就是用样本去估计相应总体的状况,其具体方法有点估计和区间估计。假设检验(hypothesis test)的主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验,又称统计检验(statistical test)。在检验中又根据是否需要依赖于对总体分布形态和总体参数检验的假设而分为参数检验和非参数检验。参数检验法在检验时对总体分布和总体参数 (μ,2 σ)有所要求,而非参数检验法在检验时则不依赖于总体的分布形态和总体参数的 情况。参数检验法主要有Z检验、t检验、F检验和q检验等,非参数检验(non-parameter test)主要有χ2检验、符号检验法、符号等级检验法、秩和检验、中位数检验等。 二、统计推断的基本问题 没有系统学过统计学的人往往有一种误解,以为只要搜集了数据资料,就可以用统计方法来处理数据。殊不知统计学是建立在概率论基础上的,而概率论是专门研究随机事件的。因此,在做统计推断之前必须考虑你所获得的资料是否能够用统计的方法来分析。通常,进行统计推断时应首先考虑以下三个方面的问题。 一是关于统计推断的基本前提。统计推断的前提是随机抽样。因此当我们利用样本统计量进行总体推断时,首先要了解抽样的方式,即了解样本是如何得来的,是随机抽取的,还是人为抽取的。随机抽样的均等性和独立性,避免了入样个体只来自总体的某一部分,从而也就避免了样本的偏倚性。可以说,样本的抽取直接关系着统计研究结果的科学性。 二是样本的规模与样本的代表性。抽样研究需要有一定的样本规模,而样本要具有代表性也需要有一定的样本规模来保证,以减少抽样误差。一般来说,在其它条件相同的情况下,样本越小,抽样的误差越大;样本越大,抽样的误差就越小。当样本增至包括总体的全部个体(即N n=)时,抽样的误差为0。因此,只要条件允许,尽可能地采用大样本,以增强样本对总体的代表性和可靠性。值得注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。 三是统计推断的错误要有一定限度。统计推断是在特定的时间、空间和条件下得出的结论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。这种错误在统计推断中是不可避免的,也是允许的。不过这种错误要有一定的限度,超过一定限度的错误是不允许的。统计推断中允许犯错误的限度是用小概率事件来表示。 第二节区间估计 一、参数估计的定义 所谓参数估计就是根据样本统计量去估计相应总体的参数。譬如我们可以根据样本均数(X)去估计总体的均数(μ),根据样本方差(2S)去估计总体方差(2 σ),根据样本的相关系数(r)去估计总体相关系数(ρ)等等。

统计学第七章假设检验

第七章 假设检验 Ⅰ.学习目的 假设检验包括参数检验与非参数检验,是一种最能体现统计推断思想和特点的方法。通过本章学习,要求:1.掌握统计检验的基本原理,理解该检验的规则及犯两类错误的性质;2.熟练掌握总体均值、总体成数及总体方差指标的各种检验方法,包括:z 检验、t 检验和p 值检验;3.掌握2 检验、符号检验、秩和检验及游程检验四种基本的非参数检验方法。 Ⅱ.课程内容要点 第一节 假设检验的基本原理 一、假设检验的基本原理 “小概率原理”:小概率事件在一次试验中几乎是不会发生的。 事先所做的假设,是假设检验中关键的一项工作。它包括原假设和备选假设两部分。原假设是建立在假定原来总体参数没有发生变化的基础之上的。备选假设是原假设的对立,是在否认原假设之后所要接受的,通常这是我们真正感兴趣的一个判断。 二、假设检验的规则与两类错误 1、假设检验的规则 假设检验的步骤: (1)首先根据实际应用问题确定合适的原假设0H 和备选假设1H ; (2)确定检验统计量,通过数理统计分析确定该统计量的抽样分布;

(3)给定检验的显著性水平α。在原假设成立的条件下,结合备选假设的定义,由检验统计量的抽样分布情况求出相应的临界值,该临界值为原假设的接受域与拒绝域的分界值; (4)从样本资料计算检验的样本统计量,并将其与临界值进行比较,判断是否接受或拒绝原假设。 从检验程序我们可以看出,统计量的取值范围可以分为接受域和拒绝域两个区域。拒绝域正是统计量取值的小概率区域。按照我们将这个拒绝域安排在所检验统计量的抽样分布的某一侧还是两端,可以将检验分为单侧检验或双侧检验。双侧检验中,又可以根据拒绝域,是在左侧还是在右侧而分为左侧检验和右侧检验。对于这些双侧、左、右单侧检验,我们要结合备选假设来考虑。 在检验规则中,我们经常碰到两种重要的检验方法:z检验与t检验。 p值检验的原理:给出原假设后,在假定原假设正确的情况下,参照备选假设,可以计算出检验统计量超过或者小于(还要依照分布的不同、单侧检验、双侧检验的差异而定)由样本所计算的检验统计量的数值的概率,这便是p值;而后将此概率值跟事先给出的显著性水平值α进行比较。如果该值小于α,否定原假设,取对应的备选假设。如果该值大于α,我们不就能否定原假设。 2、两类错误 H实际为真,但我们却依据样本信息,做出拒绝的错误结论当原假设 时,称为“弃真”错误;当原假设实际为假,而我们却错误接受时,称为“纳伪”错误。通常记显著性水平α为犯“弃真”错误的可能性大小,β为犯“纳伪”错误的可能性大小。由于两类错误是一对矛盾,在其他条件不变得情况下,减少犯“弃真”错误的可能性大小(α),势必增大犯“纳伪”错误的可能性大小(β),也就是说,β的大小和显著性水平α的大小成相反方向变化。 三、检验功效 -可以用来表明所做假设检验工作好坏的一个指标,我们称之为检1β

梁前德《统计学》(第二版)学习指导与习题训练答案:07第七章 假设检验与方差分析 习题答案

旗开得胜 1 第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u , n x σμ0 -,标准正态; ),( ),(2/2/+∞- -∞n z n z σσααY 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差

旗开得胜 2 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r 18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。( ×) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。( √) 3

最新多元统计分析第三章 假设检验与方差分析

多元统计分析第三章假设检验与方差分析

第3章 多元正态总体的假设检验与方差分析 从本章开始,我们开始转入多元统计方法和统计模型的学习。统计学分析处理的对象是带有随机性的数据。按照随机排列、重复、局部控制、正交等原则设计一个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进行统计推断,是自然科学和工程技术领域常用的一种研究方法。由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论方法研究的出发点。 所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要用概率来表明其可靠程度。统计推断的任务是“观察现象,提取信息,建立模型,作出推断”。 统计推断有参数估计和假设检验两大类问题,其统计推断目的不同。参数估计问题回答诸如“未知参数θ的值有多大?”之类的问题,而假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。本章主要讨论多元正态总体的假设检验方法及其实际应用,我们将对一元正态总体情形作一简单回顾,然后将介绍单个总体均值的推断, 两个总体均值的比较推断,多个总体均值的比较检验和协方差阵的推断等。 3.1一元正态总体情形的回顾 一、 假设检验 在假设检验问题中通常有两个统计假设(简称假设),一个作为原假设(或称零假设),另一个作为备择假设(或称对立假设),分别记为0H 和1H 。 1、显著性检验 为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来自总体),(2 σμN 的样本,我们要检验假设 100:,:μμμμ≠=H H (3.1) 原假设0H 与备择假设1H 应相互排斥,两者有且只有一个正确。备择假设的意思是,一旦否定原假设0H ,我们就选择已准备的假设1H 。 当2 σ已知时,用统计量n X z σ μ -=

第六章统计推断

第六章 统计推断 6.1 什么是统计假设?统计假设有哪几种?各有何含义?假设测验时直接测验的统计假设是哪一种?为什么? 6.2 什么是显著水平?为什么要有一个显著水平?根据什么确定显著水平?它和统计推断有何关系? 6.3 什么叫统计推断?它包括哪些内容?为什么统计推断的结论有可能发生错误?有哪两类错误?如何克服? 6.4 若n =16,=σ15,要在=α0.01水平上测验H 0:=μ140,问y 要多大?若n =100,=σ15,要在=α0.05水平上测验H 0:=μ100,试求其否定区域? [答案:(1)y <132.65或>147.35;(2)y <96.13或>103.87] 6.5 对桃树的含氮量测定10次,得结果(%)为:2.38,2.38,2.41,2.50,2.47,2.41, 2.38,2.26,2.32,2.41,试测验H 0:=μ 2.50(提示:将各观察值减去2.40,可简化计算)。 [答案:y =2.39%,=y s 0.02%,t =5.5] 6.6 从前作喷洒过有机砷杀雄剂的麦田中随机取4株各测定砷的残留量得 7.5,9.7,6.8,和6.4mg ,又测定对照田的3株样本,得砷含量为4.2,7.0及4.6mg 。(1)已知喷有机砷只能使株体的砷含量增高,决不会降低,试测验其显著性;(2)用两尾测验。将测验结果和 (1)相比较,并加解释。 [答案:=2e s 2.218,=-21y y s 1.14] 6.7 从一个方差为24的正态总体中抽取一个容量为6的样本,求得其平均数=1y 15,又从一个方差为80的正态总体中抽取一个容量为8的样本,并知=2y 13,试取=α0.05测验210μμ=:H 和相对应的21μμ≠:A H 。 [答案:u =0.534,接受H 0] 6.8 一个容量为6的样本来自一个正态总体,知其平均数=1y 30和均方=21s 40,一个容量 为11的样本来自一个正态总体,得平均数=2y 22,均方=22s 45,测验=-210μμ:H 4和 相对的21μμ-:A H >4,取0.05的显著水平。 [答案:=2e s 50,t =1.2,接受H 0] 6.9 历史资料得岱字棉15的纤维长度(mm )为N (29.8,2.25)的总体。试求:(1)若n =10,用=α0.05否定m m 029.8:=μH 和μ:0H ≤mm 29.8,其否定区间为何?(2)若n =100

第三章 多元正态整体统计推断

幻灯片1 第三章多元正态总体的统计推断 §3.1 引言 §3.2 单个总体均值的推断 §3.3 单个总体均值分量间结构关系的检验 §3.4 两个总体均值的比较推断 §3.5 两个总体均值分量间结构关系的检验 §3.6 多个总体均值的比较检验(多元方差分析) §3.7 协方差阵的检验 幻灯片2 §3.1 引言 在单一变量的统计分析中,已经给出了正态总体N( , 2)的均值 和方差 2的各种检验。对于多变量的正态总体Np( ,∑),各种实际问题同样要求对 和∑进行统计推断。 本章类似单一变量统计分析中的各种均值和方差的检验,相应地给出多元统计分析中的各种均值向量的检验。 幻灯片3 ●其基本思想和步骤均可归纳为: ●第一,提出待检验的假设H0和H1; ●第二,给出检验的统计量及其服从的分布; ●第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; ●第四,根据样本观测值计算出统计量的值,看是否落入拒绝域中,以便对待判假设做 出决策(拒绝或接受)。 幻灯片4 §3.2 单个总体均值的推断 一、单一变量检验的回顾及Hotelling T2分布 二、均值向量的检验 三、置信区域 四、联合置信区间 幻灯片5 一、单一变量检验的回顾及Hotelling T2分布 为了对多元正态总体均值向量作检验,首先需要给HotellingT2分布的定义。

在单一变量的检验问题中,设12,,,n X X X 来自总体 2(,)N μσ的样本,我们要检验假设 0010:;:H H μμμμ=≠ 当2 σ已知时,用统计量 0() X z n μσ -= 其中,1 1n i i X X n ==∑为样本均值。当假设成立时,统计量z 服 从正态分布~(0,1)z N ,从而否定域为/2||z z α>,/2z α为(0,1)N 的上/2α分位点。 幻灯片6 当2 σ未知时,用 2 2 1 1()1n i i S X X n ==--∑ 作为2 σ的估计量,用统计量: 0()X t n S μ-= 来做检验。当假设成立时,统计量t 服从自由度为1n -的t 分布,从而否定域为/2||(1)t t n α>-,/2(1)t n α-为自由度为1n -的t 分布上的/2α分位点。 这里我们应该注意到,(3.3)式可以表示为 22 21 2 ()()()()n X t n X S X S μμμ--'==-- 对于多元变量而言,可以将t 分布推广为下面将要介绍的 Hotelling 2 T 分布。 幻灯片7

统计学教案(第6章抽样推断)

统计学 授课题目第6章抽样推断课次第8-9次 授课方式讲授课时安排第8教学周-第9教学周,共4课时教学目的: 通过本章的学习,要求掌握利用样本统计资料来推断总体数量特征的原理及方法;深刻理解抽样推断的概念及特点;了解抽样误差产生的原因,并对抽样误差、抽样平均误差、抽样极限误差加以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的方法;掌握必要样本单位数的确定方法。 教学重点及难点提示: 重点:区间估计 难点:抽样平均误差的计算 案例导入:大学生消费调查:一个月你花多少? 第一节抽样推断概述 一、抽样推断的概念及特点 (一)概念 按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征进行科学估计和推断的方法。 包括抽样调查和统计推断 抽样调查:一种非全面调查,按随机原则从总体中抽取部分单位进行调查以获得相 关资料,以推断总体 统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有一定程度的估 计和推断。 (二)特点 1.按随机原则(等可能性原则)抽取调查单位.随机抽样的目的是为了排除人的主观教法提示:多媒体教学案例教学列举法

影响,使每个样本都有系统的可能性被抽中,使样本对总体具有充分的代表性。随机性原则是保证抽样推断正确性的一个重要前提条件。随机抽样不是随便抽样。 2.根据部分推断总体的数量特征 3.抽样推断的结果具有一定的可靠性和准确性,抽样误差可以事先计算和控制 其他特点有经济性、时效性、准确性、灵活性等 (三)抽样推断的使用 1.不可能进行全面调查时 2.不必要进行全面调查时 3.检查生产过程正常和否 4.对全面调查资料进行补充修正时 二、抽样的几个基本概念 1.样本容量和样本个数 (1)样本容量:样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n 表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。 (2)样本个数:又称样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多少和抽样方法有关。 2.总体参数和样本统计量 (1)总体参数:总体分布的数量特征就是总体参数,也是抽样统计推断的对象。常见的总 体参数有:总体的平均数指标,总体成数(比重)指标,总体分布的方差、标准差等等。 (2)样本统计量:和总体参数对应的是样本统计量。 设(12 ,,n X X X )是总体X 容量为n 的样本,若样本函数 T T (12 ,,n X X X ) 中不含任何未知参数,则称T 为一个统计量。 例如

统计学第七章、第八章课后题答案

统计学复习笔记 第七章 参数估计 一、 思考题 1. 解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2. 简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3. 怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4. 解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 其中: 2222α2222)(E z n σα=n z E σα2=

第五章统计推断

第五章统计推断 ?总体与样本之间的关系 -从总体到样本的研究。 -由样本推断总体:样本统计量的分布规律一般是正态分布、t 分布、χ2分布和F分布。?对总体做统计推断的两种途径 –先对所估计的总体做一假设,然后通过样本数据推断这个假设是否接受,这种途径称为统计假设检验(statistical test of hypothesis) –通过样本统计量估计总体参数,称为总体参数估计(estimation of population parameter) ?本章重点讲解统计推断的一般原理以及对总体平均数及标准差的推断。 一、假设检验 假设检验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种被此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。如果抽样结果使小概率发生,则拒绝假设,如抽样结果没有使小概率发生,则接受假设。 小概率原理 在一次试验中,某事件几乎是不会发生的,若根据一定的假设条件计算出来的该事件发生的概率很小,而在一次试验中它竟然发生了,则可认为原假设条件不正确,给予否定。 在生物统计的显著性检验中,通常取5%或1%小概率为显著性水平,记为“α” 例5.1 根据以往的经验,用一般疗法治疗某种疾病,其死亡率为40%,治愈率为60%。今用一种新药治疗染上该病的6名患者,这6人均治愈了,问该新药是否显著优于一般疗法? 小概率原理用于显著性检验 例5.2用实验动物作实验材料,现从一批动物(σ= 0.4)中抽取含量n = 10的样本并已经计算出平均值为10.23 g。已知这批动物饲养时间较长,不可能小于10g,问此批动物材料是否是抽自于μ=10的总体中? 解:1 样本平均数满足何种分布?

第五章统计学教案(假设检验)

第五章假设检验 参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证,从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 本章的目的与要求 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数的检验方法,主要是Z 检验和t检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 本章主要内容(计划学时2 ) 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验 3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 学习重点 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 学习难点 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 第一节统计检验的基本概念 一、假设检验概述

基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其为“实际不可能事件”。 二、假设检验的基本概念 (一)原假设与对立假设 1、原假设:用“H0:”表示(也称“零假设”、“虚无假设”) 这是研究者对总体参数事先提出的假设。通常以总体没有发生显著变化为原假设。 2、对立假设:用“H1:”表示 对立假设也称“备择假设” 这是与原假设完全对立的、矛盾的假设,假设总体发生了显著的变化。 (二)显著性水平与显著性差异 1、显著性水平: 在统计检验中,判断假设是否合理,是根据一定的标准来确定的,这个标准是在检验之前由研究者事先主观选定的一个小概率值,用α表示.这个α就是显著性水平。 常用的α有0.1、0.05或0.01等 2、显著性差异: 如果统计量和假设的参数值存在差距,有两种可能: (1)差距不是很大(即不在小概率范围内出现),即可认为总体没发生显著变化。可接受原假设。 (2)差距很大(即出现在小概率范围内),即可认为总体发生了显著变化。说明存在着显著性差异,故拒绝原假设。 (三)双侧检验与单侧检验 1、双侧检验(双尾检验): 双侧检验要求同时注意估计值偏高和偏低的倾向,这时,差距不分正负, 给出的显著水平α 2、单侧检验(单尾检验):(有左单侧和右单侧两种) 单侧检验只注意估计值是否偏高(或偏低),它是单方向的,给出的显著性水平α集中在同一侧。偏高时,差距为正,为右单侧检验;偏低时,差距为负,为左单侧检验。 (四)两种类型的错误 1、第一类错误——以真为假

第六章分类资料的统计推断

1不满足正态近似条件,所以采用直接计算概率法。 H0:加维生素C的治愈率与不加相同,即π=π0=0.6 H1:加维生素C的治愈率高于不加维生素C,即π>π0 α=0.05 P(X≤8)=1-P(X≥9)=1-P(X=9)-P(X=10)=1-C109*0.69*0.41-C1010*0.610*0.40= 0.9536>0.05 不拒绝H0,差别无统计学意义,可以认为加维生素C的治愈率与不加相同。 2满足正态近似条件,采用正态近似法。 H0:经健康教育后的高血压患病率与以前相同,即π=π0=0.6 H1:经健康教育后的高血压患病率比以前降低,即π<π0 单侧α=0.05 u==4.9453536 u>u0.05,单侧=1.64 p<0.05,拒绝H0,接受H1,差别有统计学意义,可以认为经健康教育后的高血压患病率与以前有差别。 3①建立检验假设和确定检验水准 H0:男女大学生HBV感染对其心理影响相同,即π1 =π2 H1:男女大学生HBV感染对其心理影响不同,即π1≠π2 检验水准α=0.05 ②计算检验统计量 χ2=(ad-bd)2*n/(a+b)(c+d)(a+c)(b+d) =(250*213-246*320)/(250+320)(246+213)(250+246)(320+213)=9.651 ν=1 ③确定p值 查χ2届值表,得p<0.05 ④统计推断 按α=0.05水准,拒绝H O,接受H1,差别有统计学意义,可以认为HBV感染对不同性别的大学生在心理行为方面的影响不同。 4①建立检验假设和确定检验水准 H0:两组的治愈率相等,即π1 =π2 H1:两组的治愈率不等,即π1≠π2 检验水准α=0.05

09、第三章第一节质量统计分析(一)

第三章建设工程质量的统计分析和试验检测方法 第一节质量统计分析 一、工程质量统计及抽样检验的基本原理和方法 ㈠总体、样本及统计推断工作过程: 总体(母体);个体; 有限总体;无限总体;样本(子样);样品;样本容量 ㈡质量数据的特征值 ⒈描述数据集中趋势的特征值 样本数据特征值是由样本数据计算的描述样本质量数据波动规律的指标。 算术平均数(均值) 是消除了个体之间个别偶 然的差异。是数据的分布中 心,对数据的代表性好 总体算术平 均数μ 样本算术平 均数 x 样本中位数按数值大 小有序排 列 样本数n为奇数,数列居中的 一位数 样本数n为偶数,取居中两个

数的平均值⒉描述数据离散趋势的特征值 极差计算简单、使用方便,但粗略,数值仅受两个极端值的影响,损失的质量信息多,不能反映中间数据的分布和波动规律,仅适用于小样本 标准偏差 (标准差或均方差) 标准差值小说明分布集中程度高,离散程度 小,均值对总体(样本)的代表性好; 标准差的平方是方差,有鲜明的数理统计特 征,能确切说明数据分布的离散程度和波动 规律,是最常用的反映数据程度的特征值 总体标准差 样本 标准 差 样本容量较大(n ≥50)时,分母 n-1简化为n 变异系数(离散系数) 表示数据的相对离散波动程度。 变异系数小。说明分布集中程度高,离散程度小, 均值对总体(样本)的代表性好。 适用于均值有较大差异的总体之问离散程度的比较 标准差除以算术 平均数得到的相 对数 【例】下列质量数据特征值中,用来描述数据集中趋势的是()。 A.极差 B.标准偏差 C.均值 D.变异系数【答案】C

【例】下列质量数据特征值中,用来描述数据离散趋势的是()。A.极差 B.中位数 C.算术平均数 D.极值【答案】A ㈢质量数据的分布特征 ⒈质量数据的特性 质量数据具有个体数值的波动性和总体(样本)分布的规律性。 ⒉质量数据波动的原因 正常波动偶然性 原因引 起 影响因素的微小变化具有随机发生的特点,是不可避免、难以测量和 控制的,或者是在经济上不值得消除,它们大量存在但对质量影响很 小,属于允许偏差、允许位移范畴 异常波动系统性 原因引 起 影响质量的人机料法环等因素发生了较大变化,如工人未遵守操作规 程、机械设备发生故障或过度磨损、原材料质量规格有显著差异等情 况发生时,没有及时排除 ⒊质量数据分布的规律性 一般计量值数据服从正态分布,计件值数据服从二项分布,计点值数据服从泊松分布等。 实践中只要是受许多起微小作用的因素影响的质量数据,都可认为是近似服从正态分布的,如构件的几何尺寸、混凝土强度等。

第六章分类资料的统计推断(pdf 6)

第六章 分类资料的统计推断 分类资料中最常用的统计方法是2χ检验,确切概率法,另外还有秩和检验。秩和检验在后一章介绍,本章重点介绍2χ检验,其它方法简略讲述。 6.1 四格表资料2χ检验 例 6.1 某医院治疗慢性肾炎病人,其中用西药治疗79例,有效者63人,有效率79.75%,用中药治疗54例,有效者47人,有效率87.04%,问两种药物治疗慢性肾炎有效率是否相同? 处理 有效 无效 西药组 63 16 中药组 47 7 具体步骤: 1. 数据录入 设变量group 代表处理组(西药组为1,中药组为2),变量effect 代表是否有效(有效为1,无效为0),变量f 代表频数,即例数。如西药组有效例数为63,则group 为1,effect 为1,freq 为63。数据格式如图6.1。 2.统计分析 首先依次选取Data -weight Cases ,展开对话框如图6.2,选择Weight cases by ,将freq 选入Frequency Variable :框,即赋予权重;然后依次选取Analyze -Descriptive Statistics -Crosstabs ,展开对话框如图6.3,将group 选入Rows 框,effect 选入Columns 框,或相反; 该对话框下方有三个按钮:Statistics 、Cells 和Format ,现将其子对话框选项介绍如下: Statistics 选择要输出的统计量,常用的有2χ(Chi -square )、Pearson 相关系数

χ(McNemar)(Correlations)、Kappa系数(Kappa)、相对危险度(Risk)、配对2 等。 Cells指定多维分布表中显示实际频数、理论频数、行列及全部百分比和残差等。 Format指定行顺序(升序或降序)。 在对话框下方还有两个选项:Display Clustered Bar Charts(输出直方图)和Suppress Tables(不输出多维分布表)。 本例仅计算2 χ,单击Statistics,弹出对话框如图6.4,选取Chi-square。返回主对话框,单击OK提交执行。 χ检验数据格式 图6.1 2

概率统计第七章参数估计

第七章 参数估计 参数估计是统计推断的基本内容之一,它是凭借从总体中抽取的样本,构造合适的样本函数,对总体中的未知参数作出符合要求的估计. 例1. 某批产品的质量用次品率来衡量,但是数量太大,无法一一检测,那么如何估计该 批产品的质量呢?我们可以抽取100件进行检测,如果其中有95件正品,5件次品.这时我们就把100件样品的次品率0.05,作为该批产品的次品率的估计。 例2. 要统计某地人均年商品消费额,我们抽取1000户进行调查,计算得到人均年商品消 费额为6800元,这时我们就把样本的人均年商品消费额6800元作为该地人均年商 品消费额的估计。 上述例子的共同之处是:利用样本资料得到的信息来估计有关总体分布中的一些未知参数,这类估计方法称为参数估计。依据估计形式的不同,参数估计分为点估计和区间估计两种。 第一节 参数的点估计 一.估计量,估计值和点估计 1. 估计量 :设 是来自总体X 的样本,是总体的未知参数,若用一个合 适的统计量 来估计,则称为参数的估计量. 2. 估计值:在抽样后,每当有了一组样本值12,,,n x x x ,将其代入统计量 ,称()12?,,,n x x x θθ= 为参数 的估计值。 3. 点估计:设 是总体的未知参数,如果用估计值()12?,,,n x x x θθ= 来估计未知参数 , 这种估计称为点估计。 二.点估计的两个基本估计式 1.用样本均值X 作为总体X 的数学期望()E X 的估计量 2. 用样本方差2S 作为总体X 的方差()D X 的估计量 特别地,对于正态总体()2,N μσ,有2 2 ??,X S μ σ ==. 例1. 某灯泡工厂某天生产了一大批灯泡,从中任意取出10只进行寿命试验,测得数据如 下(单位:小时):1050 1100 1080 1120 1200 1250 1040 1130 1300 1200 试估计该天生产的灯泡的平均寿命。 解:()11050110010801120120012501040113013001200114710 x =+++++++++= 所以?1147x μ ==,即:估计该天生产的灯泡的平均寿命为1147小时. 例2. 设总体X 的概率密度为 ()1, 01;0, 0,1 x x f x x x θθθ-?<<=? ≤≥?,其中是总体的未知参数,求 的估计量。 解:设 为取自总体X 的样本,因为()()11 ;1 E X xf x dx x x dx θθθθθ+∞ --∞ == ?= +?? 取样本均值X 作为总体X 的数学期望()E X 的估计量,即:()?E X X =,于是得到:

统计学第七章、第八章课后题答案

统计学复习笔记 第七章 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5. 简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 2. 样本量n 与置信水平1-α、总体方差、估计误差E 之间的关系为 与置信水平成正比,在其他条件不变的情况下,置信水平越大,所 需要的样本量越大; 与总体方差成正比,总体的差异越大,所要求的样本量也越大; 与与总体方差成正比,样本量与估计误差的平方成反比,即可以接 受的估计误差的平方越大,所需的样本量越小。 二、 练习题 1. 从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。 1) 样本均值的抽样标准差x x σ等于多少 2) 在95%的置信水平下,估计误差是多少 解: 1) 已知σ = 5,n = 40, = 25 ∵ ∴ x σx σ = 5 /√40 ≈ 2) 已知 ∵ 其中: 2222 α2222)(E z n σα=n z E σα2=x n x n x σσ=α2n z E σα2=

经管类概率论与数理统计第七章参数估计

从本章开始我们介绍统计推断,所谓统计推断就是由样本推断总体,统计推断包括参数估计和假设检验两部分,它们是统计推断最基本而且是互相有联系的两部分,本章介绍统计推断的第一部分参数估计。 参数通常指总体分布中的特征值和和各种分布中的参数,例如二点分布B(1,P)中的p,泊松分布P()中的,正态分布N(、)的、等,习惯用表示参数,通常参数是未知的。 参数估计的形式有两类,设x1,x2,…,x n是来自总体的样本。我们用一个统计量的取值作为参数的估计值,则称为的点估计(量),就是参数的点估计, 如果对参数的估计需要对估计作出可靠性判断,就需要对这一可靠性给出可靠性区间或置信区间,叫区间估计。 下面首先介绍点估计 7.1点估计的几种方法 直接用来估计未知参数的统计量称为参数的点估计量,简称为点估 计,人们可以运用各种方法构造出很多的估计,本节介绍两种最常用的点估计方法。它们是:矩法和极大似然法。 7.1.1替换原理和矩法估计 用下面公式表示的方法叫矩法 例7-1对某型号的20辆汽车记录每5L汽油的行驶里程(km),观测数据如下: 29.827.628.327.930.128.729.928.027.928.7 28.427.229.528.528.030.029.129.829.626.9 这是一个容量为20的样本观测值,对应总体是该型号汽车每5L汽油的行驶里程,其分布形式尚不清楚,可用矩法估计其均值,方差,本例中经计算有 =28.695,=0.9185 由此给出总体均值,方差的估计分别为即 【答疑编号:10070101针对该题提问】 矩法估计的统计思想(替换原理)十分简单明确,众人都能接受,使用场合甚广。 例7-2设总体为指数分布,其密度函数为 x 1,…,x n是样本,由于,亦即,故的矩法估计为

第五章统计估计和假设检验

第五章统计估计和假设检验 第五章统计估计和假设检验统计学的基本问题就是根据样本所提供的信息对总体的分布以及分布的数字特征作出统计推断。统计推断包括两大部分:一是统计估计,二是假设检验。 统计估计问题就是根据样本的数字特征来估计总体参数的数字特征,因此通常也称作参数估计。参数估计根据所得出结论的方式不同有两种形式:点估计和区间估计。 假设检验就是对关于总体分布的一些数字特征或分布函数所做的假设进行检验,以判断其正确性。假设检验也分为两类:一类是对总体分布的一些数字特征进行检验,称为参数假设检验; 另一类是要求根据样本所提供的信息对关于分布函数的假设进行检验,此时只检验分布,而不对参数作检验,这称作非参数的假设检验。非参数检验将在第六章进行讨论,本章着重讨论参数检验。 第一节点估计一、点估计的极大似然法点估计就是以单个数据对总体参数值作出估计。若未知的总体参数为,这时是一个未知的常数。我们根据抽样样本的观察值构造一个统计量()来估计总体参数。由于抽样的随机性,统计量是一个随机变量。点估计就是将的具体值作为的估计值。显然,这样做必然会有误差产生。这种误差就称为抽样误差。 极大似然法是一种对参数点估计的重要方法之一。我们先用一个例子说明其原理。 例5-1。设有一批产品,质量上分为正品与次品。产品的次品率有两种估计:0.1和0.4,今随机抽样15件产品,发现只有一件是次品。现根据这一抽样情况,来决定用哪一种次品率来估计更为可靠呢?记A =“抽取15件产品,只有一件是次品”,设抽得正品用X=0,抽得次品用X=1来表示。抽样结果只有X=0 与X=1 两种情形,于是,可得事件A发生的概率为:

相关文档
相关文档 最新文档