文档库 最新最全的文档下载
当前位置:文档库 › 实验三-用EXCEL进行参数估计和假设检验

实验三-用EXCEL进行参数估计和假设检验

实验三-用EXCEL进行参数估计和假设检验
实验三-用EXCEL进行参数估计和假设检验

实验三-用EXCEL进行参数估计和假设检验

实验三用EXCEL进行参数估计和假设检验

一、用EXCEL进行区间估计

数据:某百货公司6月份各天的销售额数据如下:(单位:万元)

求在概率90%的保证下,顾客平均消费额的估计区间。

参数估计数据及结果:

从上面的结果我们可以知道,该月平均销售额的置信下限为270.23,置信上限为277.97。

二、用EXCEL进行假设检验

例题1:假设有A、B两个品牌的电池,现分别从这两个品牌电池中随机抽取10只进行检测,获得下表数据。它们的使用寿命方差相等为30,试问在0.1的显著性水平下,可否认为两个品牌的平均使用寿命存在显著差异?

据上,提出原假设:A、B两个品牌的电池使用寿命不存在显著差异,

备择假设:A、B两个品牌的电池使用寿命存在显著差异。

进行Z检验-双样本平均差检验:

得如下所示结果:

此次检验属于双尾检验,P=01101282872 > 显著性水平0.1,所以在0.1的显著性水平下不能拒绝原假设,即可以认为两个品牌的平均使用寿命不存在显著性差异。

例题2:用某种药物治疗9例再生障碍性贫血患者,治疗前后患者血红蛋白变化的数据如下表所示。问在0.05的显著性水平下,能否认为这种药物至少可以使血红蛋白数量增加15个单位?

提出原假设:这种药物不能使患者血红蛋白至少增加15个单位;备择假设:这种药物可以使患者的血红蛋白至少增加15个单位。由于总体平均差已知,选用t-检验:平均值的成对二样本分析:

得结果如下:

由于显著性水平为0.05大于P值0.00037558,因此要拒绝原假设,即可以认为这种药物至少能使血红蛋白数量增加15个单位。

例题3:某研究所试验出一批新品种,想知道新品种产量是否比老品种产量有显著提高,随机抽取新老品种产量各9个,数据如下(单位:千克)。试问,在0.05的显著性水平下,可否认为新品种比老品种的产量有显著提高?

据条件,提出原假设:新品种比老品种产量没有显著提高;

备择假设:新品种比老品种产量显著提高。

得出t检验:双样本异方差分析结果如下:

在显著性水平为0.05的单侧检验下,P值为0.097038594,大于显著性水平,应拒绝原假设,即可以认为在0.05的显著性水平下,新品种比老品种的产量有显著提高。

参数估计与假设检验的区别和联系

参数估计与假设检验的区别和联系 统计学方法包括统计描述和统计推断两种方法,其中,推断统计又包括参数估计和假设检验。 1.参数估计就是用样本统计量去估计总体的参数,它的方法有点估计和区间估计两种。 点估计是用估计量的某个取值直接作为总体参数的估计值。点估计的缺陷是没法给出估计的可靠性,也没法说出点估计值与总体参数真实值接近的程度。 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。在区间估计中,由样本估计量构造出的总体参数在一定置信水平下的估计区间称为置信区间。统计学家在某种程度上确信这个区间会包含真正的总体参数。 在区间统计中置信度越高,置信区间越大。置信水平为1-a, a为小概率事件或者不可能事件,常用的置信水平值为99%,95%,90%,对应的a为0.01, 0.05,0.1 置信区间是一个随机区间,它会因样本的不同而变化,而且不是所有的区间都包含总体参数。 一个总体参数的区间估计需要考虑总体是否为正态分布,总体方差是否已知,用于估计的样本是大样本还是小样本等 (1)来自正态分布的样本均值,不论抽取的是大样本还是小样本,均服从正态分布 (2)总体不是正态分布,大样本的样本均值服从正态分布,小样本的服从t 分布 (3)不论已判断是正态分布还是t 分布,如果总体方差未知,都按t 分布来处理 (4)t 分布要比标准正态分布平坦,那么要比标准正态分布离散,随着自由度的增大越接近 (5)样本均数服从的正态分布为N(u a^2/n)远远小于原变量离散程度N (u a^2) 2. 假设检验是推断统计的另一项重要内容,它与参数估计类似,但角度不同,参数估计是利用样本信息推断未知的总体参数,而假设检验则是先对总体参数提出一个假设值,然后利用样本信息判断这一假设是否成立。 假设检验的基本思想:先提出假设,然后根据资料的特点,计算相应的统计量,来判断假设是否成立,如果成立的可能性是一个小概率的话,就拒绝该假设,因此称小概率的反证法。最重要的是看能否通过得到的概率去推翻原定的假设,而不是去证实它<2>统计学中假设检验的基本步骤:(1)建立假设,确定检验水准α--假设有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设。H0和H1的关系是互相对立的,如果拒绝H0,就要接受H1,根据备择假设不同,假设检验有单、双侧检验两种。检验水准用α表示,通常取0.05或0.10,检验水准说明了该检验犯第一类错误的概率。(2)根据研究目的和设计类型选择适合的检验方法 这里的检验方法,是指参数检验方法,有u检验、t检验和方差分析三种,对应于不同的检验公式。 (3)确定P值并作出统计结论 u检验得到的是u统计量或称u值,t检验得到的是t统计量或称t值。方差分析得到的是F统计量或称F值。将求得的统计量绝对值与界值相比,可以确定P值。当α=0.05时,u值要和u界值1.96相比较,确定P值。如果u<1.96,则P>0.05.反之,如u>1.96,则P<0.05.t值要和某自由度的t界值相比较,确定P值。如果t值<t界值,故P>0.05.反之,如t>t 界值,则P<0.05。相同自由度的情况下,单侧检验的t界值要小于双侧检验的t界值,因此有可能出现算得的t值大于单侧t界值,而小于双侧t界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。即单侧检验更容易出现阳性结论。当P>0.05时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当P<0.05时,拒绝零假设,接受备择假设,认为差异有统计学意义,也可以理解为二者存在质的区别。但即使检验结果是P<0.01甚至P<0.001,都不说明差异相差很大,只表示更有把握认为二者存在差异。 3.参数估计与假设检验之间的联系与区别: (1)主要联系:a.都是根据样本信息推断总体参数;b.都以抽样分布为理论依据,建立在概率论基础之上的推断;c.二者可相互转换,形成对偶性。 (2)主要区别:a.参数估计是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立;b.区间估计求得的是求以样本估计值为中心的双侧置信区间,假设检验既有双侧检验,也有单侧检验;c.区间估计立足于大概率,假设检验立足于小概率。

参数估计和假设检验习题解答

参数估计和假设检验习题 1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 0.05,α=26,n = 0:1600H μ=, 即,以95%的把握认为这批产品的指标 的期望值μ为1600. 2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数 的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。问,新工艺上浆率能否推广(α=0.05)? 解: 012112:, :,H H μμμμ≥< 3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)? 解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2 Z z α>,取0.0252 0.05, 1.96z z αα===, 100,n =由检验统计量 3.33 1.96Z = ==>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响. 4.有一批产品,取50个样品,其中含有4个次品。在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)? 解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==, 50,n =由检验统计量0.9733 Z = ==<1.65,接受H 0:p ≤0.05. 即, 以95%的把握认为p ≤0.05是成立的.

[实训]用Excel进行假设检验

[实训四]假设检验 一、简介: 假设检验是统计推断中的重要内容。以下例子利用Excel的正态分布函数NORMSDIST判断函数IF等,构造一张能够实现在总体方差已知情况下进行总体均值假设检验的Excel工作表。文档来自于网络搜索 二、操作步骤: 1 ?构造工作表。如图附-15所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。文档来自于网络搜索 2.为表格右边的公式计算结果定义左边的变量名。选定A3:B4,A6:B8, A10:A11,A13:A15和A17:B19单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。文档来自于网络搜索 图附-15 3?输入样本数据,以及总体标准差、总体均值假设、置信水平数据。如图附-16 所示。 4.为样本数据命名。选定C1:C11单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,得到如图附-16中

所示的计算结果。文档来自于网络搜索

图附-16 、结果说明: 如图附-16所示,该例子的检验结果不论是单侧还是双侧均为拒绝Ho假设。所以,根据样本的计算结果,在5%的显著水平之下,拒绝总体均值为35的假设。同时由单侧显著水平的计算结果还可以看出,在总体均值是35的假设之下,样本均值小于等于 31.4 的概率仅为0.020303562。文档来自于网络搜索 四、双样本等均值假设检验 (一)简介:双样本等均值检验是在一定置信水平之下,在两个总体方差相等的假设 之下,检验两个总体均值的差值等于指定平均差的假设是否成立的检验。我们可以直接使用在Excel数据分析中提供双样本等均值假设检验工具进行假设检验。以下通过一例说明双样本等均值假设检验的操作步骤。例子如下,某工厂为了比较两种装配方法的效率,分别组织了两组员工,每组9人,一组采用新的装配方法,另外一组采用旧的装配方法。18个员工的设备装配时间图附-17中表格所示。根据以下数据,是否有理由认为新的装配方法更节约时间?文档来自于网络搜索

第5章参数估计与假设检验练习题(精)

第5章 参数估计与假设检验练习题 1、设随机变量 X 的数学期望为 μ ,方差为 σ2 ,(X 1 ,X 2 ,···,X n )为X 的一个样本, 试比较 ))(1(1 2 ∑=-n i i X n E μ 与 ))(1(12∑=-n i i X X n E 的大小。 ( 前者大于后者 ) 2、设随机变量 X 与Y 相互独立,已知 EX = 3,EY = 4,DX = DY = σ2 ,试问:k 取何值时,Z = k ( X 2 - Y 2 ) + Y 2 是 σ2 的无偏估计 。 ( 16 / 7 ) 3、设正态总体 X ~ N ( μ , σ2 ) ,参数 μ ,σ2 均未知,( X 1 ,X 2 ,… ,X n )( n ≥ 2 ) 为简单随机样本,试确定 C ,使得 ∑-=+-=1 1212 )(?n i i i X X C σ 为 σ2 的无偏估计。 ( ) 1(21 -n ) 4、假设总体 X 的数学期望为 μ ,方差为 σ 2 ,),...,,(21n X X X 为来自总体 X 的一个样本, X 、S 2 分别为样本均值和样本方差,试确定常数 c ,使得 22cS X - 为 μ 2 的无偏估计量. ( 1 / n ) 5、设 X 1 ,X 2 是取自总体 N ( μ , σ2 ) ( μ 未知)的一个样本,试说明下列三个统计量 2114341?X X +=μ ,2122121?X X +=μ ,2132 1 31?X X +=μ 中哪个最有效。 ( 2?μ )

6、设某总体 X 的密度函数为:??? ??><=其它 03),(3 2θθθx x x f ,( X 1 ,X 2 ,… ,X n )为该 总体的样本, Y n = max ( X 1 , X 2 , … , X n ) ,试比较未知参数 θ 的估计量 X 3 4 与 n Y n n 31 3+ 哪个更有效? ( n > 1 时,n Y n n 31 3+ 更有效 ) 7、从某正态总体取出容量为10的样本,计算出 15010 1 =∑=i i x ,272010 1 2=∑=i i x 。求总体期望与 方差的矩估计 μ ? 和 2?σ 。 ( 15 ;47 ) 8、设总体 X 具有密度 ?? ? ??≤>=+-C x C x x C x f 01);()1 1(1???? ,其中参数 0 < ? < 1,C 为已知常数,且C > 0,从中抽得一样本 X 1 ,X 2 ,… ,X n ,求参数 ? 的矩估计量。 ( 1 - C /?X ,其中 ∑==n i i X n X 1 1 ) 9、设总体 X 服从( 0,? )上的均匀分布,其中 ? > 0 是未知参数,( X 1 ,X 2 ,… , X n )为简单随机样本,求出 ? 的矩估计量 ? ? ,并判断 ?? 是否为 ? 的无偏估计量。 ( 2?X ,其中 ∑==n i i X n X 1 1 ;是 ) 10、设( X 1 ,X 2 ,… ,X n )为总体 X 的一组样本,总体 X 密度函数为:

实验3 参数假设检验

实验编号:1四川师大SPSS实验报告2017 年3月27日 计算机科学学院2015级5班实验名称:参数假设检验 姓名:唐雪梅学号:2015110538 指导老师:__朱桂琼___ 实验成绩:___ 实验三参数假设检验 一.实验目的及要求 1.了解SPSS 特点结构操作 2.利用SPSS进行简单数据统计 二.实验内容 1.对12名来自城市的学生与14名来自农村的学生进行心理素质测验,他们的分数如下: 城市学生得分:4.75 6.40 2.62 3.44 6.50 5.30 5.60 3.80 4.30 5.78 3.76 4.15 农村学生得分:2.38 2.60 2.10 1.80 1.90 3.65 2.30 3.80 4.60 4.85 5.80 4.25 4.22 3.84 试分析农村学生与城市学生心理素质有无显著差别。 2、一汽车厂商声称其发动机排放标准的一个指标平均低于20个单位。在抽查了10台发动机之后,得到下面的排放数据:17.0、21.7、17.9、22.9、20.7、22.4、17. 3、21.8、24.2、25.4。目的是检验该申明是否正确 3. 用SPSS Samples数据文件“Employee data.sav”资料, 问:清洁工(jobcat=1)的受教育年数(Educational Level)与保管员(jobcat=2)和经理(jobcat=3)的受教育年数是否有显著差异?其中,显著性水平ɑ=0.05. ? 4. 用SPSS Samples数据文件“Employee data.sav”资料, 分析:美国企业现在工资(Current Salary)与过去工资(beginning Salary)是否有显著差异? 三、实验主要流程、基本操作或核心代码、算法片段(该部分如不够填写,请另加附页) 1.数据录入

实验六 参数估计与假设检验

实验六参数估计与假设检验 一、实验目的: 学习利用spss对数据进行参数估计与假设检验(参数估计,单样本、独立样本、配对样本T 检验)。 二、实验内容: 某助眠药物临床实验征集了20位被试,试验后得数据表包含被试的性别、身高、体重、用药前睡眠时长及用药后睡眠时长。试就该数据估计性别对未使用药物时睡眠时长的影响、检验被试总体身高与165差距是否显著、对不同性别的被试的身高和体重变量进行独立样本T 检验、并检验药物是否对被试有用。 三、实验步骤: 参数估计 1、定义变量并输入数据 2、选择菜单“分析→描述统计→探索”弹出“探索”对话框,将对话框左侧的变量框中“用药前睡眠时长”添加到因变量列表,“性别”添加到自变量列表 3、点击“统计量”,弹出“探索:统计量”对话框,勾选描述性并设置均值置信区间为95%,单击“继续” 4、单击“确定”按钮,得到输出结果,对结果进行分析解释。 单样本T检验 1、定义变量并输入数据 2、选择菜单“分析→比较均值→单样本T检验”,弹出“单样本T检验”对话框,将对话框左侧的变量框中的“身高”添加到右侧的“检验变量”框中,将检验值设为165; 3、点击“选项”,弹出“选项”对话框,将置信区间百分比设为95%,点击“继续” 4、单击“确定”按钮,得到输出结果,对结果进行分析解释。 独立样本T检验 1、定义变量并输入数据 2、选择菜单“分析→比较均值→独立样本T检验”,弹出“独立样本T检验”对话框,在对话框左侧的变量列表中选变量“身高”“体重”进入检验变量框,选变量“性别”进入控制列表框 3、点击定义组,在组1(1)中填写1,组2(2)中填写2,点击继续, 4、点击“确定”按钮,得到输出结果。对结果进行分析解释。 配对样本T检验 1.打开一份可用数据。 2.选择分析→比较平均值→配对样本T检验,选择一对配对样本“用药前睡眠时长”和“用 药后睡眠时长”,将“用药前睡眠时长”拖至“variable1”,“用药后睡眠时长”拖至“variable2”,单击“选项”设置置信区间为95%,点击“确定”查看自定义结果。

参数估计和假设检验

第五章参数估计和假设检验 本章重点 1、抽样误差的概率表述; 2、区间估计的基本原理; 3、小样本下的总体参数估计方法; 4、样本容量的确定方法; 本章难点 1、一般正态分布 标准正态分布; 2、t分布; 3、区间估计的原理; 4、分层抽样、整群抽样中总方差的分解。 统计推断:利用样本统计量对总体某些性质或数量特征进行推断。 两类问题:参数估计和假设检验 基本特点:(1)以随机样本为基础; (2)以分布理论为依据; (3)推断的只是一种可能的结果; (4)是归纳推理和演绎推理的结合。本章主要内容:阐述常用的几种参数估计方法。 第一节参数估计 一、参数估计的基本原理 两种估计方法

点估计 区间估计 1.点估计:以样本指标直接估计总体参数。 点估计优良性评价准则 (1)无偏性。估计量 的数学期望等于总体参数,即 , 该估计量称为无偏估计。 (2)有效性。当 为 的无偏估计时, 方差 越小, 无偏估计越有效。 (3)一致性。对于无限总体,如果对任意 ,有 ,则称 是 的一致估计。 (4)充分性。一个估计量如能完全地包含未知参数信息,即为 充分估计量。 2.点估计的缺点:不能反映估计的误差和精确程度 区间估计:利用样本统计量和抽样分布估计总体参数的可能区间 【例1】CJW 公司是一家专营体育设备和附件的公司,为了监控公司的服务质量, CJW 公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查,满意分数的标准差稳定在20分左右。最近一次对100名顾客的抽样显示,满意分数的样本均值为82分,试建立总体满意分数的区间。 抽样误差 抽样误差:一个无偏估计与其对应的总体参数之差的绝对值。 抽样误差 = (实际未知) 要进行区间估计,关键是将抽样误差E 求解。若 E 已知,则区间可表示为: 区间估计:估计未知参数所在的可能的区间。 区间估计优良性评价要求 θ θ??θ?θθ=?E θ?0> εθ?2)?(θθ-E 0)|?(|=≥-∞ →εθθn n P Lim n θ?θθαθθθ-=1)??(U L P <<[]E x x +-,E

实验五 抽样分布于区间估计之用Excel进行假设检验

实验五抽样分布于区间估计之用EXCEL进行假设检验一、实验目的及要求 熟练使用Excel进行参数的假设检验 二、实验内容 本章介绍的假设检验包括一个正态总体的参数检验和两个正态总体的参数检验。对于一个正态总体参数的检验,可利用函数工具和自己输入公式的方法计算统计量,并进行检验。 1)一个正态总体的参数检验 ?一个正态总体均值的假设检验:方差已知 【例1】假设某批矿砂10个样品中的镍含量,经测定为3.28,3.27,3.25,3.25,3.27,3.24,3.26,3.24,3.24,3.25(单位:%)。设总体服从正态分布,且方差为, 问:在下能否认为这批矿砂的平均镍含量为3.25。 解根据题意,提出检验的原假设和备择假设是 :;: 这是一个双侧检验问题,具体步骤如下: 步骤一:输入数据。 打开Excel工作簿,将样本观测值输入到A1:A10单元格中。 步骤二:假设检验。 1. 在B2中输入“=AVERAGE(A1:A10)”,回车后得到样本平均值3.255; 2. 在B3中输入总体标准差0.01; 3. 在B4中输入样本容量10; 4. 在B5中输入显著性水平0.01; 5. 在B6中输入“”,即输入“”,回车后得标准正态分布的的双侧分位数; “”, 6.在B7中输入检验统计量的计算公式: 回车后得统计量的值:。 步骤三:结果分析。 由于,未落入否定域内,所以接受原假设,即这批矿砂的平均镍含量为3.25 %。 ?一个正态总体均值的假设检验:方差未知 【例2】某一引擎生产商声称其生产的引擎的平均速度每小时高于公里。现将生产的20台引擎装入汽车内进行速度测试,得到行驶速度(单位:公里/小时)如下:

用Excel进行参数的假设检验

上机实习五用Excel进行参数的假设检验假设检验,就是先对总体的参数或分布形式提出假设,再利用样本数据信息来判断原假设是否合理,从而决定应接受还是拒绝原假设。 进行假设检验的一般步骤: (1)建立原假设H0和备择假设H1; (2)确定适当的检验统计量及其分布,并由给定样本值计算检验统计量的值; (3)根据显著性水平α,确定检验临界值和拒绝域; (4) 作出统计判断:由样本值确定概率P值,若P值≤α或者统计量的值落在拒绝域内,则拒绝原假设H0,接受备择假设H1,即差异有统计显著意义;若P值>α或者统计量的值不落在拒绝域内,,就接受原假设H0,即差异无统计显著意义。 我们将正态总体的参数检验的主要步骤和结果汇总于下表。 表5-1 正态总体参数的假设检验简表 [注] 式中2)1 ( )1 ( 2 1 2 2 2 2 1 1 - +- + - = n n S n S n S p ,特别地,当n1=n2时,22 2 2 1S S S p + = §5.1 单个正态总体的参数检验 一、单个正态总体均值Z检验 对于总体方差σ2已知时,进行单个正态总体均值的Z检验H0:μ=μ0,可利用Z检验统计量

n X Z /0 σμ-= 来进行。 在Excel 中,可利用函数ZTEST 进行,其格式为 ZTEST (array, a , sigma) 返回Z 检验的双侧概率P 值P{|Z|>z}, n a X Z /σ-= 其中 Array 为用来检验的数组或数据区域; a 为被检验的已知均值,即μ0; Sigma 为已知的总体标准差σ,如果省略,则使用样本标准差S 。 例如,要检验样本数据 3, 6, 7, 8, 6, 5, 4, 2, 1, 9 的总体均值是否等于4,如果已知其总体标准差为2,则只需计算 ZTEST({3, 6, 7, 8, 6, 5, 4, 2, 1, 9}, 4,2), 其概率值 P=0.0409951<0.05, 认为在显著性水平α=0.05下,总体均值与4有显著差异。 如果总体标准差未知,而用样本标准差S 替代时,计算 ZTEST({3, 6, 7, 8, 6, 5, 4, 2, 1, 9}, 4), 得到其概率值 P =0.090574>0.05, 认为在显著性水平α=0.05下,总体均值与4无显著差异。 二、单个正态总体均值t 检验 当总体方差σ2未知时,单个正态总体均值的t 检验对于大样本(n>30)问题可归结为上述Z 检验进行。对于小样本,则可利用函数和输入公式的方法计算t 统计量 n S X t 0μ-= 和P 值来进行t 检验。 例5.1 正常人的脉搏平均为72(次/min),现测得50例慢性四乙基铅中毒患者的脉搏(次/min )的均值是65.45,标准差是5.67,若四乙基铅中毒患者的脉搏服从正态分布,问四乙基铅中毒患者和正常人的脉搏有无显著性差异(α=0.05)? Excel 求解:应检验H 0:μ =72。其实现t 检验的步骤为: 1.按图5.1输入已知数据:单元格C4中输入总体均值72,单元格B7中输入样本容量25,单元格C7中输入样本均值65.45,单元格D7中输入样本标准差7.67; 2.计算t 统计量的值和P 值 (1) 在单元格G4中输入“=ABS(C7-C4)/D7*B7^0.5”求t 值; (2) 在单元格G5中输入“=B7-1”求自由度; (3) 在单元格G6中输入“=TDIST(G4,G5,1)”求单侧P 值; (4) 在单元格G7中输入“=TDIST(G4,G5,2)”求双侧P 值;

实验三用excel进行参数估计和假设检验

实验三用EXCEL进行参数估计和假设检验 一、用EXCEL进行区间估计 数据:某百货公司6月份各天的销售额数据如下:(单位:万元) 求在概率90%的保证下,顾客平均消费额的估计区间。 参数估计数据及结果: 从上面的结果我们可以知道,该月平均销售额的置信下限为,置信上限为。 二、用EXCEL进行假设检验 例题1:假设有A、B两个品牌的电池,现分别从这两个品牌电池中随机抽取10只进行检测,获得下表数据。它们的使用寿命方差相等为30,试问在的显著性水平下,可否认为两个品牌的平均使用寿命存在显著差异

据上,提出原假设:A、B两个品牌的电池使用寿命不存在显著差异, 备择假设:A、B两个品牌的电池使用寿命存在显著差异。 进行Z检验-双样本平均差检验: 得如下所示结果: 此次检验属于双尾检验,P=072 > 显著性水平,所以在的显著性水平下不能拒绝原假设,即可以认为两个品牌的平均使用寿命不存在显著性差异。 例题2:用某种药物治疗9例再生障碍性贫血患者,治疗前后患者血

红蛋白变化的数据如下表所示。问在的显著性水平下,能否认为这种药物至少可以使血红蛋白数量增加15个单位 提出原假设:这种药物不能使患者血红蛋白至少增加15个单位; 备择假设:这种药物可以使患者的血红蛋白至少增加15个单位。由于总体平均差已知,选用t-检验:平均值的成对二样本分析: 得结果如下:

由于显著性水平为大于P值,因此要拒绝原假设,即可以认为这种药物至少能使血红蛋白数量增加15个单位。 例题3:某研究所试验出一批新品种,想知道新品种产量是否比老品种产量有显著提高,随机抽取新老品种产量各9个,数据如下(单位:千克)。试问,在的显著性水平下,可否认为新品种比老品种的产量有显著提高 据条件,提出原假设:新品种比老品种产量没有显著提高; 备择假设:新品种比老品种产量显著提高。

参数估计和假设检验案例(精)

参数估计和假设检验案例 案例一:工艺流程的检测 某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的 800个观测值组成。这些数据的样本标准差为 0.21;因为有如此多的样本数据,因此,总体标准差被假设为 0.21。然后,该公司建议:持续不断地定期抽取容量为 30的随机样本以对工艺流程进行检测。 通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。设计规格要求工艺流程的均值为 12,该公司建议采用如下形式的假设检验。 H 0 :12 H 1 :12 只要 H 0被拒绝,就应采取纠正措施。 下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。

μ=μ≠ 问题: 1、对每个样本在 0.01的显著性水平下进行假设检验,并且确定,如果需要

Z0.005=2.58 2、 4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平, 哪种错误或误差将增加? 显著性水平增加,置信区间减小,误差减小。 案例二:计算机辅助教学会使完成课程的时间差异缩小吗? 某课程引导性教程采用一种个性化教学系统, 每位学生观看教学录像, 然后给以程式化的教材。每位学生独立学习直至完成训练并通过考试。人们关心的问题是学生完成训练计划的进度不同。有些学生能够相当快地完成程式化教材, 而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。 建议的替代系统是使用计算机辅助教学。在这种方法中, 所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。μ= 在整个教程的自我训练过程中,由计算机指导学生独立操作。 为了比较建议的和当前的教学方法, 刚入学的 122名学生被随机地安排到这两种教学系统中。 61名学生使用当前程式化教材, 而另外 61名学生使用建议的计算机辅助方法。记录每位学生的学习时间(小时 ,如表所示。

第五章参数估计和假设检验Stata实现

第五章参数估计和假设检验的Stata实现本章用到的Stata命令有 例5-1 随机抽取某地25名正常成年男子,测得其血红蛋白含量如下: 146 7 125 142 7 128 140 1 7 144 151 117 118 该样本的均数为137.32g/L,标准差为10.63g/L,求该地正常成年男子血红蛋白含量总体均数的95%可信区间。 数据格式为

计算95%可信区间的Stata命令为: 结果为 该地正常成年男子血红蛋白含量总体均数的95%可信区间为(132.93~141.71) 例5-2 某市2005年120名7岁男童的身高X=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。 在Stata中有即时命令可以直接计算仅给出均数和标准差时的可信区间。 结果为: 该市7岁男童总体均数90%的可信区间(122.90~124.34)。 例5-3 为研究铅暴露对儿童智商(IQ)的影响,某研究调查了78名铅暴露(其血铅水平≥40 g/100ml)的6岁儿童,测得其平均IQ为88.02,标准差为12.21;同时选择了78名铅非暴露的6岁儿童作为对照,测得其平均IQ为92.89,标准

差为13.34。试估计铅暴露的儿童智商IQ的平均水平与铅非暴露儿童相差多少,并估计两个人群IQ的总体均数之差的95%可信区间。 本题也可以应用Stata的即时命令: 结果: 差值为4.86,差值的可信区间为0.81~8.90。 例5-4 为研究肿瘤标志物癌胚抗原(CEA)对肺癌的灵敏度,随机抽取140例确诊为肺癌患者,用CEA进行检测,结果呈阳性反应者共62人,试估计肺癌人群中CEA的阳性率。 Stata即时命令为 结果为 肺癌人群中CEA的阳性率为44.28%,可信区间为35.90%~52.82%。 例5-5 某医生用A药物治疗幽门螺旋杆菌感染者10人,其中9人转阴,试估计该药物治疗幽门螺旋杆菌感染者人群的转阴率。 Stata即时命令为

第六章参数估计和假设检验(精)

第六章参数估计和假设检验 教学目的及要求:了解参数的点估计、区间估计的含义,掌握区间估计的几个概念,包括置信水平、置信区间、小概率事件,熟练掌握参数区间估计的计算方法,了解不同抽样组织形式下的参数估计,掌握参数估计中样本量的确定。了解假设检验的原假设和备择假设的含义,假设检验的两类错误,掌握总体均值的检验方法。 本章重点与难点:区间估计的计算与总体均值的假设检验方法。 计划课时:授课6课时;技能训练2课时。 授课特点:案例教学 第一节点估计和区间估计 一、总体参数估计概述 ?1、总体参数估计定义 ?就是以样本统计量来估计总体参数,总体参数是常数,而统计量是随机变量。 ?2、参数估计应满足的两个条件 二、参数的点估计 ?用样本的估计量直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计 例如:根据一个抽出的随机样本计算的平均分数为80分,我们就用80分作为全班考试成绩的平均分数的一个估计值,这就是点估计。 再例如,要估计一批产品的合格率,根据抽样结果合格率为96%,将96%直接作为这批产品合格率的估计值,这也是点估计 三、参数的区间估计 (一)参数的区间估计的含义 ?区间估计:计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。

(二)有关区间估计的几个概念 置信水平 1. 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 2. 表示为 (1 - α% ) α 为是总体参数未在区间内的比例 3. 常用的置信水平值有 99%, 95%, 90% 相应的显著性水平α 为0.01,0.05,0.10 置信区间 1. 由样本统计量所构造的总体参数的估计区间称为置信区间 2. 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 3. 用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值 我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个 4. 由样本均值的抽样分布可知,在重复抽样或无限总体抽样的情况下,样本均值的数学期望等于总体均值, 5. 样本均值的标准差为 由此可知样本均值落在总体均值μ的两侧各为一个抽样标准差范围内的概率为0。6873 落在总体均值两个抽样标准差范围内的概率为0。9545 落在总体均值三个抽样标准差范围内的概率为0。9973 影响区间宽度的因素 1.总体数据的离散程度,用 σ 来测度 2.样本均值标准差 3.置信水平 (1 - α),影响 z 的大小 评价估计量的标准 x n x σ σ=

参数估计和假设检验案例

参数估计和假设检验案例 案例一:工艺流程的检测 某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的800个观测值组成。这些数据的样本标准差为0.21;因为有如此多的样本数据,因此,总体标准差被假设为0.21。然后,该公司建议:持续不断地定期抽取容量为30的随机样本以对工艺流程进行检测。 通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。设计规格要求工艺流程的均值为12,该公司建议采用如下形式的假设检验。 μ=μ≠ H0 :12 H1 :12 只要H0被拒绝,就应采取纠正措施。 下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。

问题: 1、对每个样本在0.01的显著性水平下进行假设检验,并且确定,如果需要 Z0.005=2.58 2、 μ= 4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平, 哪种错误或误差将增加? 显著性水平增加,置信区间减小,误差减小。 案例二:计算机辅助教学会使完成课程的时间差异缩小吗? 某课程引导性教程采用一种个性化教学系统,每位学生观看教学录像,然后给以程式化的教材。每位学生独立学习直至完成训练并通过考试。人们关心的问题是学生完成训练计划的进度不同。有些学生能够相当快地完成程式化教材,而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。 建议的替代系统是使用计算机辅助教学。在这种方法中,所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。

参数估计和假设检验

攀 枝 花 学 院 实 验 报 告 实验课程:数学实验及模型 实验项目:参数估计和假设检验 实验日期:2010.12.30 系:计算机 班级: 姓名: 学号: 同组人: 指导教师: 成绩: 【实验目的】: 1 理解参数估计的基本概念、原理和方法; 2 理解正态总体的均值、方差的区间估计的方法; 3 了解假设检验的基本概念、原理和方法; 4 掌握用Matlab 进行参数估计; 5 掌握用Matlab 进行假设检验. 【实验内容:】 1 参数估计的基本概念、原理和方法; 2 假设检验的基本概念、原理和方法; 3 利用Matlab 进行参数估计和假设检验. 【实验原理:】 1 参数估计:参数估计包括点估计和区间估计 (1)点估计:点估计法主要包括矩估计和最大似然估计. 点估计的常用公式如下: ?x μ =,22?s σ= (2)区间估计:区间估计就是根据样本来估计其分布函数中未知参数的范围区间,并使区 间包含未知参数的概率≥1a -,1a -称为置信水平,估计区间称为置信区间. 总体均值μ、标准差σ的区间估计(置信水平1α-)的常用公式如下: ① σ已知时,μ 的置信区间为:2 x z α ± σ未知时,μ 的置信区间为:()2 1x n α± - ② 2σ的置信区间为: ()()()()2 222 12211,11n S n S n n ααχχ- ??-- ? ?-- ??? 其中,2 z α、()2 1t n α-、()2 2 1n αχ-分别为()0,1N 、()1t n -、()21n χ-分布的上 2 α分位点. (3)Matlab ,常见分布函数中参数估计的点估计和区间估计函数见表3-4.

实验三用EXCEL进行参数估计和假设检验

实验三用E X C E L进行参数估计和假设检验 一、用EXCEL进行区间估计 数据:某百货公司6月份各天的销售额数据如下:(单位:万元) 求在概率90%的保证下,顾客平均消费额的估计区间。 参数估计数据及结果: 从上面的结果我们可以知道,该月平均销售额的置信下限为,置信上限为。 二、用EXCEL进行假设检验 例题1:假设有A、B两个品牌的电池,现分别从这两个品牌电池中随机抽取10只进行检测,获得下表数据。它们的使用寿命方差相等为30,试问在的显着性水平下,可否认为两个品牌的平均使用寿命存在显着差异 据上,提出原假设:A、B两个品牌的电池使用寿命不存在显着差异, 备择假设:A、B两个品牌的电池使用寿命存在显着差异。 进行Z检验-双样本平均差检验: 得如下所示结果: 此次检验属于双尾检验,显着性水平,所以在的显着性水平下不能拒绝原假 设,即可以认为两个品牌的平均使用寿命不存在显着性差异。 例题2:用某种药物治疗9例再生障碍性贫血患者,治疗前后患者血红蛋白 变化的数据如下表所示。问在的显着性水平下,能否认为这种药物至少可以 使血红蛋白数量增加15个单位 提出原假设:这种药物不能使患者血红蛋白至少增加15个单位; 备择假设:这种药物可以使患者的血红蛋白至少增加15个单位。 由于总体平均差已知,选用t-检验:平均值的成对二样本分析: 得结果如下: 由于显着性水平为大于P值,因此要拒绝原假设,即可以认为这种药物至少 能使血红蛋白数量增加15个单位。

例题3:某研究所试验出一批新品种,想知道新品种产量是否比老品种产量有显着提高,随机抽取新老品种产量各9个,数据如下(单位:千克)。试问,在的显着性水平下,可否认为新品种比老品种的产量有显着提高 据条件,提出原假设:新品种比老品种产量没有显着提高; 备择假设:新品种比老品种产量显着提高。 得出t检验:双样本异方差分析结果如下: 在显着性水平为的单侧检验下,P值为0

参数估计和假设检验习题解答

参数估计和假设检验习题 1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600 解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2 Z z α>,取0.05,α=26,n = 0.0250.9752 1.96z z z α===, 由检验统计量 1.25 1.96Z = ==<,接受0:1600H μ=, 即,以95%的把握认为这批产品的指标的期望值μ为1600. 2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为根,各台布机断头数的标准差为根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为根,标准差为根。问,新工艺上浆率能否推广(α= 解: 012112:, :,H H μμμμ≥< ( 3.某电器零件的平均电阻一直保持在Ω,改变加工工艺后,测得100个零件的平均电阻为Ω,如改变工艺前后电阻的标准差保持在Ω,问新工艺对此零件的电阻有无显著影响(α= 解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=,拒绝域为2 Z z α>,取0.0252 0.05, 1.96z z αα===, 100,n = 由检验统计量 3.33 1.96Z = ==>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响. 4.有一批产品,取50个样品,其中含有4个次品。在这样情况下,判断假设H 0:p ≤是否成立(α= 解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==, 50,n = 由检验统计量0.9733Z = ==<,接受H 0:p ≤. 即, 以95%的把握认为p ≤是成立的. 5.某产品的次品率为,现对此产品进行新工艺试验,从中抽取4O0件检验,发现有次品56件,能否认为此项新工艺提高了产品的质量(α= 解: 01:0.17, :0.17,H p H p ≥<采用非正态大样本统计检验法,拒绝域为Z z α<-,400,n = ^ 0.950.05, 1.65z α=-=-,由检验统计量 400 1.5973i x np Z -= = =-∑>, 接受0:0.17H p ≥, 即, 以95%的把握认为此项新工艺没有显著地提高产品的质量. 6.从某种试验物中取出24个样品,测量其发热量,计算得x =11958,样本标准差s =323,问以5%的显著水平是否可认为发热量的期望值是12100(假定发热量是服从正态分布的)

[实训]用Excel进行假设检验

[实训四]假设检验 一、简介: 假设检验是统计推断中的重要内容。以下例子利用Excel的正态分布函数NORMSDIST、判断函数IF 等,构造一张能够实现在总体方差已知情况下进行总体均值假设检验的Excel 工作表。 二、操作步骤: 1.构造工作表。如图附-15 所示,首先在各个单元格输入以下的内容,其中左边是变量名,右边是相应的计算公式。 2. 为表格右边的公式计算结果定义左边的变量名。选定A3:B4,A6:B8, A10:A11,A13:A15 和A17:B19 单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“最左列”选项,然后点击“确定”按扭即可。 图附-15 3.输入样本数据,以及总体标准差、总体均值假设、置信水平数据。如图附-16 所示。 4.为样本数据命名。选定C1:C11 单元格,选择“插入”菜单的“名称”子菜单的“指定”选项,用鼠标点击“首行”选项,然后点击“确定”按扭,得到如图附-16 中所示的计算结果。

图附-16 三、结果说明: 如图附-16 所示,该例子的检验结果不论是单侧还是双侧均为拒绝Ho 假设。所以,根据样本的计算结果,在5%的显著水平之下,拒绝总体均值为35 的假设。同时由单侧显著水平的计算结果还可以看出,在总体均值是35 的假设之下,样本均值小于等于31.4 的概率仅为0.020303562。 四、双样本等均值假设检验 (一)简介:双样本等均值检验是在一定置信水平之下,在两个总体方差相等的假设之下,检验两个总体均值的差值等于指定平均差的假设是否成立的检验。我们可以直接使用在Excel 数据分析中提供双样本等均值假设检验工具进行假设检验。以下通过一例说明双样本等均值假设检验的操作步骤。例子如下,某工厂为了比较两种装配方法的效率,分别组织了两组员工,每组9 人,一组采用新的装配方法,另外一组采用旧的装配方法。18个员工的设备装配时间图附-17 中表格所示。根据以下数据,是否有理由认为新的装配方法更节约时间?

参数估计与假设检验

参数估计与假设检验 一、单选题 1.样本平均数的可靠性和样本的大小(D)。 A.没有一定关系B.成反比C.没有关系D.成正比 2.区间估计依据的原理是(B)。A.概率论B.样本分布理论c.小概率事件D.假设检验 3.一个好的估计量应具备的特点是(B)。 A.充分性、必要性、无偏性、一致性B.充分性、无偏性、一致性、有效性C.必要性、无偏性、一致性、有效性D.必要性、充分性、无偏性、有效性 4.用从总体抽取的一个样本统计量作为总体参数的估计值称为(B)。 A.样本估计B.点估计C.区间估计D.总体估计 5.总体分布正态,总体方差σ2已知时,从总体中随机抽取容量为25的小样本,用样本平均数估计总体平均数的置信区间为(A)。 6.理论预期实验处理能提高某种实验的成绩。一位研究者对某一研究样本进行了该种实验处理,结果未发现处理显著的改变实验结果,下列哪一种说法是正确的?(D) A.本次实验中发生了I类错误B.本次实验中发生了Ⅱ类错误C.需要多次重复实验,严格设定统计决策的标准,以减少I类错误发生的机会D.需要改进实验设计,提高统计效力,以减少Ⅱ类错误发生的机会 7.假设检验中的第二类错误是(C)。 A.原假设为真而被接受B.原假设为真而被拒绝C.原假设为假而被接受D.原假设为假而被拒绝 8.实际工作中,两均数作差别的统计检验时要求数据近似正态分布,以及(C)。 A.两样本均数相差不太大B.两组例数不能相差太多C.两样本方差相近D.两组数据标准误相近 9.在假设检验中,α取值越大,称此假设检验的显著性水平(B)。 A.越高B.越低C.越明显D.越不明显 10.假设检验中两类错误的关系是(D)。

相关文档
相关文档 最新文档