文档库 最新最全的文档下载
当前位置:文档库 › 参数估计

参数估计

参数估计
参数估计

1. 简述评价估计量的标准。

答案:

(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。

(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。知识点:参数估计

难易度:1

2. 为估计一批产品平均使用寿命的置信区间,从该批产品抽取50件作为样本进行估计,估计时采用的分布是什么?请说明理由。如果随机抽取20件作为样本,估计时采用的分布是什么?假定条件是什么?

答案:

(1)抽取50件作为样本时,应采用采用正态分布进行估计。因为n=50属于大样本,此时,样本均值经标准化后服从标准正态分布。

(2)抽取20件作为样本时,应采用采用t分布进行估计。因为n=20属于小样本,由于总体方差未知,样本均值经标准化会服从自由度为n-1 的t分布。此时的估计,假定该批产品的平均使用寿命服从正态分布。

知识点:参数估计

难易度:3

3. 从全校学生中随机抽取200人组成一个随机样本,根据95%的置信水平,估计出全校学生平均月生活费支出为500元~600元。(1)这里的95%的置信水平是指什么?(2)全校学生平均生活费支出的实际值是否在这一区间内?为什么?

答案:

(1)这里95%的置信水平是指:重复抽样所有样本量为200的样本,按相同的方法进行估计,在所构建的所有置信区间中,约有95%的置信区间包含全校学生平均月生活费支出的实际值。

(2)全校学生平均生活费支出的实际值是否在这一区间内我们并不知道。因为这个区间是根据目前的这个样本构建出来的,而这个区间又是一个常数区间。我们并不知道它是包含实际值的95%区间中的一个,还是不包含实际值的5%的区间中的一个。知识点:参数估计

难易度:3

4. 影响样本量大小的因素有哪些?简述这些因素与样本量的关系。

答案:

(1)影响样本量大小的因素有所要求的置信水平、总体方差和估计时所希望的估计误差。

(2)在其他条件不变的情况下,样本量的大小与置信水平成正比,置信水平越大,所需的样本量也就越大;样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;样本量与估计误差的平方成反比,即允许的估计误差的平方越大,所需的样本量就越小。

知识点:参数估计

难易度:2

计算分析题:

1. 现从一批零件中随机抽取16只,测得其长度(单位:厘米)如下:

(1)如果要使用t分布构建零件平均长度的置信区间,基本的假定条件是什么?(2)构建该批零件平均长度的95%的置信区间。

(3)能否确定该批零件的实际平均长度就在你所构建的区间内?为什么?

(注:)

答案:

(1)假定该批零件的长度服从正态分布。

(2)根据样本数据得:

由于n=16为小样本,且总体标准差未知,所以用分布构建零件平均长度的置信区间。

即该批零件平均长度的95%的置信区间为(14.77,15.03)。

(2)不能确定。因为这个95%的置信区间是根据目前的样本计算的,是一个常数区间,实际零件长度要么在这一区间内,要么不在这一区间内,但是否在其中并不知道。

知识点:参数估计

难易度:3

2. 为了解某银行营业厅办理某业务的办事效率,调查人员观察了该银行营业厅办理该业务的柜台办理每笔业务的时间,随机记录了25名客户办理业务的时间,测得平

均办理时间为分钟,样本标准差为s=4分钟。

(1)根据95%的置信水平,求该银行为客户办理业务所需平均时间的置信区间。(2)若随机观测的是40名客户,而观测的平均数标准差不变,则95%的置信区间又是多少?

(3)在上述(1)估计中,有什么假定?

(注:,)

答案:

(1)已知有,,,。由于是小样本,且总体方差未知,所以用t分布构置信区间:

即银行为客户办理业务所需平均时间的95%的置信区间为10.35分钟~13.65分钟之间。

(2)若样本量为,为大样本,所以用正态分布分布构置信区间:

即银行为客户办理业务所需平均时间的95%的置信区间为10.43分钟~13.57分钟之间。

(3)在(1)估计中,假定该银行办理每笔业务所需的时间服从正态分布。

知识点:参数估计

难易度:2

3. 从一批零件中随机抽取36个,测得其平均长度为150厘米,标准差为2.4厘米。

(1)若置信水平为95%,确定该种零件平均长度的置信区间。

(2)在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。

(3)若其他条件不变,要求将估计误差E=0.5,应抽取多少个零件进行检查?

(注:)

答案:

(1)已知,,,。由于是大样本,所以用正态分布分布构置信区间:

即该种零件平均长度的95%的置信区间在149.216厘米~150.784厘米之间。

(2)使用了中心极限定理。该定理证明,从均值为、方差为的总体中,抽取

样本量为n的随机样本,当n充分大时(通常要求),样本均值的分布近似服

从均值为、方差为的正态分布。

(3)应抽取的样本量为:

知识点:参数估计

难易度:3

4. 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量经分组后如下:

已知食品包重服从正态分布,要求:

(1)确定该种食品平均重量的95%的置信区间。

(2)如果规定食品重量低于100克属于不合格,确定该批食品合格率的95%的置信区间。

(注:)

答案:

(1)已知,n=36。根据样本数据计算得:

由于n=50为大样本,所以用正态分布分布构建食品平均重量的置信区间。

即该食品平均重量的95%的置信区间在100.87克~101.77克之间。

(2)根据样本数据计算得:。总体比例的置信区间为:

即该食品平均重量的95%的置信区间在82%~98%克之间。

知识点:参数估计

难易度:2

5. 一家调查公司进行一项调查,其目的是为了了解某市电信营业厅大客户对该电信的服务的满意情况。调查人员随机访问了100名去该电信营业厅办理业务的大客户,发现受访的大客户中有35名认为营业厅现在的服务质量比以前好。

(1)在95%的置信水平下,对大客户中认为营业厅现在的服务质量比以前好的比例进行区间估计。

(2)如果要求估计去查不超过5%,在相同条件下,应抽取多少大客户进行调查?

答案:

(1)已知n=100,=1.96,根据抽样结果计算出的样本比例为。

由于,所以总体比例的置信区间为:

即大客户中认为营业厅现在的服务质量比以前好的比例的95%的置信区间在26%~4 4%之间。

(2)由于,所以应抽取的大客户数量为:

知识点:参数估计

难易度:2

6. 某公司为研究职工上班从家里到单位的时间,抽取了由16个人组成的一个随机样本,他们自驾车上班到单位的时间(单位:分钟)如下:

假定该公司职工自驾车上班的时间服从正态分布,在99%的置信水平下,估计:(1)该公司职工自驾车上班平均时间的置信区间。

(2)如果已知总体标准差为20分钟,估计该公司职工自驾车上班平均时间的置信区间。

(3)如果已知总体标准差为20分钟,若要求估计误差不超过10分钟,应抽取多少职工进行调查?

(注:,)

答案:

(1)已知n=16。根据样本数据计算得:

由于n=16为小样本,且总体方差未知,所以用t分布构建置信区间。

即该公司职工自驾车上班平均时间的95%的置信区间在22.74分钟~48.26分钟之间。(2)由于n=16为小样本,但总体标准差已知,所以用正态分布分布构建置信区间。

即该公司职工自驾车上班平均时间的95%的置信区间在23.39分钟~47.61分钟之间。(3)由于E=10,所以应抽取的职工数为:

知识点:参数估计

难易度:3

7. 某居民小区随机抽取16户居民,调查显示,在2008年北京第29届奥运期间,每个家庭每天观看电视的平均时间为7.5小时,样本标准差为2小时。

(1)在90%的置信水平下,对家庭每天平均看电视时间进行区间估计。

(2)若抽取100个家庭,得到每天看电视时间超过10小时的家庭为5%,在90%的置信水平下,求每天看电视时间超过10小时的家庭比例的置信区间。

(3)若要求估计误差不超过3%,估计每天看电视时间超过10小时的家庭比例90%的置信区间时,需调查多少户才能满足要求?

(注:,)

答案:

(1)已知n=16,,s=2。

由于总体方差未知时,由小样本的区间估计公式得:

即该社区平均每个家庭每天看电视的90%的置信区间为6.62小时到8.38小时。

(2)已知n=100,p=5%,总体比例的置信区间为:

每天看电视时间超过10小时的家庭比例的90%的置信区间为1.4%到8.6%。

(3)由于估计误差E=0.03,所以应抽取的家庭数为:

知识点:参数估计

难易度:3

第六章 从本统计量估计整体参数

第六章从样本统计量估计整体参数 学习要点 第一节点估计 第二节区间估计 第三节总体均数的估计 第四节其他总体参数的估计 本章小结 学习要点 掌握推断统计的内容和前提条件 理解统计估计的原理,掌握统计估计的方法 能够运用总体均数估计的方法解决实际问题 第一节点估计 当总休平均数或比例未知时,我们可以直接把样本平均数或比例用作它的估计值。由于样本统计量为数轴上的一个点,所以称为“点估计值” 。 科学研究不仅需要对事物特征作出一般性的描述,而且更要根据样本提供的信息去推测相应总体的情况,统计内容中的推断统计则是专门研究如何用样本去推断总体的方法。 一、什么是推断统计 一般情况下,样本统计量是不会和相应的总体参数完全相同的,两者多少都会有一定的差距,但是如果用无限多个样本的统计量来估计总体参数,平均估计误差将会等于0。 具有这一特征的统计量就无偏估计值。 例如,用样本平均数估计总体平均数时,总会有些误差,在有些样本中,它可能会大于总体平均数,而在另一些样本中它又可能会小于总体平均数,而且对于不同的样本估计误差的大小也是不同的,但是无限多个样本平均数的平均估计误差为0。换句话说,样本平均数的平均数将会等于总体平均数。 推断统计就是指由样本资料去推测相应总体情况的理论与方法。也就是由部分推全体,

由已知推未知的过程。 推断统计根据推测的性质不同而分为参数估计和假设检验两方面。参数估计(parameter estimation)就是用样本去估计相应总体的状况,其具体方法有点估计和区间估计。假设检验(hypothesis test)的主要用途是对出现差异的两个或多个现象或事物进行真实性情况的检验,又称统计检验(statistical test)。在检验中又根据是否需要依赖于对总体分布形态和总体参数检验的假设而分为参数检验和非参数检验。参数检验法在检验时对总体分布和总体参数 (μ,2 σ)有所要求,而非参数检验法在检验时则不依赖于总体的分布形态和总体参数的 情况。参数检验法主要有Z检验、t检验、F检验和q检验等,非参数检验(non-parameter test)主要有χ2检验、符号检验法、符号等级检验法、秩和检验、中位数检验等。 二、统计推断的基本问题 没有系统学过统计学的人往往有一种误解,以为只要搜集了数据资料,就可以用统计方法来处理数据。殊不知统计学是建立在概率论基础上的,而概率论是专门研究随机事件的。因此,在做统计推断之前必须考虑你所获得的资料是否能够用统计的方法来分析。通常,进行统计推断时应首先考虑以下三个方面的问题。 一是关于统计推断的基本前提。统计推断的前提是随机抽样。因此当我们利用样本统计量进行总体推断时,首先要了解抽样的方式,即了解样本是如何得来的,是随机抽取的,还是人为抽取的。随机抽样的均等性和独立性,避免了入样个体只来自总体的某一部分,从而也就避免了样本的偏倚性。可以说,样本的抽取直接关系着统计研究结果的科学性。 二是样本的规模与样本的代表性。抽样研究需要有一定的样本规模,而样本要具有代表性也需要有一定的样本规模来保证,以减少抽样误差。一般来说,在其它条件相同的情况下,样本越小,抽样的误差越大;样本越大,抽样的误差就越小。当样本增至包括总体的全部个体(即N n=)时,抽样的误差为0。因此,只要条件允许,尽可能地采用大样本,以增强样本对总体的代表性和可靠性。值得注意的样本规模和样本代表性是建立在随机抽样基础之上的,否则即使样本再大也是无意义的。 三是统计推断的错误要有一定限度。统计推断是在特定的时间、空间和条件下得出的结论,加上抽样误差的影响,在用样本推测总体时总会犯一定的错误。这种错误在统计推断中是不可避免的,也是允许的。不过这种错误要有一定的限度,超过一定限度的错误是不允许的。统计推断中允许犯错误的限度是用小概率事件来表示。 第二节区间估计 一、参数估计的定义 所谓参数估计就是根据样本统计量去估计相应总体的参数。譬如我们可以根据样本均数(X)去估计总体的均数(μ),根据样本方差(2S)去估计总体方差(2 σ),根据样本的相关系数(r)去估计总体相关系数(ρ)等等。

参数估计精讲及经典案例

第21讲 参数估计习题课 教学目的:1. 通过练习使学生进一步掌握矩估计和最大似然估计的计算方法; 2. 通过练习使学生理解无偏性和有效性对于评价估计量标准的重要性; 3. 通过练习使学生进一步掌握正态总体参数的区间估计和单侧置信限。 教学重点:矩估计和最大似然估计,无偏性与有效性,正态总体参数的区间估计。 教学难点:矩估计,最大似然估计,正态总体参数的区间估计。 教学时数:2学时。 教学过程: 一、知识要点回顾 1. 矩估计 用各阶样本原点矩n k i i 1 1x n k V ==∑ 作为各阶总体原点矩k EX 的估计,1,2,k = 。若有参 数2g(,(),,)k E X E X E X θ= ()(),则参数θ的矩估计为 n n n 2i=1i=1i=1 111?(,,,)k i i i X X X n n n θ=∑∑∑ 。 2. 最大似然估计 似然函数1()(;)n i i L f x θθ==∏,取对数ln[()]L θ,从 ln() d d θθ =0中解得θ的最大似然估计θ?。

3. 无偏性,有效性 当θθ=?E 时,称θ?为θ的无偏估计。 当21?D ?D θθ<时,称估计量1?θ比2 ?θ有效。 5. 两个正态总体均差值的区间估计 当21σ和2 2σ已知时,12μμ-的置信水平为1α-的置信区间为 当21σ和22σ未知时,12μμ-的置信水平为1α-的置信区间为 二 、典型例题解析 1.设,0()0, 0x e x f x x θθ-?>=?≤? ,求θ的矩估计。

解 ,0 dx xe EX x ?+∞ -=θθ设du dx u x x u θ θ θ1 ,1 ,= = = 则0 0011 1()0()u u u EX ue du ue e du e θθθθ+∞+∞--+∞ --+∞????==-+=+-??? ?????=θ 1 故1EX θ= ,所以x 1?=θ 。 2. 设总体X 在[]b a ,上服从均匀分布,求a 和b 的矩估计。 解 由均匀分布的数学期望和方差知 1 ()()2 E X a b =+ (1) 21()()12 D X b a =- (2) 由(1)解得a EX b -=2,代入(2)得2)22(121a EX DX -=, 整理得2)(3 1 a EX DX -=,解得 ()()a E X b E X ?=?? =?? 故得b a ,的矩估计为 ??a x b x ?=-??=+?? 其中∑=-=n i i x x n 1 22 )(1?σ 。 3.设总体X 的密度函数为(;)! x e f x x θ θθ-= ,求θ的最大似然估计。 解 设)!)...(!)(!(),()(2111n n x n i i x x x e x f L n i i θ θ θθ-=∑===∏,则 1 1 ln ()()ln ln(!)n n i i i i L x n x θθθ===--∑∑ 11 ln ()11?0, n n i i i i d L x n x x d n θθθθ===-===∑∑

参数估计教程

目录 参数估计 ________________________________________________________________________________ 3 第一节抽样推断的基本概念与原理 ________________________________________________________ 3 一、抽样推断的特点和作用 _____________________________________________________________ 3 二、重复抽样与不重复抽样 _____________________________________________________________ 4 三、抽样误差与抽样平均误差 ___________________________________________________________ 4 四、抽样推断的理论基础 _______________________________________________________________ 6 五、参数估计的基本步骤 _______________________________________________________________ 7 第二节参数估计中的点估计 ______________________________________________________________ 7 一、总体参数的点估计 _________________________________________________________________ 7 二、点估计量的优良标准 _______________________________________________________________ 7 第三节参数估计中的区间估计 ____________________________________________________________ 8 一、参数估计的精度与抽样平均误差计算 _________________________________________________ 8 二、参数估计的误差范围与概率度 _______________________________________________________11 三、总体参数的区间估计 ______________________________________________________________ 12 第四节抽样组织方式及其参数估计 _______________________________________________________ 13 一、简单随机抽样 ____________________________________________________________________ 13 二、分层抽样 ________________________________________________________________________ 14 三、机械抽样 ________________________________________________________________________ 16 四、整群抽样 ________________________________________________________________________ 16 第五节必要样本容量的确定 _____________________________________________________________ 17 一、平均数的必要样本容量 ____________________________________________________________ 17 二、成数的必要样本容量 ______________________________________________________________ 18 三、影响必要样本容量的因素 __________________________________________________________ 19 习题 ___________________________________________________________________ 错误!未定义书签。

状态估计系统

状态估计系统 发表时间:2016-04-01T16:33:01.573Z 来源:《基层建设》2015年28期供稿作者:左培玲 [导读] 安徽省铜陵市供电公司状态估计系统是PAS系统的基础,是在SCADA系统提供的实时信息和网络拓扑的基础上对分析结果及不良。左培玲 安徽省铜陵市供电公司 244000 摘要:随着电力调度的不断发展,对电网调度自动化系统的要求越来越高,对“四遥”数据的精准率要求也越来越高,因此电力调度自动化状态估计合格率的稳定已成为国家电网公司地区电网运行情况的主要考核指标。对于影响状态估计遥测合格率的根源、以及提高状态估计合格率的改进措施的研究变的刻不容缓。 引言: 状态估计系统是PAS系统的基础,是在SCADA系统提供的实时信息和网络拓扑的基础上对分析结果及不良、错误数据进行粗检和辨识,用估计算法来检测与剔除坏数据,提高数据精度及数据前后一致性,为PAS系统提供了完整可靠的数据和信息,为网络分析提供实时潮流数据,其结果可直接影响潮流计算、静态安全分析、电压无功优化、短路电流计算等电网调度的智能化分析与决策。 关键词:电力调度自动化;状态估计;状态估计遥测合格率 一:状态估计遥测合格率在电网中的地位 状态估计系统是PAS系统的基础,是Scada系统的的核心功能之一,是在冗余、可观测遥测数据基础上的在线实用的高级软件,合理使用状态估计软件可实时检查发现电网的网络拓扑错误、参数填写错误、量测数据错误。同时为PAS系统其他功能的应用提供准确支持,并且提醒自动化运维人员及时处理发生缺陷、故障,为电网安全、经济调度、网架优化等提供保障。 二:影响状态估计合格率的原因分析 结合铜陵供电公司现状分析状态估计合格率影响因素较大大的有以下几点: 1:变电站部分现场采集装置、远动装置运行年限长,装置运行环境差,降低了自身性能导致采集数据存在误差; 2:公司35kV变电站相对处于偏远地区,基本都是单通道运行,网架结构薄弱。在采集数据传输过程中的各个环节都有可能发生问题,使得遥测数据存在一定的误差和不确定性; 3:在高级应用系统中设备编辑、参数录入有可能误写; 4:变电站因改造或扩建将原线路或负荷重新定义没有及时变更参数。以上主要因素是状态估计合格率降低的主要原因。 三:提高状态估计遥测合格率的具体措施 为提高调度技术支持系统对电网运行的支撑力度,电力系统状态估计遥测合格率也是近年来调控中心自动化班一直努力追求完善的方向,往年来影响我公司状态估计合格率的主要体现在两方面: 1:自动化基础数据(主要县公司9个站)采集、传输误差大;在今后尽快做好改善35kV数据网络结构工程的上报工作。 2:电网模型与实际存在偏差。根据上述的原因,我部门主要采取了四步改进措施: (1)提高自动化基础数据覆盖范围,精确采集铜陵公司所辖变电站、用户变、电厂数据、地区联络线并将公司调度范围以外的网络模拟放在虚厂站处理以便考虑这部分网络对本区域电网的影响; (2)明确网络结构,确定建立模型范围、内容及方式; (3)全面核查电气设备模型参数、正确填写发电机、线路、电容器、变压器设备参数,尤其在填写线路参数时尽可能使用实测参数,减少使用理论参数; (4)全面排查变电站现场自动化设备,将超年限服役的装置进行更换,加强运行环境较差、网络薄弱的设备监视并做好备案。 (5)结合状态估计合格率现状,加强日常Scada系统运行、消缺、维护工作。 总结: 结合电网及Scada系统实际情况,长期以来改进对影响状态估计合格率的原因后,极大的提升了合格率指标,状态估计合格率日平均高达99%以上大大超过了地市公司合格率达90%及以上的要求,为地调调度技术支持系统的高级软件实用化运行奠定了扎实的基础。

(整理)参数估计方法.

第七章 参数估计 第一节 基本概念 1、概念网络图 {}???? ??? ?? ???????????????????→??????单正态总体的区间估计区间估计一致性有效性无偏性估计量的评选标准极大似然估计矩估计点估计从样本推断总体

2、重要公式和结论

例7.1:设总体),(~b a U X ,求对a, b 的矩估计量。 例7.2:设n x x x ,,,,21 是总体的一个样本,试证 (1);21 10351321x x x ++= ∧ μ (2);12541313212x x x ++=∧μ (3).12 143313213x x x -+=∧μ 都是总体均值u 的无偏估计,并比较有效性。 例7.3:设n x x x ,,,,21 是取自总体),(~2 σμN X 的样本,试证 ∑=--=n i i x x n S 1 22 )(11 是2 σ的相合估计量。

第二节 重点考核点 矩估计和极大似然估计;估计量的优劣;区间估计 第三节 常见题型 1、矩估计和极大似然估计 例7.4:设0),,0(~>θθU X ,求θ的最大似然估计量及矩估计量。 例7.5:设总体X 的密度函数为 ?????≥=--. , 0,1)(/)(其他μθ θμx e x f x 其中θ>0, θ,μ为未知参数,n X X X ,,,21 为取自X 的样本。试求θ,μ的极大似然估计量。 2、估计量的优劣 例7.6:设n 个随机变量n x x x ,,,21 独立同分布, ,)(11,1,)(1 22 12 1∑∑==--===n i i n i i x x n S x n x x D σ 则 (A )S 是σ的无偏估计量; (B )S 是σ的最大似然估计量; (C )S 是σ的相合估计量; (D )x S 与2 相互独立。 例7.7:设总体X 的密度函数为 ?????<<-=, , 0,0),(6)(3 其他θθθx x x x f n X X X ,,,21 是取自X 的简单随机样本。 (1) 求θ的矩估计量∧ θ;

第二章 参数估计

第二章 参数估计 一、填空题 1、总体X 的分布函数为);(θx F ,其中θ为未知参数,则对θ常用的点估计方法有 , 。 2、设总体X 的概率密度为 (),(;)0, x e x f x x θθ θθ--?≥=?

该总体的一个样本,设用矩法求得

μ的估计量为1?μ 、用极大似然法求得μ的估计量为2?μ,则1?μ=2?μ。 _________________ 8、?n θ是总体未知参数θ的相合估计量的一个充分条件是_______ . 解:??lim (), lim Var()0n n n n E θθθ→∞ →∞ ==. 9、已知1021,,x x x Λ是来自总体X 的简单随机样本,μ=EX 。令 ∑∑==+=10 7 6 181?i i i i x A x μ ,则当=A 时,μ?为总体均值μ的无偏估计。 10、 设总体()θ,0~U X ,现从该总体中抽取容量为10的样本,样本值为 0.51.30.61.7 2.21.20.81.5 2.01.6, , , , , , , , , 则参数θ的矩估计为 。 11、 设1?θ与2?θ都是总体未知参数θ的估计,且1?θ比2?θ有效,则1?θ与2?θ的期望与方差满足_______ . 解:1212 ????()(), ()()E E D D θθθθ=<. 12、设1?θ和2?θ均是未知参数θ的无偏估计量,且)?()?(2221θθE E >,则其中的统计量 更有效。 13、在参数的区间估计),(21θθ中,当样本容量n 固定时,精度12θθ-提高时,置信度α-1 。 14、设n X X X ,,,21Λ是来自总体)1,(~μN X 的样本,则μ的置信度为0.95的置信区间为 。 15、设n X X X ,,,21Λ是来自总体),(~2σμN X 的样本,其中2σ未知,则μ的置

参数估计案例

大学生综合素质成绩分析 参与者:李艳 起止时间:2016.5.13-2016.5.21 学习目的: (1)掌握参数估计的统计方法,能够针对具体的数据进行实际运用 (2)深入挖掘数据,结合数据特点选择恰当的统计方法进行分析 (3)熟练使用excel 进行数据分析,并结合具体背景给出合理解释 (4)掌握统计分析报告的撰写方法 调查研究背景与现实意义 大学生是备受关注的群体,这些年轻人日后必定承担着很多责任。所以社会也很关注高校对大学生的培养。如今大学生的培养状况如何呢?高校的培养方案是否还需改进呢?让我们一起来研究一下大学生的学习状况。 调查方案的设计 数据分析 1,数据的基本信息 序号 综合素质分 性别 序号 综合素质分 性别 1 82.54 男 26 75.4 男 2 81.57 女 27 75.38 男 3 81.44 女 28 74.93 男 4 80.83 女 29 74.49 女 5 80.29 男 30 74.44 女 6 80.25 女 31 74.43 男 抽样 整理数据 总结 分析数据

7 80.14 男32 74.28 男 8 80.05 男33 73.88 男 9 79.61 女34 73.67 男 10 79.44 女35 73.21 女 11 79.22 女36 72.34 男 12 78.55 男37 72.32 女 13 78.26 女38 72.16 女 14 77.93 女39 71.64 女 15 77.9 男40 71.12 男 16 77.69 男41 70.7 女 17 77.53 女42 69.87 女 18 77.16 男43 69.87 女 19 77.09 女44 69.48 男 20 77.09 女45 68.09 男 21 76.86 女46 67.84 女 22 76.59 女47 67.26 男 23 76.53 男48 66.68 男 24 76.08 男49 64.55 男 25 75.63 女50 64.25 男 分组人数女生男生 60-65 2 0 2 65-70 7 3 4 70-75 14 7 7 75-80 19 11 8 80-85 8 4 4

第八章 参数估计

第八章参数估计 一、思考题 1.什么是参数估计?参数估计有何特点? 2.评价估计量优劣的准则是什么? 3.什么是点估计、区间估计?二者有何联系和区别? 4.确定必要的抽样数目有何意义?必要抽样数目受哪些因素影响? 二、练习题 (一)填空题 1.参数估计的方法有_________和_________。 2.若样本方差(s n21-)的期望值等于总体方差(σ2),则称s n21-为σ2的____________估计量 3.总体参数的估计区间是由_________和_________组成。 4.允许误差是指与的最大绝对误差范围。 5.如果总体平均数落在区间960~1040内的概率是95%,则抽样平均数是 ______,允许误差是______。 6.在同样的精度要求下,不重复抽样比重复抽样需要的样本容量。 x=5,7.设总体X的方差为1,从总体中随机取容量为100的样本,得样本均值 =2.58) 则总体均值的置信水平为99%的置信区间_____________。(Z 0.005 (二)判断题 1( )参数估计就是用样本统计量去估计总体的参数。 2( )随机抽样是参数估计的前提。 3( )参数估计的抽样误差可以计算和控制。 4( )估计量的数学期望等于相应的总体参数值,则该估计量就被称为相应总体参数的无偏估计量。 5( )区间估计就是根据样本估计量以一定的置信度推断总体参数所在的区间范围。

6( )样本统计量n x x s ∑-=22)(是总体参数2σ的无偏估计量。 7( )估计量的有效性是指估计量的方差比其它估计的方差小。 8( )点估计是以样本估计量的实际值直接作为相应总体参数的估计值。 9( )抽样估计的置信水平就是指在抽样指标与总体参数构造的置信区间中, 包含总体参数真值的区间所占的比重。 10( )样本容量一定时,置信区间的宽度随置信水平的增大而减小。 (三)单选题 1.极限误差是指样本统计量和总体参数之间( )。 A.抽样误差的平均数 B.抽样误差的标准差 C.抽样误差的可靠程度 D.抽样误差的最大可能范围 2.参数估计的主要目的是( )。 A.计算和控制抽样误差 B. 为了深入开展调查研究 C.根据样本统计量的数值来推断总体参数的数值 D. 为了应用概率论 3.参数是指基于( )计算的指标值。 A.样本 B.某一个样本 C.多个样本 D.总体 4.总体参数很多,就某一参数(如均值)而言,它的取值( )。 A.是唯一的 B.不是唯一的 C.随样本的变化而变化 D.随抽样组织形式的变化而变化 5.样本统计量很多,就某一统计量(如均值)而言,它的取值( )。 A.是唯一的 B.随样本的变化而变化 C.由总体确定 D.由抽样的组织形式唯一确定 6.以样本均值x 估计正态总体的均值μ时,如果总体方差2σ已知,这时将会需要查阅( )。 A.正态分布表 B.标准正态分布表 C.t 分布表 D.2χ分布表 7.以样本均值x 估计正态总体的均值μ时,如果总体方差2σ未知,这时将会需要查阅( )。

参数估计

选择题: 1.估计量的含义是指()。 A.用来估计总体参数的统计量的名称 B.用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体数值 2.在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与总体参数的离差越小越好。这种评价标准称为()。 A.无偏性B.有效性C.一致性D.充分性 3.根据一个具体的样本求出的总体均值的95%的置信区间()。 A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C.一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 4.无偏估计是指()。 A.样本统计量的值恰好等于待估的总体参数 B.所有可能样本估计值的数学期望等于待估总体参数 C.样本估计值围绕待估总体参数使其误差最小 D.样本量扩大到和总体单元相等时与总体参数一致 5.总体均值的置信区间等于样本均值加减边际误差,其中的边际误差等于所要求置信水平的临界值乘以()。 A.样本均值的抽样标准差B.样本标准差 C.样本方差D.总体标准差 6.当样本量一定时,置信区间的宽度()。 A.随着置信系数的增大而减小B.随着样本量的增大而增大 C.与置信系数的大小无关D.与置信系数的平方成反比 7.当置信水平一定时,置信区间的宽度()。 A.随着样本量的增大而减小B.随着样本量的增大而增大 C.与样本量的大小无关D.与样本量的平方根成正比 8.一个95%的置信区间是指()。 A.总体参数有95%的概率落在这一区间内 B.总体参数有5%的概率未落在这一区间内 C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数 D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数9.95%的置信水平是指()。 A.总体参数落在一个特定的样本所构造的区间内的概率为95% B.在用同样的方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率为5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 10.一个估计量的有效性是指()。 A.该估计量的数学期望等于被估计的总体参数 B.该估计量的一个具体数值等于被估计的总体参数 C.该估计量的方差比其他估计量大 D.该估计量的方差比其他估计量小

统计学——参数估计

第8 讲参数估计 本讲的主要内容 8.1 参数估计的一般问题 8.2 一个总体参数的区间估计 8.3 两个总体参数的区间估计 8.4 样本量的确定 学习目标 1.估计量与估计值的概念 2.点估计与区间估计的区别 3.评价估计量优良性的标准 4.一个总体参数的区间估计方法 5.两个总体参数的区间估计方法 6.样本量的确定方法 8.1 参数估计的一般问题 8.1.1 估计量与估计值 估计量与估计值(estimator & estimated value) 1.估计量:用于估计总体参数的随机变量 如样本均值,样本比例, 样本方差等 例如: 样本均值就是总体均值m 的一个估计量 2.参数用θ表示,估计量用表示 3.估计值:估计参数时计算出来的统计量的具体值 如果样本均值?x=80,则80就是m的估计值 8.1.2 点估计与区间估计 点估计 (point estimate) 1.用样本的估计量的某个取值直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计;用两个样本均值之差直接作为总体均值之差的估计 2.无法给出估计值接近总体参数程度的信息 ⑴虽然在重复抽样条件下,点估计的均值可望等于总体真值,但由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值 ⑵一个点估计量的可靠性是由它的抽样标准误差来衡量的,这表明一个具体的点估计值无法给出估计的可靠性的度量 区间估计 (interval estimate) 1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到 2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示

电力系统状态估计概述

电力系统状态估计研究综述 摘要:电力系统状态估计是当代电力系统能量管理系统(EMS)的重要组成部分。本文介绍了电力系统状态估计的概念、数学模型,阐述了状态估计的必要性及其作用,系统介绍了状态估计的研究现状,最后对状态估计的研究方向进行了展望。关键词:电力系统;状态估计;能量管理系统 0 引言 状态估计是当代电力系统能量管理系统(EMS)的重要组成部分, 尤其在电力市场环境中发挥更重要的作用。它是将可用的冗余信息(直接量测值及其他信息)转变为电力系统当前状态估计值的实时计算机程序和算法。准确的状态估计结果是进行后续工作(如安全分析、调度员潮流和最优潮流等)必不可少的基础。随着电力市场的发展,状态估计的作用更显重要[1]。 状态估计的理论研究促进了工程应用,而状态估计软件的工程应用也推动了状态估计理论的研究和发展。迄今为止,这两方面都取得了大量成果。然而,状态估计领域仍有不少问题未得到妥善解决,随着电力系统规模的不断扩大,电力工业管理体制向市场化迈进,对状态估计有了新要求,各种新技术和新理论不断涌现,为解决状态估计的某些问题提供了可能。本文就电力系统状态估计的研究现状和进一步的研究方向进行了综合阐述。 1 电力系统状态估计的概念 1.1电力系统状态估计的基本定义 状态估计也被称为滤波,它是利用实时量测系统的冗余度来提高数据精度,自动排除随机干扰所引起的错误信息,估计或预报系统的运行状态(或轨迹)。状态估计作为近代计算机实时数据处理的手段,首先应用于宇宙飞船、卫星、导弹、潜艇和飞机的追踪、导航和控制中。它主要使用了六十年代初期由卡尔曼、布西等人提出的一种递推式数字滤波方法,该方法既节约内存,又大大降低了每次估计的计算量[2,4]。 电力系统状态估计的研究也是由卡尔曼滤波开始。但根据电力系统的特点,即状态估计主要处理对象是某一时间断面上的高维空间(网络)问题,而且对量测误差的统计知识又不够清楚,因此便于采用基于统计学的估计方法如最小方差估计、极大验后估计、极大似然估计等方法,目前很多电力系统实际采用的状态估计算法是最小二乘法。 1.2电力系统状态估计的数学模型 状态估计的数学模型是基于反映网络结构、线路参数、状态变量和实时量测之间相互关系的量测方程: z+ =) ( h v x 其中z是量测量;x是状态变量,一般是节点电压幅值和相位角;v是量测误差;z和v都是随机变量。 状态估计器的估计准则是指求解状态变量x的原则, 电力系统状态估计器采用的估计准则大多是极大似然估计, 即求解的状态变量x*使量测值z被观测到的可能性最大, 用数学语言描述, 即: z f x f= z (x , )] , ( *) max[ 其中f(z)是z的概率分布密度函数[3]。

第七章参数估计练习题

第七章参数估计练习题 一.选择题 1. 估计量的含义是指() A. 用来估计总体参数的统计量的名称 B. 用来估计总体参数的统计量的具体数值 C. 总体参数的名称 D ?总体参数的具体取值 2.一个95%的置信区间是指() A. 总体参数有95%的概率落在这一区间内 B. 总体参数有5%的概率未落在这一区间内 C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。 3.95%的置信水平是指() A. 总体参数落在一个特定的样本所构造的区间内的概率是95% B ?在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率是5% D ?在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 4. 根据一个具体的样本求出的总体均值的95%的置信区间() A .以95%的概率包含总体均值 B .有5%的可能性包含总体均值 C.一定包含总体均值 D ?要么包含总体均值,要么不包含总体均值 5. 当样本量一定时,置信区间的宽度() A .随着置信水平的增大而减小 B. .随着置信水平的增大而增大 C.与置信水平的大小无关D。与置信水平的平方成反比 6. 当置信水平一定时,置信区间的宽度() A?随着样本量的增大而减小 B..随着样本量的增大而增大 C.与样本量的大小无关D。与样本量的平方根成正比 7. 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与 总体参数的离差越小越好。这种评价标准称为() A .无偏性 B.有效性C. 一致性D.充分性 8. 置信水平(1-a)表达了置信区间的() A .准确性 B.精确性C.显著性D.可靠性 9. 在总体均值和总体比例的区间估计中,边际误差由() A .置信水平决定 B.统计量的抽样标准差确定 C. 置信水平和统计量的抽样标准差 D. 统计量的抽样方差确定 10. 当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是() A.正态分布 B. t分布 C. x 2分布 D. F分布

参数估计和假设检验案例(精)

参数估计和假设检验案例 案例一:工艺流程的检测 某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的 800个观测值组成。这些数据的样本标准差为 0.21;因为有如此多的样本数据,因此,总体标准差被假设为 0.21。然后,该公司建议:持续不断地定期抽取容量为 30的随机样本以对工艺流程进行检测。 通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。设计规格要求工艺流程的均值为 12,该公司建议采用如下形式的假设检验。 H 0 :12 H 1 :12 只要 H 0被拒绝,就应采取纠正措施。 下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。

μ=μ≠ 问题: 1、对每个样本在 0.01的显著性水平下进行假设检验,并且确定,如果需要

Z0.005=2.58 2、 4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平, 哪种错误或误差将增加? 显著性水平增加,置信区间减小,误差减小。 案例二:计算机辅助教学会使完成课程的时间差异缩小吗? 某课程引导性教程采用一种个性化教学系统, 每位学生观看教学录像, 然后给以程式化的教材。每位学生独立学习直至完成训练并通过考试。人们关心的问题是学生完成训练计划的进度不同。有些学生能够相当快地完成程式化教材, 而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。 建议的替代系统是使用计算机辅助教学。在这种方法中, 所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。μ= 在整个教程的自我训练过程中,由计算机指导学生独立操作。 为了比较建议的和当前的教学方法, 刚入学的 122名学生被随机地安排到这两种教学系统中。 61名学生使用当前程式化教材, 而另外 61名学生使用建议的计算机辅助方法。记录每位学生的学习时间(小时 ,如表所示。

参数估计和假设检验案例

参数估计和假设检验案例 案例一:工艺流程的检测 某公司是一家为客户提供抽样和统计程序方面建议的咨询公司,这些建议可以用来监控客户的制造工艺流程。在一个应用项目中,一名客户向该公司提供了一个样本,该样本由工艺流程正常运行时的800个观测值组成。这些数据的样本标准差为0.21;因为有如此多的样本数据,因此,总体标准差被假设为0.21。然后,该公司建议:持续不断地定期抽取容量为30的随机样本以对工艺流程进行检测。 通过对这些新样本的分析,客户可以迅速知道,工艺流程的运行状况是否令人满意。当工艺流程的运行状况不能令人满意时,可以采取纠正措施来解决这个问题。设计规格要求工艺流程的均值为12,该公司建议采用如下形式的假设检验。 μ=μ≠ H0 :12 H1 :12 只要H0被拒绝,就应采取纠正措施。 下表为第一天运行新的工艺流程的统计控制程序时,每隔一小时收集的样本数据。

问题: 1、对每个样本在0.01的显著性水平下进行假设检验,并且确定,如果需要 Z0.005=2.58 2、 μ= 4、讨论将显著性水平改变为一个更大的值时的影响?如果增加显著性水平, 哪种错误或误差将增加? 显著性水平增加,置信区间减小,误差减小。 案例二:计算机辅助教学会使完成课程的时间差异缩小吗? 某课程引导性教程采用一种个性化教学系统,每位学生观看教学录像,然后给以程式化的教材。每位学生独立学习直至完成训练并通过考试。人们关心的问题是学生完成训练计划的进度不同。有些学生能够相当快地完成程式化教材,而另一些学生在教材上需要花费较长的时间,甚至需要加班加点才能完成课程。学的较快的学生必须等待学得较慢的学生完成引导性课程才能一起进行其他方面的训练。 建议的替代系统是使用计算机辅助教学。在这种方法中,所有的学生观看同样的讲座录像,然后每位学生被指派到一个计算机终端来接受进一步的训练。

参数估计方法

参数估计的方法 矩法 一、矩的概念 矩(moment )分为原点矩和中心矩两种。对于样本n y y y ,,, 21,各观测值的k 次方的平均值,称为样本的k 阶原点矩,记为k y ,有∑==n i k i k y n y 1 1,例如,算术 平均数就是一阶原点矩;用观测值减去平均数得到的离均差的k 次方的平均数称为样本的k 阶中心矩,记为k y y ) (-或k μ ?,有∑-= -=n i k i k y y n y y 1 ) (1)(,例如,样本 方差 ∑-=n i i y y n 1 2 ) (1就是二阶中心矩。 对于总体N y y y ,,, 21,各观测值的k 次方的平均值,称为总体的k 阶原点矩,记为)(k y E ,有∑= =N i k i k y N y E 1 1)(;用观测值减去平均数得到的离均差的k 次方 的平均数称为总体的k 阶中心矩,记为 ] )[(k y E μ-或 k μ,有 ∑-= -=N i k i k y N y E 1 ) (1])[(μμ。 二、矩法及矩估计量 所谓矩法就是利用样本各阶原点矩来估计总体相应各阶原点矩的方法,即 ∑= =n i k i k y n y 1 1→)(k y E (8·6) 并且也可以用样本各阶原点矩的函数来估计总体各阶原点矩同一函数,即若 ))(,),(),((k y E y E y E f Q 2= 则 ),,,(k y y y f Q 2?= 由此得到的估计量称为矩估计量。 [例8.1] 现获得正态分布),(2σμN 的随机样本n y y y ,,, 21,要求正态分布),(2σμN 参数μ和2σ的矩估计量。 首先,求正态分布总体的1阶原点矩和2阶中心矩: ?=?? ? ???--? =?=∞ +∞-∞ +∞-μσμσπdy y y dy y yf y E 2 2 exp 2)(21)()( (此处?? ? ???--2 2exp σμ2)(y 表示自然对数底数e 的?? ? ???--2 2σμ2)(y 的指数式,即] [2)(22 σμ--y e )

参数估计与假设检验案例

参数估计与假设检验案例 一、案例的背景和现实意义 上海五洲信息咨询公司市场部刘经理新世纪第一天上班,刚走进办公室还来不及与同事们互祝新年问候,办公桌上的传真机就响了,这是一份来自美国Lion投资公司的委托书,委托书上的文字十分简单:“2001年10月,美国Lion公司的品牌香槟酒将进入中国市场,现需了解上海市场的有关情况,委托业务费用10万美元。”随后是Lion酒的产品介绍。刘经理一看兴奋得差一点跳了起来:这是等待已久的项目,其收人也十分可观。在与同事们庆祝之后,刘经理陷入了思考,委托书上的要求看似简单,但这是一个十分棘手的项目,如果稍有疏忽不仅将影响到公司的声誉和发展前景,搞得不好还有可能丢了自己的饭碗。想到这,刘经理马上召集部门的业务骨干,共商对策。一个多小时的紧张讨论,一个颇为周全的企划方案跃人桌面:这是一个十分典型的市场调查和抽样推断的案例,了解市场有关情况,意味着需掌握洋酒的市场价格、需求量、消费群体、产品市场定位、促销手段、同类产品的市场占有率、销售情况、广告宣传以及消费者的心态、未来洋酒需求能力的推断、潜在用户挖掘的可能性等等。做好这个项目,关键是切入口的确定。应该说,刘经理做市场调查是熟门熟路,然而洋酒的市场调查,其调查对象与其他调查的不一样。对于上海销售的除从法国进口的某些葡萄酒及香槟以外,诸如轩尼诗、人头马、拿破仑、路易十六等品牌,由于其昂贵的价格,市场消费群体并不大,销量也十分有限。为此,刘经理与同事们反复论证,最后决定,首先拟订一个周密的市场调查方案,然后分头作市场调查及数据处理,最后完成这一项目。 目前中国正处于经济体制的转轨时期,信息资料的搜集也由过去单一的统计报表制度转向了“以周期性普查为基础,经常性的抽样调查为主体,其他调查形式为补充”的调查体制,向市场直接索取资料,将会成为了解市场、获得信息的主要手段,如何完成这一过程,怎样着手做市场调查,最终根据市场信息对未来市场走势作出判断和推测,就显得十分重要和具有现实意义。 二、案例所依托的客体与现状及操作过程

第4章总体参数估计讲解

◎第4章参数估计 ※一、单一总体的参数估计※ ●(一)估计的含义 ●估计:人人都做过。如: ?上课时,你会估计一下老师提问你的概率有多大? ?当你去公司应聘时,会估计你被录用的可能性是多少??推销员年初时要估计今年超额完成任务的概率有多大?◎估计量:用来估计总体参数的样本统计量。如:算术平均数、中位数、标准差、方差等。 ●估计的可能性与科学性:数理统计证明,一个“优良”的样本统计量应具备以下特征: (1)、无偏性。样本估计量的期望值应等于总体参数。无系统偏差。 (2)、有效性。与离散度相联系。在多个无偏估计量中,方差最小的估计量最有效。 (3)、一致性。随着样本容量的增加,可以使估计量越来越靠近总体参数。 (4)、充分性。估计量能够充分利用有关信息,中位数和众数不具备这一点。 ※估计的类型包括:

1、 点估计:只有一个取值。 就 是总体平均数μ的点估计值。 2、区间估计:给出取值范围(值域)。见PPT ▲两种估计类型哪一种更科学? ※ 区间估计的优点在于:它在给出估计区间时, 还可以给予一个“可信程度”。例如:销售经理想 估计一下明年的出口总值,甲估计是53万美元,乙估计 是50—56万美元之间,并可以确切地说“有95%的把握”。 显然后者的可信程度大于前者。那么,50—56万美元之 间的范围是如何计算的?“有95%的把握”是什么意思? 【引例】:某食品进出口公司向东南亚出口一批花生制品,管 理人员从中抽取50包作为样本,计算其平均数为250克。另 外,合同规定总体标准差为6克。 如果问这批花生制品的平均重量,可用样本平均数作为总 体平均数的最佳估计量:250克。但这是远远不够的,在许多 时候,管理人员还想了解“这个估计值的平均误差是多少?” “总体平均数可能落入样本平均数上、下多大范围内?”“ 这 个估计值的可靠程度是多少?” 〖1〗由于n=50,根据中心极限定理可作图: n=50,σ=6 〖2〗抽样平均误差:8485.0506 ===n x σσ

相关文档