文档库 最新最全的文档下载
当前位置:文档库 › 指数分布参数的稳健估计

指数分布参数的稳健估计

指数分布参数的稳健估计
指数分布参数的稳健估计

稳定分布的参数估计

稳定分布的参数估计 顾娟茆诗松 2012-9-12 10:25:00 来源:《应用概率统计》2002年第4期内容提要:由于金融数据经常具有“高峰厚尾”现象,所以用稳定分布去拟合。但由于稳定分布没有密度函数显式,而且可能一阶矩或二阶矩又不存在,因此稳定分布的参数估计问题用经典方法很难处理。本文利用类似Duffie和Singleton(1993)的模拟矩法(SMM)的想法,构造了一种新的参数估计方法,并得到该估计的强相合性结果。最后举了一个实际的例子,分析了深圳成分指数的情况。 关键词:稳定分布模拟矩法(SMM) 强相合性特征函数 作者简介:顾娟广发证券股份有限公司博士后工作站,广州510075;茆诗松华东师范大学统计系,上海200062 引言 金融资产的收益是大量在实践上连续到来的信息和个人决策的结果。根据中心极限定理,如果经适当的平移和尺度变换,大量的独立同分布的随机变量和的极限分布一定是稳定分布族中的某一分布。因此很自然地认为,如果资产收益的积累是可加的,则应近似服从稳定分布;如果资产收益的累积是相乘的,则应近似服从对数稳定分布。 对于稳定分布的研究从本世纪初就引起了大家的注意。正态分布属于稳定分布族。同时也是大家最为熟悉也最易处理的分布,所以在处理一般问题时大都认

为资产收益的分布是近似服从正态分布或对数正态分布。在处理股票价格的经验研究中,Mandelbrot[1]和Fama[2]最先发现股票价格的对数变化明显偏离了正态分布,尤其是非常小和非常大的价格变化比在正态假设出现的频率明显偏大、对这类问题用非高斯的稳定分布去拟和优于正态分布。(近年来,很多金融数据的经验研究发现,金融数据具有一些普遍的规律,其中与平稳直接相关的就是“高峰厚尾”现象,这种现象现在已得到广泛的认识)这之后,很多统计学,经济,金融学等方面的学者对稳定分布和资产收益之间的关系进行了研究。 我们考察了深圳成分指数从1994年1月3日到1998年11月2日的日收益率情况,发现经过作收益率变化后,日收益率的分布形态明显具有这种“高峰厚尾”现象。其中表1是回收益率的常用描述性统计量的估计值,其中的曲线是用正态分布拟和的结果。可以看出在上述时期,深圳市场的日平均收益率大于0,折算成年收益率大约为25%左右。考虑厚尾的衡量指标常常用峰度,即四阶矩。由于正态分布的峰度为3,而该数据的峰度为17.7618,说明该数据的峰度远大于正态分布的峰度,这正是“高峰”说法的来源。另外,数据比正态分布不仅峰度高,而且两端数据出现的频率也较大。所以我们试图用稳定分布去拟和深圳数据。 对于稳定分布,没有显示的密度函数或分布函数形式。Levy(1924)得到了稳定分布特征函数的显示表达。经过Zolotarev[3]的再参数化变成极点形式,得到了目前比较常用的稳定分布的特征函数的表达式。

双参数威布尔分布函数的确定及曲线拟合(精)

2007.NO.4. CN35-1272/TK 图 1威布尔函数拟合曲线的仿真系统模块 作者简介 :包小庆 (1959~ , 男 , 高级工程师 , 从事可再生能源的研究。 大型风电场的建设不但可以减缓用电短缺情况 , 而且并网后还能为电网提供很大一部分电能。而大型风电场的选址 , 与该地的风速分布情况有关。用于描述风速分布的模型很多 , 如瑞利分布、对数正态分布、 r 分布、双参数威布尔分布、 3参数威布尔分布 , 皮尔逊曲线拟合等。经过大量的研究表明 , 双参数威布尔分布函数更接近风速的实际分布。本文采用 4种方法计算威布尔分布函数的参数 , 并利用计算出的参数确定威布尔分布函数的实际数学模型进行曲线拟合。最后以白云鄂博矿区风电场拟选址为例 , 使用计算机软件 (MATLAB 对该地区风速威布尔分布函数进行曲线拟合 , 得到该地区不同高度的风速分布函数曲线。 1双参数威布尔分布函数的确定 双参数威布尔分布是一种单峰的正偏态分布函数 , 其概 率密度函数表达式为 : p(x=k x " exp-x " (1 式中 :k ———形状参数 , 无因次量 ; c ———

尺度参数 , 其量纲与速度相同。为了确定威布尔分布函数的实际模型 , 需计算出实际情况下对应函数的 2个参数。估算风速威布尔参数的方法很多 , 本文给出4种有效的方法以确定 k 和 c 值。 1.1HOMER 软件法 HOMER 是一个对发电系统优化配置与经济性分析的软件。通过输入 1a 逐时风速数据或者月平均风速数据 , 根据实际情况设置相应参数 , 即可计算得到 k 和c 值 , 此时计算出的 k 和 c 值是计算机系统认为的最佳值。 1.2Wasp 软件法 Wasp 是一个风气候评估、 计算风力发电机组年发电量、风电场年总发电量的软件。通过输入风速统计资料 , 计算机可以直接计算出 k 和 c 值。 1.3最小二乘法 通过风速统计资料计算出最小二乘法拟合直线 y=ax+b 的斜率 a 和截距 b 。由下式确定 k 和 c 的值 : k=b (2 c=esp a (3 1.4平均风速和最大风速估计法 从常规气象数据获得平均风速和时间 T 观测到的 10min 平均最大风速 V m ax , 设全年的平均风速为通过下式计算 k 和 c 值 : k=ln (lnT (4 c=(5

参数估计练习题

第七章参数估计练习题 一.选择题 1. 估计量的含义是指() A. 用来估计总体参数的统计量的名称 B. 用来估计总体参数的统计量的具体数值 C.总体参数的名称 D.总体参数的具体取值 2.一个95%的置信区间是指() A. 总体参数有95%的概率落在这一区间内 B. 总体参数有5%的概率未落在这一区间内 C. 在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。 D. 在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数。 %的置信水平是指() A. 总体参数落在一个特定的样本所构造的区间内的概率是95% B.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95% C.总体参数落在一个特定的样本所构造的区间内的概率是5% D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5% 4. 根据一个具体的样本求出的总体均值的95%的置信区间() A.以95%的概率包含总体均值 B.有5%的可能性包含总体均值 C. 一定包含总体均值 D.要么包含总体均值,要么不包含总体均值 5. 当样本量一定时,置信区间的宽度() A.随着置信水平的增大而减小 B. .随着置信水平的增大而增大 C.与置信水平的大小无关D。与置信水平的平方成反比 6. 当置信水平一定时,置信区间的宽度() A.随着样本量的增大而减小 B. .随着样本量的增大而增大 C.与样本量的大小无关D。与样本量的平方根成正比 7. 在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是使它与 总体参数的离差越小越好。这种评价标准称为() A.无偏性 B. 有效性 C. 一致性 D. 充分性 8. 置信水平(1-α)表达了置信区间的() A.准确性 B. 精确性 C. 显着性 D. 可靠性 9. 在总体均值和总体比例的区间估计中,边际误差由()A.置信水平决定 B. 统计量的抽样标准差确定 C. 置信水平和统计量的抽样标准差 D. 统计量的抽样方差确定 10. 当正态总体的方差未知,且为小样本条件下,估计总体均值使用的分布是() A.正态分布 B. t 分布 C.χ2分布 D. F分布

第4章总体参数估计讲解

◎第4章参数估计 ※一、单一总体的参数估计※ ●(一)估计的含义 ●估计:人人都做过。如: ?上课时,你会估计一下老师提问你的概率有多大? ?当你去公司应聘时,会估计你被录用的可能性是多少??推销员年初时要估计今年超额完成任务的概率有多大?◎估计量:用来估计总体参数的样本统计量。如:算术平均数、中位数、标准差、方差等。 ●估计的可能性与科学性:数理统计证明,一个“优良”的样本统计量应具备以下特征: (1)、无偏性。样本估计量的期望值应等于总体参数。无系统偏差。 (2)、有效性。与离散度相联系。在多个无偏估计量中,方差最小的估计量最有效。 (3)、一致性。随着样本容量的增加,可以使估计量越来越靠近总体参数。 (4)、充分性。估计量能够充分利用有关信息,中位数和众数不具备这一点。 ※估计的类型包括:

1、 点估计:只有一个取值。 就 是总体平均数μ的点估计值。 2、区间估计:给出取值范围(值域)。见PPT ▲两种估计类型哪一种更科学? ※ 区间估计的优点在于:它在给出估计区间时, 还可以给予一个“可信程度”。例如:销售经理想 估计一下明年的出口总值,甲估计是53万美元,乙估计 是50—56万美元之间,并可以确切地说“有95%的把握”。 显然后者的可信程度大于前者。那么,50—56万美元之 间的范围是如何计算的?“有95%的把握”是什么意思? 【引例】:某食品进出口公司向东南亚出口一批花生制品,管 理人员从中抽取50包作为样本,计算其平均数为250克。另 外,合同规定总体标准差为6克。 如果问这批花生制品的平均重量,可用样本平均数作为总 体平均数的最佳估计量:250克。但这是远远不够的,在许多 时候,管理人员还想了解“这个估计值的平均误差是多少?” “总体平均数可能落入样本平均数上、下多大范围内?”“ 这 个估计值的可靠程度是多少?” 〖1〗由于n=50,根据中心极限定理可作图: n=50,σ=6 〖2〗抽样平均误差:8485.0506 ===n x σσ

3-第7章统计学参数估计练习题(20200627170347)

第7章参数估计 练习题 一、填空题(共10题,每题2分,共计20分) 1 ?参数估计就是用_________ 去估计____________ 。 2?点估计就是用_____________ 的某个取值直接作为总体参数的 _____________ 。 3. ______________________ 区间估计是在的基础上,给出总体参数估计的一个区间范围,该区间 通常由样本统计量加减___________ 得到。 4. 如果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的 比例称为___________ ,也成为_____________ 。 5. __________________________________________________________ 当样本量给定时,置信区间的宽度随着置信系数的增大而__________________________ ;当置信水 平固定时,置信区间的宽度随着样本量的增大而_____________ 。 6. 评价估计量的标准包含无偏性、 ___________ 和____________ 。 7. 在参数估计中,总是希望提高估计的可靠程度,但在一定的样本量下,要提高估计 的可靠程度,就会___________ 置信区间的宽度;如要缩小置信区间的宽度,又不降 低置信程度,就要____________ 样本量。 8. 估计总体均值置信区间时的估计误差受总体标准差、 ___________ 和___________ 的影响。 9?估计方差未知的正态总体均值置信区间用公式_____________ ;当样本容量大于等于30时,可以用近似公式__________ 。 10?估计正态总体方差的置信区间时,用___________ 分布,公式为___________ 。 二、选择题(共10题,每题1分,共计10分) 1 ?根据一个具体的样本求出的总体均值的95%勺置信区间()。 A. 以95%勺概率包含总体均值 B. 有5%勺可能性包含总体均值 C?一定包含总体均值

正态总体参数的区间估计

第19讲 正态总体参数的区间估计 教学目的:理解区间估计的概念,掌握各种条件下对一个正态总体的均值和方差进行 区间估计的方法。 教学重点:置信区间的确定。 教学难点:对置信区间的理解。 教学时数: 2学时。 教学过程: 第六章 参数估计 §6.3正态总体参数的区间估计 1. 区间估计的概念 我们已经讨论了参数的点估计,但是对于一个估计量,人们在测量或计算时,常不以得到近似值为满足,还需估计误差,即要求知道近似值的精确程度。因此,对于未知参数θ,除了求出它的点估计?θ外,我们还希望估计出一个范围,并希望知道这个范围包含参数θ真值的可信程度。 设?θ为未知参数θ的估计量,其误差小于某个正数ε的概率为1(01)αα-<<,即 ?{||}1P θθεα -<=- 或 αεθθεθ-=+<<-1)??(P 这表明,随机区间)?,?(εθεθ+-包含参数θ真值的概率(可信程度)为1α-,则这个区间)?,?(εθεθ+-就称为置信区间,1α-称为置信水平。 定义 设总体X 的分布中含有一个未知参数θ。若对于给定的概率1(01)αα-<<,存在两个统计量1112(,,,)n X X X θθ= 与2212(,,,)n X X X θθ= ,使得 12{}1P θθθα <<=-

则随机区间12(,)θθ称为参数θ的置信水平为1α-的置信区间,1θ称为置信下限,2θ称为置信上限,1α-称为置信水平。 注(1)置信区间的含义:若反复抽样多次(各次的样本容量相等,均为n ),每一组样本值确定一个区间12(,)θθ,每个这样的区间要么包含θ的真值,要么不包含θ的真值。按伯努利大数定理,在这么多的区间中,包含θ真值的约占100(1)%α-,不包含θ真值的约仅占100%α。例如:若0.01α=,反复抽样1000次,则得到的1000个区间中,不包含θ真值的约为10个。 (2)置信区间的长度表示估计结果的精确性,而置信水平表示估计结果的可靠性。对于置信水平为1α-的置信区间12(,)θθ,一方面置信水平1α-越大,估计的可靠性越高;另一方面区间12(,)θθ的长度(2)ε越小,估计的精确性越好。但这两方面通常是矛盾的,提高可靠性通常会使精确性下降(区间长度变大),而提高精确性通常会使可靠性下降(1α-变小),所以要找两方面的平衡点。 在学习区间估计方法之前,我们先介绍标准正态分布的α分位点概念。 设 () ~0,1X N ,若 z α 满足条件 { },01 P X z α αα>=<<,则称点z α为标准正态分布的α分位点。例如求0.01z 。按照α分位点定义,我们有 {}0.010.01P X z >=,则{}0.010.99P X z ≤=,即0.01()0.99z φ=。查表可得0.01 2.327z =. 又 由()x ?图形的对称性知1z z αα-=-。下面列出了几个常用的z α值: 2. 正态总体均值μ的区间估计 设已给定置信水平为1α-,总体()2~,X N μσ,12,,,n X X X 为一个样本,2 ,X S 分别是样本均值和样本方差。

相关文档