文档库 最新最全的文档下载
当前位置:文档库 › 负二项分布NB (r, p) 参数的点估计

负二项分布NB (r, p) 参数的点估计

负二项分布NB (r, p) 参数的点估计
负二项分布NB (r, p) 参数的点估计

1 / 2

第二章 多元正态分布及参数的估计汇总

第二章多元正态分布及参数的估计 在多元统计分析中,多元正态分布占有相当重要的地位.这是因为许多实际问题涉及到的随机向量服从正态分布或近似服从正态分布;当样本量很大时,许多统计量的极限分布往往和正态分布有关;此外,对多元正态分布,理论与实践都比较成熟,已有一整套行之有效的统计推断方法.基于这些理由,我们在介绍多元统计分析的种种具体方法之前,首先介绍多元正态分布的定义、性质及多元正态分布中参 数的估计问题. 目录 §2.1 随机向量 §2.2 多元正态分布的定义与基本性质 §2.3 条件分布和独立性 §2.4 多元正态分布的参数估计 §2.1 随机向量 本课程所讨论的是多变量总体.把p个随机变量放在一起得X=(X1,X2,…,Xp)′为一个p维随机向量,如果同时对p维总体进行一次观测,得一个样品为p维数据.常把n个样品排成一个n×p矩阵,称为样本资料阵.

?? ? ? ?? ??'''= ?????? ??=)()2()1(2 1 2222111211n np n n p p X X X x x x x x x x x x X def =(X 1,X 2,…,X p ) 其中 X(i)( i =1,…,n)是来自p 维总体的一个样品. 在多元统计分析中涉及到的都是随机向量,或是多个随机向量放在一起组成的随机矩阵. 本节有关随机向量的一些概念(联合分布,边缘分布,条件分布,独立性;X 的均值向量,X 的协差阵和相关阵,X 与Y 的协差阵)要求大家自已复习. 三﹑ 均值向量和协方差阵的性质 (1) 设X ,Y 为随机向量,A ,B 为常数阵,则 E(AX )=A·E(X ), E(AXB )=A·E(X )·B D(AX)=A·D(X)·A' COV(AX,BY)=A·COV(X,Y)·B' (2) 若X,Y 相互独立,则COV(X,Y)=O;反之不成立. 若COV(X,Y)=O,我们称X 与Y 不相关.故有: 两随机向量若相互独立,则必不相关;

厦门大学《应用多元统计分析》习题第02章 多元正态分布的参数估计

思考与练习 2.1 试述多元联合分布和边缘分布之间的关系。 2.2 设随机向量12(,)X X ′=X 服从二元正态分布,写出其联合分布密度函数和1X 、2X 各自的边缘密度函数。 2.3 已知随机向量12(,)X X ′=X 的联合分布密度函数为: ()()()()()()()()() 121122 2 22,d c x a b a x c x a x c f x x b a d c ??+?????2???? = ?? 其中,。求: 12,a x b c x d ≤≤≤≤⑴ 随机变量1X 和2X 各自的边缘密度函数、均值与方差。 ⑵ 随机变量1X 和2X 的协方差和相关系数。 ⑶ 判断1X 和2X 是否相互独立。 2.4 设随机向量12(,,,)p X X X ′=X L 服从正态分布,已知其协差阵为对角阵,证明ΣX 的分量是相互独立的随机变量。 2.5 从某企业全部职工中随机抽取一个容量为6的样本,该样本中各职工的目前工资、受教育年限、初始工资和工作经验资料如下表所示: 职工编号 目前工资 (美元) 受教育年限(年) 初始工资 (美元) 工作经验(月) 1

1 2 3 4 5 6 57,000 40,200 21,450 21,900 45,000 28,350 15 16 12 8 15 8 27,000 18,750 12,000 13,200 21,000 12,000 144 36 381 190 138 26 设职工总体的以上变量服从多元正态分布,根据样本资料求出均值向量和协差阵的最大似然估计。 2.6 均值向量和协差阵的最大似然估计量具有哪些优良性质? 2.7 试证多元正态总体的样本均值向量(,)p N μΣ1 ~(, p N n X μΣ)。 2.8 试证多元正态总体的样本协差阵S 为(,)p N μΣΣ的无偏估计。 2.9 设()1x 、()2x 、…、()n x 是从多元正态总体中独立抽取的一个随机样本,试求样本协差阵的分布。 (,)p N μΣS 2.10 设()i i X n p ×是来自(),p i i N μΣ的数据阵,1,,i k =L , ⑴ 已知1k ===μμμL 且1k ===ΣΣL Σ,求μ和的估计。 Σ⑵ 已知1k ===ΣΣL Σ,求1,,k μμL 和Σ的估计。 2

泊松分布的概念及表和查表方法

泊松分布的概念及表和查表方法 Poisson分布,是一种统计与概率学里常见到的离散概率分布,由法国数学家西莫恩·德 目录 1命名原因 2分布特点 3关系 4应用场景 5应用示例 6推导 7形式与性质

命名原因 泊松分布实例 泊松分布(Poisson distribution),台译卜瓦松分布(法语:loi de Poisson,英语:Poisson distribution,译名有泊松分布、普阿松分布、卜瓦松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等),是一种统计与概率学里常见到的离散机率分布(discrete probability distribution)。泊松分布是以18~19 世纪的法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)命名的,他在1838年时发表。这个分布在更早些时候由贝努里家族的一个人描述过。 分布特点 泊松分布的概率函数为: 泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。泊松分布适合于描述单位时间内随机事件发生的次数。 泊松分布的期望和方差均为特征函数为 关系 泊松分布与二项分布 泊松分布 当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧20,p≦0.05时,就可以用泊松公式近似得计算。 事实上,泊松分布正是由二项分布推导而来的,具体推导过程参见本词条相关部分。应用场景

在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客、某放射性物质发射出的粒子、显微镜下某区域中的白血球等等,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布P(λ)。因此,泊松分布在管理科学、运筹学以及自然科学的某些问题中都占有重要的地位(在早期学界认为人类行为是服从泊松分布,2005年在nature上发表的文章揭示了人类行为具有高度非均匀性)。 应用示例 泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷数,显微镜下单位分区内的细菌分布数等等。 观察事物平均发生m次的条件下,实际发生x次的概率P(x)可用下式表示: 例如采用0.05J/㎡紫外线照射大肠杆菌时,每个基因组(~4×106核苷酸对)平均产生3个嘧啶二体。实际上每个基因组二体的分布是服从泊松分布的,将取如下形式: …… 是未产生二体的菌的存在概率,实际上其值的5%与采用0.05J/㎡照射时的大肠杆菌uvrA-株,recA-株(除去既不能修复又不能重组修复的二重突变)的生存率是一致的。由于该菌株每个基因组有一个二体就是致死量,因此就意味着全部死亡的概率。 推导 泊松分布是最重要的离散分布之一,它多出现在当X表示在一定的时间或空间内出现的事件个数这种场合。在一定时间内某交通路口所发生的事故个数,是一个典型的例子。泊松分布的产生机制可以通过如下例子来解释。

负二项分布(研究生)

负二项分布(Negative Binomial Regression)福建医科大学流行病与统计教研室

负二项分布(Negative Binomial Regression)Introduction Scott Long notes that the Poisson regression model rarely fits in practice since in most applications the variance of the count data is greater than the mean

NB Distribution One, the variance of the NB distribution exceeds the variance of the Poisson distribution for a given mean Two, the increased variance of the NB regression model results in substantially larger probabilities for small counts Finally, in the NB distribution there are slightly larger probabilities for larger counts .

负二项分布的概念 常用于描述生物的群聚性,如钉螺在土壤的 分布、昆虫的空间分布等。医学上可用于描述传染性疾病的分布和致病生物的分布,在毒理学上 显性致死试验或致癌试验。 独立重复试验次数n 不固定,n=X+k ,k 为大于0的常数。 若要求X+K 次试验,出现“阳性”的次数恰为X 次的概率分布为负二项分布:k -? ?? ?? ???? ??-+ππ111

二项分布经典例题+测验题

二项分布 1.n 次独立重复实验 一般地,由n 次实验构成,且每次实验相互独立完成,每次实验的结果仅有两种对立的状态,即A 与A ,每次实验中()0P A p =>。我们将这样的实验称为n 次独立重复实验,也称为伯努利实验。 (1)独立重复实验满足的条件第一:每次实验是在同样条件下进行的;第二:各次实验中的事件是互相独立的;第三:每次实验都只有两种结果。 (2)n 次独立重复实验中事件A 恰好发生k 次的概率 ()P X k ==(1)k k n k n C p p --。 2.二项分布 若随机变量X 的分布列为()P X k == k k n k n C p q -,其中 0 1.1,0,1,2,,,p p q k n <<+==则称X 服从参数为,n p 的二项分布,记作(,)X B n p 。 1.一盒零件中有9个正品和3个次品,每次取一个零件,如果取出的次品不再放回,求在取得正品前已取出的次品数X 的概率分布。 3.甲乙两人各进行3次射击,甲每次击中目标的概率为2 1,乙每次击中目标的概率为3 2 . (1)记甲击中目标的此时为ξ,求ξ的分布列及数学期望; (2)求乙至多击中目标2次的概率; (3)求甲恰好比乙多击中目标2次的概率. 【巩固练习】 1.(2012年高考(浙江理))已知箱中装有4个白球和5个黑球,且

规定:取出一个白球的2分,取出一个黑球的1分.现从该箱中任取(无放回,且每球取到的机会均等)3个球,记随机变量X为取出3球所得分数之和. (Ⅰ)求X的分布列。 (Ⅱ)求X的数学期望E(X). 2.(2012年高考(重庆理))(本小题满分13分,(Ⅰ)小问5分,(Ⅱ)小问8分.) 甲、乙两人轮流投篮,每人每次投一球,.约定甲先投且先投中者获胜,一直到有人获胜或每人都已投球3次时投篮结束.设甲每次投 篮投中的概率为1 3,乙每次投篮投中的概率为1 2 ,且各次投篮互不 影响. (Ⅰ) 求甲获胜的概率。 (Ⅱ) 求投篮结束时甲的投篮次数 的分布列与期望 3.设篮球队A与B进行比赛,每场比赛均有一队胜,若有一队胜 4场则比赛宣告结束,假定,A B在每场比赛中获胜的概率都是1 2 , 试求需要比赛场数的期望. 3.(2012年高考(辽宁理))电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查. 下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图。

练习一多元正态分布的参数估计(精)

练习一 多元正态分布的参数估计 1.试叙述多元联合分布和边际分布之间的关系。 2.设二维随机向量12()X X '服从二元正态分布,写出其联合分布。 3.已知随机向量1 2()X X '的联合密度函数为 12121222 2[()()()()2()()] (,)()()d c x a b a x c x a x c f x x b a d c --+-----= -- 其中1a x b ≤≤,2c x d ≤≤。求 (1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。 4.设12(,,)p X X X X '= 服从正态分布,已知其协方差矩阵∑为对角阵,证明其分量是相互独立的随机变量。 5. 影响粮食产量的因素很多, 大致可分为三个层次:第一层次是宏观因素。主要有三种,一是制度创新, 如20世纪50年代初的土地改革、60年代初的“ 三自一包”和 80年代初的联产承包责任制和现行的粮食直补及税费改革等。二是政策导向, 如收购政策及价格、市场政策结构调整、储备政策、财政投人、政府抓粮食生产的力度等。三是科技进步,如良种的培育、播种技术的改进、机械化程度的提高等等, 特别是杂交水稻的发明, 是粮食生产的一次绿色革命, 大大地提高了粮食单位面积产量。第二层次是中观因素。主要有粮食播种面积、单位面积产量、受灾面积等等, 这些因素是影响粮食产量的直接因素。第三层次是微观因素, 主要有有效灌溉面积、化肥施用量、农业机械化程度、财政三项投入等。为了分析粮食产量的影响因素及其影响程度,将用1978一2007年的统计数据进行分析。其中:Y 是粮食产量(万吨),X1是农业化肥试用量(万吨),X2是粮食播种面积(千公顷),X3是成灾面积(千公顷),X4是农业劳动力(万人),X5是农业机械总动力(万千瓦)。

数学分布(泊松分布、二项分布、正态分布、均匀分布、指数分布) 生存分析 贝叶斯概率公式 全概率公式讲解

数学期望:随机变量最基本的数学特征之一。它反映随机变量平均取值的大小。又称期望或均值。它是简单算术平均的一种推广。例如某城市有10万个家庭,没有孩子的家庭有1000个,有一个孩子的家庭有9万个,有两个孩子的家庭有6000个,有3个孩子的家庭有3000个,则此城市中任一个家庭中孩子的数目是一个随机变量,记为X,它可取值0,1,2,3,其中取0的概率为0.01,取1的概率为0.9,取2的概率为0.06,取3的概率为0.03,它的数学期望为0×0.01+1×0.9+2×0.06+3×0.03等于1.11,即此城市一个家庭平均有小孩1.11个,用数学式子表示为:E(X)=1.11。 也就是说,我们用数学的方法分析了这个概率性的问题,对于每一个家庭,最有可能它家的孩子为1.11个。 可以简单的理解为求一个概率性事件的平均状况。 各种数学分布的方差是: 1、一个完全符合分布的样本 2、这个样本的方差 概率密度的概念是:某种事物发生的概率占总概率(1)的比例,越大就说明密度越大。比如某地某次考试的成绩近似服从均值为80的正态分布,即平均分是80分,由正态分布的图形知x=80时的函数值最大,即随机变量在80附近取值最密集,也即考试成绩在80分左右的人最多。 下图为概率密度函数图(F(x)应为f(x),表示概率密度):

离散型分布:二项分布、泊松分布 连续型分布:指数分布、正态分布、X 2分布、t 分布、F 分布 抽样分布只与自由度,即样本含量(抽样样本含量)有关 二项分布(binomial distribution ):例子抛硬币 1、 重复试验(n 个相同试验,每次试验两种结果,每种结果概率恒定————伯努利试验) 2、 抽样分布

如何统计分析非正态分布的数据

如何统计分析非正态分布的数据 小飞看了9月23日医咖会微信推送的“降糖药物利拉鲁肽,还能治疗心衰吗?”的研究(FIGHT 研究)后[1],不明白研究方法II中的Wilcoxon秩和检验到底是什么,于是来找小咖讨论。 小飞:Wilcoxon秩和检验到底是个什么鬼? 小咖:这是一种非参数检验方法。 小飞:非参数检验又是个什么鬼啊? 小咖:平时我们常用的t检验、卡方检验、方差分析等方法都要求样本服从特定的分布(比如t检验要求样本服从正态分布),这些方法被称为参数检验方法。但有些数据并不符合参数检验的要求,最常见的情况是数据不符合正态分布,这时可以使用非参数检验的方法。 非参数检验有很多种,Wilcoxon秩和检验就是其中一种。 小飞:不明觉厉...你还是来个栗子呗。

小咖:好吧。某医生为了评价A药对绝经后妇女的骨质疏松症是否有效,将30名绝经后妇女随机分为两组,干预组研究对象15例,给予A药+乳酸钙治疗;对照组15例,仅给予乳酸钙治疗。24周之后观察两组L2-4骨密度的改善率。数据如下图: 两组骨密度改善率(%) 干预组对照组 ID 改善率ID 改善率 1 -0.20 1 -0.83 2 0.21 2 0.26 3 1.86 3 0.48 4 1.97 4 1.03 5 2.31 5 1.06 6 2.80 6 1.19 7 3.30 7 1.27 8 3.60 8 1.71 9 4.31 9 1.75 10 4.40 10 2.33 11 5.29 11 2.66 12 5.87 12 2.80 13 6.06 13 3.22 14 6.08 14 3.34 15 7.00 15 3.34 小飞:嗯,我明白了。对于这种两组平行设计、结局是不符合正态分布的连续变量,就应当使用Wilcoxon秩和检验对吧? 小咖:很聪明,给你满分。接下来给你演示一下用SPSS 22.0怎么操作。 (1)数据录入SPSS

广义负二项分布

两参数广义负二项分布的参数估计 摘 要:讨论了在两参数场合下广义负二项分布的矩估计和极大似然估计问题,构造了矩方程和极大似然方程,得出了矩估计和极大似然估计。 关键词:广义负二项分布;矩估计;极大似然估计; 1.引言 文献[1]求出了单参数广义负二项分布的最小方差无偏估计并对其做出了区间估计。本文在此文的基础上结合构造样本矩的方法对广义负二项分布做出了矩估计和极大似然估计。 2.基本知识 设离散型随机变量X 的分布函数为 0000(,)(1)m x x x x m x m P m x x ββθβθθβ+-+??=- ?+?? (1.1.1) 0,1,2,3,x = ,其中,θβ为参数且01,0θβ<<=或11βθ-≤≤,0m 为常数且00m >。当0β=时,概率模型(1.1.1)即为二项分布; 当1β=时,概率模型(1.1.1)即为负二项分布。 由概率的正则性公理可得: (,)1x x P θβ∞==∑ 即00000(1)1m x x x x m x m m x x ββθθβ∞+-=+??-= ?+??∑ 00(1)10000[(1)](1)(1)m x x m x xm EX m m x x ββθθθθθββ∞--=+??∴=--=- ?+? ?∑ (1.1.2) 同理可求得:222232 00003(1)m m m m EX θθθθβθβ-+-=- 2230()(1)(1)VarX EX EX m θθθβ-∴=-=-- (1.1.3) 3.构造矩方程 设随机变量X 服从(1.1.1)定义的广义负二项分布,12,,,n x x x 是取自于总体X 的一 个容量大小为n 的样本,1n i i x x =∴=∑为样本均值,样本方差为:2 211()1n i i S x x n ==--∑ 2,EX x VarX S == 10(1)m x θθβ-∴-= (1.1.4) 320(1)(1)m S θθθβ---= (1.1.5)

二项分布与正态分布的特点及联系

二项分布与正态分布的特点及他们的联系 2008-05-23 09:22:10| 分类:数学|举报|字号订阅 正态分布的特点如下: 1.正态分布的形式是对称的,它的对称轴是过平均数点的垂直线,即关于x=u对称。 2.曲线在Z=0处为最高点,向左右延伸时,在正负1个标准差之内,既向下又向内弯。从正负1个标准差开始,既向下又向外弯。拐点位于正负一个标准差处,曲线两端向靠近基线处无限延伸和接近,但不相交。 3.正态分布下的面积为1,过平均数的垂直线将面积分为左右各0.50的部分。正态曲线下的每一面积都可以被看成是概率,即对应着横坐标值的随机变量出现的概率。 4.正态分布是一族分布,它随着随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。但是所有的正态分布都可以通过公式Z=(Xl—M)/S,转换成标准正态分布,即平均数为0,标准差为1的正态分布。 5.在正态分布曲线中,标准差与概率(面积)有一定的关系。 二项分布的特点如下: 1、二项分布的均值为np,方差为npq。 2、以事件A出现的次数为横坐标,以概率为纵坐标,画出二项分布的图象,可以看出: (1)、二项分布是一种离散性分布 (2)、当p=q=0.5时,图象对称;当p不等于q时,图形是偏斜的。p>q 时,呈负偏态; 3、n->∞时,趋近于正态分布N(np,npq)

一般1/2np>=5且nq>=5时,二项分布就非常接近正态分布。 二项分布函数在教育中主要用来判断试验结果的机遇性与真实性的界限,例如,求测验猜测行为的判断标准:在选择题测验中,通过二项分布计算得出被试凭猜测答对N道以上的概率。 阅读(744)|评论(0)

浅析二项分布与泊松分布之间的关系

学年论文 题目:浅析二项分布与泊松分布之间的关系 学生: 学号: 院(系):理学院 专业:信息与计算科学 指导教师:安晓钢 2013 年11月25日

浅析二项分布与泊松分布之间的关系 信息121班; 指导教师:安晓钢 (陕西科技大学理学院 陕西 西安 710021) 摘 要:泊松分布刻画了稀有事件在一段时间内发生次数这一随机变量的分布,如电话交换台单位时间内接到的呼唤次数等。二项分布是n 个独立的是/非试验中成功的次数的离散概率分布。它们有着密切的关系。泊松分布是二项分布的特例。某现象的发生率很小,而样本例数n 很大时,则二项分布接近于泊松分布,即:如果试验次数n 很大,二项分布的概率p 很小,且乘积np =λ比较适中,则事件出现的次数的概率可以用泊松分布来逼近。事实上,二项分布可以看作泊松分布在离散时间上的对应物,是二项分布的特例。通过分析二项分布和泊松分布之间的关系,使学生对概率分布理论的理解更为深刻,能够将学到的理论知识应用在实际生活中,从而提高自己的综合素质。 关 键 词:二项分布, 泊松分布, 近似 The Application of Asignment Poblem ABSTRACT: Poisson distribution is used to depict the distribution of rare events that a random variable frequency over a period of time, such as a telephone exchange in unit time received the call number. The two distribution is n independent / discrete probability distributions of number of successful non trials. They have a close relationship. Poisson distribution is two distribution case. The incidence of the phenomenon is very small, and the number of sample n is large, then the two distribution is close to the Poisson distribution, i.e.: if the test number n is large, the two probability distribution P is small, and the product of lambda = N P is moderate, the probability of the event can be used to force the Poisson distribution near. In fact, the two distribution can be seen as the counterpart of Poisson distribution in discrete time, are the two distribution case. Through the analysis of the relationship between two binomial distribution and Poisson distribution, enables the student to the theory of probability distribution for more profound understanding will be able to learn the application of theoretical knowledge in real life, so as to improve their comprehensive quality. KEY WORDS : Two distribution, Poisson distribution, Approximate

参数估计和假设检验习题解答

参数估计和假设检验习题 1.设某产品的指标服从正态分布,它的标准差σ已知为150,今抽了一个容量为26的样本,计算得平均值为1637。问在5%的显著水平下,能否认为这批产品的指标的期望值μ为1600? 解: 01:1600, :1600,H H μμ=≠标准差σ已知,拒绝域为2 Z z α>,取0.05,α=26,n = 0.0250.9752 1.96z z z α===, 由检验统计量 1.25 1.96Z = ==<,接受0:1600H μ=, 即,以95%的把握认为这批产品的指标的期望值μ为1600. 2.某纺织厂在正常的运转条件下,平均每台布机每小时经纱断头数为O.973根,各台布机断头数的标准差为O.162根,该厂进行工艺改进,减少经纱上浆率,在200台布机上进行试验,结果平均每台每小时经纱断头数为O.994根,标准差为0.16根。问,新工艺上浆率能否推广(α=0.05)? 解: 012112:, :,H H μμμμ≥< 3.某电器零件的平均电阻一直保持在2.64Ω,改变加工工艺后,测得100个零件的平均电阻为2.62Ω,如改变工艺前后电阻的标准差保持在O.06Ω,问新工艺对此零件的电阻有无显著影响(α=0.05)? 解: 01: 2.64, : 2.64,H H μμ=≠已知标准差σ=0.16,拒绝域为2 Z z α>,取0.0252 0.05, 1.96z z αα===, 100,n = 由检验统计量 3.33 1.96Z = ==>,接受1: 2.64H μ≠, 即, 以95%的把握认为新工艺对此零件的电阻有显著影响. 4.有一批产品,取50个样品,其中含有4个次品。在这样情况下,判断假设H 0:p ≤0.05是否成立(α=0.05)? 解: 01:0.05, :0.05,H p H p ≤>采用非正态大样本统计检验法,拒绝域为Z z α>,0.950.05, 1.65z α==, 50,n = 由检验统计量0.9733Z = ==<1.65,接受H 0:p ≤0.05. 即, 以95%的把握认为p ≤0.05是成立的. 5.某产品的次品率为O.17,现对此产品进行新工艺试验,从中抽取4O0件检验,发现有次品56件,能否认为此项新工艺提高了产品的质量(α=0.05)? 解: 01:0.17, :0.17,H p H p ≥<采用非正态大样本统计检验法,拒绝域为Z z α<-,400,n = 0.950.05, 1.65z α=-=-,由检验统计量 400 1.5973i x np Z -= = =-∑>-1.65, 接受0:0.17H p ≥, 即, 以95%的把握认为此项新工艺没有显著地提高产品的质量. 6.从某种试验物中取出24个样品,测量其发热量,计算得x =11958,样本标准差s =323,问以5%的显著水平是否可认为发热量的期望值是12100(假定发热量是服从正态分布的)?

二项分布与负二项分布

第四周常见随机变量 这一周我们介绍几种常见的随机变量。我们希望能够从各种随机变量产生的机理角度进行说明,从而使它们的性质展开更加自然,同时也能更深入地理解它们之所以常见的内在原因。本周学习的分布包括:二项分布,负二项分布,泊松分布,几何分布,指数分布,正态分布。 ************************************************************ 4.1二项分布与负二项分布 伯努利(Bernoulli)试验 一个随机试验只有“成功”和“失败”两种可能的结果,其中出现“成功”的概率为()01p p <<,则称此随机试验为一个参数为p 的伯努利试验。 由参数为p 的伯努利试验定义一个随机变量X , ,, 10X ?=??伯努利试验成功否则则称X 是参数为p 的伯努利随机变量,或称X 服从参数为p 的伯努利分布。************************************************************ 例4.1.1抛一颗均匀色子,如果出现偶数点称为试验“成功”,出现奇数点为试验“失败”,则随机变量 ,,,10X ?=??抛出的点数为偶数抛出的点数为奇数.是一个参数为12 p =的伯努利随机变量。************************************************************************二项分布 将参数为p 的伯努利试验独立地重复n 次,定义随机变量X 为试验成功的次数,则X 的

分布律为: ???? ??n k p p p p p n k 210210,其中()k p P X k ==k n C =()1n k k p p --,0,1,,k n = 。 此分布即称为二项分布,记为()~,X B n p ,也称X 服从参数为(),n p 的二项分布。 利用二项式定理可验证:() ()00111n n n n k k k k n k k p C p p p p -===-=+-=????∑∑, ************************************************************ 例4.1.2甲、乙两棋手约定进行10局比赛,每局棋甲获胜的概率是0.6,乙获胜的概率为0.4。如果各局比赛独立进行,试问甲获胜、战平和失败的概率? X 表示甲获胜的局数,则() 6.0,10~b X ()()101010650.60.40.6330k k k k P P X C -==>==∑甲胜, ()()41010050.60.40.1663k k k k P P X C -==<==∑乙胜, ()()5551050.60.40.2007P P X C ====战平。 ************************************************************ 例4.1.3一个通讯系统由n 个部件组成,每个部件独立工作且能正常运行的概率均为p ,如果构成系统的部件中至少有一半以上能正常运行,则称系统是“有效”的。试问当p 取何值时,由5个部件组成的系统要比由3个部件组成的系统更有效?解设n 个部件能正常运行的数目为随机变量n X ,则() ~,n X B n p 由5个部件组成的系统是“有效”的概率为:() 52P X >()()()()332445555555552345(1)(1)P X P X P X P X C p p C p p C p >==+=+==-+-+由3个部件组成的系统是“有效”的概率为:() 31P X >

负二项分布参数估计的MM算法

华中师范大学学报(自然科学版) Vol. 53 No. 3 JOURNAL OF CENTRAL CHINA NORMAL UNIVERSITY(Nat . Sci. ) Jun. 2019 第53卷第3期2019年6月 DOI : 10. 19603/j. cnki. 1000-1190. 2019. 03. 001 文章编号:1000-1190(2019)03-0319-05 负二项分布参数估计的MM 算法 刘寅* *收稿日期:2018-10-02. 基金项目:国家自然科学基金项目(11601524.61773401);中南财经政法大学青年教师资助项目(31721811206).* 通讯联系人.E-mail : yliu_1031@https://www.wendangku.net/doc/271277869.html, . (中南财经政法大学统计与数学学院,武汉430073) 摘 要:同时求解负二项分布的参数的极大似然估计并不是一件容易的事情,该文利用 Tian, Huang 和Xu 提出的组装分解技术来导出负二项分布中关于未知参数(r,p )的极大似然估 计的MM 算法迭代式.并给出该方法的收敛率的计算公式.随机模拟的结果表明的MM 迭代结果收敛到其极大似然估计.并且随着样本容量的增加,估计的准确性和精确性以及估计的 速度均有显著提高. 关键词:负二项分布;极大似然估计;组装分解技术;MM 算法;收敛率 中图分类号:C81 文献标识码:A 负二项分布又称为Pascal 分布,是概率统计 中的一种非常重要的离散分布.该分布与Poisson 具有相同的观测数据类型,但能够有效克服 Poisson 分布要求总体均值与总体方差相等这一局 限,因此可以更好的模拟实际计数数据中可能存在 的过离散现象. 令 X ?NBinomiaKr, />)(;-〉0,0< p < 1), 则其相应的概率质量函数为 iid 假设 X,?NBinomiaKr,p )异=1,…皿,{x. }?=i 为 其相应的观测值.令丫必、={工】,…,无”},则 (厂,P )的观测数据似然函数为 灯)=口 巩黑和(,'(1-以P n 口 r (x ;+r )/r (r ), 1 = 1 其中& = 2L x '/n -故相应的对数似然函数为 0(厂,p | Y 必)=c * + zzrlog (p ) + log (l — p ) + n 工 iog [『a + 厂)]—wiog [r (r )], (1) 其中,「为与o ,p )无关的标准化常数. 在对负二项分布的参数进行估计时,普遍做法 主要有以下几种: 1)将r 当做常数仅对进行估计⑴;2) 用矩方法估计r.即 r = jc 2/(52 — x ), 其中,孑为样本方差図,再基于;?估计p ; 3) 求解方程组 3Kr,p I Y,a , )/3r = 「0(心 + r ) np (r') + nlog ( 1 — />) = 0 , df (r,p I Y i A s ~)/ap = (工:=]Xi/p )— Ttr/{ \ — p ) =0, 其中,0(_r ) = r (x )/r (a:)称为 digamma 函数. 然而上述方法在实际应用中存在一定的局 限性: 1) 实际中往往并不知道确切的r 是多少,因此 将其当做常数并不合适; 2) 尽管一般对于单参数指数分布族来说.矩 估计和极大似然估计相等,但是对于双参数指数分 布族而言,极大似然估计往往要优于矩估计; 3) 理论上使得a 心p | Y “,)/"= 0的解广存 在,但是求解包含digamma 函数的方程往往并不 容易.虽然牛顿二分法是一个不错的逼近方法,但 找到一个符合二分法使用条件的求解区间可能存 在困难. Adamids 通过将负二项分布看成是对数级数 随机变量的Poisson 和,并借助于对数级数随机变 量与定义在(0,1)上的截断的指数分布随机变量 的符合来构造负二项分布参数估计的EM 算法⑶, 但是该算法较为复杂,对于初学者来说理解上较为

非参数分析

非参数统计分析――Nonparametric Tests菜单详解 平时我们使用的统计推断方法大多为参数统计方法,它们都是在已知总体分布的条件下,对相应分布的总体参数进行估计和检验。比如单样本u检验就是假定该样本所在总体服从正态分布,然后推断总体的均数是否和已知的总体均数相同。本节要讨论的统计方法着眼点不是总体参数,而是总体分布情况,即研究目标总体的分布是否与已知理论分布相同,或者各样本所在的分布位置/形状是否相同。由于这一类方法不涉及总体参数,因而称为非参数统计方法。 SPSS的的Nonparametric Tests菜单中一共提供了8种非参数分析方法,它们可以被分为两大类: 1、分布类型检验方法:亦称拟合优度检验方法。即检验样本所在总体是否服从已知的理论分布。具体包括: Chi-square test:用卡方检验来检验二项/多项分类变量的几个取值所占百分比是否和我们期望的比例有没有统计学差异。 Binomial Test:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以使连续性变量,然后按你给出的分界点一分为二。 Runs Test:用于检验样本序列随机性。观察某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 One-Sample Kolmogorov-Smirnov Test:采用柯尔莫哥诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 2、分布位置检验方法:用于检验样本所在总体的分布位置/形状是否相同。具体包括: Two-Independent-Samples Tests:即成组设计的两独立样本的秩和检验。 Tests for Several Independent Samples:成组设计的多个独立样本的秩和检验,此处不提供两两比较方法。 Two-Related-Samples Tests:配对设计的两样本秩和检验。 Tests for Several Related Samples:配伍设计的多样本秩和检验,此处同样不提供两两比较。 一、分布位置检验方法

负二项分布的性质特征及在流行病学研究中的应用

负二项分布的性质特征及在流行病学研究中的应用 【摘要】给出了负二项分布的分解定理,进一步研究了负二项分布的有关性质及参数的无偏一致估计,以及在流行病学该分布的生物学意义。 【关键词】负二项分布;无偏一致估计;应用 负二项分布是概率论中常用的重要的离散型随机分布,它在医学中主要用于聚集性疾病及生物、微生物、寄生虫分布模型等的研究。具体地说,当个体间发病概率不相等可以拟合负二项分布,如单位人数内某传染病的发病人数,某地方病、遗传病的发病人数等,这些均可通过负二项分布进行处理。本文从概率论的角度阐述负二项分布的性质及参数的最小方差无偏估计,并且以该分布在流行病学中应用为例证讨论了其生物学意义。 1 负二项分布的概率模型 负二项分布又称帕斯卡分布(Pascal),它有两种基本模型[1]: 模型Ⅰ:假定每次试验可能的结果只有两个:可归结为成功或失败,每次试验之间是独立,每次成功的概率均为π,直到恰好出现r(指定的一个自然数)次成功所需试验次数X,则X的概率分布为: p(X=K)=πCr-1k-1πk-1(1-π)k-r=Cr-1k-1π-(1-π)k-r k=r,r+1 (1) 模型Ⅱ:假定每次试验可能的结果只有两个:可归结为成功或失败,每次试验之间是独立,每次成功的概率均为π,试验进行到r次成功为止,记X为试验共进行的次数,则X 的概率分布为[3]: p(X=k)=Cr-1k+r-1πk(1-π)k k=0,1,2, (2) 此分布的概率是πr(1-(1-π))-r 的幂级数展开式的项,负二项分布由此而得名记作 X~f(k,r,π) ,或 X~NB(r,π) 一个重要的特例是 r=1。这时(2)成为 p(X=k)=π(1-π)k k=0,1,2, (3) 称为几何分布。 2 性质特征 为研究负二项分布的性质,我们先给出一个重要的结论: 引理:设X~NB(r,π),则其特征函数为ψx(t)=πr(1-(1-π)eit)-r 证明:ψx(t)=E(eitx)=∑∞i=0Cr-1i+r-1πr(1-π)i eitr =∑∞i=0Cr-1i+r-1πr((1-π) e)rti =πr∑∞i=0Cr-1i+r-1((1-π) ert)i =πr(1-(1-π)eit)-r 定理1 设: X1,X2,…,Xr(3)的iid样本,如果 X=∑ri=1Xi, 则X=∑ri=1Xi~NB(r,π) 证明:因为X1,X2,…,Xr独立同分布,又有引理知X=∑ri=1Xi的特征函数为:φ(t)=πr(1-(1-π) eit)-r =πr∑∞k=0(-r)(-r01)…(-r-k+1)k! ((1-π) eit)k(-1)keitr =πr∑∞k=0(r+k-1)!(r-1)!k! (1-π)k eit(k+1) =∑∞k=0πr(1-π)k eit(k+r) Cr-1r+k-1 这正是 p(X=k)=Cr-1r+k-1(1-π)k 的概率分布 则X=∑ri=1Xi~NB(r,π)

正确理解泊松分布

正确理解泊松分布 很多人在上概率论这门课的时候就没搞明白过泊松分布到底是怎么回事,至少我就是如此。虽然那个时候大家都会背“当试验的次数趋于无穷大,而乘积np固定时,二项分布收敛于泊松分布”,大部分的教科书上也都会给出这个收敛过程的数学推导,但是看懂它和真正的理解还有很大距离。如果我们学习的意义是为了通过考试,那么我们大可停留在“只会做题”的阶段,因为试卷上不会出现“请发表一下你对泊松公式的看法”这样的题目,因为那样一来卷子就变得不容易批改,大部分考试都会出一些客观题,比如到底是泊松分布还是肉松分布。 而如果我们学习的目的是为了理解一样东西,那么我们就有必要停下来去思考一下诸如“为什么要有泊松分布?”、“泊松分布的物理意义是什么?”这样的“哲学”问题。 如果我们要向一个石器时代的人解释什么是电话,我们一定会说:“电话是一种机器,两个距离很远的人可以通过它进行交谈”,而不会说:“电话在18XX年由贝尔发明,一台电话由几个部分构成……”(泊松分布在18XX年由泊松提出,泊松分布的公式是……)所以我们问的第一个问题应该是“泊松分布能拿来干嘛?” 泊松分布最常见的一个应用就是,它作为了排队论的一个输入。什么是排队论?比如我们去每天食堂打饭,最头疼的一个问题就是排队,之所以要排队是因为食堂打饭的大叔有限,假设学校有1000个学生,而食堂恰好配了1000个大叔和打饭的窗口,那么就永远不会有人排队。但是出于经营成本方面的考虑食堂通常不会这么干,因此如何控制窗口的数量并且保证学生不会因为排队时间太长而起义是一门很高深的学问。 在一段时间t(比如1个小时)内来到食堂就餐的学生数量肯定不会是一个常数(比如一直是200人),而应该符合某种随机规律:比如在1个小时内来200 个学生的概率是10%,来180个学生的概率是20%……一般认为,这种随机规律服从的就是泊松分布。 也就是在单位时间内有k个学生到达的概率为: 其中为单位时间内学生的期望到达数。 问题是“这个式子是怎么来的呢?”——我们知道泊松分布是二项分布满足某种条件的一个特殊形式,因此可以先从简单的二项分布入手,寻找两者之间的联系。

相关文档
相关文档 最新文档