常见大题:
1. 全概率公式和贝叶斯公式问题 B 看做“结果”,有多个“原因或者条件
i
A ”可以导
致B 这个“结果”发生,考虑结果B 发生的概率,或者求在B 发生的条件下,源于某个原因i
A 的概率问题
全概率公式:
()()()
1B |n
i i i P B P A P A ==∑
贝叶斯公式:
1(|)()()
()()n
i i i j
j
j P A B P A P B A P A P B
A ==∑||
一(12分)今有四个口袋,它们是甲、乙、丙、丁,每个口袋中都装有a 只红球和b 只白球。先从甲口袋中任取一只球放入乙口袋,再从乙口袋中任取一只球放入丙口袋,然后再从丙口袋中任取一只球放入丁口袋,最后从丁口袋中任取一球,问取到红球的概率为多少? 解 i B 表示从第i 个口袋放入第1+i 个口袋红球,4,3,2,1=i
i A 表示从第i 个口袋中任取一个球为红球, 2分
则
b a a
B P +=
)(1, 2分 111++++
++++=b a a b a b b a a b a a b a a
+= 2分 依次类推 2分 二(10分)袋中装有m 只正品硬币,n 只次品硬币(次品硬币的两面均印有国徽),在袋中任取一只,将它投掷r 次,已知每次都出现国徽,问这只硬币是次品的概率为多少?
、解 记B ={取到次品},B ={取到正品},A ={将硬币投掷r 次每次都出现国徽} 则()(),n m P B P B m n m n
=
=
++,()1P A B =,()1
2r P A B =―—5分 三、(10分)一批产品共100件,其中有4件次品,其余皆为正品。现在每次从中任
取一件产品进行检验,检验后放回,连续检验3次,如果发现有次品,则认为这批产品不合格。在检验时,一件正品被误判为次品的概率为,而一件次品被误判为正品的概率为。(1)求任取一件产品被检验为正品的概率;(2)求这批产品被检验为合格品的概率。
解 设 A 表示“任取一件产品被检验为正品”, B 表示“任取一件产品是正品”,则
()96100P B =
,()4100
P B =,()|0.95P A B =,()|0.01P A B = (1)由全概率公式得
(2)这批产品被检验为合格品的概率为
四、在电报通讯中不断发出信号‘0’和‘1’,统计资料表明,发出‘0’和‘1’的概率分别为和,由于存在干扰,发出‘0’时,分别以概率和接收到‘0’和‘1’,以的概率收为模糊信号‘x ’;发出‘1’时,分别以概率和收到‘1’和‘0’,以概率收到模糊信号‘x ’。
(1)求收到模糊信号‘x ’的概率;
(2)当收到模糊信号‘x ’时,以译成哪个信号为好?为什么?
解 设i A =“发出信号i ”)1,0(=i , i B =“收到信号i ”),1,0(x i =。由题意知
6.0)(0=A P , 4.0)(1=A P , 2.0)|(0=A B P x , 1.0)|(1=A B P x 。
(1)由全概率公式得
)
()|()()|()(1100A P A B P A P A B P B P x x x += 4分
16.04.01.06.02.0=?+?=。 2分
(2)由贝叶斯公式得
75.016
.06
.02.0)()()|()|(000=?==
x x x B P A P A B P B A P , 3分
25
.075.01)|(1)|(01=-=-=x x B A P B A P 3分
二、随机变量函数的分布及其边缘密度及其独立性的判断 记住如下知识点: 常见分布律和概率密度:
一般正态分布的计算转化为标准正态分布去做:
连续随机变量X:
二维随机变量的分布函数: 联合密度:
掌握如下解决随机变量函数分布的解题方法:
对于二维随机变量函数的概率密度,注意:除了求随机变量 Z=X+Y 的密度函数用公式: 注意:
先写出联合密度:(,y)f x ,根据联合密度写出
(,)f x z x -或者(,)f z y y -,
在平面x0z 或者y0z 上画出被积函数
(,)f x z x -不为零的区
域,然后穿线通过区域确定x 的上下限。
他的函数Z = g ( X , Y )的概率密度,只能使用分布函数法 其步骤如下: 第一步 求联合密度:
(,y)f x ,根据联合密度写出
(,)f x z x -或者(,)f z y y -
第二步 求z 的分布函数:
难点是画出二重积分的积分区域,然后把二重积分化为二次积分定上下限,
画图:先画出被积函数也就是联合密度非零的区域,再确定区域
(,)g x y z ≤与密度非零区域的重合区域就是二重积分的积分区域,
穿线定积分限:然后左右穿或者上下穿个积分区域定内限,求出分布函数
第三步 求密度函数:()()Z Z f z F z '= 分析:
一、设总体X 服从(0,1)上的均匀分布,12,,,n X X X L 是来自总体X 的一个样本,最大顺序统计量),,,max (21)(n n X X X X Λ=, 1.求随机变量)(n X 的概率密度;
解:???<<=其它,010,1)(~x x f X ,其分布函数为??
?
??≥<<≤=1
,110,0
,0)(x x x x x F
而),,,max (21)(n n X X X X Λ=的分布函数为
()()z F z f n n X
X )()('=()[]()z f z F n n 1-=1-=n nz ,)10(< 解 (1)由()0 1,y y f x y dxdy dy Ae dx A ∞∞ ∞--∞-∞ ===?? ??,得1A = (2)()()20 1,12 y y y E X xf x y dxdy dy xe dx y e dy +∞+∞ ∞∞ ---∞ -∞ = ===?? ??? 三(16分)设二维随机变量),(Y X 的概率密度为 (1) 求边缘密度函数)(x f X ,)(y f Y ; (2) 求边缘分布函数)(x F X ,)(y F Y ; (3) 判断X 与Y 是否相互独立; (4) 求)1(>+Y X P 。 (1) ()(,)X f x f x y dy +∞ -∞=?, 当x ≤0时,(,)f x y =0,于是()X f x =0 当x >0时,() X f x = y x x e dy e +∞ --=? , 所以X 的边缘概率密度为 ()X f x =? ??≤>-0,00 ,x x e x Y 的边缘概率密度 ()(,)Y f y f x y dx +∞ -∞=? 当y ≤0时, ()Y f y =0 当 y >0时 () Y f y = ?? ?≤>-0 ,00 ,y y e y 4分 (2) ?? ?<-=-其他 , 00, 1)(y e y F y ?? ?<-=-其他 , 00,1)(x e x F x 4分 ( 3)独立 4分 (3 ) 1 2 (X 1)(,)x y P Y f x y dxdy e +>+>= = ?? 4分 四(10分)设随机变量),(Y X 的概率密度为 求随机变量Y X Z 2+=的分布函数。 当0≤z 时,0)(=z F Z 当 >z 时, z z z x z y x Z ze e dy e dx z F ---+---==?? 12)(0 20 )2( 所以Y X Z 2+=的分布函数为 3.中心极限定理的问题:用正态分布近似计算 共两类: 一类是二项分布的近似计算问题 ~(,)X b n p (,(1)) N np np p -:近似 ~(0,1) N , 这个公式给出了n 较大时二项分布的概率计算方法。 另一类是除二项分布之外的其他分布的独立变量连加和的计算问题, 设12,,,,n X X X L L 独立同分布,()()201,2,,.k k E X D X k n μσ==>=L 近似有连加和服从正态分布: 一、 (14分) 设粮仓内老鼠的数目是一个服从泊松分布的随机变量,且仓内无鼠的概率为2 -e 。 (1)写出随机变量的分布律; (2)试用中心极限定理计算,在200个同类粮仓内老鼠总数超过350只的概率。 解 (1))2(~πX ; 5分 (2)X 表示任意老鼠个数,由中心极限定理 3分 ???? ????->??-=>220022003502 2002200)350(X P X P 3分 ???? ? ???-Φ-≈220022003501 3分 二、(10分)某保险公司多年的统计资料表明,在索赔户中被盗索赔户占20%,以X 表示在随意抽查的100个索赔户中因被盗而向保险公司索赔的数。 (1)写出X 的概率分布; (2)求被盗索赔户不少于14户且不多于30户的概率的近似值。 [解] (1))2.0,100(~b X , k k k C k X P -==1001008.02.0}{,100,,2,1,0Λ=k (2) 20 2.0100)(=?=X E ,16)2.01(2.0100)(=-??=X D 根据棣莫佛—拉普拉斯中心极限定理 三(10分)某银行的柜台替每一位顾客的服务时间(单位:分钟)服从参数1 2 λ = 的指数分布,且各位顾客的服务时间是相互独立的,试用中心极限定理计算,对100位顾客的总服务时间不超过240分钟的概率。 解 设1100,,X X K 分别表示每一位顾客的服务时间,则它们相互独立相同分布,且 ()2,()4i i E X D X == ------------------------------- 5分 点估计的问题:矩估计和似然估计 似然函数的构造: 例题分析: 一、设总体X 的概率密度为 θ是未知参数,n X X X ,,,21Λ是来自X 的样本, 1.求θ的矩估计量1θ∧ ; 矩估计法:()1x EX xe dx θθ θ∞ --==-?,令X EX =-=1θ, => 1?1+=X θ 2.求θ的最大似然估计量2θ∧ ; 3.判断1θ∧ ,2θ∧ 是否为无偏估计 解:最大似然估计法:设n x x x ,,21Λ为样本的观察值,则 似然函数为∑===- --=∏n i i i x n x n i e e L 1 ) (1 ) (θθθ, θ θ≥=≥≤≤i n i i x n i x 1min ,,1,即 按似然估计的思想,当 似然函数关于θ 是增函数,故 i x min ?2=θ。 θ的最大似然估计量为i X min ?2=θ。 二(10分)设n X X X ,,,21Λ为样本,总体X 的概率密度为 求参数μ的最大似然估计量;问它是否为μ的无偏估计量 解设n x x x ,,,21Λ是n X X X ,,,21Λ相应的样本值,则似然函数为 )21( )(12 )(ln 2∏=-- =n i x i i e x L μπμ=∏=-- --∑ =n i x i n n i i e x 1 2)(ln 12 1 2 )()2(μπ 令 ?=0ln μd L d ∑==n i i x n 1ln 1?μ μπ μμ?∑∞+∞---====dy e y x E n E y n i i 2 )(12 2ln 1)?( 为无偏估计量 三、设n X X X ,,,21Λ是总体X 的样本, X 的概率密度为 其中0>θ .求θ和μ的最大似然估计量。 设n x x x ,,,21Λ是n X X X ,,,21Λ的样本值, 则似然函数 ∏==n i i x f L 1 ),;(μθn i x e i x n n i i ,,2,1,,1 )(1 Λ=≥∑ ==-- -μθμθ, 当μ≥ i x (n i ,,2,1Λ=)时, ∑=-- -=n i i x n L 1 )(1 ln ln μθ θ, 令 显然, 第二个等式是矛盾等式, 所以由上述似然方程求不出θ ?和μ?. 由于0ln >=??θ μn L , 这表明L 是μ的严格递增函数, 注意到i x ≤μ(n i ,,2,1Λ=), 因此当 },,,min{21n x x x Λ=μ时L 最大. 于是θ和μ的最大似然估计值 },,,min{?21n x x x Λ=μ , },,,min{)?(1?211 n n i i x x x x x n Λ∑=-=-=μθ, 于是θ和μ的最大似然估计量为 },,,m in{?21n X X X Λ=μ, },,,min{?21n X X X X Λ-=θ. 四、(10分)设总体X 的概率密度为 其中0σ>是未知参数。设12,,,n X X X L 为总体X 的样本。 (1)求参数σ的最大似然估计量?σ ;(2)判断?σ是否为σ的无偏估计量。 解 (1)设12,,,n x x x L 是12,,,n X X X L 的观测值, 则似然函数为 1 1 1 1122n i i n x n x i L e e σσσσ=--=∑??== ???∏, 1 1 ln ln 2ln n i i L n n x σσ ==--- ∑。 令 ln 0d L d σ =,得21 10n i i n x σσ=-+=∑ ,解得1 1?n i i x n σ ==∑ σ的最大似然估计量为 1 1?n i i X n σ ==∑ 五(10分)设电池的寿命服从指数分布,其概率密度为 其中0>θ 为未知参数,今随机抽取5只,测得寿命如下: 1150,1190,1310,1380,1420 求电池的平均寿命θ的最大似然估计值。 解 似然函数∑ = =n i i x n e L 1 1 _ 1 ) (θθ θ, 3分 ∑=- -=n i i x n L 1 1 ln )(ln θ θθ 3分 令01 )(ln 1 2=+-=∑=n i i x n L dx d θ θθ得 2分 1290)14201380131011901150(5 1 ?=++++==x θ 2分 六、设总体X 的概率密度为 其中1α->是未知参数.设n X X X ,,,21Λ为总体X 的样本.求参数α的矩估计量 和最大似然估计量. 解 矩估计 且 n i i A X X n ===∑11 1,令 11A μ=,则 1 2 X αα+=+ 从而α的矩估计量 最大似然估计 设n x x x ,,,21Λ是n X X X ,,,21Λ的样本观测值, 则似然函数为 ()()1111n n n i i i i L x x α α αα==??=+=+ ??? ∏∏. 取对数得()1 ln ln 1ln n i i L n x α α==++∑, 令 ln 0d L d α =,得1ln 01n i i n x α=+=+∑,解得 1 ?1ln n i i n x α==--∑, 所以, α的最大似然估计量为 1 ?1ln n i i n X α ==--∑. 七、.设总体X 的分布律为 {}21P X θ==, {}()221P X θθ==-, {}()2 31P X θ==- 其中θ为未知参数。现抽得一个样本:11x =,22x =,31x =,求参数θ的矩估计值和极大似然估计值。 解 ()()()2 2413132E X θθθθθ=+-+-=-,43 x = 由()E X x =,即4 323 θ-=,得参数θ的矩估计值为5?6 θ= 统计量的分布判断问题: 主要利用性质: 独立正态分布的线性组合还是正态分布 三大分布的定义: 例题分析: 一 、设12,,,n X X X L 是正态总体2 ~(,)X N μσ的样本, 1.试问 22 1 1 ()n i i X μσ=-∑服从什么分布(指明自由度)? )1,0(~N X i σ μ -且独立, )(~)( )(1 21 21 2 2 n X X n i i n i i χσ μ μσ ∑∑==-=- 2.假定0μ=,求2 122 12()() X X X X +-的分布。 )2,0(~221σN X X +,)2,0(~221σN X X - )1,0(~22 1N X X σ +, )1,0(~22 1N X X σ -)1(~)2( 22 1χσ X X +,)1(~)2( 22 1χσ X X - 又22 1)2( σ X X +和22 1)2( σ X X -相互独立,故 2 122 12()()X X X X +-=)1,1(~1 /)2(1 /)2( 22122 1F X X X X σ σ++ 三、 2 21 11()n i i S X n μ==-∑, ∑=--=n i i X X n S 1 22 2)(11. (1) 证明2221,S S 都是2σ的无偏估计量;(2)判断2 221,S S 中哪一个估计量更有效. 利用卡方分布: 四设129,,,X X X L 是来自正态总体2 (,)N μσ的样本,记1 161 ()6 Y X X =++L ,27891()3 Y X X X =++,92 2271()2i i S X Y ==-∑,求统计量122()Y Y Z S -= 的分布? 五、设()2~0,,X N σ12,,,n X X X L 为X 的样本,求统计量3 2124 13i i n i i X n X ==?? - ? ?? ∑∑的分布. 六、.设总体 ()2~0,X N σ,12345,,,,X X X X X 是X 的样本,统计量 ()()2 2 12345Y a X X b X X X =++--,(0ab ≠) 服从2 χ分布,求参数,a b 的值和Y 的分布的自由度。 解 由()2~0,X N σ,得 且相互独立,即 ()()345 12 ~0,1,~0,123N N σ σ , 且相互独立。于是 且相互独立。所以当2 2 11,23a b σ σ = = 时, 该分布的自由度为2。 假设检验和区间估计的题目类型: 记住正态总体的抽样分布定理,弄懂上分位数的含义,在密度曲线图上用分位数给出各个分布的大概率1α-区域和小概率 α 区域 能够从图上用分位数标出各种分布的双侧小概率区域和单侧小概率区域 , , 。 1(10分)某工厂生产铜线,根据长期积累的数据知,铜线的折断力服从正态分布,方差为 162=σ。今从某天生产的铜线中随机抽取10根,测得折断力如下: 292298286285285286284285286289, 问该天生产的铜线折断力与以往比较,其波动性有无显着变化?)05.0(=α 检验假设16:16 :212 0≠=σσH H , 统计量20 2 2 )1(σχ S n -= ,则当0H 为真时,)1(~22 -n χχ , 拒绝域为)1(22 12 -<-n αχχ 或)1(2 2 2->n αχχ。 现在65.1016 4 .170)1(2 2 2 == -= σχ S n ,,05.0=α 7.2)9()1(,023.19)9()1(2975.022 2025.022 ==-==-χχχχααn n , 由于0,023.1965.107.2H 故接受<<, 即该天生产的铜线折断力与以往比较,其波动性无显着变化。 2(8分)在某砖厂生产的一批砖中, 随机地抽取6块, 测量其抗断强度(单位MPa)分别为 设砖的抗断强度X 服从正态分布)11.0,(2 μN , 问能否认为这批砖的平均抗断强度是?(显着性水平01.0=α ) 、解 0100:,:μμμμ≠=H H 3分 检验统计量n x t /0 σμ-= ,拒绝域 )1(2 ->n u t α 3分 算得 575.2005.0= 接受0H 3(10分)某化工厂一天中生产的化学制品产量(单位:吨)服从正态分布,今测得5天的产量分别为785,805,790,790,802。问是否可以认为日产量的均值显着小于800? (取 05.0=α) 解 假设01:800,:800H H μμ≥< 检验统计量 x t = 分 拒绝域0.05(4)t t <- 1.4527 2.1318 t = =->-,接受0H -- 4.12,,,n X X X L 是来自正态总体()2 ,N μσ的样本,其中参数μ和2 σ 均未知,对于参数μ 的置信度为1α-的置信区间,试问当α减少时该置信区间的长度如何变化? 答:则μ的置信度为1- α的置信区间)]1([-±n t n S X α 置信区间的长度)1(22-= n t n S L α,当样本容量给定时,减小α的值会增大)1(-n t α的值,相应地)1(22-= n t n S L α变长。 5、(10分) 某灯泡生产车间为考察灯泡的寿命,从生产的一批灯泡中随机抽取25只,测得平均寿命1980x =小时,标准方差2 3600S =小时。假设灯泡的寿命X 服从正态分布()2 ,N μσ,(1)求总体方差2 σ 的置信水平为95%的置信区间;(2)在显着性水平 0.05α=条件下能否认为这批灯泡的平均寿命为2000小时? 解 (1)0.05α=,25n =,()2 1/2112.401n αχ--=,()2 /2139.364n αχ-=。 2σ的置信水平为95%的置信区间为 (2)在检验水平为5%的条件下检验假设 0:2000H μ=,1:2000H μ≠ 选取检验统计量 X t =当原假设0H 时,()~1X t t n = -;该假设检验问题的拒绝域为 由条件得 ()()/20.025124 2.0639t n t α-== 由于()/21.6667 2.06391t t n α=<=-,因此接受原假设0:2000H μ=,即在检验水平为5%的条件下可以认为这批灯泡的平均寿命为2000小时。 6. 假设某种产品来自甲、乙两个厂家,为考查产品性能的差异,现从甲乙两厂产品中分别抽取了8件和9件产品,测其性能指标X 得到两组数据,经对其作相应运算得 假设测定结果服从正态分布()()2~,1,2i i X i μσ=, 1.在显着性水平0.10α =下,能否认为22 12 σσ=? 2.求12μμ-的置信度为90%的置信区间,并从置信区间和假设检验的关系角度分析甲乙两厂生产产品的性能指标有无显着差异。 解 (1) 检验假设2 2 22 012112:, :H H σσσσ=≠ 拒绝域为 ()() 22 11/2121/2122222 1,11,1S S F F n n F F n n S S αα-=≥--=≤--或 由条件知 查表得 ()()/2 120.051,17,8 3.50F n n F α--==, 显然 ()()1/212/2121 ,10.751,1F n n F F n n αα---<=<-- 接受原假设2 2 012:H σσ=,故可认为2 2 12σσ=,即认为两总体方差相等,也就是两厂生产的产品的指标X 的方差无显着性差异. (2) 求12μμ-的置信区间。 由(1)知2 2 12σσ=,但其值未知,故12μμ-的1α-置信 区间为 计算 ()()22 11222 12110.00712 w n S n S S n n -+-= =+- 查表 ()()/2 120.05215 1.7531t n n t α+-== 故12μμ-的90%置信区间为 =()0.1900.238 1.75310.120,0.024?-±=- ? 数字特征: 概念清楚: 均值(期望)的概念: , 重点掌握均值、方差、协方差的性质结合常见分布的均值和方差计算其他数字特征: 1.设随机变量 ,X Y 的协方差矩阵为12C σσσσ?? = ??? ,求()D aX bY -。 设二维随机变量(,)~(1,2;4,9;0.5)X Y N ,求二维随机变量(2,2)X Y X Y +-的协方差矩阵. 解 ()()()12,,,D X D Y Cov X Y σσσ === 一些填空和选择常用的知识点 例题