文档库 最新最全的文档下载
当前位置:文档库 › 概率统计补充案例解析

概率统计补充案例解析

概率统计补充案例解析
概率统计补充案例解析

补充案例:概率部分:

案例1、“三人行必有我师焉”

案例2、抓阄问题

案例3、贝叶斯方法运用案例介绍

案例4、化验呈阳性者是否患病

案例5、敏感性问题的调查

案例6、泊松分布在企业评先进中的应用

案例7、碰运气能否通过英语四级考试

案例8、检验方案的确定问题

案例9、风险型决策模型

案例10、一种很迷惑游客的赌博游戏

案例11、标准分及其应用

案例12、正态分布在人才招聘中的应用

案例13、预测录取分数线和考生考试名

统计部分:

案例14、随机变量函数的均值和标准差的近似计算方法案例15、如何表示考试成绩比较合理

案例16、如何估计湖中黑、白鱼的比例

案例17、预测水稻总产量

案例18、工程师的建议是否应采纳

案例19、母亲嗜酒是否影响下—代的健康

案例20、银行经理的方案是否有效

案例21、一元线性回归分析的Excel实现

案例22、方差分析的Excel实现

案例23、预测高考分数

案例24、两次地震间的间隔时间服从指数分布

案例1、“三人行必有我师焉”

我们可以运用概率知识解释孔子的名言“三人行必有我师焉”. 首先我们要明确一个问题,即只要在某一方面领先就可以为师(韩愈说“术业有专攻”). 俗语说“三百六十行,行行出状元”,我们不妨把一个人的才能分成360个方面。孔子是个大圣人,我们假设他在一个方面超过某个人的概率为99%,那么孔子在这方面超过与他“同行”的两个人的概率为99% ×99% =98.0l %,在360个方面孔子总比这两人强的概率为

(98.01%)360=0.07% ,即这两个人在某一方面可以做孔子老师的概率为99.93%.从数学角度分析,孔子的话是很有道理的. 案例2、抓阄问题

一项耐力比赛胜出的10人中有1 人可以获得一次旅游的机会,组织者决定以抓阄的方式分配这一名额. 采取一组10人抓阄,10张阄中只有一张写“有”. 每个人都想争取到这次机会,你希望自己是第几个抓阄者呢? 有人说要先抓,否则写有“有”的阄被别人抓到,自己就没有机会了;有人说不急于先抓,如果前面的人没有抓到写有“有”的阄,这时再抓抓到“有”的机会会大一些. 为了统一认识,用概率的方法构造一个摸球模型来说明问题.

摸球模型:袋中装有1 个红球和9 个黄球除颜色不同外球的大小、形状、质量都相同. 现在10 人依次摸球(不放回),求红球被第 k 个人摸到的概率( k = 1, 2, ?, 10).

解决问题 :设 k A = “ {第 k 个人摸到红球

}, k = 1, 2, ?

, 10. 显然,红球被

第一个人摸到的概率为

101

)(1=

A P . 因为 12A A ?,于是红球被第二个人摸到的概率为 101

91109)()()()(121212=

?===A A P A P A A P A P .

同样,由 213A A A ?知红球被第三个人摸到的概率为

1018198109)()()()()(2131213213=

??=

==A A A P A A P A P A A A P A P .

如此继续,类似可得 )(4A P = =

=ΛΛ)(5A P 101

)(10

=A P .

由此可见,其结果与k无关,表明10 个人无论摸球顺序如何,每个人摸到红球的机会相等. 这也说明10 个人抓阄,只要每个人在抓之前不知道他前边那些已经抓完的结果,无论先后, 抓到的机会是均等的.

在现实生活中单位分房、学生分班、短缺物品的分配等,人们常常乐于用抓阄的办法来解决,其合理性保证当然得归功于“概率”. 通过上面的摸球模型,我们总结出分配中的“抓阄”问题,无论先抓后抓,结果是一样的.学完概率之后再遇到抓阄问题时不必争先恐后,我们要发扬风格让他人先抓.

案例3、贝叶斯方法运用案例介绍

什么是贝叶斯过滤器?

垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。

正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规避。

2002年,Paul Graham提出使用"贝叶斯推断"过滤垃圾邮件。他说,这样做的效果,好得不可思议。1000封垃圾邮件可以过滤掉995封,且没有一个误判。

另外,这种过滤器还具有自我学习的功能,会根据新收到的邮件,不断调整。收到的垃圾邮件越多,它的准确率就越高。

建立历史资料库

贝叶斯过滤器是一种统计学过滤器,建立在已有的统计结果之上。所以,我们必须预先提供两组已经识别好的邮件,一组是正常邮件,另一组是垃圾邮件。

我们用这两组邮件,对过滤器进行"训练"。这两组邮件的规模越大,训练效果就越好。Paul Graham使用的邮件规模,是正常邮件和垃圾邮件各4000封。

"训练"过程很简单。首先,解析所有邮件,提取每一个词。然后,计算每个词语在正常邮件和垃圾邮件中的出现频率。比如,我们假定"sex"这个词,在4000封垃圾邮件中,有200封包含这个词,那么它的出现频率就是5%;而在4000封正常邮件中,只有2封包含这个词,那么出现频率就是0.05%。(【注释】如果某个词只出现在垃圾邮件中,Paul Graham 就假定,它在正常邮件的出现频率是1%,反之亦然。随着邮件数量的增加,计算结果会自动调整。)

有了这个初步的统计结果,过滤器就可以投入使用了。

贝叶斯过滤器的使用过程

现在,我们收到了一封新邮件。在未经统计分析之前,我们假定它是垃圾邮件的概率为50%。(【注释】有研究表明,用户收到的电子邮件中,80%是垃圾邮件。但是,这里仍然假定垃圾邮件的"先验概率"为50%。)

我们用S表示垃圾邮件(spam),H表示正常邮件(healthy)。因此,P(S)和P(H)的先验概率,都是50%。

然后,对这封邮件进行解析,发现其中包含了sex这个词,请问这封邮件属于垃圾邮件的概率有多高?

我们用W表示"sex"这个词,那么问题就变成了如何计算P(S|W)的值,即在某个词语(W)已经存在的条件下,垃圾邮件(S)的概率有多大。

根据条件概率公式,马上可以写出

公式中,P(W|S)和P(W|H)的含义是,这个词语在垃圾邮件和正常邮件中,分别出现的概率。这两个值可以从历史资料库中得到,对sex这个词来说,上文假定它们分别等于5%和0.05%。另外,P(S)和P(H)的值,前面说过都等于50%。所以,马上可以计算P(S|W)的值:因此,这封新邮件是垃圾邮件的概率等于99%。这说明,sex这个词的推断能力很强,将50%的"先验概率"一下子提高到了99%的"后验概率"。

联合概率的计算

做完上面一步,请问我们能否得出结论,这封新邮件就是垃圾邮件?

回答是不能。因为一封邮件包含很多词语,一些词语(比如sex)说这是垃圾邮件,另一些说这不是。你怎么知道以哪个词为准?

Paul Graham的做法是,选出这封信中P(S|W)最高的15个词,计算它们的联合概率。(【注释】如果有的词是第一次出现,无法计算P(S|W),Paul Graham就假定这个值等于0.4。因为垃圾邮件用的往往都是某些固定的词语,所以如果你从来没见过某个词,它多半是一个正常的词。)

所谓联合概率,就是指在多个事件发生的情况下,另一个事件发生概率有多大。比如,已知W1和W2是两个不同的词语,它们都出现在某封电子邮件之中,那么这封邮件是垃圾邮件的概率,就是联合概率。

在已知W1和W2的情况下,无非就是两种结果:垃圾邮件(事件E1)或正常邮件(事件E2)。

其中,W1、W2和垃圾邮件的概率分别如下:

如果假定所有事件都是独立事件(【注释】严格地说,这个假定不成立,但是这里可以忽略),那么就可以计算P(E1)和P(E2):

又由于在W1和W2已经发生的情况下,垃圾邮件的概率等于下面的式子:

将P(S)等于0.5代入,得到

将P(S|W1)记为P1,P(S|W2)记为P2,公式就变成

这就是联合概率的计算公式。

最终的计算公式

将上面的公式扩展到15个词的情况,就得到了最终的概率计算公式:

一封邮件是不是垃圾邮件,就用这个式子进行计算。这时我们还需要一个用于比较的门槛值。Paul Graham 的门槛值是0.9,概率大于0.9,表示15个词联合认定,这封邮件有90%以上的可能属于垃圾邮件;概率小于0.9,就表示是正常邮件。 有了这个公式以后,一封正常的信件即使出现sex 这个词,也不会被认定为垃圾邮件了。 案例4、化验呈阳性者是否患病

在医疗中经常通过化验来诊断。当某人做癌症检查结果呈阳性时,他就患癌症了?其实不然。假设某一地区患有癌症的人占0.005,患者对一种试验反应是阳性的概率为0.95,正常人对这种试验反应是阳性的概率为0.04,现抽查了一个人,试验反应是阳性,问此人是癌症患者的概率有多大?

设C={抽查的人患有癌症},A={试验结果是阳性},则C 表示“抽查的人不患癌症”。

已知()0.005P C =, ()0.995P C =,

()0.95P A C =, ()0.04P A C =。 由贝叶斯公式,可得

)

()()()()

()()(C A P C P C A P C P C A P C P A C P +=

代入数据计算得: P (C |A )= 0.1066 。在以上假设下,做癌症检查结果呈阳性的人确患癌症的概率为仅为0.1066,平均来说,1000个人中大约只有107人确患癌症。

这是不是意味着这种试验对于诊断一个人是否患有癌症没有意义呢?不是!如果不做试验,一人是患者的概率为0.005。若试验后得阳性反应,则此人是患者的概率为0.1066, 从0.005增加到0.1066,将近增加约21倍,说明这种试验对于诊断一个人是否患有癌症有意义。

案例5、敏感性问题的调查

学生阅读不健康书刊或录像会严重影响学生的身心健康. 但这些都是避着家长和教师进行的,属个人隐私行为. 我们如何设计一种调查方案,能够估计出大学生中看过不健康书刊或录像的人数的比率呢?

对这种敏感性问题的调查,被调查者会有一种顾虑,害怕调查者不能很好的保守秘密. 如果被调查者不愿意真实回答问题,将使调查数据失真,这样的统计结果将没有意义. 因此巧妙设计调查方案是获得真实数据的关键.

经过多年的研究和实践,一些统计学家和心理学家发明了一种能消除人们抵触情绪的“随机化应答”方法. 被调查者只需回答两个问题之一,而且只需回答“是”或“否”,设计的问题如下:

问题A :你的生日是否在 7月1日 之前? 问题B :你是否看过不健康书刊?

被调查者在没有外人的情况下,从一个装有黑球和白球的箱子中随机抽取一个球,看过颜色后又放回.若抽出白球则回答问题A ;若抽出黑球则回答问题B. 箱中黑球所占比率 α是已知的,即

{}P α=任意抽取一个是黑球, {}1P α=-任意抽取一个是白球.

被调查者无论回答A 或B ,都只需在一张只有“是”、“否”两个选项的答案上做出选择,然后投入密封的投票箱内. 上述抽球和答卷都在无人的情况下进行,这样就可以消除被调查者的顾虑,从而可以保证答卷的真实可靠性.

打开投票箱进行统计,设共有 n 张有效答卷,其中 k 张选择“是”,那么可用频率 n

k

估计回答“是”的概率 ?为:

{}/P k n ?==答“是”.

回答“是”有两种情况:一种是摸到白球后对问题A 回答“是”,也就是被调查者 “生日在7月1日之前”的概率,一般认为这个概率是0.5,即

}{

0.5

P =答“是”抽白球;

另一种是摸到黑球后对问题B 回答“是”,这个条件概率就是看不健康书刊的学生在参加

调查的学生中的比率 p ,即 }

{

P p

=答“是”抽黑球.

利用全概率公式得

{}{}}{{}}

{

P P P P P =?+?答“是”抽白球答“是”抽白球抽黑球答“是”抽黑球,

即 αα?p +-=)(

15.0. 由此可获得

/0.5(1)

k n p αα

--==

.

假设在一次实际调查中,箱子中共有50个球,其中30个是黑球,20个白球,则 6.0=α. 调查结束时共收到1583张有效答卷,其中有389张回答“是”,据此可估算出

0762

.06.04.021

1583389=?-=p .

这表明1583名学生中,约 62.7%的学生看过不健康书刊. 案例6、泊松分布在企业评先进中的应用

某工业系统在进行安全管理评选时,有两家企业在其它方面得分相等,难分高下。只剩下千人事故率这个指标,甲企业有2000人,发生事故率为0.005,即发生事故10起。乙

企业有1000人,发生事故率也为0.005,即发生事故5起。那么,应该评选谁为先进企业呢?

显然,按事故数来评,则应评乙企业为先进。但甲企业不服。因为甲企业的事故数虽然是乙企业的2倍。但甲企业的人数正好是乙企业的2倍。按事故率来评,两企业应榜上有名。由于指标限制,只能评出一家企业,究竟评谁好呢? 可用泊松(Poisson )分布来解决这个问题。

统计资料表明:安全管理中的事故次数、负伤人数是服从泊松分布的。服从泊松分布的随机变量 X 取

k 值的概率为:

{}!

k

P X k e k λ

λ-==

其中 np λ=(

n 为人数,

p 为平均事故概率)

事件发生了至少

x 次的概率为

{}!

k

k x P X x e k λ

λ∞

-=≥=∑

0x =,上式 {0}1P X ≥=成为必然事件。

假设两厂均不发生事故得满分10分。两厂的均值分别为10与5,则两厂发生事故的概率为

105

105(),()!!k k P X k e P X k e k k --==

==乙甲

两厂的得分为

评选乙企业为先进。

案例7、碰运气能否通过英语四级考试

大学英语四级考试是全面检验大学生英语水平的一种综合考试,具有一定难度.这种考试包括听力、语法结构、阅读理解、写作等.除写作占15分外,其余85道为单项选择题,每道题附有A 、B 、C 、D 四个选项.这种考试方法使个别学生产生碰运气和侥幸心理. 那么,靠运气能通过英语四级考试吗?

答案是否定的. 下面我们计算靠运气通过英语四级考试的概率有多大. 假定不考虑写作所占的15分,若按及格为60分计算,则85道选择题必须要答对51道题以上才行,这可以看成是85重伯努利试验.

设随机变量X 表示答对的题数,则)25.0,85(~B X

,其分布律为:

()

8585()(0.25)0.75,0,1,2,,85k

k

k P X k C k -===L

若要及格,必须51≥X ,其概率为

()85

8512

8551

(51)(0.25)0.758.7410k

k

k k P X C --=≥=

≈?∑

此概率非常之小,故可认为靠运气通过英语四级考试几乎是不可能发生的事件,它相当于在1000亿个碰运气的考生中,只有0.874个人可以通过考试. 然而,我们地球上只有60多亿人口.

案例8、检验方案的确定问题

在某地区为了进行某种疾病普查,需要检验N 个人的血液,可用两种方法进行,方法(一):对每个人的血液逐个检验,这时需要检验N 次;方法(二):将N 个检验者分组,每组k 个人,把一组的k 个人抽出的血液混合在一起进行一次检验,如果检验结果为阴性,则说明这k 个人的血液均为阴性,这时这k 个人总共检验了一次;如果检验结果为阳性,为了明确这k 个人中哪些人为阳性,就要对这k 个人再逐个进行检验,这时这k 个人总共进行了 1 + k 次检验. 假设每个人的检验结果是否为阳性是独立的,且每个人为阴性的概率为q. 问哪种检验方法检验次数少些?

对方法(二),设每个人所需检验次数是一个随机变量X ,则X 的分布律为

?????

?

?-+

k k q q k k 1111

k q q k q k EX k k k 11)1)(11(1+-=-++=

那么,N 个人平均需要检验的次数为

)

11(k q N k +- 由此可知,适当选择k ,使得 1

k

k q 1>时,则N 个人的平均需要检验的次数小于N ,这时方法(二)比方法(一)检验次数少.

如果q 已知,还可以根据

k q EX k 1

1+

-=选出使其最小的整数 0k ,从而使得检验次

数最少. 比如, 若需检验 1000人,且 9.0=q ,则 40=k ,按方法(二)平均只需进行检

验 594

)41

9.01(10004=+-?次,这样可以减少约 40%的工作量,为检验工作节约大量

的人力、物力、财力. 案例9、风险型决策模型

决策是人们在政治、经济、军事和日常生活等多方面普遍存在的一种选择方案的行为.风险型决策是指在作出决策时,由于某些随机性的因素影响,决策因存在一定的风险,称为风险型决策.

某渔船要对下个月是否出海打鱼作出决策. 如果出海后是好天,可获收益 5000元,若出海后天气变坏,将损失 2000元;若不出海,无论天气好坏都要承担 1000元损失费. 据

预测下月好天的概率为0.6,天气变坏的概率为0.4,应如何选择最佳方案?

我们将出海的收益作为随机变量X,其概率分布如下:

故X的数学期望为

2200

4.0

)

2000

(

6.0

5000=

?

-

+

?

=

EX(元)

显然出海的收益比不出海的收益好.

案例10、一种很迷惑游客的赌博游戏

在一个游客很多的旅游圣地,发现一类赌博游戏。形式是这样的:摊主(以下称赌主)拿着一个装有20个同样大小的玻璃球的小袋,玻璃球共有红、黄、蓝、白、黑5种颜色,每种颜色均为4个球。让游客(以下称赌客)从袋中任意摸出10个球。如摸到红球4个,黄球4个,白球2个,则数字排列为442(数字大者排前,小者排后),以摸到各种球组成的数

不同球色数字排列

4

4

2

4

3

3

4

4

1

1

4

2

2

2

4

3

1

1

1

3

3

3

1

2

2

2

2

2

4

3

2

1

4

2

2

1

1

3

3

2

2

3

3

2

1

1

3

2

2

2

1 输赢金额(元)

+1

+5 +5 +2 +2 +2 +1 +1

+0.

5

+0.

5

-2 -2.5

表面上看12中可能只有2中可能赌客输钱,似乎赌客赢钱的可能性大。也正是如此,很能吸引过往的旅客参赌。最后结果如何?若每天有100人参赌,则赌主每天能赢100来元。下面具体计算。

用()i

P x表示摸到某球色数字排列

i

x的概率。由古典概率公式可得如下概率分布表

10

20

184756

C=

球色数字排列种类组合种数概率()

p x输赢金额1

(442)

x24412

54434

180

C C C C C=0.0010 +10

2

(433)

x14233

54444

480

C C C C C=0.0026 +5

3

(4411)

x244211

544344

480

C C C C C C=0.0026 +5

4

(4222)

x143222

544444

4320

C C C C C C=0.0234 +2

5

(43111)

x1413111

5444444

5120

C C C C C C C=0.0277 +2

6

(331)

x33311

54424

5120

C C C C C=0.0277 +2

7

(22222)

x22222

44444

7776

C C C C C=0.0421 +1

8

(4321)

x1413121

5444344

11520

C C C C C C C=0.0642 +1

9

(42211)

x1422211

5444444

17280

C C C C C C C=0.0935 +0.5

由上表可得 赌客赢钱概率 10

1()0.3765

i

i p x ==∑

赌客输钱概率

1112()()0.6235p x p x +=

当摸的次数很多时,赌主赢钱几乎是必然的。

设随机变量 X 为赌客每赌一次输赢的金额,则其数学期望为:

()100.001520.00262(0.023420.0277)1(0.04210.0624)0.520.093520.2494 2.50.3741

1.04E X =?+??+?+?+

?++??-?-?=-

从整体上看赌客每赌一次平均输1.04元。如果每天有100人参赌,则赌主每天平均进

帐104元。

案例11、标准分及其应用

原始分数不利于各科水平的横向比较和考试的评价分析. 一是其位置含义不明确. 原始分数是75分,这个分数是高还是低?该考生在全体考生中的位置靠前还是靠后?单从这个分数看不出来,因为没有一个稳定的参照点. 二是不可比. 原始分数往往受试题难度和区分度大小的影响,具有不稳定性. 题目难,原始分数就偏低;试题容易,分数就偏高,从而导致了原始分数之间的不可比性. 三是不可加. 各科原始分数、位置标准不一致,不可直接累加后比较,就像我们不能将甲乙两人口袋里的美元与港币数直接相加来比较哪个钱多一样.所以,在评价学生学业水平时,为了可比性,比较一学生几门课的情况、两个学生多科的总成绩等,可将卷面分转化为标准分来比较. 对一门课,比较标准分的大小;对多门课,比较标准分总和. 标准分就是分数这个随机变量

X 的标准化:

DX EX X -.

由于标准分数分值小,并带有小数和负值,在许多情形下直接使用不大合乎人们的习惯,故通常根据具体情况,把标准分数通过线性变换化为各种导出分数. 常见的有: ①教育与心理测验中的分数:T=50+10Z ②韦氏智力量表中各分测验的量表分:T=10+3Z

③韦氏智力量表智商(离差智商):IQ=100+15Z

④美国大学入学考试委员会使用的标准分数:CEEB=500+100Z

⑤美国教育测验中心举办“托福”考试:TOEFL=500+70Z ⑥我国出国人员英语水平考试即EPT 所使用的分数:EPT=90+20Z

⑦五等级分数:由标准分的值按表4来分段确定等级。按此方式,40人的班,每次考试,不管原始分数如何,大约有3人(占7%)不及格。美国不少大学采用这种“竞争”的评分方式。

表4 标准分与五等级划分

案例某公司准备通过考试招工 300 名。其中 280 名正式工,20 名临时工. 实际报考人数为 1657名. 考试满分400 分。考试不久后,通过当地新闻媒体得到如下消息:考试平均成绩是166 分, 360 分以上的高分考生31 名. 某考生A 的成绩为 256分. 问他能否被录取?若被录取,能否是正式工?

我们用正态分布来解决这个问题.

先预测最低录取分数线,记最低录取分数为 0x 。设考生成绩为 X ,对一次成功的考试来说,X 应服从正态分布,即 ),166(~2

σN X ,从而 )1,0(~166

N X Y σ-=

由题设知 165731

)166

360()360(≈

->

=>σ

Y P X P

于是

981.01657311)166

360(

=-

≈-Φσ

。查正态分布表,得 08.2166

360≈-σ,

从而 93=σ。因此

)93,166(~2N X .

因为最低录取分数线 0x 的确定,应使高于此线的考生的频率等于 1657300

,即

1657300

)93166()(00≈

->=>x Y P x X P

819

.016573001)93166(0=-≈-Φx

于是 251,91.093166

00≈≈-x x .即最低录取分数线是251 分.

下面预测考生 A 的名次,其考分 256 = x .

831.0)93166

256()93166256()256(≈-Φ=-<

=

故 169.0831.01)256(=-≈>X P ,此表示成绩高于考生A 的人数约占总人数的 16.9%.

由 282169.01657≈?知考生A 大约排在 283名.

因为该考生的成绩是 256 分,大于录取分数限 251 分,因此该考生 A 能被录取. 但他的排名是283,排在280 名之后,所以他不能被录取为正式工,只能是临时工。 案例13、预测录取分数线和考生考试名次

当今社会,考试作为一种选拔人才的有效途径,正被广泛采用.每次考试过后,考生最关心的两个问题是:自己能否达到最低录取分数线?自己的考试名次如何?其实,学了概率之后我们可以通过二项分布来解决这些问题.

招工问题: 某公司通过招聘考试,准备招工300名(其中 280名正式工,20名临时

工),而报考的人数是 1657名,考试满分为400分.考试后不久,通过当地新闻媒介得到如下信息:考试总评成绩是166分,360分以上的高分考生31名.某考生A 的成绩是256分,问他能否被录取?如被录取能否是正式工?

解决问题: 先来预测一下最低录取分数线,记该最低分数线为 0x .

设考生考试成绩为 ξ,则 ξ是随机变量,对于一次成功的考试来说, ξ应服从正态分布.本题中, ),166(~2

σξN ,则

)1,0(~166

N σξη-=

因为考试成绩高于360分的频率是 165731

,所以

165731)166

360()360(≈

->

=>σ

ηξP P .

于是

981.0165731

1)166

3600()3600(=-

≈-≤

≤=≤≤σ

ηξP P ,

查正态分布表知,

08

.2166

360≈-σ

,即 93≈σ.

所以

)93,166(~2

N ξ. 因为最低录取分数线 0x 有确定应使高于此线的考生的频率等于 1657300

,即

1657300

)93166()(00≈->

=>x P x P ηξ,

所以

819.01657300

1)931660()0(00=-≈-≤

≤=≤≤x P x P ηξ.

查正态分布表,得 0166

0.911593x -≈,求得 0250.77x ≈.

即最低录取分数线是251.

下面预测考生A 的考试名次.他的考分x=256,查正态分布表知,

166.0834.01)968.0(1)93166

256()256(=-≈Φ-=->

=>ηξP P .

这说明,考试成绩高于256分的频率是0.166,也就是说成绩高于考生A 的人数大约占总人数的16.6%.所以,考试名次排在A 之前的人大约有 165716.6%275.06?=(名), 即考生A 大约排在第276名.

从以上分析得出:最低录取分数线为251分,低于考生A 的分数,所以,考生A 能被录取.但因其考试名次大约是276名,排在280名之前,所以,有可能被录取为正式工. 案例14、随机变量函数的均值和标准差的近似计算方法

在工程上,已知随机变量的均值和标准差,求随机变量函数的均值和标准差的近似方法主要有泰勒展开式、变异系数法、基本函数法.

例1 设

X 、 Y 的均值、标准差分别为 Y Y X X σμσμ,;,.找出函数 2

)(X X f =均值、

标准差的近似计算公式.

对 2

)(X X f Z ==在 X X μ=附近进行线性逼近:

)(2))(()()(2

X X X X X X X X f f X f μμμμμμ-+=-'+≈

所以 X X X X X X X X X D X D σμσσμμμμ2,4)](2[)(22

222==-+=, 而

222)(2

X

X X EX DX μσμ+=+= .

例2 设

X 、 Y 的均值、标准差分别为 Y Y X X σμσμ,;,。找出函数

Y X Y X g =

),(均

值、标准差的近似计算公式.

Y X

Y X g =

),(在 X X μ=附近进行线性逼近:

))(,())(,(),(),(Y Y X Y X Y X X Y X Y g X g g Y X g μμμμμμμμ-'+-'+≈

)()(12

Y Y

X X Y Y X Y X μμμμμμμ---+=

所以 Y X Y X E μμ=)(, 242

22)(Y Y X Y X Y X D σμμμσ+=,即 2

1

22222)(1X Y Y X Y Y X σμσμμσ+=.

案例15、如何表示考试成绩比较合理 ——TOEFEL 成绩是如何计算出来的

考试成绩是考生水平的反映,考试成绩的合理表示不但能反映考生的实际水平,而且还应该尽量减少因题目难易程度对考试成绩的影响。

目前,我国普遍采用百分制记分法、即满分设计为100分,考生在这 100分中所得分数即为他们的成绩。

这种记分法的主要缺点是分数受题目难易程度的影响很大,若考题容易,很可能大部分考生成绩都在80分以上,这样80分未必是好成绩。从这个角度看,百分制不能完全反映考生实际水平的高低.

采用排名次的方法,或者称为秩方法,对于评定考生间的相对成绩不失为一个好办法。 该方法将考生的成绩由低到高排列,考生所排位置成为该考生的秩,成绩越好的考生秩越大

(注意这与我们通常的考生的排名正好相反),而相同成绩的考生的秩规定为这几个考生在他们应排位置上的平均数.例如,某6位考生的考试成绩的百分制和秩方法有如下关系: 百分制 90 80 70 70 65 60 秩 6 5 3.5 3.5 2 1

其中两位考生的成绩相同,他们应排在3,4的位置上,从而他们的秩同为(3+4)/2=3.5。 秩方法也有其不足之处,由于秩的大小与考生人数有关,1000人中的第三和10人中的第三是难以比较的.

为了克服百分制和秩方法的不足,可以将百分制分数或秩改换为百分位.某考生的百分位是假定有l 00人参加考试时,成绩等于或小于该考生成绩的人数.若有4人参考,考生成绩的百分制及百分位有如下关系:

百分制67 78 90 95

秩l 2 3 4

百分位25 50 75 100

又如,若有50人参考,某位考生的成绩是第11名,倒数是第40名,则他的百分位为80,也就是说,有80%同学的成绩不如他或和他持平。

百分制是将满分定位100,而百分位是将考生中的最好成绩定位100.具体算法为:百分位也有其不足之处,就是不能根据百分位确定原来的考试得分。

一种比较合理因而也是国际上较通用的记分方法就是标准分方法;一个考生的标准分等于一个考生的考试得分见减去全体考生得分的平均值再除以所有考生的得分的标准查(样本方差开方),

i

i

X X Y

S

-=

正的标准分表示该考生的成绩高于平均分,负的标准分表示该考生的成绩低于平均分,且在一般情况下,根据中心极限定理,标准分可认为服从正态分布(0,1)

N,这样标准分不仅与考试的原始得分相对应,而且可有标准正态分布表。确定出某标准分下的相应的百分位(即标准分小于或等于所给定标准分的概率乘100),由标准正态分布表可得百分位与标准

例如,百分位-50,则标准分一0;百分位=95,则标准分—1.64.反之若标准分为0.5,则百分位—69,等等.

TOEFEL 自考试成绩采用标准分记分法.只是为了消除标准分中的两位小数,给标准分乘上100,另外又为了消除负号,再加上500,即 TOEFEL :-h=1 00×标准分+500

由TOEFEL 分结台上表可以看出,考TOKFEL 得500分并不难。因为它只相当于所有考生的平均分,考600分以上的人(此时标准分≥1)占全体考生人数的l5%,而得664分以上得人数只占全体考生得5%.因此能考664分自然是很不容易的。 案例16、如何估计湖中黑、白鱼的比例

某水产养殖场两年前在人工湖混养了黑白两种鱼. 现在需要对黑白鱼数目的比例进行估计. 设湖中有黑鱼 a 条,则白鱼数为 b ka =,其中 k 为待估计参数. 从湖中任捕一条鱼,记

1,0,X ?=?

?若是黑鱼若是白鱼

则,

1(1),(0)1(1)11a k

P X P X P X a ka k k ==

===-==+++. 为了使抽取的样本为简单随机样本,我们从湖中有放回的捕鱼 n 条.(即任捕一条,记

下其颜色后放回湖中.任其自由游动,稍后再捕第二条,重复前一过程) 得样本

12,,,n X X X L . 显然诸 i X 相互独立,且均与 X 同分布. 设在这 n 次抽样中,捕得

m 条

黑鱼.下面用用矩法和极大似然估计法估计 k .

(1)矩估计法.令

1

()1X E X k ==

+

可求得 1?1M

k X =-.由具体抽样结果知, X 的观测值

m X n =,故 k 的矩估计值为 ?1M

n k m =-. (2)极大似然估计. 由于每个 i X 的分布为:

11{}()(),0,111i i

x x i i i k P X x x k k -===++ 设

1,2,,n

x x x L 为相应抽样结果(样本观测值),则似然函数为:

11121

(;,,,)()()11n

n

i

i

i i n x x n k L k x x x k k

==-

∑∑=++L (1)n m n k k -=

+ 12ln (;,,,)()ln ln(1)n L k x x x n m k n k =--+L 令 12ln (;,,,)0

1n d L k x x x n m n

dk k k -=-=+L

可求得 R 的极大似然估计值为

?1MLE

n k m =-

对本题而言,两种方法所得估计结果相同.

本题是一个十分广泛的估计比例的统计模型. 案例17、预测水稻总产量

某县多年来一直种植水稻,并沿用传统的耕作方法, 平均亩产600千克.今年换了新的稻种,耕作方法也作了改进. 收获前,为了预测产量高低,先抽查了具有一定代表性的30亩水稻的产量,平均亩产642.5千克,标准差为160千克. 如何预测总产量?

要预测总产量,只要预测平均亩产量. 只要算出平均亩产量的置信区间,则下限与种植面积的乘积就是对总产量的最保守估计,上限与种植面积的乘积就是对总产量最乐观估计.

设水稻亩产量 X 为一随机变量,由于它受众多随机因素的影响,故可设 ),(~2

σμN X .

根据正态分布关于均值的区间估计,在方差 2

σ已知时,

μ的置信度为95%的置信区间为: ]

96

.1,96

.1[n X n X σ

σ

+-

用 2S 代替 2

σ,将 160,5.642,30===S X n 代入,有

25.575.64296

.1±=±n S

X

故得 μ的置信度为95%的置信区间为:[585.25,699.75]. 所以,最保守的估计为亩产585.25千克,比往年略低;最乐观的估计为亩产可能达到700千克,比往年高出100千克.

因上下差距太大,影响预测的准确. 要解决这个问题,可再抽查70亩,即前后共抽样100亩. 若设 160,5.642,100===S X n ,则 μ的95%的置信区间为:

4.31

5.64296

.1±=±n S

X

即[611.1,673.9].置信下限比以往年亩产多11.1千克.这就可以预测:在很大程度上,今年水稻平均亩产至少比往年高出11千克, 当然这是最保守的估计. 案例18、工程师的建议是否应采纳

某机械厂工程师建议厂长采用新工艺加工齿轮可节省开销。他用新工艺做了9个星期的试验。在保证齿轮质量和数量的同时,使每台机器平均每周开支由原来的100元降到了75元。

假定每台机器采用新、老工艺每周运转开支都服从正态分布 2

(,25)N u 。在 0.01α=的水

平下。检验新工艺能否节省开支。

我们把开支不能节省与开支能节省分别作为零假设与备则假设,即 01:100;:100H u H u =<

在 0H 为真时,检验统计量

~(0,1)

X U N =

拒绝域为 0.01 2.33U Z Z α<-=-=-

00100,75,9,25u x n σ====代入

U 的观察值

00.01

3 2.33U Z =

=-<-=-

落在拒绝域内。故应拒绝 0H 。即认为新工艺能显著节省开支。所以工程师的建议应该被采纳。

〔注〕为什么要把“开支不节省”即 100u =作为零假设而不把 100u <作为零假设?这是因为工程师建议采用新工艺是一件大事。如果没有较可靠的证据表明这样做有益,则不宜采纳。把“开支不节省”作为零假设便能体现这一点。因为检验水平为0.01,当零假设正确开支不节省,因而不宜采纳工程师建议时,犯错误(即采纳工程师建议)的可能性只有0.01,这个概率很小。

案例19、母亲嗜酒是否影响下—代的健康

美国的jones 医生于1974年观察了母亲在妊娠时曾患慢性酒精中毒的6名七岁儿童(称为甲组)以母亲的年龄,文化程度及婚姻状况与前6名儿童的母亲相同或相近,但不饮酒的46

智商一般受诸多因素的影响从而可以假定两组儿童的智商服从正态分布

211(,)N u σ和

211(,)N u σ

本问题实际是检验甲组总体的均值 1u 是否比乙组总体的均值 2u 偏小?若是,这个差异范围有多大?前一问题属假设检验,后一问题属区间估计。

由于两个总体的方差未知,而甲组的样本容量较小。因此采用大样本下两总体均值比较的U -检验法似乎不妥.故采用方差相等(但未知)时。两正态总体均值比较的t -检验法对第一个问题作出回答。为此,利用样本先检验两总体方差是否相等,即检验假设

2222

012112

:;:H H σσσσ=≠

当 0H 为真时,统计统计量 2

122

~(5,45)

S F F S =

拒绝域为 1/2(5,45)F F α-≤或

/2(5,45)F F α≥,取

0.1α=

/20.051/20.950.05(5,45)(5,45) 2.431

(5,45)(5,45)0.22

(45,5)F F F F F αα-====

=

F 的观察值 2

0219 1.41

16F ==,得

0.9500.05(5,45)(5,45)F F F <<

未落在拒绝域内,故接受 0H ,即认为两总体方差相等

下面用t -检验法检验 1u 是否比 2u 显著偏小?即检验假设

012112:;:H u u H u u =<

当 0H 为真时,检验统计量

12~(2)

X X T t n n =

+-

其中 22

2

1122

12(1)(1)2w

n S n S S n n -+-=

+-,取 0.01α=

将 221

212119,16,6,46,99S S n n x =====代入得 T 的观察值 00.012.96 2.54(50)T t =-<-=-

落在拒绝域内,故拒绝 0H .即认为母亲嗜酒会对儿童智力发育产生不良影响. 下面继续考察这种不良影响的程度。为此要对两总体均值差进行区间估计. 21u u -的置信度为 1α-的置信区间为

21122)X X S n n -±+-

取 0.01α=,并代入相应数据可得 0.005(50) 2.67,16.32w t S == 于是置信度为99%的置信区间为。

99-78±16. 32×2.67×

土18 91=(2 .09, 3 9.91)

由此可断言:在99%的置信度下。嗜酒母亲所生孩子在七岁时自己智商比不饮酒的母亲所生孩子在七岁时的智商平均低2.09到39.91

〔注〕读者可能已注意到。在解决问题过程中。两次假设检验所取的显著性水平不同.在检验方差相等时,取 0.1α=;在检验均值是否相等时取 0.01α=。前者远比后者大。为什么要这样取呢?因为检验的结果与检验的显著性水平 α有关。 α取得小。则拒绝域也会小。产生的后果使零假设 0H 难以被拒绝。因此,限制显著性水平的原则体现了“保护零假设”的原则

在 α较大时,若能接受 0H ,说明 0H 为真的依据很充足:同理,在 α很小时.我们仍

然拒绝 0H 说明 0H 不真的理由就更充足。在本例中,对 0.1α=,仍得出 22

12σσ=可被

接受及对 0.01α=,

12u u =可被拒绝的结论,说明在所给数据下,得出相应的结论有很

充足的理由。

另外在区间估计中,取较小的置信水平 0.01α=(即较大的置信度),从而使得区间估计的范围较大。若反之,取较大的置信水平.则可减少估计区间的长度,使区间估计分精确。但相应地区间估计的可靠度要是降低了,则要冒更大的风险 案例20、银行经理的方案是否有效

某银行经理认为现在的储蓄机制有点片面的强调顾客的存款数而对顾客取款缺乏一些激励措施。为此,他设计了一种将存款数与存款期限相乘的指数,然后在不太影响银行效益的前提下设计了一些有吸引力的存款有奖措施已尽量减少顾客的取款数。为了比较此方案的

有效性,随机地选择了该银行的15位储户,得到他们在新方案实施前后的指数,结果见下表

对α检验该经理的方案是否有效。

对本检验问题,采用成对数据的比较方法较好。这是因为初看起来,这是两总体均值的比较问题,即将新方案实施前后的指数分别看作两个总体,将1 5位储户在新方案实施前后的指数看作来自这两个总体的样本,若进一步假设这两个总体服从正态分布,便可利用t-检验法检验二者的均值是否有显著差异.但仔细想想,发现这样有点欠妥,因为每位储户的家庭经济状况、消费水平、理财策略等等会有很大的差异,从而储户的存款存在较大差异,这使得各户之间的存款指数缺乏一致性,因而看成来自同一总体的样本是不妥当的.如果我们将同一储户在新方案实施前后的存款指数相减,由于各储户在新方案实施前后

的经济状况、消费水平、理财策略等方面不会有太大的变化,则该差值不是由于各储户的家庭状况的差异而来,而是反映了新方案的实施对存款指数的影响,因而将这些差值看成来自

某一总体的样本就比较合理了.若进一步假定这些差值服从

2

(,)N u σ,则 u 的大小反映了新方案实施前后对存款指数的平均影响程度.检验方案是否有效,等价于检验假设 01:0;:0H u H u ≤>

该假设便可有正态总体均值的t -检验法来检验

以 12,(1,2,,15)i i x x i =L 分别表示新方案实施前后各储户的存款指数,令

21,1,2,,15i i i y x x i =-=L

则 1215,,,y y y L 可看做来自正态总体

2

(,)N u σ的一个容量为15的样本观测值。由此可求得:

15

1

0.011300.4715190.96(1)(14) 2.624

i i n y y S t n t α=====-==∑

由正态总体均值的t -检验统计量

n

T =

及上述假设可得其拒绝域为(注意此处( 00u =))

0)

(1)n

Y u T t n S α-=

>-

0(1)Y u t n α=-

0.010.01,(14) 2.624t α==

(1)Y n c α≥

->

代入具体数据可求得

2.624129.38c =

=。由于 300.47y c =>,

故拒绝 0H ,所给数据结果显著地支持新方案有效。

本例关于原假设 0H 的选择体现了数理统计数材中指出的如何选择零假设和备择假设的精神.即我们“希望”证实某方法有效果时,“有意”将“该方法无效"作为零假设.因为如果这时还能拒绝零假设(特别时在显著性水平 α较小时),则“有效果”的断言就得到更有

力的支持.反之,若把“新方法有效果”作为零假设,则当它被接受时,只是说明有效果的断言“能与观察数据相容”,并不能说明它受到观察数据的有力支持.

本例中所介绍的方法称为成对数据比较的参数性检验方法.能用此方法检验的问题在现实世界中大量存在.例如,为了比较两个玉米品种的平均亩产量,如果利用正态总体均值此

概率论重要知识点总结

概率论重要知识点总结 概率论重要知识点总结 第一章随机事件及其概率 第一节基本概念 随机实验:将一切具有下面三个特点: (1)可重复性 (2)多结果性 (3)不确定性的试验或观察称为随机试验,简称为试验,常用表示。 随机事件:在一次试验中,可能出现也可能不出现的事情(结果)称为随机事件,简称为事不可能事件:在试验中不可能出现的事情,记为。必然事件:在试验中必然出现的事情,记为Ω。 样本点:随机试验的每个基本结果称为样本点,记作ω.样本空间:所有样本点组成的集合称为样本空间.样本空间用Ω表示.一个随机事件就是样本空间的一个子集。基本事件—单点集,复合事件—多点集一个随机事件发生,当且仅当该事件所包含的一个样本点出现。事件的关系与运算(就是集合的关系和运算)包含关系:若事件发生必然导致事件B发生,则称B 包含A,记为,则称事件A与事件B 相等,记为A=B。 事件的和:“事件A 与事件B 至少有一个发生”是一事件,称此事件为事件A 与事件B 事件的积:称事件“事件A与事件B 都发生”为A 或AB。事件的差:称事件“事件A 发生而事件B 不发生”为事件A 与事件B 的差事件,记为A-B。用交并补可以表示为互斥事件:如果A,B两事件不

能同时发生,即AB=Φ,则称事件A 与事件B 是互不相容事件或互斥事件。互斥时可记为A+B。对立事件:称事件“A不发生”为事件A 的对立事件(逆事件),记为A 。对立事件的性质:事件运算律:设A,B,C为事件,则有: (1)交换律:AB=BA,AB=BA A(BC)=(AB)C=ABC (3)分配律:A(BC)=(AB)(AC)ABAC (4)对偶律(摩根律): 第二节事件的概率 概率的公理化体系:第三节古典概率模型1、设试验E 是古典概型,其样本空间Ω个样本点组成.则定义事件A 的概率为的某个区域,它的面积为μ(A),则向区域上随机投掷一点,该点落在区域假如样本空间Ω可用一线段,或空间中某个区域表示,则事件A 的概率仍可用上式确定,只不过把μ理解为长度或体积即可.第四节条件概率条件概率:在事件B 发生的条件下,事件A 发生的概率称为条件概率,记作乘法公式: P(AB)=P(B)P(A|B)=P(A)P(B|A)全概率公式:设第五节事件的独立性两个事件的相互独立:若两事件A、B 满足P(AB)=相互独立.三个事件的相互独立:对于三个事件A、B、C,若P(AB)=相互独立三个事件的两两独立:对于三个事件A、B、C,若P(AB)=两两独立独立的性质:若A 均相互独立总结: 1.条件概率是概率论中的重要概念,其与独立性有密切的关系,在不具有独立性的场合,它将扮演主要的角色。 2.乘法公式、全概公式、贝叶斯公式在概率论的计算中经常使用,应

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

概率论与数理统计第二章补充题与答案

《概率论与数理统计》第二单元补充题 一、 填空题: 1、函数()f x 为连续型随机变量X 的概率密度函数的充要条件是 12),) 2、随机变量X 的分布律为5 110 32 12 10 P X ,则2X 的分布律为__________,2X +1的分布律为__________ 3、设离散型随机变量X 的分布律为 ,2,1,21}{===k k X P k ,则随机变量X Y 2sin π =的分布律为 4、设离散型随机变量X 的分布律为 k =1, 2, 3,…,则c= . 5、设随机变量X 的概率密度函数为 , 则P (0

【免费下载】概率论与数理统计案例

实例1 发行彩票的创收利润某一彩票中心发行彩票 10万张, 每张2元. 设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计算彩票发行单位的创收利润.解:设每张彩票中奖的数额为随机变量X , 则X 10000 5000 1000 100 10 0p 51/1052/10510/105100/1051000/100p 每张彩票平均能得到奖金 05512()10000500001010E X p =? +?++? 0.5(),=元每张彩票平均可赚20.50.3 1.2(), --=元因此彩票发行单位发行 10 万张彩票的创收利润为:100000 1.2120000().?=元实例2 如何确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70%,将损失 2 万元.若存入银行,同期间的利率为5% ,问是否作此项投资?解:设 X 为投资利润,则 X 8 -2p 0.3 0.7()80.320.71(),E X =?-?=万元存入银行的利息:故应选择投资.1050.5(),%?=万元实例3 商店的销售策略某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X (以年计),规定1,1500;12,2000;23,2500; 3,3000.X X X X ≤<≤<≤>一台付款元一台付款元一台付款元一台付款元10,1e ,0,()100, 0.x X x f x x Y -?>?=??≤? 设寿命服从指数分布概率密度为试求该商店一台家用电器收费的数学期望定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术、电气课校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料、电气设备调试高中中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并

概率论知识点

第一章 随机事件及其概率 §1.1 随机事件及其运算 随机现象:概率论的基本概念之一。是人们通常说的偶然现象。其特点是,在相同的条件下重复观察时,可能出现这样的结果,也可能出现那样的结果,预先不能断言将出现哪种结果.例如,投掷一枚五分硬币,可能“国徽”向上,也可能“伍分”向上;从含有5件次品的一批产品中任意取出3件,取到次品的件数可能是0,1,2或3. 随机试验:概率论的基本概念之一.指在科学研究或工程技术中,对随机现象在相同条件下的观察。对随机现象的一次观察(包括试验、实验、测量和观测等),事先不能精确地断定其结果,而且在相同条件下可以重复进行,这种试验就称为随机试验。 样本空间: 概率论术语。我们将随机试验E 的一切可能结果组成的集合称为E 的样本空间,记为Ω。样本空间的元素,即E 的每一个结果,称为样本点。 随机事件:实际中,在进行随机试验时,人们常常关心满足某种条件的那些样本点所组成的集合.称试验E 的样本空间Ω的子集为E 的随机事件,简称事件.在每次试验中,当且仅当这一子集中的一个样本点出现时,称这一事件发生.特别,由一个样本点组成的单点集,称为基本事件.样本空间Ω包含所有的样本点,它是Ω自身的子集,在每次试验中它总是发生的,称为必然事件.空集?不包含任何样本点,它也作为样本空间的子集,它在每次试验中都不发生,称为不可能事件. 互斥事件(互不相容事件): 若事件A 与事件B 不可能同时发生,亦即ΦB A = ,则称事件A 与事件B 是互斥(或互不相容)事件。 互逆事件: 事件A 与事件B 满足条件ΦB A = ,Ω=B A ,则称A 与B 是互逆事件,也称A 与B 是对立事件,记作A B =(或B A =)。 互不相容完备事件组:若事件组n A A A ,,21满足条件ΦA A j i = ,(n 1,2j i, =), Ω== n 1i i A ,则称事件组n A A A ,,21为互不相容完备事件组(或称n A A A ,,21为样本空 间Ω的一个划分)。 §1.2 随机事件的概率 概率:随机事件出现的可能性的量度。概率论最基本的概念之一。人们常说某人有百分之多少的把握能通过这次考试,某件事发生的可能性是多少,这都是概率的实例。 统计概率:在一定条件下,重复做n 次试验,A n 为n 次试验中事件A 发生的次数,如果随着n 逐渐增大,频率n n A 逐渐稳定在某一数值p 附近,则数值p 称为事件A

概率论知识点总结

概率论知识点总结 基本概念随机实验:将一切具有下面三个特点:(1)可重复性(2)多结果性(3)不确定性的试验或观察称为随机试验,简称为试验,常用 E 表示。随机事件:在一次试验中,可能出现也可能不出现的事情(结果)称为随机事件,简称为事件。不可能事件:在试验中不可能出现的事情,记为Ф。 必然事件:在试验中必然出现的事情,记为Ω。 样本点:随机试验的每个基本结果称为样本点,记作ω、样本空间:所有样本点组成的集合称为样本空间、样本空间用Ω表示、一个随机事件就是样本空间的一个子集。基本事件多点集一个随机事件发生,当且仅当该事件所包含的一个样本点出现。事件的关系与运算(就是集合的关系和运算)包含关系:若事件A 发生必然导致事件B发生,则称B包含A,记为或。 相等关系:若且,则称事件A与事件B相等,记为A=B。事件的和:“事件A与事件B至少有一个发生”是一事件,称此事件为事件A与事件B的和事件。记为A∪B。事件的积:称事件“事件A与事件B都发生”为A与B的积事件,记为A∩ B或AB。事件的差:称事件“事件A发生而事件B不发生”为事件A 与事件B的差事件,记为 A-B。用交并补可以表示为。互斥事件:如果A,B两事件不能同时发生,即AB=Φ,则称事件A与事件B是互不相容事件或互斥事件。互斥时可记为A+B。对立事

件:称事件“A不发生”为事件A的对立事件(逆事件),记为。对立事件的性质:。事件运算律:设A,B,C为事件,则有(1)交换律:A∪B=B∪A,AB=BA(2)结合律: A∪(B∪C)=(A∪B)∪C=A∪B∪C A(BC)=(AB)C=ABC(3)分配律:A∪(B∩C)=(A∪B)∩(A∪C) A(B∪C)=(A∩B)∪(A∩C)= AB∪AC(4)对偶律(摩根律): 第二节事件的概率概率的公理化体系:(1)非负性: P(A)≥0;(2)规范性:P(Ω)=1(3)可数可加性:两两不相容时概率的性质:(1)P(Φ)=0(2)有限可加性:两两不相容时当AB=Φ时P(A∪B)=P(A)+P(B)(3)(4)P(A-B)=P(A)- P(AB)(5)P(A∪B)=P(A)+P(B)-P(AB)第三节古典概率模型 1、设试验E是古典概型, 其样本空间Ω由n个样本点组成,事件A由k个样本点组成、则定义事件A的概率为 2、几何概率:设事件A是Ω的某个区域,它的面积为 μ(A),则向区域Ω上随机投掷一点,该点落在区域 A 的概率为假如样本空间Ω可用一线段,或空间中某个区域表示,则事件A 的概率仍可用上式确定,只不过把μ理解为长度或体积即可、第四节条件概率条件概率:在事件B发生的条件下,事件A发生的概率称为条件概率,记作 P(A|B)、乘法公式:P(AB)=P(B)P(A|B)=P(A)P(B|A)全概率公式:设是一个完备事件组,则

考研数学概率论重要知识点梳理

2017考研数学:概率论重要知识点梳理 来源:文都图书 概率论在历年考研数学真题中特点比较明显。概率论与数理统计对计算技巧的要求低一些,一些题目,尤其是文字叙述题要求考生有比较强的分析问题的能力。所以考生应在这门中尽量做到那全分,这样才能保证数学的分数,下面我们整理了一些概率论的重要知识点: 第一部分:随机事件和概率 (1)样本空间与随机事件 (2)概率的定义与性质(含古典概型、几何概型、加法公式) (3)条件概率与概率的乘法公式 (4)事件之间的关系与运算(含事件的独立性) (5)全概公式与贝叶斯公式 (6)伯努利概型 其中:条件概率和独立为本章的重点,这也是后续章节的难点之一,考生务必引起重视, 第二部分:随机变量及其概率分布 (1)随机变量的概念及分类 (2)离散型随机变量概率分布及其性质 (3)连续型随机变量概率密度及其性质 (4)随机变量分布函数及其性质 (5)常见分布 (6)随机变量函数的分布 其中:要理解分布函数的定义,还有就是常见分布的分布律抑或密度函数必须记好且熟练。 第三部分:二维随机变量及其概率分布 (1)多维随机变量的概念及分类 (2)二维离散型随机变量联合概率分布及其性质 (3)二维连续型随机变量联合概率密度及其性质

(4)二维随机变量联合分布函数及其性质 (5)二维随机变量的边缘分布和条件分布 (6)随机变量的独立性 (7)两个随机变量的简单函数的分布 其中:本章是概率的重中之重,每年的解答题定会有一道与此知识点有关,每个知识点都是重点,务必重视! 第四部分:随机变量的数字特征 (1)随机变量的数字期望的概念与性质 (2)随机变量的方差的概念与性质 (3)常见分布的数字期望与方差 (4)随机变量矩、协方差和相关系数 其中:本章只要清楚概念和运算性质,其实就会显得很简单,关键在于计算 第五部分:大数定律和中心极限定理 (1)切比雪夫不等式 (2)大数定律 (3)中心极限定理 其中:其实本章考试的可能性不大,最多以选择填空的形式,但那也是十年前的事情了。 第六部分:数理统计的基本概念 (1)总体与样本 (2)样本函数与统计量 (3)样本分布函数和样本矩 其中:本章还是以概念为主,清楚概念后灵活运用解决此类问题不在话下 第七部分:参数估计 (1)点估计 (2)估计量的优良性 (3)区间估计

概率论练习题第三章补充题

1.设随机变量1X ,2X ,3X ,...,n X 相互独立,均服从参数为λ的指数分布, ),,,, m in(321n X X X X Y =,求Y 的分布密度函数和数学期望。 2. 设随机向量(X ,Y )服从二元正态分布)0;4,1;0,0(N ,求)(X Y D -和)0(>XY P 。 3. 设随机向量(X ,Y )联合分布密度 ),(y x f =?? ?<<<-其他0 0,21y x xe xy 求(1)条件密度函数)(x y f X Y ; (2)条件概率??? ?? =≤231X Y P 和概率()X Y P >; (3))cov(Y X ,; (4)判断X ,Y 的相关性与独立性(说明理由)。 (以上为历届试题) 1.设随机变量ξ,η相互独立,ξ,η的分布列分别如下表所示. ξ -3 -2 -1 P 0.25 0.25 0.5 η 1 2 3 P 0.4 0.2 0.4 求(1)(ξ,η)的联合分布列;(2)ηξ+的分布列。 2.已知ξ,η有联合分布列如下, (1)求ξ,η的边缘分布; (2)ξ,η独立吗? (3)求ηξ+的分布。 3.设二维随机变量(ξ,η)的分布密度为: ),(y x f =? ??≤≤≤≤+其它,020,10),3(2y x xy x A 求:(1)系数A ;(2)ξ,η相互独立吗;(3)求)1(≤+ηξP 4.设X ,Y 是随机变量,若ξ =a X +b ,η =cY +d ,其中a ,b ,c ,d 是常数. 求证:)cov(ηξ,=),cov(Y X ac

5.设随机变量ξ ,η 相互独立,其概率密度分别是 ???≤>=-0 002)(2x x e x p x ,,ξ , 82 π221 )(x e y p -=η, 记132+-=ηξζ,求ζE ,ζD . 6.若 ξ1 ,ξ2 ,ξ3 ,ξ4 , 独立同分布,且 ξk ~U[0, 1] , k=1,2,3,4,令∑= =4 1 5 1k k k ξη,则 E ξk = ; D ξk = ; E ξ2k = , E η= ; D η= 。 7.设( ξ, η )的联合分布列为 (1).求ξ, η 各自的边沿分布列; (2).判断ξ与η是否相互独立; (3).求P( ξη >1 ). 8.若(ξ ,η)联合分布密度函数为: p x y Ax ,x ; (,)=x )条件下,Y 的密度函数为 )(x y f X Y =?????<<其他 ,,001x y x ,试求随机向量)Y X ,(的密度函数。 12.设随机变量+∞<<∞-=-x ke x f X x ,)(~,试求(1)常数k ;(2)EX 和DX ; (3)X 与X 的协方差,并判断X 与X 的相关性。 13.设R.V.ξ,η相互独立,均服从参数为α=1的指数分布,求ηξ2-的分布密度。 14. 从(0,1)随机取两个数,求 (1) 两数之积小于四分之一的概率; (2) 两数之和小

概率论知识点总结

概率论总结 目录 一、前五章总结 第一章随机事件和概率 (1) 第二章随机变量及其分布 (5) 第三章多维随机变量及其分布 (10) 第四章随机变量的数字特征 (13) 第五章极限定理 (18) 二、学习概率论这门课的心得体会 (20) 一、前五章总结 第一章随机事件和概率 第一节:1.、将一切具有下面三个特点:(1)可重复性(2)多结 果性(3)不确定性的试验或观察称为随机试验,简称为试验,常用 E表示。 在一次试验中,可能出现也可能不出现的事情(结果)称为随 机事件,简称为事件。 不可能事件:在试验中不可能出现的事情,记为Ф。 必然事件:在试验中必然出现的事情,记为S或Ω。 2、我们把随机试验的每个基本结果称为样本点,记作e 或ω. 全体 样本点的集合称为样本空间. 样本空间用S或Ω表示.

一个随机事件就是样本空间的一个子集。 基本事件—单点集,复合事件—多点集 一个随机事件发生,当且仅当该事件所包含的一个样本点出现。 事件间的关系及运算,就是集合间的关系和运算。 3、定义:事件的包含与相等 若事件A发生必然导致事件B发生,则称B包含A,记为B?A 或A?B。 若A?B且A?B则称事件A与事件B相等,记为A=B。 定义:和事件 “事件A与事件B至少有一个发生”是一事件,称此事件为事件 A与事件B的和事件。记为A∪B。用集合表示为: A∪B={e|e∈A,或e∈B}。 定义:积事件 称事件“事件A与事件B都发生”为A与B的积事件,记为A∩ B或AB,用集合表示为AB={e|e∈A且e∈B}。 定义:差事件 称“事件A发生而事件B不发生,这一事件为事件A与事件B的差 事件,记为A-B,用集合表示为 A-B={e|e∈A,e?B} 。 定义:互不相容事件或互斥事件 如果A,B两事件不能同时发生,即AB=Φ,则称事件A与事件 B是互不相容事件或互斥事件。 定义6:逆事件/对立事件 称事件“A不发生”为事件A的逆事件,记为ā。A与ā满足:A ∪ā= S,且Aā=Φ。

概率论与数理统计第三章习题及答案

概率论与数理统计习题 第三章 多维随机变量及其分布 习题3-1 盒子里装有3只黑球、2只红球、2只白球,在其中任取4只球.以X 表示取到黑球的只数,以Y 表示取到红球的只数,求X 和Y 的联合分布律. (X ,Y )的可能取值为(i , j ),i =0,1,2,3, j =0,12,i + j ≥2,联合分布律为 P {X=0, Y=2 }= 35147 2222=C C C P {X=1, Y=1 }=356 47221213=C C C C P {X=1, Y=2 }= 3564 7 1 2 2213=C C C C P {X=2, Y=0 }=353 472 223=C C C P {X=2, Y=1 }= 35124 712 1223=C C C C P {X=2, Y=2 }=353 47 2 223=C C C P {X=3, Y=0 }= 35247 1233=C C C P {X=3, Y=1 }=352 47 1233=C C C P {X=3, Y=2 }=0 习题3-2 设随机变量),(Y X 的概率密度为 ?? ?<<<<--=其它 , 0, 42,20), 6(),(y x y x k y x f (1) 确定常数k ; (2) 求{}3,1<

?? ????????<<<<=42,20),(y x y x D o 解:(1)∵??? ? +∞∞-+∞ ∞ ---= = 20 12 )6(),(1dydx y x k dy dx y x f ,∴8 1= k (2)8 3 )6(8 1)3,1(32 1 ? ?= --= <

概率统计补充案例

补充案例:概率部分: 案例1、“三人行必有我师焉” 案例2、抓阄问题 案例3、贝叶斯方法运用案例介绍 案例4、化验呈阳性者是否患病 案例5、敏感性问题的调查 案例6、泊松分布在企业评先进中的应用 案例7、碰运气能否通过英语四级考试 案例8、检验方案的确定问题 案例9、风险型决策模型 案例10、一种很迷惑游客的赌博游戏 案例11、标准分及其应用 案例12、正态分布在人才招聘中的应用 案例13、预测录取分数线和考生考试名 统计部分: 案例14、随机变量函数的均值和标准差的近似计算方法案例15、如何表示考试成绩比较合理 案例16、如何估计湖中黑、白鱼的比例 案例17、预测水稻总产量 案例18、工程师的建议是否应采纳 案例19、母亲嗜酒是否影响下—代的健康 案例20、银行经理的方案是否有效 案例21、一元线性回归分析的Excel实现 案例22、方差分析的Excel实现 案例23、预测高考分数 案例24、两次地震间的间隔时间服从指数分布

案例1、“三人行必有我师焉” 我们可以运用概率知识解释孔子的名言“三人行必有我师焉”. 首先我们要明确一个问题,即只要在某一方面领先就可以为师(韩愈说“术业有专攻”). 俗语说“三百六十行,行行出状元”,我们不妨把一个人的才能分成360个方面。孔子是个大圣人,我们假设他在一个方面超过某个人的概率为99%,那么孔子在这方面超过与他“同行”的两个人的概率为99% ×99% =98.0l %,在360个方面孔子总比这两人强的概率为 (98.01%)360=0.07% ,即这两个人在某一方面可以做孔子老师的概率为99.93%.从数学角度分析,孔子的话是很有道理的. 案例2、抓阄问题 一项耐力比赛胜出的10人中有1 人可以获得一次旅游的机会,组织者决定以抓阄的方式分配这一名额. 采取一组10人抓阄,10张阄中只有一张写“有”. 每个人都想争取到这次机会,你希望自己是第几个抓阄者呢? 有人说要先抓,否则写有“有”的阄被别人抓到,自己就没有机会了;有人说不急于先抓,如果前面的人没有抓到写有“有”的阄,这时再抓抓到“有”的机会会大一些. 为了统一认识,用概率的方法构造一个摸球模型来说明问题. 摸球模型:袋中装有1 个红球和9 个黄球除颜色不同外球的大小、形状、质量都相同. 现在10 人依次摸球(不放回),求红球被第 k 个人摸到的概率( k = 1, 2, ?, 10). 解决问题 :设 k A = “ { 第 k 个人摸到红球 }, k = 1, 2, ? , 10. 显然,红球被 第一个人摸到的概率为 101 )(1= A P . 因为 12A A ?,于是红球被第二个人摸到的概率为 101 91109)()()()(121212= ?===A A P A P A A P A P . 同样,由 213A A A ?知红球被第三个人摸到的概率为 1018198109)()()()()(2131213213= ??= ==A A A P A A P A P A A A P A P . 如此继续,类似可得 )(4A P = ==ΛΛ)(5A P 101 )(10=A P . 由此可见,其结果与 k 无关,表明10 个人无论摸球顺序如何,每个人摸到红球的机 会相等. 这也说明10 个人抓阄,只要每个人在抓之前不知道他前边那些已经抓完的结果,无论先后, 抓到的机会是均等的. 在现实生活中单位分房、学生分班、短缺物品的分配等,人们常常乐于用抓阄的办法来解决,其合理性保证当然得归功于“概率”. 通过上面的摸球模型,我们总结出分配中的“抓阄”问题,无论先抓后抓, 结果是一样的.学完概率之后再遇到抓阄问题时不必争先恐后,我们要发扬风格让他人先抓. 案例3、贝叶斯方法运用案例介绍 什么是贝叶斯过滤器? 垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。 正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规避。

概率论知识点总结

概率论知识点总结 第一章 随机事件及其概率 第一节 基本概念 随机实验:将一切具有下面三个特点:(1)可重复性(2)多结果性(3)不确定性的试验或观察称为随机试验,简称为试验,常用 E 表示。 随机事件:在一次试验中,可能出现也可能不出现的事情(结果)称为随机事件,简称为事件。 不可能事件:在试验中不可能出现的事情,记为Ф。 必然事件:在试验中必然出现的事情,记为Ω。 样本点:随机试验的每个基本结果称为样本点,记作ω. 样本空间:所有样本点组成的集合称为样本空间. 样本空间用Ω表示. 一个随机事件就是样本空间的一个子集。基本事件—单点集,复合事件—多点集 一个随机事件发生,当且仅当该事件所包含的一个样本点出现。 事件的关系与运算(就是集合的关系和运算) 包含关系:若事件 A 发生必然导致事件B 发生,则称B 包含A ,记为A B ?或B A ?。 相等关系:若A B ?且B A ?,则称事件A 与事件B 相等,记为A =B 。 事件的和:“事件A 与事件B 至少有一个发生”是一事件,称此事件为事件A 与事件B 的和事件。记为 A ∪B 。 事件的积:称事件“事件A 与事件B 都发生”为A 与B 的积事件,记为A∩ B 或AB 。 事件的差:称事件“事件A 发生而事件B 不发生”为事件A 与事件B 的差事件,记为 A -B 。 用交并补可以表示为B A B A =-。 互斥事件:如果A ,B 两事件不能同时发生,即AB =Φ,则称事件A 与事件B 是互不相容事件或互斥事件。互斥时B A ?可记为A +B 。 对立事件:称事件“A 不发生”为事件A 的对立事件(逆事件),记为A 。对立事件的性质: Ω=?Φ=?B A B A ,。 事件运算律:设A ,B ,C 为事件,则有 (1)交换律:A ∪B=B ∪A ,AB=BA (2)结合律:A ∪(B ∪C)=(A ∪B)∪C=A ∪B ∪C A(BC)=(AB)C=ABC (3)分配律:A ∪(B∩C)=(A ∪B)∩(A ∪C) A(B ∪C)=(A∩B)∪(A∩C)= AB ∪AC (4)对偶律(摩根律):B A B A ?=? B A B A ?=? 第二节 事件的概率 概率的公理化体系: (1)非负性:P(A)≥0; (2)规范性:P(Ω)=1 (3)可数可加性: ????n A A A 21两两不相容时

概率论练习题第二章补充题1答案

第二章补充题一答案 1.e 21 2. 2-55!2e 3. e 11- 4. ?? ???≤>=-0 , 0 0 , 2)(2y y e y p y π 5.(1)1=A (2) e 2-1 6.(1)1=b (2) ?????????≥<≤<≤<=2 ,121,1-2310,20,0)(2 x x x x x x x F (3) 2ln 31+=EX (4)()22ln -2ln 3 2-3641=DX 7. 21 +=μe EX 8. ?????≤>=1 , 0 1 , 1)(2y y y y f 9.(13-14)(1) 79;(2)14 3 10.(13-14) (1)21=C ;(2)2π=a 11.(13-14)分布律 ()45.0)55.0(1?==-k k X P , ,3,2,1=k ; ()31 11 ==偶数X P 12.(13-14) 10≥n 1. ??? ??61,10~B ξ 2.(1)61=C (2)31 (3)?????????≥<≤<≤<=1 ,110,6501-,611-,0)(x x x x x F 3.(1)()010.,100~B ξ (2)1=ξE (3)99.0=ξD 4.(1)1=C (2)e 1 (3) ???≤>=0 , 0 0 , -1)(-x x e x f x 6. ()1-ξξξD E P ≤≥ 7. ()10-150 1015e k X P k k ∑=≈≤=0.95126

8.(1) ??? ??94,2~B ξ (2) ?????????≥<≤<≤<=2 ,121,816510,81250,0)(x x x x x F 9. ()6.0,5~B X 10. 3 2=a ,31=b 11. 32440 12. 32 13.(1) 1=a ,21 6=??? ??<πX P (2) ?????<<=其他 , 0 20 ,cos )(πx x x f (3) 1=EX (4) 3-π=DX

概率论第三章习题

第三章 一、填空题 1.若(X ,Y )的联合密度为f (x ,y )=?? ?>>+-其他 ,00 ,0 ,)2(y x Ae y x ,则常数A =_______, P (X ≤2,Y ≤1)=_______ 2.设X 1~N (0,2), X 2~N (1,3), X 3~N (0,6),且X 1, X 2, X 3相互独立,则P (2≤3X 1+2X 2+X 3≤8)=_______ 3.已知随机变量X 和Y 的联合密度为f (x ,y )=?? ?<<-其他 ,00 ,y x e y ,则随机变量 X 的概率密度f (x )=__________ 4.设X 与Y 相互独立,均服从[1,3]上的均匀分布,记A =(X ≤a ), B =(Y >a ),且P (A ∪B )=9 7,则a =_______ 5.设(X ,Y )的联合概率密度为f (x ,y )=?? ?≤≤其他 ,00 ,6y x x ,则P (X +Y ≤ 1)=_______ 二、选择题 1.设随机变量X 和Y 相互独立,其概率分布相应为 则__________ (A) P (X =Y )=0 (B) P (X =Y )=1 (C) P (X =Y )=2 1 (D) P (X ≠Y )=3 1 2.设随机变量X 和Y 有相同的概率分布 :

并且P (XY =0)=1,则P (X ≠Y )为__________ (A) 0 (B)4 1 (C)2 1 (D) 1 3.设二维随机变量(X ,Y )的概率密度为 f (x ,y )=???<<<<+其他 ,04 1 ,20 ),(22y x y x k 则k 的值必为__________ (A) 30 1 (B) 50 1 (C) 60 1 (D) 80 1 4.设X 与Y 相互独立, 且X 与Y 的分布函数各为F X (x ), F Y (y ),令Z =min(X ,Y ), 则Z 的分布函数F Z (z )为__________ (A) F X (z )F Y (z ) (B) 1-F X (z )F Y (z ) (C) (1-F X (z ))(1-F Y (z )) (D) 1-(1-F X (z ))(1-F Y (z )) 5.设X 与Y 相互独立, X ~U (0,2), Y 的密度函数为f Y (y )=?? ?<≥-0 ,00 ,y y e y ,则 P (X +Y ≥1)为__________ (A)1-e -1 (B)1-e -2 (C) 1-2 1e -1 (D)1-2e -2 三、计算题 1.设二维随机变量(X ,Y )的概率密度为 f (x ,y )=?? ?≤≤≤≤--其他 ,042 ,20 ),6(y x y x k 试求: (1) k 的值 (2) P (X ≤2,Y ≤3)

概率论练习题第二章补充题3

第二章补充题三 1.随机变量ξ服从拉普拉斯分布,其密度函数为 +∞<<∞-=-x e x x 21 )(? (1) 求ξ的分布函数;(2)求随机变量2ξη=的分布。(3)求随机变量2ξη=的 数学期望及方差。 2. 随机变量ξ的密度函数为 ???<<=其他 ,010,2)(x x x f 对ξ进行n 次独立重复观测,以η表示观测值不大于1.0的次数,试求η的概率分布。 3. 某商店每月销售某种商品的数量X 服从参数为7的泊松分布,问在月初进货时要 库存多少此种商品,才能保证当月不脱销的概率为0.999。 4. 设每次试验中事件A 发生的概率为0.6,请用切比雪夫不等式估计,在1000次独 立试验中,事件A 发生的次数在500—700次之间的概率。 5. 今有一停船码头,它最多只能停靠10条船,多来的船将不得不在码头外等待, 设有 160条船,每条船要在此码头停靠的概率均为0.05, 且它们是否停靠是彼此独立的。 (1)求有船在此码头外等待的概率; (2)若要以0.99的概率保证码头外无船等待,问应扩建码头, 使码头最少能停靠几条 船; (3)求要求停靠的平均船数。 6. 设有同类型仪器300台,各仪器的工作相互独立,且发生故障的概率均为0.01, 通常一台仪器的故障可以由一个人来排除。 (1)现有6名工人负责管理这些仪器,求仪器发生故障时因工人不够而不能及时排 出的概率。 (2)问至少配备多少维修工人,才能保证当仪器发生故障但不能及时排除的概率小 于0.01。 (3)求同时发生故障的仪器的平均台数。 7.假定国际市场上,每年对我国某种商品的需求量是随机变量 X (单位:吨),已知 X 服从 [ 2000,4000 ] 上的均匀分布,设每出售这种商品1吨,国家可挣外汇3万 元,但假设销售不出而囤积于仓库,则每吨需浪费保养费1万元,问应组织多少货 源,才能使国家的平均收益最大? ( 3500吨 ) (以下为考研试题) 1. 设随机变量X 的密度函数为

《概率与统计》教学案例

“统计与概率”教学案例 南昌市洪都小学谭琴 教材内容:人教版义务教育课程标准实验教科书数学三年级下册第38页内容及练习十第1题。 教材分析 统计最基础的知识是比较、排列和分类。对现实生活中一类物体根据其不同的标准进行比较,从中分辨出异同,并按一定的顺序进行排列,这些都是统计的萌芽思想,而分类则是在比较、排列的基础上,进一步划分不同标准的结果。 本课在学生认识了一格代表2个单位、5个单位的纵向条形统计图的基础上,通过两个例题继续介绍一些常见的条形统计图:一种是横向条形统计图,另一种是起始格与其他格表示不同单位量的条形统计图。让学生根据统计图表进行初步的数据分析,通过分析寻找信息,并根据这些信息作出进一步的判断和决策。学生通过这一阶段的学习,对条形统计图的结构、数据的表示方式,以及条形统计图的作用,都有了一个基本的了解,为下一阶段学习折线统计图打下坚实的基础。练习十中的习题除了让学生根据统计图进行简单的数据分析以外,还注意加强对学生进行提出问题、解决问题能力的培养,让学生根据统计图寻找信息,提出问题并加以解决的要求。 设计思路 1. 数学生活化,让学生学习现实的数学。围绕新课标的这一具体要求,力图让学生在熟悉、亲切的生活背景素材中提出数学问题,让学生感到生活中处处有统计,处处有数学。 2.数学活动化,让学生学习动态的数学。为了让学生真正投入到统计的过程中,为此创设了画一画、议一议的活动氛围,从活动中初步感受数据收集、整理、分析的全过程,从而形成统计观念。 3.数学问题化,让学生学习思考的数学。注意在课中引导学生用精确的数学语言描述数据,根据数据提出问题并解决问题,充分拓展思维,深化对统计意义的理解。 学情分析 在前几册的教材中,学生已经学会了收集和整理数据的方法,会用统计表(包括单式统计表和复式统计表)和条形统计图(一格表示一个或多个单位)来表示统计的结果,并能根据统计图表提出问题加以解决。学生已经掌握基本的统计方法,建立了初步的统计观念。这是本节课的基础和起点。这节课进一步学习统计知识,通过有限样本的数据分析来推断总体样本的大致情况,有些学生在课前已经试着进行了分析,有一定基础,但有一些学生动手能力较弱,推理能力不强,对学生这部分内容会产生一定的困难。主要的难点是在“分析数据”和“合理推断上。 教学目标 1、引导学生自主探索、合作交流,学会看横向条形统计图和起始格与其他格代表的单位量不一致的条形统计图,并能根据统计表中的数据完成统计图。 2、初步学会简单的数据分析,进一步感受到统计对于决策的作用,体会统计在现实生活中的作用,理解数学与生活的紧密联系。 3、加强学生提出问题、解决问题能力的培养。

高考数学 概率+统计与统计案例难题专项训练 文

2014年高考数学(文)难题专项训练:概率+统计与统计案例 1.(2013湖北黄冈市高三三月质量检测,10,5分)将一骰子抛掷两次,所得向上的点数分别为和,则函数在上为增函数的概率是() A. B. C. D. 2. (2012山东省济南市第二次模拟,12,5分)下列命题: ①函数,的最小值为2; ②线性回归方程对应的直线至少经过其样本数据点(,),(,),…,(,)中的一个点; ③命题p:x R,使得,则p:x R,均有x2+x+1≥0; ④若x1,x2,…,x10的平均数为a,方差为b,则x1+5,x2+5,…,x10+5的平均数为a+5,方差为b+25. 其中,错误命题的个数为( ) A. 0 B. 1 C. 2 D. 3 3.在发生某公共卫生事件期间, 有专业机构认为该事件在一段时间内没有发生大规模群体感染的 标志为“连续10天, 每天新增疑似病例不超过7人”. 根据过去10天甲、乙、丙、丁四地新增疑似病例数据, 一定符合该标志的是( ) A. 甲地:总体均值为3, 中位数为4 B. 乙地:总体均值为1, 总体方差大于0 C. 丙地:中位数为2, 众数为3 D. 丁地:总体均值为2, 总体方差为3 4.设集合A={1, 2}, B={1, 2, 3}, 分别从集合A和B中随机取一个数a和b, 确定平面上的一个点P(a, b), 记“点P(a, b)落在直线x+y=n上”为事件C n(2≤n≤5, n∈N), 若事件C n的概率最大, 则n的所有可能值为( ) A. 3 B. 4 C. 2和5 D. 3和4

5.电子钟一天显示的时间是从00∶00到23∶59, 每一时刻都由四个数字组成, 则一天中任一时刻显示的四个数字之和为23的概率为( ) A. B. C. D. 6.甲、乙、丙、丁4个足球队参加比赛, 假设每场比赛各队取胜的概率相等, 现任意将这4个队分成两个组(每组两个队)进行比赛, 胜者再赛. 则甲、乙相遇的概率为( ) A. B. C. D. 7.在区间上随机取一个数x, cos x的值介于0到之间的概率为( ) A. B. C. D. 8.(2013年四川成都高新区高三4月模拟,13,5分)在区间内任取两个数,则使方程 的两个根分别作为椭圆与双曲线的离心率的概率为 . 9.(2013山东青岛高三三月质量检测,16,5分) 给出以下命题: ①双曲线的渐近线方程为; ②命题“,” 是真命题; ③已知线性回归方程为,当变量增加个单位,其预报值平均增加个单位; ④已知,,,,依照以上各式的规律,得到一般性的等式为,() 则正确命题的序号为(写出所有正确命题的序号). 10. 有20张卡片, 每张卡片上分别标有两个连续的自然数k, k+1, 其中k=0, 1, 2, …, 19. 从这20张卡片中任取一张, 记事件“该卡片上两个数的各位数字之和(例如:若取到标有9, 10的卡

相关文档
相关文档 最新文档