文档库 最新最全的文档下载
当前位置:文档库 › 第七章 概率分布及其应用

第七章 概率分布及其应用

第七章   概率分布及其应用
第七章   概率分布及其应用

第七章概率分布及其应用

第一节概率基础 (1)

第二节二项分布 (6)

第三节正态分布及其应用 (10)

第四节抽样分布 (18)

第五节SPSS实验——峰度和偏度 (22)

本章小结 (24)

同步练习与思考题 (24)

学习目标

1.1.掌握正态分布的特点及其应用

2.2.了解二项分析的应用

3.3.理解抽样分析的理论及相关概念

4.4.熟练掌握中心极限定理

描述统计可以概括地描述观测数据的统计特征,使人们了解其集中趋势、离中趋势及相

互关系。但是科学研究的任务不仅是对这些数据的特征进行简单的描述,而且更重要的是通

过研究去发现一类事物的共同特征和规律,然后用这些规律去指导实际工作。要做到这一点,

则需要人们先对样本进行观测或实验,再根据样本所反映的信息,对总体或事物的全体做出

统计的估计或推论,即进行统计推断。推断统计是建立在概率基础上的,所以学习推论统计

应掌握一些概率的知识及其常用数学模型或数学分布,如正态分布、二项分布、t分布、2

分布、F分布等等。

第一节概率基础

一、事件与概率

(一)随机事件

事件(event)是一种数学语言,通俗地说就是事情或现象。宇宙间的客观现象是多种

多样的,大致分为确定事件和随机事件和模糊事件三类。

确定性事件(deterministic event )是指在一定条件下必然会发生或必然不会发生的事件。确定性事件又有必然事件和不可能事件。必然事件(necessary event )是在一定条件必然会发生的事件,如在一个标准大气压下,水加热到摄氏100℃必然会沸腾就是一个必然事件。不可能事件(impossible event )是在一定条件下必然不会发生的事件,如在一个标准大气压下,水加热到60℃会沸腾则是一个不可能事件。确定性事件或者会发生,或者不会发生,二者只具其一,遵循“非此即彼”的二值逻辑。

随机事件(random event )是在一定条件下,可能发生,也可能不发生的事件。随机事件与确定性事件相比,是不确定的,因为对这种事件我们不能确定它是发生呢,还是不发生,即对事件的结果无法确定。例如,抛掷一枚硬币,其结果可能是正面朝上,也可能是反面朝上。在一次抛掷中,我们无法预知究竟会出现哪一种结果。象这种在一定条件下,每次观测结果具有不确定性的现象称为随机现象。一个随机现象也就是一个随机试验,而试验的可能结果都叫随机事件,就抛硬币来说,正面朝上是一个事件,反面朝上也是一个事件。对于随机事件而言,不管对他了解的如何“精确”,但是要想事先就确定预言是不可能的。概率和数理统计就是研究随机事件之间关系的,它用数学来描述这些可能发生或不可能发生的事件。

模糊事件(fizzy event )是指对象类属边界和性态不确定性的事件。模糊认识是人类不确定认识的基本形式和本质特征。日常生活中,模糊认识比比皆是。如婴儿并不依照外形尺寸和衣着来辨认母亲;作家不用严格量化的语言和完整的三段式来表达意境;人类思维也不只是循着严格、明晰的道路前进。许多心理与教育现象和自然现象一样,既存在随机性,又存在模糊性。

(二)频率与概率

随机事件虽然在每次试验中可能发生,也可能不发生,表现出随机性、偶然性。但是,当试验次数很大时又会表现统计的规律性。例如,历史上有人做过成千上万次投掷硬币的试验,结果如表7-1。随着试验次数的逐渐增大,每一个随机事件(A )发生的次数(m )在试验总次数(n )中所占的比率(N f )都会越来越稳定地逼近一个定值。如下表投掷硬币在大量试验的条件下,“正面向上”事件的比率逼向定值0.5000,“反面向上”事件的比率也逼近定值0.5000。一种随机事件发生的次数与总试验次数的比值就称频率,记为

()n m A P =

一般来说,事件的频率会时升时降,但总的趋势是试验次数越来越大时,这两种频率会越来越逼近定值0.5000,这种现象是频率的稳定性。

表7-1 投掷硬币大量实验的结果

试验总次数

正面向上次数

正面向上次数

正面频率 反面频率 De Morgan 2048 1061 987 0.5181 0.4819 Buffon

4040

2048

1992

0.5069

0.4931

Pearson 12000 6019 5981 0.5016 0.4984 Pearson 24000 12012 11988 0.5005 0.4995 Pearson

50000

24946

25054

0.4989

0.5011

概率(probability )是随机事件在试验中发生可能性的程度或可能性的大小,用符号P 表示。概率定义有统计定义和古典定义之分。

如前所述,频率具有一定的稳定性,我们把随机事件A 的频率在试验次数无限增大时所逼近的定值称为“A 事件发生的概率”或“A 事件的概率”,记为()A P 。一般情况下,定值是不可能精确获得的,所以通常在重复试验资料(n )充分大的时候,用事件A 的频率作为事件A 的概率()A P 的近似值。所以说,概率的统计定义是指通过频率来计算的概率,记为

()n m

A P =

由于这种概率的统计定义是任经验得到的,又被称为“经验概率”(empirical probability )。 概率的统计定义不仅是一个概念,而且还为我们提供了近似计算概率的一般方法,其最大的特点就是试验次数是大量的。但是在某些特殊的情况下,不仅不可能,而且也不必要临时做大量的试验来求我们所需要的概率,这时只需根据问题本身所具有的“对称性”特点直接计算事件的概率,这种概率即为概率的古典定义,又称先验概率(prior probability )。所谓“对称性”是指事件出现的机会是相等的,这种机会相等的事件无需进行大量的试验。如计算投掷一次硬币的概率,只根据概率的古典定义就会想到出现“正面向上”和“反面向上”的机会相等,因此“正面向上”发生的概率是0.5,“反面向上”发生的概率也是0.5。因为对投掷一枚硬币来说,只有两种可能性,不是“正面向上”,就是“反面向上”,这种可能结果称为基本事件,其总个数为2,且n 表示,其中任何一个基本事件在一次投掷中只可能出现一种,用m 表示。由此,概率的古典定义则为基本事件的个数m 与基本事件的总个数n 的比值,记为

()n m

A P =

虽然概率的两种定义中计算概率的公式相同,但意义却不完全相同。在统计定义中,n 表示大量试验的总次数,m 表示随机事件出现的次数。而在古典定义中,n 表示某事件可能出现的总次数,m 表示基本事件或成功事件的次数。 (三)小概率事件

小概率事件(small probability event )是指在一次试验中发生的可能极小,但在大量重复试验下终究会发生的事件。也就是当某一事件在大量试验中出现的频率非常小,其概率值非常接近于0的事件。因为()0=A P ,所以也称为“小概率事件实际不可能”,这是进行统计假设检验的基本思想。

究竟什么样的值为小概率值呢?一般认为概率小于或等于0.05的随机事件为小概率事

件。在进行统计假设检验中,通常当随机样本统计量的数值在抽样分布上出现的概率等于或小于0.05或0.01时,就以小概率事件绝对零假设。 二、概率的性质和基本运算 (一)概率的性质

1.随机事件的概率值范围为0≤()A P ≤1。

2.若()A P =1,则为必然事件的概率;若()A P 0=则为不可能事件的概率。值得注意的是这项定理是不可逆的,即概率为1的某个事件并不一定是必然事件,同样概率为0的某个事件也不能说是不可能事件,只能说其出现的可能极大或极小。

3.在一随机现象中,按同一标准划分出的整个随机事件系列的频率之和等于1,即

()1=∑A P

(二)概率的基本运算 1.几个基本概念

1)事件的“和”或“并”。事件A 与事件B 中至少出现一件的事件,记为B A +或B A 。例如,A 表示电视机色彩不合格,B 表示电视机高度不合格,C 表示电视机不合格,则有

B A

C +=。

2)事件的“积”或“交”。事件A 与事件B 中同时出现的事件,记为AB 或B A 。例如,A 表示电视机色彩合格,B 表示电视机高度合格,C 表示电视机合格,则有AB C =。 3)互斥事件。若A 与B 的积事件为不可能事件,即V AB =,则称A 与B 两事件互斥或互不相容。例如,投掷一枚硬币,正面与反面不能同时向上,正面向上和反面向上这两个事件是互斥的。

4)相互独立事件。若两事件A 与B 中任一事件的发生,都不影响另一事件的发生,则称A 与B 是相互独立事件或A 与B 相互独立。例如,投掷甲、乙两枚硬币,“甲出现正面”与“乙出现正面”就是相互独立事件。

5)互逆事件或称对立事件。若事件B A +为必须事件(U B A =+),且事件AB 为不可能事件(V AB =),则A 与B 为互逆事件或A 与B 互逆,即A 是B 的逆事件或B 是A 的逆事件。事件A 的逆事件记作A 。互逆事件必定是互斥事件,但是互斥事件不一定是互逆事件。例如,投掷一枚骰子,事件A 表示“出现偶数点”,事件B 表示“出现奇数点”,C 表示“出现1点”,则B 是A 的逆事件,但C 只与A 互斥,不算A 的逆事件。 2.概率的运算定理 1)加法定理

若A 、B 为互斥事件,则 ()()()B P A P B A P +=+

例如一学生从5个试题中随机抽取1题进行口试,则每一题抽到的概率为()51

=A P ,

而抽到第1题或第2题的概率则为

()()()525151=+=

+=+B P A P B A P

推论:若1A ,2A ,3A ,…,k A 为k 个两两互斥事件,则

()()()()()k k A P A P A P A P A A A A P ++++=++++ 3213211

2)乘法定理

若A 、B 为两相相互独立事件,则 ()()()B P A P AB P ?=

如上例,若第1个学生把抽过的试题放还后,让第2个学生再抽,则两个学生都抽到第1题的概率为

()()()2515151=?=

?=B P A P AB P 推论:若若1A ,2A ,3A ,…,k A 为k 个相互独立事件,则

()()()()()k k A P A P A P A P A A A A P ????=???? 3213211 三、概率分布及其类型

概率分布(probability distribution )是描述随机变量所有可能取值及相应概率变化规律的函数,又称随机变量分布。概率分布从不同角度可分为不同类型。

从变量连续性上分为离散分布和连续分布。离散分布是用以描述离散变量变化规律的,其分布类型主要有二项分布、多项式分布、普照阿松分布和超几何分布等。连续分布用以描述连续变量的变化规律,其常见类型有正态分布、t 分布、负指数分布和威布尔分布等。 从分布函数来源上分为经验分布和理论分布。经验分布是指根据观察或实验所获得的数据而编制的次数分布或相对频率分布,它往往是总体的一个样本,故而又称样本分布。理论分布有两层含义,一是指随机变量概率分布的函数,即数学模型;二是指按某种数学模型计算出的总体的资料分布,故而又称总体分布。

从概率分布描述的数据特征分为基本随机变量分布和抽样分布。基本随机变量分布是指理论分布,描述构成总体的基本变量的分布。教育统计中最常用的基本随机分布有二项分布和正态分布。抽样分布是指样本统计量的理论分布,其类型有正态分布、渐近正态分布、t 分布、2

χ分布、F 分布等,这些分布是按一定的数学理论推导出来的,又称理论抽样分布。 四、排列与组合 (一)排列

用不同的方式编排一堆东西是件很有趣的问题。如重新排列RSTQM 五个字母可能有多少种不同方式。用三条裙子、两件衬衫和四件毛衣,可以搭配成多少种不同的穿着方式。解决这类问题需要排列的知识。

从n 个不同元素里,每次取出r 个不同元素,按一定的顺序排成一列,称为从n 个元素

里每次取r 个元素的排列。当n >r 时,称选排列,,其排列的种数用r

n P 表示;当r n =时,称全排列,其排列种数用n P 或n

n P 表示。其计算的一般公式为

()!!r n n P r n -=

为方便起见,规定1!0=。

例如五个字母,每次选3个排列或全排,其排列种数为

()60345!2!

5!35!535=??==-=P (种)

()1202345!0!

5!55!535=???==-=

P (种)

(二)组合

有时一个排列的次序并不很重要。例如,由李享、赵刚和郭凯组成的委员会有六种排列,但每一种排列的意义是相同的,因为排列次序不会改变这个三人委员会。若在选择事物而不考虑它们排列次序时,就能得到一个组合。从n 个不同元素中,每次取出r 个元素,不管顺序排成一组,称为从n 个元素里每次取r 个元素的组合,所有不同组合种数用r

n C 表示,其公式为

()!!!

r n r n C r

n -=

例如,从五个硬币(假设这五个硬币是不同的)中同时取出两个组合次数为

()10

233

45!3!2!5!25!2!5=???==-=

r

n C (种)

第二节 二项分布

无论是在理论研究方面还是在实际运用中,二项分布都是种常见的、非常重要的离散型随机变量的概率分布。

一、二项分布的定义与特点 (一)二项试验与二项分布

二项分布(binomial distribution )是二项试验(如成功与失败)结果的概率分布。二项试验的特点,一是任何一次试验都只有两种对立的结果,不是成功就是失败。二是共有n 次试验,即n 表示试验次数。三是各次试验相互独立。四是任何一次试验中,成功或失败的概率保持相同,但成功与失败的概率可以相等,也可以不等。例如,某生全凭猜测做几道“五选一”的选择题,对每一题的回答只有猜对或猜错两种对立的结果,其中猜对的概率是51,猜错的概率是54,各题的回答是彼此独立的。若以p 表示成功,q 表示失败,n 表示试验次数,则有二项式

()n q p +

(二)二项式定理的特点

1.项数:二项式的展开式中共有1+n 项。例如,()2

22

2q pq p q p ++=+,共有三

项,而()3

2

2

3

3

33q pq q p p q p +++=+,共有四项。

2.方次:二项式中,p 的方次从0~n 为降冥,q 则从n ~0为升冥,且每项的p 、q 方次之和等于n 。

3.系数:二项式中,各项的系数是成功与失败次数的组合数。从第1项开始,各项的系数依次为

0n C ,1n C ,2n C ,…,n n C

从两端起,等距项的系数相等,即0n C ,1n C ,2n C ,…,2-n n C ,1-n n C ,n n C 。当项数是奇

数时,中间一项系数最大;当项数是偶数时,中间两项的系数相等且最大。 (三)二项式的概率分布及其二项分布曲线

1.二项式的概率分布

根据二项式的定理,若在n 次试验中,求r 次成功的概率分布函数,可由正式求得,即

r

n r r n r q p C P -=

式中,p 表示成功的概率,q 表示失败的概率,r

n C 是组合数,故上式也可写成

()r

n r r q p r n r n P --=

!!!

二项分布的优点在于它能迅速地确定各种可能结果的概率。

假设把一个质地均匀的硬币抛掷3次,这时你和朋友打赌:着地时出现“正面”会有2次,赌注为10元。如果这种结果出现了,你的朋友必须给你10元钱。但谁最有可能赢得这钱呢?你还是你朋友?通过上式可以计算出你赢的这场赌注的概率仅0.375,而你朋友更可

能赢得这场赌注(因为他的机率有1-0.375=0.625)。因为

21

=

=q p ,3=n ,2=r ,所

()375

.021

213!23!2!32

232=???? ???=-=-q p P r

又如,从某次测验抽取3个选择题,每题有4个备选答案,其中一个正确答案,三个错误答案。

假设全凭猜测来回答,则猜对3,2,1,0题的概率是多少?计算过程及结果见表7-2。

表7-2 猜测概率的计算

猜对 个数

组 合

猜对所含的任一可能情况的概率 猜对的概率

猜 对 猜 错 次数 概率

次数 概率

2 23C

2 41 1 4

3 1406.043411

2

2

3

=C 1 1

3

C 1 41 2 43 ()()4219.043412

1

1

3

=C 0

03

C

41

3

43

()()4219.043413

3

=C 可见,3题都猜对概率只有0.0156,猜对2题的概率为0.1406,猜对1题或一题都猜不对的概率为0.4219。

2.二项分布曲线

当我们以二项式中成功的次数为X ,组合次数为Y 绘制次数多边图就可形成二项分布曲线图,其特点有三。一是当

21=

=q p 时,不论n 有多大,二项分布曲线都总是对称的;

二是当q p ≠时,且n 相当小,则图形显偏态;三是当n 相当大时(n ≥30)时,二项分布曲线会逐渐接近正态分布。

二、二项分布的平均数和标准差

当二项分布接近正态分布时,且成功的概率小于或等于失败的概率(即p ≤q ),n p ≥5;或者成功的概率大于或等于失败的概率(即)p ≥q ),n

p ≥5,可推导出其二项分布的平均数和标准差计算公式,即

平均数 np =μ 标准差

npq =σ

三、三、二项分布的应用

二项分布主要用于分析带有机遇性的问题。譬如,了解在客观测验中猜测有多大,如何排除猜测的可能影响,做出较为科学、客观的结论。

例7-1:某套测验题中有10道正误选择题,要了解学生对所测内容在什么情况下是真正领会了,什么情况下属猜测的成分多。

解法一:正态法

① 条件分析。因为10=n ,

21=

=q p ,521

10=?=np ,所以满足使用条件。

② 计算平均数与标准差 平均猜对的题目数为:

52110=?

==np μ

猜对的平均差距为: 58.121

2110=?

?==npq σσ

③ 确定掌握的最低限度。根据正态分布的概率,当645.1=Z 时,该点以下包含了全

体次数的95%,因此有

858.1645.15645.1≈?+=+σμ

这表示完全凭猜测10题中猜对8题以下的可能性有95%,而猜对8题以上的概率仅为5%。因此只有答对8题以上者才能说他不是凭猜测答对。做对8题以下者其成绩还不能真正代表他的真实水平,可以怀疑其对所测内容并非完全领会,只是凭猜测获得了这一成绩。当我们作出这种结论时也有犯错误的可能性,即有些学生全凭猜测也可能猜对8题以上,不过这种机率极小,只有5%。因此做出上述结论时,我们犯错误的概率为5%。

另外,或当33.2=Z 时,该点以下包含了全体次数的99%,因此有

958.133.2533.2≈?+=+σμ

这表示完全凭猜测10题中猜对9题以下的可能性有99%。

可见,判断题的猜测机率是很大的。为了降低猜测率,人们常用三方法进行改进。一是增大题量,二是改正误选择为多项选择,三是采用倒扣分的方式让学生慎重答题。假使有

30个正误题,则2074.2645.115645

.1≈?+=+σμ题,974.233.21533.2≈?+=+σμ题,即至少答对20题或以上者属掌握,其可靠性为95%;至少答对21题或以上者属掌握,其可靠性为99%。

解法二:二项分布法

上例也可用二项分布的函数来计算。其过程如下: ① 分别求猜对8题,9题和10题的概率

()1024452121!810!8!102

8

8=

???

?????? ???-=P

()1024102121!910!9!101

99=

???

?????? ???-=P ()102412121!1010!10!100

10

10

=??

? ?????? ???-=P ② 根据加法定理,答对8题以上的概率总和为

0547.010245610241102410102445==++

结果表示答对8题以上的概率为5%(同理也可以计算答对8题以的概率为95%),则答对8题以下的概率为%95%51=-。

例7-2:假设有20个选择题,每题有4个备选答案,其中只有一个正确答案,试问学生答对多少题才算真正掌握了?

① 条件分析。20=n , 41=

p ,43=q ,p

20=?=np

② 计算平均数与标准差 平均猜对的题目数为:

541

20=?

==np μ

猜对的平均差距为:

94.143

4120=?

?==npq σ

③ 确定掌握的最低限度。

994.1645.15645.1≈?+=+σμ

1194.133.2533

.2≈?+=+σμ 结果表明,20个选择题中,要做对9个或以上者才为真正领会了所测的内容,做此结论犯错误的概率为5%。要做对11个或以上者,才为真正领会了所测的内容,做此结论犯错误的概率为1%。

例7-3:设有10个正误判断题和10个选择题,每题有4个备选答案,其中只有一个正确答案,试比较两套试题的优劣。

① 条件分析。因选择题10=n ,

41=

p ,43=q ,p

10=?=np <5,

不满足上述条件,需计算二项分布的概率。

② 计算概率

假设两套题的解答学生都答对了8道题,答错2道,则

对正误题有

21

=

=q p ,其概率为

()044

.010********!810!8!102

8

8==???

?????? ???-=P

对选择题有

41=

p ,43

=q ,其概率为 ()00039

.010485764054341!810!8!102

8

8==???

?????? ???-=P

结果表明,凭猜测答对8题的可能性,对判断题来说,在1000次中有44次;对四择一题,在100000次中只有39次。可见,选择题的功能优于判断题。

第三节 正态分布及其应用

二项分布虽然解决某类问题,但是在有些情形下存在其不足之处。如二项分布是求在n 次独立试验情形下,事件A 出现次数的概率分布,若试验次数太大,其概率的计算概是非常繁琐的。另外,它所研究的随机现象只局限于两种可能结果(即离散型数据),现实中许多现象的试验结果所获得的数据可能充满某一区间而不能一一列举,为此需要对连续型数据进行分析的概率分布,其中正态分布则是其中最常见的一种,也是许多统计理论的基础。

一、正态分布与标准正态分布 (一) (一) 正态分布的定义

从概率的角度来说,服从正态分布的随机变量,在取值区间中部取值概率最高,从中间到两侧取值概率逐渐下降,接近取值区间上、下限时取值概率越来越小,且两侧取值概率是对称的。通俗地说,正态分布(normal distribution )就是中间量数次数分布多,两端量数次数分布少,呈对称型的概率分布,又叫高斯分布。其方程为

()2

2

221

σμπ

σ--

=

X e

Y

式中,Y 为概率密度,σ为分布的标准差,X 为变量值,μ为分布的平均数,e 和π为常数(e =2.7183,π=3.1416)。

正态分布曲线是根据正态分布描绘的图形。在正态分布中,平均数μ和标准差σ决定着分布曲线的位置和形状。其中,平均数决定着曲线在x 轴上的位置,标准差σ决定着曲线的形状。

当σ相同而μ不同时,曲线形状相同,位置各异,见图7-1。

图7-1

μ

不相同时的各种曲线

当μ相同而σ不同时,正态曲线有不同的形状,σ越大,曲线越是“低阔”,σ越小曲线越是“高窄”,见图7-2。

图7-2

σ不相同时的各种曲线

正态分布有一簇曲线,它们有许多共同的特点。一是所有曲线都有一个极值点,从这一点现左或向右移动时,曲线连续地下降。这意味着,当随机变量值偏离其最大概率对应值时,它们对应的概率连续地减少。二是所有曲线都是对称的。对称轴是过极值点的垂线。这意味着,与最大概率对应值等距离的两个值对应着相同的概率。三是所有曲线都呈钟形。曲线向上凸起,在距极值点某一距离时曲线拐向下凸起,而这个距离因不同曲线而异。四是所有曲线包括的面积都等于1。各种不同的正态曲线的区别只是在不同区间面积分布情况不同。

(二)标准正态分布及其特征

标准正态分布(standard normal distribution )是标准差(σ)为1,平均数(μ)为0的正态方程,其函数为

2

2

21X e

Y -

=

π

标准正态方程的特点有三。

1.曲线以=z 0为中心,双侧对称。即无论z 值是正或是负,平方后的y 值相等,所以1-=z

和1+=z ,其y 值都相等。

2.曲线在=z 0处为最高点。当=z 0时,

21

e Y π=

=0.39894,这是y 的最大值。当≠z 0时,因e 的指数为负值,所以:z 的绝对值越小,y 值越大;z 的绝对值越大,y 值越小。

3.曲线以最高点向左右两侧缓慢下降,且无限延伸,但永远不与基线相交。因为z 的绝对值越大,y 值越接近基线,但y 值永远不会为0,所以也就不可能与基线相交。

4.标准正态曲线只有一条,见图7-3。

图7-3 标准正态分布曲线

三、标准正态分布曲线表及其使用

(一)正态分布曲线的面积,高度与标准分数

在正态分布中,总次数N 的几何意义是曲线与x 轴间所包含的总面积,用p 表示,且

1=p 。以曲线中线为界,每边为分布50%的面积。垂线为曲线的纵线高度,以y 表示。基

线是Z 分数的刻度。

在实际工作中,为了减少计算上的麻烦,人们根据标准正态分布的函数,以σ为测量面积的单位,用积分法则计算出Z 值所对应的各个部分的面积p 值和y 值,并制成正态分布曲线表,供人们查阅。由于正态分布的对称性特点,所以在正态曲线表上所提供只是50%的面积p 值及相应的Z 值和y 值,实际应用时就注意这一点。

(二)标准正态分布曲线相应内容的求解方法 1.已知Z 值,求面积值p

1)求均数与某个Z 值之间的p 值,可直接查正态曲线表。

例如:求0=Z 至94.0=Z 之间的面积。查表可知94.0=Z 时,3264.0=p ,见图7-4;因为正态分布为具有对称性,所以有94.0-=Z 时,3264.0=p 。

图7-4 Z=0~0.94的面积

图7-5 Z=-0.34~0.62的面积

图7-6 Z=0.87~1.28的面积

2)求任何两个Z 值之间的p

例如:求σσ62.0~34.0-和σσ28.1~87.0之间的面积。 首先,查出0=Z 至每个Z 值间的面积(见图7-5,图7-6),即有

34.0-=Z ,1331.0=p ;62.0=Z ,2324.0=p 87.0=Z ,3078.0=p ;28.1=Z ,3997.0=p

其次,求两个Z 值之间的面积,即有 3655.02324.01332.01=+=p

0919.03078.03997.02=-=p

规律:Z 值符号相反,用加法求p ;Z 值符号相同,用减法求p 。 3)求某个Z 值以下或以上的面积

例如:求σ85.0-=Z 以下和σ76.1=Z 以上的面积。

图7-7 Z=-0.85以下的面积

图7-8 Z=1.76以上的面积

首先,出0=Z 至每个Z 值间的面积(见图7-7,图7-8),即有 85.0-=Z ,3023.0=p ,76.1=Z ,4608.0=p 其次,用正态分布一半的面积(0.50)减去所查出的面积,即有

0082.04918.05000.01=-=p ,1151.03849.05000.02=-=p

2.已知p 值求Z 值.

1)查表法——求近似的Z 值 例如,求30.0=p 时,Z 的面积。

正态曲线表中并无可30.0=p 的面积,只有与其接近的两个值,即29955.01=p ,

30234.02=p ,前者与0.30相差0.00045,后者与0.30相差0.00234。可见,0.29955与0.30

更接近,其对应的Z 值0.84,即为30.0=p 时Z 的近似值。

2)内插法——求精确的Z 值,其公式为

()121

21

1Z Z P P P P Z Z X ---+

=

p

Z

1p

0.29955 0.84

()

84.085.029955.030234.029955

.030.084.0---+

=X Z

p

0.30000 X Z

8416.00016.084.0=+=

2p

0.30234

0.85

3.已知p 值求y 值 1)查表法——求近似的y 值 例如,求当30.0=p 的y 值。

同样,与0.30接近的p 值为0.29955,其y 值为0.28034。 2)内插法——求精确的y 值

()12121

1y y P P P P y y X ---+=

p y

1p 0.29955 0.28034

()

28034.027798.029955.030234.029955

.030.028034.0---+

=X y

p

0.30000

X y

27996.000038.028034.0=+= 2p 0.30234 0.27798

(三)正态分布中的几个常用值

图7-9 Z=±1,±2,±3的面积

图7-10 Z=±1.96,±2.58的面积

在正态分布中,离开均数的距离越远,其离差越大,面积也愈大。在σ1±,σ2±,σ3±及其σ96.1±,σ58.2±范围内的面积值见图7-9和图7-10。

在此σ96.1±和σ58.2±范围之外的面积只有0.05和0.01。0.05和0.01在正态分布曲线中是两尾的概率值,它是差异显著性的临界值或界限,用符号α表示。。

四、正态分布在教育科学中的应用

已经发现许多数据分布都接近于正态分布的模型。例如,如果我们搜集到关于几千个七岁儿童体重的数据,或者关于参加统一数学考试的几千个学生的分数数据,我们可能得到的分布都是近似的正态分布。正因为如此,在教育与心理领域有许多实际问题可以用正态分布的理论进行分析研究。

(一)确定正态分布中特定分数间的个体数量

例7-4:假设有1000名学生的数学成绩分布符合正态分布。已知平均分70,标准差10分。试问60分以下,60~80,80分以上三个分数段的学生人数分布各为多少?

求人数分布,需知道各段分数人数分布的百分比,已知总人数(N ),又知百分比(p ),则人数分布为p N ?。而要求得p ,需知道Z 值,Z 值可以从已知条件求得。其分析过程如下。

1)将原始分数转换为Z 值,即有

110706060-=-=

Z ,110708080=-=

Z

2)查表求与Z 值对应的p 值

3413.060=p ,

3413.080=p 3)求两个Z 值之间的p 及各段分数的人数分布(f )

60

分以下,即σ

1-以下,

1587.03413.05.0=-=p ,7.1581587.01000=?=f

60~80

σ

σ1~1-, 6826

.023413.0=?=p ,

6.6826826.01000=?=f

80

分以下,即σ

1以上,

158

.03413.05.0=-=p ,7.1581587.01000=?=f

结果表明,根据正态分布的理论,60分以下和80分以上分别159人,60~80分之间分布682人。

(二)确定能力或等级分组的人数分布

一般地说,能力分布是正态的。根据正态分布的理论可将能力分为若干组,推算各组分布的人数多少以构成能力分组的等距尺度。

例2:假设对100名报考研究生的学生按能力分为A 、B 、C 、D 四个组(或等级),试问A 、B 、C 、D 各组分布学生各是多少?

解决此问题,首先要确定分组在正态分布上的位置,有了位置也就有了Z ,再由Z 查表获得p ,最后将各组人数比例乘以总人数,其分析过程如下。

1)确定各组在正态分布上的位置

正态分布区间以6个标准差为全距,因能力分组是等距的,则每一等级的区间在横轴上的距离为5.146=σ。则四个组的能力区间范围分别是:A 组为σ5.1以上,B 组为

σσ5.1~0,C 组为σσ5.1~0-,D 组为σ5.1-以下,见图7-11。

2)查表,由Z 求p

A 组:0669.04331.05.0=-=p

B 组:4331.0=p

C 组=B 组:4331.0=p

D 组=A 组:0669.04331.05.0=-=p 3)求各组的人数(Np )

69.60669.0100=?==D A 31.434331.0100=?==C B

图7-11 能力分组图

(三)确定试题的标准难度

值)。虽然通过率能反映难度的高低,但却无法分析各难度之间的差异大小。因为通过率并非等距尺度,它不能解决试题难度的等值性问题。例如,有三道题的通过率分别为0.4,0.6和0.8,但并不意味着它们之间的难度差为0.2。若将根据正态分布理论将试题通过率转换为

Z 分数(即标准分数)则可解决等值性问题。分析过程如下 1)计算各题的通过率(p )

2)由p 值求Z 值

在正态分布上,通过率是从分布最右端算其面积,而查表值却是从中间开始。为方便起

见,可用0.5减去p 获得查有的p '值。其Z 值的符号则以p 值大小而定,若p >50%,Z 值为负;若p <50%,Z 值为正。

上例第1题,4.0=p ,1.04.05.0=-='p ,25.0=Z 。 第2题, 6.0=p ,1.06.05.0=-='p ,25.0-=Z 。 第3题,8.0=p ,3.08.05.0=-='p ,84.0-=Z 。

3)难度分析

上述结果表明,第1题在平均难度以上,第2、3题在平均难度以下,且第1题与第2题标准难度相差0.50,第2题与第3题相差0.59,其差距并不相同。此处,Z 值越大,难度越大。

由于Z 值有正有负,可进行线性转换,即

134+=?Z

式中,4为难度的标准差,13为平均难度,其难度范围在1~25之间,△值越大,难度也越大。如上例三道题的难度分别为14,12,9.6。

(四)品质评定数量化

在教育与心理研究和实践中,采用等级评定的情况较多。如调查人们对事物的喜好程度、评价成绩的优劣、能力的大小、品行等级等等。在评定等级的处理上常会遇上两个难题,一是不同的评价者所持标准不同、宽严不同,在对同一对象评定时可能给出不同的等级,难以对结果作出准确的综合评价。二是等级分数的界限较宽,又不一定等距,也难以比较不同对象的心理差异。而运用正态分布的理论,可先将等级评定结果转化为测量分数(即Z 分数),再作比较。不过,转化之前需考虑两个问题,一是能否转换,即评定的现象是否为正态或近似正态分布,若不是则不能进行转化。二是是否需要转换,若各评定者的评定结果不等值(如宽严标准不同)可转换,反之评定结果一致则无需转换。

例如,将学生社交能力分为A 、B 、C 、D 、E 五级,甲、乙、丙三位教师对100名学生在各等级上的人数评定结果及其中四名学生在三位教师那里获得的等级评价见表7-3和表7-4。试比较三个学生学习能力的高低。

表7-3 3位教师对100名学生学习能力的评定

等级

评 定 结 果

转 换 过 程 与 结 果 甲

甲 教 师

乙 教 师

丙 教 师

n

n

n

p

p F p '

Z

p

p F p '

Z

p

p F p '

Z

A

5

10

20 0.05 .975 .495 1.96 0.10

.95

.45

1.64 0.20

.900 .400 1.28

B

25

20 25 0.25 .825 .325 0.93 0.20

.80 .30 0.84 0.25

.675 .175 0.45

C

0.4

.50

.00

0.00 0.4.50 .00 0.00 0.3.32

.12

-0.3

40 40 35 0 0 0 0 5 5 5 2 D

25 20 15 0.25 .175 .325 -0.93 0.20 .20

.30

-0.84 0.15 .125 .375 -1.15 E

5

10

5

0.05

.025 .475 -1.96 0.10 .05

.45 -1.64

0.05 .025 .475 -1.96 ∑

100

100

100

1.00

1.0

1.0

由上表可知,三位教师评定的宽严标准不同,且能力为正态分布,可以并能够转换。既然要转换成Z 值进行比较,则需知道其对应的p 值。而p 值根据已知的人数分布可求出来。

其分析思想为,首先求出各等级人数分布的比例,即∑

=f f

p 。其次求各等级比率的中值。各等级p 值在坐标图上所对应的基线Z 值是一段距离,而Z 值是位置量数属于点值,只有求出各等级比例的中值才可确定相应的Z 值。为此需要先分别确定各位教师等级评定

在正态分布上的位置。然后再确定本组比例的中点比例至0=Z 距离,最后根据此距离确定Z 值,如甲教师的等级评定结果,见图7-12,其。根据此做法可形成一种较为简单的分析程序,具体操作如下。

1)求各等级人数分布的比例p 值,见表7-12。

2)求比例中点以下的累积比例p F ,即将每一等级p 值除以2再加上其以下的所

有面积。如图7-7所示,各等级的累积比例

A

975.095.0205.0=+÷=p F

B :825.070.0225.0=+÷=p F

C :50.030.0240.0=+÷=p F

D :175.005.0225.0=+÷=p F E

图7-12 甲教师评定等级分布

E :025.00205.=+÷=p F

乙教师和丙教师的评定等级转换过程以此类推。

3)确定查表的p 值p ',即5.0-='p F p 。

4)由p '值直接查正态曲线表,确定Z 值。Z 值的正负号以中点以下累积比例决定,若p F >0.5,Z 值为正;若p <0.5,Z 值为负。

5)学生社交的比较。用Z 值比较四名学生社交能力的高低,需根据各位教师评定等级

D

E

的Z 值及教师人数(k )求其平均数,即k Z

Z ∑=

,结果见表7-4。

表7-4 两位学生获得的等级评定结果

学生

等 级 评 定 结 果

各 等 级 的

Z

平均数

甲教师

乙教师 丙教师 甲教师 乙教师 丙教师 李×× A A B 1.96 1.64 0.45 1.35 陈×× B A A 0.93 1.64 1.28 1.20 郭×× D B B -0.93 0.45 0.45 -0.01 张××

B

D

B

0.93

-0.84

0.45

0.18

结果表明,虽然李同学和陈同学同样获得两个A 和一个B ,但其能力并不完全相同,两位同学的社交能力均在平均水平以上,但李同学的能力位置更高一些。而郭同学和张同学虽然都得了两个B 和一个D ,其能力也不相同,其中郭同学处在平均能力之下,而张同学处在平均能力之上。

第四节 抽样分布

一、抽样分布的理论及定理 (一) (一) 抽样分布

抽样分布(sampling distribution )是统计推断的基础,它是指从总体中随机抽取容量为n 的若干个样本,对每一样本可计算其k 统计量,而k 个统计量构成的分布即为抽样分布,也称统计量分布或随机变量函数分布。譬如由1X ,2X ,3X ,…,k X 构成的分布称为样本平均数(X )的抽样分布,由1S ,2S ,3S ,…,k S 构成的分布称样本标准差(S )的抽样分布,而由1r ,2r ,3r ,…,k r 构成的分布称为样本相关系数的抽样分布等等。心理与教育统计中常用的抽样分布除了正态分布,还有渐进正态分布、t 分布、2

χ分布、F 分布等。这些抽样分布都是根据一定的数学理论推导出来,所以又称理论抽样分布。

(二) (二) 中心极限定理

中心极限定理(central limit theorem )可以说是推断统计中最基本的理论与方法,它是用极限的方法所求的随机变量分布的一系列定理,其内容主要反映在三个方面。

1.如果总体呈正态分布,则从总体中抽取容量为n 的一切可能样本时,其样本均数的分布也呈正态分布;无论总体是否服从正态分布,只要样本容量足够大,样本均数的分布也接近正态分布。

2.从总体中抽取容量为n 的一切可能样本时,所有样本均数的均数(X μ)等于总体均数(μ)即

μμ=X

3.从总体中抽取容量为n 的一切可能样本时,所有样本均数的标准差(X σ)等于总体标准差除以样本容量的算数平方根,即

n X σ

σ=

中心极限定理在统计学中是相当重要的。因为许多问题都使用正态曲线的方法。这个定理适于无限总体的抽样,同样也适于有限总体的抽样。中心极限定理不仅给出了样本均数抽样分布的正态性依据,使得大多数数据分布都能运用正态分布的理论进行分析,而且还给出了推断统计中两个重要参数(即样本均数X μ与样本标准差X σ)的计算方法。

(三)抽样分布中的几个重要概念

1.随机样本。统计学是以概率论为其理论和方法的科学,概率又是研究随机现象的,因此进行统计推断所使用的样本必须为随机样本(random sample )。所谓随机样本是指按照概率的规律抽取的样本,即随机样本所包含的研究对象不是由某个人或集体的意向所决定的,只能凭各研究对象相互独立的机会而定。随机样本的抽取必须遵从随机化原则,随机化的原则一要做到抽样时总体中每个个体被抽取的机会均等,譬如,某班得到4张重要演出入场券,为公平起见采用了抓阄的方法,这时班中每一个都有相等的机会得到入场券。二要做到任何个体的抽取与其他个体的抽取彼此独立,没有牵连。譬如,抓阄中王同学抓到了并不意味着李同学一定抓不到。此外,同时抽取的个体数目应达到足够的数量。

2.抽样误差。从总体中抽取容量为n 的k 个样本时,样本统计量与总体参数之间总会存在一定的差距,而这种差距是由于抽样的随机性所引起的样本统计量与总体参数之间的不同,称为抽样误差(sampling error )。譬如,在一个平均数为80的总体中,抽取了三个样本,而三个样本的平均数可能为78,84和81,它们并不正好等于总体均数,这种差距即为抽样误差。在抽样研究中,抽样误差是不可避免的,但是只要是随机抽取样本,抽样误差也会是随机的,因此可以用统计方法来估计其大小。此外,在统计分析中抽样误差是忽略不计的,也就是不将其视为事物之间的真实差异。如上例,样本均数虽然与总体均数相差2-,4和

1,并不认为他们与总体之间存在真实的差异。

3.标准误。由于抽样研究中存在抽样误差,统计推断时需要估计出这种误差的大小,它是根据某一统计量在抽样分布上的标准差计算而来的,即为样本统计量分布的标准差或某统计量在抽样分布上的标准差。为了与样本标准差区别起见将其称为标准误(S tandard E rror ),符号SE 或X σ表示。譬如当我们从同一总体中抽出容量为n 的一切可能的样本时,计算每一个样本的平均数(X )则有1X ,2X ,3X ,…,k X ,它们与总体平均数μ之间的离均差为(μ-i X ),根据中心极限定理其标准差为

n X σ

σ=

X σ即为样本均数的标准差,即标准误,它代表着统计量与总体参数之间的抽样误差。值得

注意的是不同内容统计量的标准误,不仅符号稍有差别(如S SE 表示统计量标准差的标准误,r SE 表示统计量相关系数的标准误等),而且还有着不同的标准误估计方法,但样本均数的标准误是最基础的。

标准误与标准差之间既有共同点也有不同点。从共同点来讲它们都是表示离散程度或离中趋势的指标。但是标准差是描述一般变量值或样本原始分数离中趋势的指标,如(X X -);标准误则是专门用以说明样本统计量离中趋势的指标,如(μ-X )或(21μμ-)。

正如标准差越小,数据分布越集中,平均数的代表性越好。同理,在推断统计中,标准误越小,说明样本统计量与总体参数的之间越接近,即样本对总体的代表性越好,这时用样本统计量去推断总体就越可靠、越准确;相反,标准误越大,说明样本统计量与总体参数之间的差距越大,即样本对总体的代表性越差,这时用样本统计量去推断总体就越不可靠、越不准确。所以说标准误是进行统计推断可靠性高低的指标。

4.自由度。在统计推断中,我们把一群数据或观测值可以独立自由变动的数目称为自由度(d egree of f reedom ),用符号df 或n '表示。譬如从某一总体中随机抽取容量为n 的一个样本,其数据为1X ,2X ,3X ,…,n X 。在计算求其样本均数时,其中每一个数据i X 都不受其他数据的约束而可以自由独立地变化,因此N X

X ∑

=的自由度为N df =。但

是,在计算方差或标准差时,由于受

()∑=-0X X 这一条件的限制,即受X 的限制,使N

个数据中只有1-N 个可以独立自由地变化,有一个数据因X 的限制不能独自由地变化而成定值,因此其自由度为1-=N df ,即有方差

()

1

2

2--=

∑N X X S 。

例如有5个测量值为8,12,6,10,14,其平均数为10,现将其中四个数任意变动,如8变成5,12变成7,6变成10,14变成16,均数仍为10,那么10还能随意变动吗?显然不能,这时它因其它四个数的变化而成为定值12。所以说均数一定时,上述观测值的标准差只有4个数可以独立自由地变化,有一个数因其他数的变化而被固定下来不能任意地变动。

二、二、常用抽样分布

在心理与教育统计中,常用的抽样分布有正态分布、渐近正态分布、t 分布、F 分布、

q 分布和2χ分布等等。

(一) (一) 正态分布及渐近正态分布

当统计量的分布符合正态分布或渐近正态分布(asymptotic normal distribution )时,进行统计推论的理论依据即为正态分布的理论。以样本平均数为例,正态分布的应用情形如下。

1.总体呈正态,总体方差2

σ已知,则样本均数的分布也呈正态。根据中心极限定理则有

① ① 样本均数的均数等于总体均数,即μμ=X

② ② 样本均数的标准差等于总体标准差除以样本容量的平方根,即

n X σ

σ=

第五章 概率与概率分布(ok)

第五章概率与概率分布 5.1写出下列随机试验的样本空间: (1)记录某班一次统计学测验的平均分数。 (2)某人骑自行车在公路上行驶,观察该骑车人在遇到第一个红灯停下来以前遇到的绿灯次数。 (3)生产产品,直到有10件正品为止,记录生产产品的总件数。 解:(1)测验的平均分数为0至100分,故样本空间为 Ω=≤≤ {|0100} x x (2)遇到第一个红灯停下来以前遇到的绿灯次数为0至∞,故样本空间为 Ω=∞ {0,1,,} (3)与(2)类似,到有10件正品为止,生产产品的总件数的样本空间为 Ω=∞ {10,11,,} 5.2某市有50%的住户订日报,有65%的住户订晚报,有85%的住户至少订两种报纸中的一种,求同时订这两种报纸的住户的百分比。 解:设A = {订日报},B = {订晚报},C = {同时订两种报纸} 则P(C) = P(A∩B) = P(A) + P(B) – P(A∪B) 由题意可知: P(A) = 0.5,P(B) = 0.65,P(A∪B) = 0.85 于是P(C) = 0.5+0.65 – 0.85 = 0.3 即同时订两种报纸的住户百分比为30%。 5.3设A与B是两个随机事件,已知A与B至少有一个发生的概率是1/3,A发生且B不发生的概率是1/9,求B发生的概率。 解:由题意可知,P(A∪B) = 1/3,()1/9 P A B=。 因为()()()() P A B P A P B P A B =+-,而()()() =-,故有 P A B P A P A B

()()[()()] ()()112399 P B P A B P A P A B P A B P A B =--=-=-= 5.4 设A 与B 是两个随机事件,已知P(A) = P(B) = 1/3,P(A|B) = 1/6,求 ()P A B 。 解:首先,我们有P(AB) = P(B)P(A|B)=(1/3)*(1/6)=1/18, 其次, ()()1() (|)1()()() 1()()()1()11/31/31/1811/3712 P A B P A B P A B P A B P B P B P B P A P B P AB P B -= == ---+= ---+= -= 5.5 有甲、乙两批种子,发芽率分别是0.8和0.7。在两批种子中各随机抽取一粒,求: (1)两粒都发芽的概率。 (2)至少有一粒发芽的概率。 (3)恰有一粒发芽的概率。 解:设A = {甲种子发芽},B = {甲种子发芽}。 由题意可知,P(A) = 0.8,P(B) = 0.7。 (1)记C={两粒种子都发芽},因A 与B 独立, 故P(C) = P(A)P(B) = 0.8*0.7 = 0.56 (2)记D= {至少有一粒发芽} P(D) = P(A) + P(B) – P(AB) = 0.8+0.7-0.56 = 0.84 (3)记E = {恰有一粒发芽} 则P(E) = P(D) – P(C) = 0.84 – 0.56 = 0.28

概率与概率分布

第六章概率与概率分布 本章是推断统计的基础。 主要内容包括:基础概率,概率的数学性质,概率分布、期望值与变异数推断统计研究如何依据样本资料对总体性质作出推断,这是以概率论为基础的。 第一节基础概率 概率论起源于17世纪,当时在人口统计、人寿保险等工作中,要整理和研究大量的随机数据资料,这就需要一种专门研究大量随机现象的规律性的数学。 参赌者就想:如果同时掷两颗骰子,则点数之和为9 和点数之和为10 ,哪种情况出现的可能性较大? 例如17世纪中叶,贵族德·梅尔发现:将一枚骰子连掷四次,出现一个6 点的机会比较多,而同时将两枚掷24次,出现一次双6 的机会却很少。 概率论的创始人是法国的帕斯卡(1623—1662)和费尔马(1601—1665),他们在以通信的方式讨论赌博的机率问题时,发表了《骰子赌博理论》一书。棣莫弗(1667—1754)发现了正态方程式。同一时期瑞士的伯努利(1654一1705)提出了二项分布理论。1814年,法国的拉普拉斯(1749—1827)发表了《概率分析论》,该书奠定了古典概率理论的基础,并将概率理论应用于自然和社会的研究。此后,法国的泊松(1781—1840)提出了泊松分布,德国的高斯(1777—1855)提出了最小平方法。 1、随机现象和随机事件 概率是与随机现象相联系的一个概念。所谓随机现象,是指事先不能精确预言其结果的现象,如即将出生的婴儿是男还是女?一枚硬币落地后其正面是朝上还是朝下?等等。所有这些现象都有一个共同的特点,那就是在给定的条件下,观察所得的结果不止一个。随机现象具有非确定性,但内中也有一定的规律性。例如,事先我们虽不能准确预言一个婴儿出生后的性别,但大量观察,我们会发现妇女生男生女的可能性几乎一样大,都是0.5,这就是概率。

【免费下载】概率论与数理统计 第三章 二维随机变量及其概率分布 例题

概率论与数理统计 第三章 二维随机变量及其概率分布 例题1.甲乙两人独立地进行两次射击,命中率分别为0.2、0.5,把X 、Y 分别表示甲乙命中的次数,求(X,Y )联合分布律。2.袋中有两只白球,两只红球,从中任取两只以X 、Y 表示其中黑球、白球的数目,求(X,Y )联合分布律。3.设,且P{}=1,求()的X 1=(?1011/41/21/4) X 2=(011/21/2)X 1X 2=0X 1,X 2联合分布律,并指出是否独立。 X 1,X 24.设随机变量X 的分布律为Y=,求(X,Y )联合分布律。X 2X Y 01

概率论与数理统计 第三章 二维随机变量及其概率分布 例题 5.设(X,Y )的概率分布为 且事件{X=0}与{X+Y=1}独立求a ,b 。6. 设某班车起点上车人数X 服从参数λ(λ>0)的泊松分布,每位乘客中途下车的概率为P (0

概率论与数理统计 第三章 二维随机变量及其概率分布 例题 (1)C 的值 (2), (3)P{X+Y ≤1}并判别X 与Y 是否独立。f z (x)f Y (y)9.设f(x,y)= 为(X,Y )的密度函数,求{10 |y |1/2|Y>0}(2) f Y|X (y|x ), f X|Y (x|y )10. 设f(x,y)= 为(X,Y )的密度函数,求 {12x 2y 0 1x ≤y ≤x,x ≥1 其它 f X|Y (x|y )11. 设f(x,y)= 为(X,Y )的密度函数,求的联合分布 {4xy 0 0≤x ≤1,0≤y ≤1 其它 (X,Y )

第三章 概率与概率分布习题及答案

第三章概率、概率分布与抽样分布 计算题: 1.某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。 2. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。 3. 某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策? 4. 一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):(1)至少获利50万元的概率;(2)亏本的概率;(3)支付保险金额的均值和标准差。

5. 某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。 6. 某商场某销售区域有6种商品。假如每1小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少? 7. 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。⑴ 描述x(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x服从怎样 的分布以及x的均值和方差是什么?证明你的回答;⑵对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率呢?在209美元和217美元之间的概率呢? 解:a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938

第5章概率与概率分布

第5章 概率与概率分布 一、思考题 、频率与概率有什么关系 、独立性与互斥性有什么关系 、根据自己的经验体会举几个服从泊松分布的随机变量的实例。 、根据自己的经验体会举几个服从正态分布的随机变量的实例。 二、练习题 、写出下列随机试验的样本空间: (1)记录某班一次统计学测试的平均分数。 (2)某人在公路上骑自行车,观察该骑车人在遇到第一个红灯停下来以前遇到的绿灯次数。 (3)生产产品,直到有10件正品为止,记录生产产品的总件数。 、某市有50%的住户订阅日报,有65%的住户订阅晚报,有85%的住户至少订两种报纸中的一种,求同时订这两种报纸的住户的百分比。 、设A 与B 是两个随机事件,已知A 与B 至少有个发生的概率是3 1 ,A 发生且B 不发生的概率是 9 1 ,求B 发现的概率。 、设A 与B 是两个随机事件,已知P(A)=P(B)= 31,P(A |B)= 6 1 ,求P(A |B ) 、有甲、乙两批种子,发芽率分别是和。在两批种子中各随机取一粒,试求: (1)两粒都发芽的概率。 (2)至少有一粒发芽的概率。 (3)恰有一粒发芽的概率。 、某厂产品的合格率为96%,合格品中一级品率为75%,从产品中任取一件为一级品的概率是多少 、某种品牌的电视机用到5000小时未坏的概率为 43,用到10000小时未坏的概率为2 1。现在有一台这种品牌的电视机已经用了5000小时未坏,它能用到10000小时的概率是多少

、某厂职工中,小学文化程度的有10%,初中文化程度的有50%,高中及高中以上文化程度的有40%,25岁以下青年在小学、初中、高中及高中以上文化程度各组中的比例分别为20%,50%,70%。从该厂随机抽取一名职工,发现年龄不到25岁,他具有小学、初中、高中及高中以上文化程度的概率各为多少 、某厂有A ,B ,C ,D 四个车间生产同种产品,日产量分别占全厂产量的30%,27%,25%,18%。已知这四个车间产品的次品率分别为,,和,从该厂任意抽取一件产品,发现为次品,且这件产品是由A ,B 车间生产的分布。 、考虑抛出两枚硬币的试验。令X 表示观察到正面的个数,试求X 的概率分布。 、某人花2元钱买彩票,他抽中100元奖的概率是%,抽取10元奖的概率是1%,抽中1元奖的概率是20%,假设各种奖不能同时抽中,试求: (1)此人收益的概率分布。 (2)此人收益的期望值。 、设随机变量X 的概率密度为: F(x)= 3 2 3θ X ,01)= 8 7 ,求θ的值。 (2) 求X 的期望值与方差。 、一张考卷上有5道题目,同时每道题列出4个备选答案,其中有一个答案是正确的。某学生凭猜测能答对至少4道题的概率是多少 设随机变量X 服从参数为的泊松分布,且已知P {X=1}= P {X=2},求P {X=4}。 、设随机变量X 服从参数为λ的泊松分布:

第六章-概率分布Word版

第六章概率分布 一、单选题 180,一个随机样本n=16,其均值大于85的概率是()。 A. 2.52% B. 4.78% c. 5.31% D. 6.44% 2.让64位大学生品尝A.、B两种品牌的可乐并选择一种自己比较喜欢的。如果这两种品牌的可乐味道实际没有任何区别,有39人或39人以上选择品牌B的概率是(不查表): () A.2.28% B.4 .01% C.5.21% D. 39.06% 3. 某个单峰分布的众数为15,均值是10,这个分布应该是( ) A.正态分布 B.正偏态分布 C.负偏态分布 D.无法确定 4.一个单项选择有48单侧检验标准,至少应对多少题成绩显著优于单凭猜测()。 A.16题 B.17题 C.18题 D.19题 5. 在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z值等于() A.4.05 B.2.31 C.1.33 D. 2.02 6. 某班200人的考试成绩呈正态分布,其平均数=l2,S=4分,成绩在8分和16分之间的人数占全部人数的()。 A.34.13% B.68.26% C.90% D. 95% 7. 在一个二择一实验中,被试挑12次,结果他挑对10次,那么在Z=(X-M)/S这个公式中X应为() A.12 B.10 C.9.5 D. 10.5 8. 在处理两类刺激实验结果时,在下列哪种情况下不可以用正态分布来表示二项分布的近似值?() A.N<10 B.N>=10 C.N>30 D. N>10 9. t分布是平均数的对称的分布,当样本n趋于∞时,t分布为() A. 二项分布 B. 正态分布 C. F分布 10. 概率和统计学中,把随机事件发生的可能性大小称作随机事件发生的() A.概率 B.频率 C.频数 D. 相对频数 11. 在一次实验中,若事件B的发生不受事件A的影响,则称AB两事件为() A.不影响事件 B.相容事件 C.不相容事件 D. 独立事件 12. 正态分布由()于1733年发现的 A.高斯 B.拉普拉斯 C.莫弗 D. 高赛特

第三章 概率与概率分布习题及答案教学提纲

第三章概率与概率分布习题及答案

第三章概率、概率分布与抽样分布 计算题: 1.某种零件加工必须依次经过三道工序,从已往大量的生产记录得知,第一、 二、三道工序的次品率分别为0.2,0.1,0.1,并且每道工序是否产生次品与其它工序无关。试求这种零件的次品率。 2. 某项飞碟射击比赛规定一个碟靶有两次命中机会(即允许在第一次脱靶后进行第二次射击)。某射击选手第一发命中的可能性是80%,第二发命中的可能性为50%。求该选手两发都脱靶的概率。 3. 某企业决策人考虑是否采用一种新的生产管理流程。据对同行的调查得知,采用新生产管理流程后产品优质率达95%的占四成,优质率维持在原来水平(即80%)的占六成。该企业利用新的生产管理流程进行一次试验,所生产5件产品全部达到优质。问该企业决策者会倾向于如何决策?

4. 一家人寿保险公司某险种的投保人数有20000人,据测算被保险人一年中的死亡率为万分之5。保险费每人50元。若一年中死亡,则保险公司赔付保险金额50000元。试求未来一年该保险公司将在该项保险中(这里不考虑保险公司的其它费用):(1)至少获利50万元的概率;(2)亏本的概率;(3)支付保险金额的均值和标准差。 5. 某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时。若规定寿命低于150小时为不合格品。试求该企业生产的电池的:(1)合格率是多少?(2)电池寿命在200左右多大的范围内的概率不小于0.9。

6. 某商场某销售区域有6种商品。假如每1小时内每种商品需要12分钟时间的咨询服务,而且每种商品是否需要咨询服务是相互独立的。求:(1)在同一时刻需用咨询的商品种数的最可能值是多少?(2)若该销售区域仅配有2名服务员,则因服务员不足而不能提供咨询服务的概率是多少? 7. 美国汽车联合会(AAA)是一个拥有90个俱乐部的非营利联盟,它对其成员提供旅行、金融、保险以及与汽车相关的各项服务。1999年5月,AAA通过对会员调查得知一个4口之家出游中平均每日餐饮和住宿费用大约是213美元(《旅行新闻》Travel News,1999年5月11日)。假设这个花费的标准差是15美元,并且AAA所报道的平均每日消费是总体均值。又假设选取49个4口之家,并对其在1999年6月期间的旅行费用进行记录。⑴ 描述x(样本家庭平均每日餐饮和住宿的消费)的抽样分布。特别说明x服从怎样 的分布以及x的均值和方差是什么?证明你的回答;⑵对于样本家庭来说平均每日消费大于213美元的概率是什么?大于217美元的概率呢?在209美元和217美元之间的概率呢? 解: a. 正态分布, 213, 4.5918 b. 0.5, 0.031, 0.938

统计学习题 第六章 概率与概率分布

第六章 概率与概率分布 第一节 概率论 随机现象与随机事件·事件之间的关系(事件和、事件积、事件的包含与相等、互斥事件、对立事件、互相独立事件)·先验概率与古典法·经验概率与频率法 第二节 概率的数学性质 概率的数学性质(非负性、加法规则、乘法规则)·排列与样本点的计数·运用概率方法进行统计推断的前提 第三节 概率分布、期望值与变异数 概率分布的定义·离散型随机变量及其概率分布·连续型随机变量及其概率分布·分布函数·数学期望与变异数 一、填空 1.用古典法求算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设( 机会均等 )。 2.分布函数)(x F 和)(x P 或 )(x 的关系,就像向上累计频数和频率的关系一样。所不同的是,)(x F 累计的是( 概率 )。 3.如果A 和B ( 互斥 ),总合有P(A/B)=P 〔B/A 〕=0。 4.( 大数定律 )和( 中心极限定理 )为抽样推断提供了主要理论依据。 5.抽样推断中,判断一个样本估计量是否优良的标准是( 无偏性 )、( 一致性 )、( 有效性 )。 6.抽样设计的主要标准有( 最小抽样误差原则 )和( 最少经济费用原则 )。 7.在抽样中,遵守( 随机原则 )是计算抽样误差的先决条件。 8.抽样平均误差和总体标志变动的大小成( 正比 ),与样本容量的平方根成( 反比 )。如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应( 增大到16倍 )。 9.若事件A 和事件B 不能同时发生,则称A 和B 是( 互斥 )事件。 10.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是( 1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是( 1/52 )。 二、单项选择 1.古典概率的特点应为(A ) A 、基本事件是有限个,并且是等可能的; B 、基本事件是无限个,并且是等可能的; C 、基本事件是有限个,但可以是具有不同的可能性;

第六章 概率分布

第六章概率分布 第一节概率的基本概念 一、什么是概率 概率指用一个比值来概括某事件出现的可能性大小。因为纯粹利用概率的概念是无法计算出概率的,所以它有几个用于不同情况下的计算办法: (一)古典概率(先验概率) 基本事件:如果某一随机实验可以分成有限的n种可能结果,这n种结果之间是互不交叉的,而且这些结果出现的可能性相等,我们把这n种可能结果称为基本事件。如抛置骰子这一随机试验的基本事件为:{1}{2}{3}{4}{5}{6}。 基本事件必须具备如下的五个条件: ①等可能性:实验中基本事件发生的概率相等(根据对称性来判断)。 ②互斥性:各个基本事件不可能在一次试验中同时发生,或者说一次试验中只能发生基本事件中的一个。 ③完备性:一次试验中所有基本事件必然有一个发生,即所有基本事件概率之和为100%。 ④有限性:全部结果只有有限的n种。 ⑤不可再分性:不可能有比基本事件范围更小的事件。若把抛置骰子的基本事件取为:A={1,2,3},B={4,5,6},则它满足前面的所有4上条件,但它们可以再分。 古典概率的定义:在只含有有限个基本事件的试验中,任意事件A发生的概率定义为: (二)统计概率(后验概率) 统计概率常用于随机现象不满足“基本事件等可能发生”的条件,或者某些试验不可能分为等可能的互不相交的事件。 在相同条件下进行n次试验,事件A出现了m次,如果试验次数n充分地大,且事件A 出现的频率稳定在某一数值p附近,则称p为事件A的概率。由于p也是一抽象的值, 常常用n在充分大时的代替。即: 。 二、概率的基本性质 1、概率的加法定理 两个互不相容事件A、B之和的概率,等于两个事件概率之和,P(A+B)=P(A)+P(B) 2、概率的乘法定理 两个独立事件同时出现的概率等于该两事件概率的乘积,P(AB)=P(A)×P(B) 例6-1:一枚硬币掷三次,或三枚硬币各掷一次,问出现两次或两次以上H的概率是多 少?

概率论与数理统计第三章课后习题答案

习题三 1.将一硬币抛掷三次,以X 表示在三次中出现正面的次数,以Y 表示三次中出现正面次数与 出现反面次数之差的绝对值.试写出X 和Y 的联合分布律. 2.盒子里装有3只黑球、2只红球、2只白球,在其中任取4只球,以X 表示取到黑球的只数,以Y 表示取到红球的只数.求X 和Y 的联合分布律. 3.设二维随机变量(X ,Y )的联合分布函数为 F (x ,y )=?????≤ ≤≤≤., 020,20,sin sin 其他ππy x y x 求二维随机变量(X ,Y )在长方形域? ?? ? ??≤<≤<36,40πππy x 内的概率. 【解】如图πππ {0,}(3.2)463 P X Y <≤ <≤公式 ππππππ(,)(,)(0,)(0,)434636 F F F F --+

ππππππ sin sin sin sin sin0sin sin0sin 434636 2 (31). 4 =--+ =- g g g g 题3图 说明:也可先求出密度函数,再求概率。 4.设随机变量(X,Y)的分布密度 f(x,y)= ? ? ?> > + - . ,0 ,0 ,0 ,)4 3( 其他 y x A y x e 求:(1)常数A; (2)随机变量(X,Y)的分布函数; (3)P{0≤X<1,0≤Y<2}. 【解】(1)由-(34) 00 (,)d d e d d1 12 x y A f x y x y A x y +∞+∞+∞+∞ + -∞-∞ === ???? 得A=12 (2)由定义,有 (,)(,)d d y x F x y f u v u v -∞-∞ =?? (34)34 00 12e d d(1e)(1e)0,0, 0, 0, y y u v x y u v y x -+-- ??-->> ? == ?? ? ?? ?? 其他 (3) {01,02} P X Y ≤<≤< 12(34)38 00 {01,02} 12e d d(1e)(1e)0.9499. x y P X Y x y -+-- =<≤<≤ ==--≈ ?? 5.设随机变量(X,Y)的概率密度为 f(x,y)= ? ? ?< < < < - - . ,0 ,4 2,2 ), 6( 其他 y x y x k (1)确定常数k; (2)求P{X<1,Y<3}; (3)求P{X<}; (4)求P{X+Y≤4}. 【解】(1)由性质有

概率与概率分布(一)

第六章 概率与概率分布(一) 第一节 概率论 随机现象与随机事件·事件之间的关系(事件和、事件积、事件的包含与相等、互斥事件、对立事件、互相独立事件)·先验概率与古典法·经验概率与频率法 第二节 概率的数学性质 概率的数学性质(非负性、加法规则、乘法规则)·排列与样本点的计数·运用概率方法进行统计推断的前提 第三节 概率分布、期望值与变异数 概率分布的定义·离散型随机变量及其概率分布·连续型随机变量及其概率分布·分布函数·数学期望与变异数 一、填空 1.用古典法求算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设( 机会均等 )。 2.分布函数)(x F 和)(x P 或 )(x 的关系,就像向上累计频数和频率的关系一样。所 不同的是,)(x F 累计的是( 概率 )。 3.如果A 和B ( 互斥 ),总合有P(A/B)=P 〔B/A 〕=0。 4.( 大数定律 )和( 中心极限定理 )为抽样推断提供了主要理论依据。 5.抽样推断中,判断一个样本估计量是否优良的标准是( 无偏性 )、( 一致性 )、( 有效性 )。 6.抽样设计的主要标准有( 最小抽样误差原则 )和( 最少经济费用原则 )。 7.在抽样中,遵守( 随机原则 )是计算抽样误差的先决条件。 8.抽样平均误差和总体标志变动的大小成( 正比 ),与样本容量的平方根成( 反比 )。如果其他条件不变,抽样平均误差要减小到原来的1/4,则样本容量应( 增大到16倍 )。 9.若事件A 和事件B 不能同时发生,则称A 和B 是( 互斥 )事件。 10.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是( 1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是( 1/52 )。 二、单项选择 1.古典概率的特点应为(A ) A 、基本事件是有限个,并且是等可能的; B 、基本事件是无限个,并且是等可能的; C 、基本事件是有限个,但可以是具有不同的可能性;

概率论与数理统计习题及答案 第三章

《概率论与数理统计》习题及答案 第 三 章 1.掷一枚非均质的硬币,出现正面的概率为p (01)p <<,若以X 表示直至掷到正、反面都出现时为止所需投掷次数,求X 的分布列。 解 ()X k =表示事件:前1k -次出现正面,第k 次出现反面,或前1k -次出现反面,第k 次出现正面,所以 1 1()(1)(1),2,3,.k k P X k p p p p k --==-+-=L 2.袋中有b 个黑球a 个白球,从袋中任意取出r 个球,求r 个球中黑球个 数X 的分布列。 解 从a b +个球中任取r 个球共有r a b C +种取法,r 个球中有k 个黑球的取法有k r k b a C C -,所以X 的分布列为 ()k r k b a r a b C C P X k C -+==,max(0,),max(0,)1,,min(,)k r a r a b r =--+L , 此乃因为,如果r a <,则r 个球中可以全是白球,没有黑球,即0k =;如果r a >则r 个球中至少有r a -个黑球,此时k 应从r a -开始。 3.一实习生用一台机器接连生产了三个同种零件,第i 个零件是不合格品的概率1 (1,2,3)1 i p i i ==+,以X 表示三个零件中合格品的个数,求X 的分布列。 解 设i A =‘第i 个零件是合格品’1,2,3i =。则 1231111 (0)()23424 P X P A A A === ??= , 123123123(1)()P X P A A A A A A A A A ==++ 123123123()()()P A A A P A A A P A A A =++ 1111211136 23423423424 = ??+??+??= , 123123123(2)()P X P A A A A A A A A A ==++ 123123123()()()P A A A P A A A P A A A =++ 1211131231123423423424 = ??+???+??=,

第五章 概率与概率分布基础

第五章概率与概率分布基础 第一节什么是概率 第二节概率分布 第三节常用离散型随机变量分布举例 第四节常用连续型随机变量分布举例 为什么学习概率? 概率是公共和非盈利性事业管理中最有用的数量分析方法之一.利用概率及相关知识,公共和非盈利事业的管理者可以判断和解决各种各样的问题. 比如,维修机构的负责人可以运用概率来决定公共设施发生故障的频率,并依此部署维护力量.公共交通部门可以用概率来分析某一站点某一时段内可能候车人数,从而决定公共交通的车次间隔. 本章内容包括一些基本的概率法则和假定. 最常用的适于作定量研究的方法--抽样调查就是通过概率的理论使我们掌握一种媒介,它可以做我们推断和分析的平台. 第一节什么是概率 一、随机事件与概率 (一)随机试验与随机事件 随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。对随机现象的试验或观测称为随机试验,它必须满足以下的性质: (1)每次试验的可能结果不是唯一的; (2)每次试验之前不能确定何种结果会出现; (3)试验可在相同条件下重复进行。 比如:标准大气压下,水沸腾的温度是100度. 必然事件 扔100次硬币,正面朝上的次数.随机事件. 历史上曾有人做过试验,试图证明抛掷匀质硬币时,出现正反面的机会均等。 实验者n nH fn(H) De Morgan 2048 1061 0.5181 Buffon 4040 2048 0.5069 K. Pearson 12000 6019 0.5016 K. Pearson 24000 12012 0.5005 在经济与社会领域,随机命题是常见的,而必然命题是十分少见的. 任何一种社会现象,社会行为其产生的原因都是复杂的,事物单个出现的时候难免有偶然性和非确定性,但是对于大量事物的研究,由于平衡与排除了单个孤立事件所具有的偶然性,从而可以发现其内部的规律性. 在随机试验中(对随机现象的观察)可能出现也可能不出现,而在大量重复试验中却具有某种规律性的事件,称之为随机事件。 试验的结果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件,又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件 还可称为样本点,设试验有n个基本事件,分别记为(i=1,2,…,n)。集合Ω={ω1 ,ω2 , …,ωn}称为样本空间,Ω中的元素就是样本点。

概率论第6章练习答案

第6章《二维随机变量》练习题 一、判断题 1.设(ξ,η)为连续型随机向量,如果联合密度等于各自边际密度的乘积,则ξ,η相互独立.( 1 ) 2.等边三角形域上二维均匀分布的边缘分布仍是均匀分布. ( 0) 3.二维均匀分布的边缘分布仍是均匀分布. ( 0 ) 4.设0)(=A P ,则随机事件A 与任何随机事件B 一定相互独立.( 0 ) 1.设ξ服从参数为λ的普阿松分布,P(ξ=1)=P(ξ=3),则λ 2.设(ξ,η)~N(0,1;1,4,0.5),则ξ,η分别服从3.设ξξ12,的概率密度函数分别为f t f t 12 (),(),且ξξ12,相互独立, 则(ξξ12,)的联4.设(,)X Y 的联合概率分布为 已知(11)P X Y === 2 3 ,则a=_0.2___,X 的概率分布为_____________=。 5.已知),(Y X 的联合分布函数为),(y x F ,且d c b a <<,,则 (,)P a X b c Y d <≤<≤= 6.设),(Y X 的联合概率分布为

则X 7.设二维连续型随机变量),(Y X 的联合概率密度函数为 其它 当0 ,00),()43(>>? ? ?=+-y x ke y x f y x ,则系数=k 12, 三、计算题 1.设随机变量(,)X Y 的联合密度函数 ?? ?<<<=他 其 ,20),(x y x A y x f 求 (1) 常数A ; (2) 边际密度函数; (3) 讨论X 与Y 的相关性. (1) .4/1=A (3) ?==2 2 ,3/4)2/()(dx x X E ??==-2 ,0)4/()(x x dy y dx Y E ??==-2 ,0)4/()(x x dy y xdx XY E c o v (,)()()X Y E X Y E X E Y =-= 所以X 与Y 不相关. 2.设(,)X Y 的联合密度函数为???∈=其它 ,0),(,6),(D y x x y x p ,其中D 为由0,0 x y ==及1x y +=所围区域。(1)求();PY X ≤(2)求(,)X Y 的边际密度函数(),(),X Y p x p y

概率论与数理统计第三章习题及答案

概率论与数理统计习题 第三章 多维随机变量及其分布 习题3-1 盒子里装有3只黑球、2只红球、2只白球,在其中任取4只球.以X 表示取到黑球的只数,以Y 表示取到红球的只数,求X 和Y 的联合分布律. (X ,Y )的可能取值为(i , j ),i =0,1,2,3, j =0,12,i + j ≥2,联合分布律为 P {X=0, Y=2 }= 35147 2222=C C C P {X=1, Y=1 }=356 47221213=C C C C P {X=1, Y=2 }= 3564 7 1 2 2213=C C C C P {X=2, Y=0 }=353 472 223=C C C P {X=2, Y=1 }= 35124 712 1223=C C C C P {X=2, Y=2 }=353 47 2 223=C C C P {X=3, Y=0 }= 35247 1233=C C C P {X=3, Y=1 }=352 47 1233=C C C P {X=3, Y=2 }=0 习题3-2 设随机变量),(Y X 的概率密度为 ?? ?<<<<--=其它 , 0, 42,20), 6(),(y x y x k y x f (1) 确定常数k ; (2) 求{}3,1<

?? ????????<<<<=42,20),(y x y x D o 解:(1)∵??? ? +∞∞-+∞ ∞ ---= = 20 12 )6(),(1dydx y x k dy dx y x f ,∴8 1= k (2)8 3 )6(8 1)3,1(32 1 ? ?= --= <

考研资料_厦门大学卫生综合_卫生统计厦大内部习题集_第五章 常用概率分布

第五章常用概率分布习题 一、是非题 1.在确定某个指标的医学参考值范围时,必须选取足够多的健康人来进行计算。2.对于服从正态分布的资料,变量取值位于-1.96到1.96之间的可能性为0.95。3.Poisson分布有两个参数:n和μ。 4.在μ足够大时,Poisson分布就是正态分布。 5.设X服从Poisson分布,则Y=2X也服从Poisson分布。 6.用X表示某个放射性物体的每分钟脉冲数,其平均每分钟脉冲数为5次(可以认为服从Poisson分布),用Y表示连续观察20分钟的脉冲数,则可以认为近似服从正态分布,但不能认为X近似服从正态分布。 二、选择题 1.关于二项分布,错误的是( )。 A.服从二项分布随机变量为离散型随机变量 B.当n很大,π接近0.5时,二项分布图形接近正态分布 C.当π接近0.5时,二项分布图形接近对称分布 D.服从二项分布随机变量,取值的概率之和为1 E.当nπ>5时,二项分布接近正态分布 2.关于泊松分布,错误的是( )。 A.当二项分布的n很大而π很小时,可用泊松分布近似二项分布 B.泊松分布由均数λ唯一确定 C.泊松分布的均数越大,越接近正态分布

D.泊松分布的均数与标准差相等 E.如果X1和X2分别服从均数为λl和λ2的泊松分布,且相互独立。则X1+X2服从均数为λl+λ2泊松分布 3.正态曲线下、横轴上,从μ到μ+2.58σ的面积占曲线下总面积的( ) A.99%B.95%C.47.5%D.49.5%E.90% 4.标准正态曲线下,中间95%的面积所对应的横轴范围是( )。 A.-∞到+1.96 B.-1.96到+1.96 C.-∞到+2.58 D.-2.58到+2.58 E.-1.64到+1.64 5.服从二项分布的随机变量的总体均数为( )。 A.n(1-π) B.(n-1)π(1-π) C.nπ(1-π) D.nπE. 6.服从二项分布的随机变量的总体标准为( )。 A B.(n-1)π(1-π) C.nπ(1-π) D E 7.以下方法中,确定医学参考值范围的最好方法是( ) A.百分位数法B.正态分布法C.对数正态分布法D.标准化法E.结合原始数据分布类型选择相应的方法 8.下列叙述中.错误的是( )。 A.二项分布中两个可能结果出现的概率之和为1 B.泊松分布只有1个参数λ C.正态曲线下的面积之和为1 D.服从泊松分布的随机变量,其取值为0到n的概率之和为1 E.标准正态分布的标准差为1 三、筒答题

统计学课后答案(第3版)第5章概率与概率分布基础习题答案

第五章 概率与概率分布基础习题答案 一、单选 1.A ; 2.D ; 3.C ; 4.A ; 5.D ; 6.C ; 7.A ; 8.D ; 9.B ;10.C 二、多选 1.ABCE ; 2.ABCE ; 3.ABD ; 4.ACE ; 5.ABCE 6.ABD ; 7.ABCD ; 8.ABCDE ; 9.ABCDE ;10.ACD 三、计算分析题 1、(1)C B A ;C B A ;C B A (2)C AB (3) C B A C B A C B A (4) C B A C B A 或 2、6.0)(1=A P ;4.0)(2=A P ;95.0)(1=A B P ;90.0)(2=A B P (2)16.0889.001.0101.05001.010)(=÷+?+?+?=x E (元) 说明2元彩票平均中奖额为0.16元。 4、包含对6道、7道、8道、9道和10道题的五种情况的概率为: 4661037710288109910101010)43()41()43()41()43()41()43()41()41 (C C C C C ++++ %202.098.01)4 3()41()43()41()43()41()43()41()43)(41()43(15551064410733108221091100010==-=+++++-=C C C C C C 5、!2)2()1(2λ λλλ--=====e X P e X P ,则λ=2 22432!42)4(e e X P ===- 6、(1)化为标准正态分布有: )22 3()2123()2()2()2(-<-+->-=-<+>=>x P x P x P x P x P

第六章 概率与概率分布练习题

第六章 概率与概率分布 一、填空 1.用古典法求算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设(机会均等 )。 2.分布函数)(x F 和)(x P 或 ?)(x 的关系,就像向上累计频数和频率的关系一样。所不同的是,)(x F 累计的是(概率 ) 。 3.如果A 和B (互斥 ),总合有P(A/B)=P 〔B/A 〕=0。 4.(大数定律 )和( 中心极限定理 )为抽样推断提供了主要理论依据。 6.抽样设计的主要标准有(最小抽样误差原则 )和(最少经济费用原则 )。 7.在抽样中,遵守(随机原则 )是计算抽样误差的先决条件。 9.若事件A 和事件B 不能同时发生,则称A 和B 是(互斥 )事件。 10.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是(1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是( 1/52 )。 二、单项选择 1.随机试验所有可能出现的结果,称为( D )。A 基本事件; B 样本;C 全部事件;D 样本空间。 2.在次数分布中,频率是指( ) A.各组的频率相互之比 B.各组的分布次数相互之比 C.各组分布次数与频率之比 D.各组分布次数与总次数之比 3.若不断重复某次调查,每次向随机抽取的100人提出同一个问题,则每次都能得到一个回答“是”的人数百分数,这若干百分数的分布称为:( D )。 A .总体平均数的次数分布 B .样本平均的抽样分布 C .总体成数的次数分布 D .样本成数的抽样分布 4.以等可能性为基础的概率是(A )。A 古典概率;B 经验概率;C 试验概率;D 主观概率。 5.古典概率的特点应为( A )。 A 基本事件是有限个,并且是等可能的; B 基本事件是无限个,并且是等可能的; C 基本事件是有限个,但可以是具有不同的可能性; D 基本事件是无限的,但可以是具有不同的可能性。 6.任一随机事件出现的概率为( D )。A 在–1与1之间;B 小于0;C 不小于1;D 在0与1之间。 7.若P (A )=0.2,P(B )=0.6,P (A/B )=0.4,则)(B A P =( D )。A 0.8 B 0.08 C 0.12 D 0.24。 8.若A 与B 是任意的两个事件,且P (AB )=P (A )·P (B ),则可称事件A 与B (C )。 A 等价 B 互不相容 C 相互独立 D 相互对立。 9.若相互独立的随机变量X 和Y 的标准差分别为6与8,则(X +Y )的标准差为(B )。A 7 B 10 C 14 D 无法计算。 10.对于变异数D (X ),下面数学表达错误的是( D )。 A D (X )=E (X 2)―μ2 B D (X )=E [(X ―μ)2] C D (X )= E (X 2)―[E (X ) ] 2 D D (X )=σ 11.如果在事件A 和B 存在包含关系A ?B 的同时,又存在两事件的反向包含关系A ?B ,则称事件A 与事件B (A )A 相等 B 互斥 C 对立 D 互相独立 三、多项选择 1.随机试验必须符合以下几个条件(ABD )。 A .它可以在相同条件下重复进行; B .每次试验只出现这些可能结果中的一个; C .预先要能断定出现哪个结果; D .试验的所有结果事先已知; E .预先要能知道哪个结果出现的概率。 2.重复抽样的特点是(ACE )。 A 每次抽选时,总体单位数始终不变; B 每次抽选时,总体单位数逐渐减少; C 各单位被抽中的机会在每次抽选中相等; D 各单位被抽中的机会在每次抽选中不等; E 各次抽选相互独立。 3.关于频率和概率,下面正确的说法是(BCE )。 A .频率的大小在0与1之间; B .概率的大小在0与1之间; C .就某一随机事件来讲,其发生的频率是唯一的; D .就某一随机事件来讲,其发生的概率是唯一的; E .频率分布有对应的频数分布,概率分布则没有。

相关文档
相关文档 最新文档