文档库 最新最全的文档下载
当前位置:文档库 › 第三讲 正态分布、统计与统计案例

第三讲 正态分布、统计与统计案例

第三讲 正态分布、统计与统计案例
第三讲 正态分布、统计与统计案例

专题六概率与统计、算法、复数、推理与证明

第三讲正态分布、统计与统计案例

高考导航

1.考查正态曲线的性质及正态分布的概率计算.

2.考查系统抽样和分层抽样、样本的频率分布与数字特征、线性回归分析、独立性检验.

3.与概率知识交汇进行综合考查.

1.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图:

根据该折线图,下列结论错误的是()

A.月接待游客量逐月增加

B.年接待游客量逐年增加

C.各年的月接待游客量高峰期大致在7,8月

D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

[解析] 折线图呈现出的是一个逐渐上升的趋势,但是并不是每个月都在增加,故A 说法错误;折线图中按照年份进行划分,可以看出每年的游客量都在逐年增加,故B 说法正确;折线图中每年的高峰出现在每年的7,8月,故C 说法正确;每年的1月至6月相对于7月至12月的波动性更小,变化的幅度较小,说明变化比较平稳,故D 说法正确.

[答案] A

2.(2017·山东卷)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的

散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^

=b ^x +a ^,已知∑i =110x i =225,∑i =1

10y i =1600,b ^=4.该班某学生的脚长为24,

据此估计其身高为( )

A .160

B .163

C .166

D .170

[解析] 由题意可得x -=22.5,y -=160,∴a ^=160-4×22.5=70,

即y ^=4x +70.当x =24时,y ^

=4×24+70=166,故选C.

[答案] C

3.(2017·江苏卷)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量 ,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型

号的产品中抽取________件.

[解析]从丙种型号的产品中抽取的件数为

60×300

200+400+300+100

=18.

[答案]18

4.(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:

(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A 的概率;

(2)填写下面列联表,并根据列联表判断是否有99%的把握认为

箱产量与养殖方法有关:

(3)

的估计值(精确到0.01).

附:

K2=

.

(a+b)(c+d)(a+c)(b+d)

[解](1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”.

由题意知P(A)=P(BC)=P(B)P(C).

旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,

故P(B)的估计值为0.62.

新养殖法的箱产量不低于50 kg的频率为(0.068+0.046+0.010+0.008)×5=0.66,

故P(C)的估计值为0.66.

因此,事件A的概率估计值为0.62×0.66=0.4092.

(2)根据箱产量的频率分布直方图得列联表

K2=200×(62×66-34×38)2

100×100×96×104

≈15.705.

由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.

(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新

养殖法箱产量的中位数的估计值为50+0.5-0.34

0.068≈52.35(kg).

考点一正态分布

1.正态曲线的性质

(1)曲线位于x轴上方,与x轴不相交;曲线关于直线x=μ对称,且在x=μ处达到峰值.

(2)曲线与x轴之间的面积为1.

(3)当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散.

2.正态分布X~N(μ,σ2)的三个常用数据

(1)P(μ-σ

(2)P(μ-2σ

(2)P(μ-3σ

[思维流程]

[解](1)抽取的一个零件的尺寸在(μ-3σ,μ+3σ)之内的概率为0.9974,从而零件的尺寸在(μ-3σ,μ+3σ)之外的概率为0.0026,故X~B(16,0.0026).

因此P(X≥1)=1-P(X=0)=1-0.997416≈0.0408.

X的数学期望为E(X)=16×0.0026=0.0416.

(2)(ⅰ)如果生产状态正常,一个零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.0408,发生的概率很小.因此一旦发

生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现

【免费下载】概率论与数理统计案例

实例1 发行彩票的创收利润某一彩票中心发行彩票 10万张, 每张2元. 设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计算彩票发行单位的创收利润.解:设每张彩票中奖的数额为随机变量X , 则X 10000 5000 1000 100 10 0p 51/1052/10510/105100/1051000/100p 每张彩票平均能得到奖金 05512()10000500001010E X p =? +?++? 0.5(),=元每张彩票平均可赚20.50.3 1.2(), --=元因此彩票发行单位发行 10 万张彩票的创收利润为:100000 1.2120000().?=元实例2 如何确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70%,将损失 2 万元.若存入银行,同期间的利率为5% ,问是否作此项投资?解:设 X 为投资利润,则 X 8 -2p 0.3 0.7()80.320.71(),E X =?-?=万元存入银行的利息:故应选择投资.1050.5(),%?=万元实例3 商店的销售策略某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X (以年计),规定1,1500;12,2000;23,2500; 3,3000.X X X X ≤<≤<≤>一台付款元一台付款元一台付款元一台付款元10,1e ,0,()100, 0.x X x f x x Y -?>?=??≤? 设寿命服从指数分布概率密度为试求该商店一台家用电器收费的数学期望定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术、电气课校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料、电气设备调试高中中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并

数理统计的起源

课程文化2-数理统计的起源 数理统计是伴随着概率论的发展而发展起来的一个数学分支,研究如何有效 的收集、整理和分析受随机因素影响的数据,并对所考虑的问题作出推断或预测,为采取某种决策和行动提供依据或建议. 数理统计的发展大致可分为古典时期、近代时期和现代时期三个阶段. 古典时期(19世纪以前).这是描述性的统计学形成和发展阶段,是数理统计的萌芽时期.在这一时期里,瑞土数学家雅各布·伯努利(Jakob Bernoulli?,1654-1705)较早地系统论证了大数定律.1763年,英国数学家贝叶斯(Thomas Bayes,1701-1761)提出了一种归纳推理的理论,后被发展为一种统计推断方法― 贝叶斯方法,开创了数理统计的先河.法国数学家棣莫佛(de Moivre,1667-1754)于1733年首次发现了正态分布的密度函数并计算出该曲线在各种不同区间内的概率,为整个大样本理论奠定了基础.1809年,德国数学家高斯(Gauss.Garl Friedrich,1777-1855,德国)和法国数学家勒让德(Adrien Marie Legendre1752-1833)各自独立地发现了最小二乘法,并应用于观测数据的误差分析.在数理统计的理 论与应用方面都作出了重要贡献,他不仅将数理统计应用到生物学,而且还应用到教育学和心理学的研究.并且详细地论证了数理统计应用的广泛性,高斯曾预言:"统计方法,可应用于各种学科的各个部门." 近代时期(19世纪末至1845年).数理统计的主要分支建立,是数理统计的形成时期.上一世纪初,由于概率论的发展从理论上接近完备,加之工农业生产迫切需要,推动着这门学科的蓬勃发展. 1889年,英国数学家皮尔逊(Karl Pearson,1857-1936)提出了矩阵估计法,次年 又提出了频率曲线的理论,并于1900年在德国大地测量学者赫尔梅特(F.Helmert)1876年研究正态总体的样本方差时发现的一个十分重要的分布的基础上提出了 检验,这是数理统计发展史上出现的第一个小样本分布. 1908年,英国的统计学家戈塞特(W.S.Gosset,1876-1937)创立了小样本检验代替了大样本检验的理论和方法(即t分布和t检验法),这为数理统计的另一分支---多元分析奠定了理论基础. 1912年,英国统计学家费歇(R.A.Fisher,1890-1962)推广了t检验法,同时发展了显著性检验及估计、方差分析等数理统计新分支. 这样,数理统计的一些重要分支如假设检验、回归分析、方差分析、正交设 计等都有了决定其基本面貌的内容和理论框架.数理统计成为应用广泛、方法独特的一门数学学科. 现代时期(1945年以后).美籍数理统计学家瓦尔德(A.Wald,1902-1950)致力于用数学方法使统计学精确化、严密化,取得了很多重要成果.他发展了决策理论,提出了一般的判别问题,创立了序贯分析理论,提出了著名的序贯概率比检验 法(比如,用于贵重产品的抽样检查与验收).瓦尔德的两本著作《序贯分析》和《统计决策函数论》,被认为是数理发展史上的经典之作.统计决策理论从人与大自 然进行博弈的观点出发,把形形色色的统计问题纳入一个统一的模式之下,对战后数理统计许多分支的发展产生了很大的影响,特别是参数估计这个分支.

概率论与数理统计MOOC课程中的案例设计

概率论与数理统计MOOC课程中的案例设计 发表时间:2018-07-06T10:44:29.247Z 来源:《防护工程》2018年第5期作者:郭珂琪 [导读] 概率论与数理统计是工程数学非常重要的组成部分,甚至有西方学者提出:在大数据时代,统计比微积分更基础。 北京计算机技术及应用研究所北京 100854 摘要:概率论与数理统计是工程数学非常重要的组成部分,甚至有西方学者提出:在大数据时代,统计比微积分更基础。在西方,这门课是几乎所有大学生都要学习的必修课程,在我国,概率论与数理统计也是理工,农林,经管,医药卫生等各领域学生的必修课程,如何让学生学好这门课程一直是很多教师关注的热点。这门课程成为MOOC 课程,可以面向更多的学生,整合并充分利用优质教育资源,方便不同专业的交流;但同时也面临了学生专业跨度大,数学基础差别大的困难。针对这样的学生群体,该课程的MOOC 课程制作面临更大的挑战,必须深入浅出,形象生动,难度层次递进,且有连贯性,才能达到更好的教学效果,并有效降低学生辍学率。 关键词:MOOC 课程;概率论与数理统计;案例教学;概率统计 随着各种MOOC资源平台的涌现和推广,新的在线教学模式—MOOC已经成为大学教育中不可忽视的一种教育模式。MOOC对学校而言,能更好地整合教育资源;对学生而言,能更好地锻炼自学、思考和反思的能力。但MOOC也存在一些较难克服的障碍,对于内容抽象、学习难度大的课程,基础有欠缺、自制力缺乏的学生的辍学率始终居高不下,故可以预见,在较长时期内,部分学生还是会选择以传统课堂教学课程为主的学习方式。对于这门内容抽象、学习难度大的课程,如何保证学生课下自学的效果,不影响课程内容的进度,成为翻转课堂实施的一个关键问题,MOOC相关课程的资源便成为学生课下自学中最好的辅助;同时在课上讨论中,为了更好地提高学生的兴趣,锻炼学生的思考能力,也可以适当结合和借鉴MOOC灵活开放的教学方式。 一、案例教学对概率论与数理统计课堂教学的意义 在概率论与数理统计课堂教学中积极提倡案例教学是十分必要的,并具有其独特的意义。 1、概率论与数理统计的教学目标,既有学习理论方面的目标,又有实践层面的目标,既培养学生具有扎实的概率统计基础理论,又能将该理论和实践结合起来。而案例教学能将理论和实践很好地结合起来,可以使两个目标得以同时实现,且在两者结合方面拉近了距离,使得理论不再是空中楼阁,而是活生生的理论,实践也不是盲目的实践,而是有指导、有方向、有目的的实践。概率论与数理统计是一门应用性很强的学科,很适合用案例教学方法来组织课堂教学。 2、概率论与数理统计是一门研究随机现象的学科,在学习中有许多难点,需辅以案例教学才能理解概率论与数理统计的思想方法、基本原理和统计工具。概率论与数理统计这门课程不同于以往学习的确定性数学,其中随机变量、分布函数、大数定理、中心极限定理、极大似然估计方法以及假设检验的思想方法等都是该课程中难以理解的内容,如果教师在课堂教学上照本宣科,只强调教学过程的理论性、严谨性和逻辑性而脱离实际应用,学生要真正掌握和理解概率统计思想方法和概率统计模型是很困难的,必须从案例出发,才能清晰地阐明其概念和统计思想,必须通过案例的描述、假设、建模与求解,演示理论与方法的应用过程。 3、在概率论与数理统计课堂教学中实施案例教学也是教学改革的必然要求。案例教学法是把案例作为一种教学工具,把学生引导到实际问题中去,通过分析与相互讨论,调动学生的主动性和积极性,并提出解决问题的基本方法和途径的一种教学方法,它是连接理论和实践的桥梁。将理论教学与实际案例有机地结合起来,使得课堂讲解生动而清晰,可收到良好的教学效果。同时案例教学可以促进学生全面地看问题,从数量的角度分析事物的变化规律,使概率与数理统计的思想和方法在现实生活中得到更好的应用,从而提高学生分析问题和解决问题的能力。 二、案例教学在概率论与数理统计课堂教学中的运用 案例教学一般适合于既要注重理论教学,又注重实际操作的课程,而概率论与数理统计作为一门应用性很强的随机学科,在课堂上很适合采用案例教学方法,根据该学科的特点,在案例教学时应按照以下步骤组织实施: 1、案例的选择。选择合适的案例是整个案例教学的核心,同时也是一项十分复杂的工作,这主要是由于大学各理工科的专业性质不同,对案例的选择也不同,一般来说,所选择的案例要与相应专业比较接近,这样才能调动学生学习的积极性,以达到好的教学效果。因而在选择案例时需把握以下几点:一要考虑案例的实用性;二要考虑案例的典型性;三要考虑案例的针对性。根据案例的选择原则,这就要求我们在选择案例时要深入各个相关专业进行调研,与专业教师交流探讨,对专业教材阅读分析,收集专业课程中使用概率论与数理统计知识的案例和学生感兴趣的案例,安排教研活动组织专题讨论,进行分类汇总,编写《概率论与数理统计案例选编》,对于来自各个学科专业的数学应用案例,要有问题的提出和分析,有模型的建立与求解,有应用的讨论和评注。 2、明确案例教学思路,做好案例教学设计。根据教学内容,结合学生的专业特点,从概率论与数理统计案例选编中选取合适案例,选取好案例后,要合理分配好课堂上案例讨论与分析的时间,选择好教学方法和教学手段,并以多媒体的形式在课堂上呈现。概率论与数理统计从内容到方法与以往的数学课程有本质的不同,因此其基本概念的引入就显得更为重要。在教学中,应首先从案例出发引入概率统计的相关概念、概率统计的基本原理、统计方法,然后再选择合适案例来说明概率统计原理与方法的应用。当然,在课堂上不是要一味地讲解案例,也不是案例越多越好,而是要把握好案例与课堂知识点的结合,不能公式化,在教学过程中要充分体现“实践—理论—实践”的认识过程,做到理论与实际的有机结合。 3、有效组织案例教学,做好案例的讨论、分析。案例的讨论与分析是案例教学的中心环节,对案例进行讨论的目的是提出解决问题的途径与方法,可以从自身角度出发来剖析案例,说明自己的观点和看法,教师要掌握讨论的进程,让学生成为案例讨论的主体,同时把握好案例讨论的重点和方向,进行必要的引导。同时在组织案例教学时要辅以各种有效的教学方法,如启发式教学、讨论式教学,让学生积极参与,大胆发表意见,提出观点,深入思考,激发学生的学习热情及科研兴趣,使案例教学效果达到最佳,培养学生运用概率统计原理解决实际问题的能力。 4、案例的总结。案例总结是保证和提高案例教学质量的必备环节。对案例的总结一般要包括以下内容:一是对讨论过程进行总结,对于一个案例,让学生提出各种观点及其案例所包含的概率统计原理,让学生通过分析和评价案例,掌握正确处理和解决复杂多变的现实

应用数理统计在服装中的运用案例

应用数理统计在服装中的运用案例 PPAP 小组 一、 专业背景介绍 服装设计与工程专业所研究的服装领域比较广泛,研究方向大致分为:服装先进制造、服装舒适性和服装产业经济。各个方向中都涉及到应用数理统计知识和方法,如:分析研究服装结构数据与人体的关系、人体体型分类与判别,服装面料各种性能评定,市场消费行为、调查问卷分析等范畴。本专业在学术研究中要求严谨科学、实事求是求实求是,结合数据处理等数理统计可以提取出更有价值的信息,有利于开展科研工作以及服装的设计、制造、销售等各个环节。 二、 相关统计知识简介 1.区间估计 参数估计方法之一,是从点估计值和抽样标准误差出发,按给定的置信水平建立包含待估计参数的置信区间。置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。其中,单个正态总体的区间估计,有两个待估参数——均值和方差。其原理为:设总体X 的分布中含有一个未知参数θ。若对于给定的概率1(01)αα-<<,存在两个统计量1112(,,,)n X X X θθ= 与2212(,,,)n X X X θθ= ,使得12{}1P θθθα<<=-,则随机区间12(,)θθ称为参数θ的置信水平为1α-的置信区间。案例1运用的是正态总体σ2未知时,均值μ的区间估计,以及正态总体μ未知,σ2的区间估计,证明过程见书本105-106页。 2.假设检验 又称统计假设检验,是一种基本的统计推断形式,也是数理统计学的一个重要的分支。其基本任务是根据样本所提供的信息,对未知总体分布的某些方面(常见如总体均值、总体方差、总体分布参数、总体分布本身等)的假设作出合理的判断。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。具体作法是:根据问题的需要对所研究的总体作某种假设,记作H0;选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。常用的假设检验方法有u 检验法、t 检验法、χ2检验法(卡方检验)、F —检验法,秩和检验等。案例1所涉及到的是一个正态总体方差σ2为未知时均值μ的检验,运用t 检验法,推导过程见书本129-132页。

数理统计例题

例题解析(1) 例1设随机变量X 和Y 相互独立,),(~),,(~2 2 2211σμσμN Y N X 。1621,,,X X X Λ是X 的一个样本,1021,,,Y Y Y Λ是Y 的一个样本,测得数据 ∑∑∑∑========10 1 2 10 1 16 1 2 16 1 72,18,563,84i i i i i i i i y y x x (1)分别求21,μμ的矩估计量;(2)分别求2 221σσ,的极大似然估计值; (3)在显著水平05.0=α下检验假设 22210σσ≤:H ,2 2211σσ>:H 。 解 (1)用样本一阶原点矩估计总体一阶矩,即得1μ和2μ的矩估计值: 8.1101?,25.5161?10 1 21611=====∑∑==i i i i y x x μμ 。 (2)正态总体),(~2σμN X 的参数2σ的极大似然估计量为 ∑=-==n i i X X n 1 22 )(1?σ。因此2 221σσ和的极大似然估计值为 625.716161)(161?1611222 21 =?? ? ??-=-=∑∑==i n i i i x x x x σ 96.316101)(101?1011222 22 =?? ? ??-=-==∑∑==i n i i i y y y y σ (3)是21,μμ未知,双总体方差的假设检验。待检假设2 2210σσ≤:H ; 2 2211σσ>:H ,是在05.0=α下的单侧检验。 因为4.4)(91,31.8)(1511 21221221 =-==-=∑∑==n i n i i y y S x x S &。所以F 同机量得 值 847.14.415 .822 21===S S F 查F 分布表,得01.391505 .0=),(F .经比较知,01.3)9,15(847.105.0=<=F F ,故接 受0H ,认为2 221σσ不比大。

《概率论与数理统计》案例

实例1 发行彩票的创收利润 某一彩票中心发行彩票 10万张, 每张2元. 设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计算彩票发行单位的创收利润. 每张彩票平均能得到奖金 05512()10000500001010 E X p =?+?++? 0.5(),=元 每张彩票平均可赚20.50.3 1.2(),--=元 因此彩票发行单位发行 10 万张彩票的创收利润为:100000 1.2120000().?=元 实例2 如何确定投资决策方向? 某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70%,将损失 2 万元.若存入银行,同期间的利率为5% ,问是否作此项投资? 解:设 X 为投资利润,则 ()80.320.71(),E X =?-?=万元 存入银行的利息:1050.5(),%?=万元故应选择投资. 实例3 商店的销售策略 某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X (以年计),规定 1,1500;12,2000;23,2500;3,3000.X X X X ≤<≤<≤>一台付款元一台付款元一台付款元一台付款元 10,1e ,0,()100, 0.x X x f x x Y -?>?=??≤? 设寿命服从指数分布概率密度为 试求该商店一台家用电器收费的数学期望

解:1 1001{1}e d 10 x P X x -≤=?0.11e -=-0.0952,= 21011{12}e d 10 x P X x -<≤=?0.10.2e e --=-0.0861,= 31021{23}e d 10 x P X x -<≤=?0.20.3e e 0.0779,--=-= 1031{3}e d 10x P X x +∞->=?0.3e 0.7408.-== Y 因而一台收费的分布律为 ()2732.15,E Y =得2732.15.即平均一台家用电器收费元 例1 某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能95%满足每个分机在用外线时不用等候? 解: 令),260,2,1(01 =? ??=k k k X K 个分机不要用外线第个分机要用外线第,26021,,,X X X 是260个相互独立的随机变量,且04.0)(=i X E ,26021X X X m +++= 表示同时使用外线的分机数,根据题意应确定最小的x 使%95}{≥=Φ,故,取65.1=b ,于是 61.1504.026096.004.026065.1260)1(260≈?+???=+-=p p p b x 也就是说,至少需要16条外线才能95%满足每个分机在用外线时不用等候。 例2 用机器包装味精,每袋净重为随机变量,期望值为100克,标准差为10克,一箱内装200袋味精,求一箱味精净重大于20500克的概率。 解: 设一箱味精净重为X 克,箱中第k 袋味精的净重为k X 克,200,,2,1 =k . 20021,,,X X X 是200个相互独立的随机变量,且100)(,100)(==k k X D X E ,

概率论与数理统计:数理统计基本概念

数理统计基本概念 教学目标:1.理解总体、样本和统计量的概念 2.掌握样本均值、样本方差及样本矩的计算 教学内容: 一、引例 例如,考察某厂生产的日光灯管的质量,灯管的平均寿命是一个重要的质量指标。由于生产中各种随机因素的影响,各个灯管的寿命是不完全不同的,但受到人力、物力等限制,特别是灯管寿命测试这类试验带有破坏性,所以不可能对生产的全部灯管一一进行测试,一般只是从整批中取出一部分灯管来测试,然后根据这些得到的灯管寿命数据来推断整批灯管的平均寿命。 二、总体与个体概念 在一个统计问题中,我们把研究对象的全体称为总体,构成总体的每个成员称为个体。对多数实际问题。总体中的个体是一些实在的人或物。比如,我们要研究某大学的学生身高情况,则该大学的全体学生构成问题的总体,而每一个学生即是一个个体。事实上,每个学生有许多特征:性别、年龄、身高、体重、民族、籍贯等。而在该问题中,我们关心的只是该校学生的身高如何,对其他的特征暂不予以考虑。这样,每个学生(个体)所具有的数量指标值——身高就是个体,而将所有身高全体看成总体。这样一来,若抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现的机会多,有的出现的机会少,因此用一个概率分布去描述和归纳总体是恰当的。从这个意义上看,总体就是一个分布,而其数量指标就是服从这个分布的随机变量。以后说“从总体中抽样”与“从某分布中抽样”是同一个意思。 例1.考察某厂的产品质量,将其产品只分为合格品与不合格品,并以0记合格品,以1记不合格品,则 总体={该厂生产的全部合格品与不合格品}={由0或1组成的一堆数}。 若以p表示这堆数中1的比例(不合格品率),则该总体可由一个二点分布表示: 不同的p反映了总体间的差异。例如,两个生产同类产品的工厂的产品总体分布为: 我们可以看到,第一个工厂的产品质量优于第二个工厂。 实际中,分布中的不合格品率是未知的,如何对之进行估计是统计学要研究的问题。三、样本 为了了解总体的分布,我们从总体中随机地抽取n个个体,记其指标值为x1,x2,…,x n,则x1,x2,…,x n称为总体的一个样本,n称为样本容量,或简称样本量,样本中的个体称为样品。 从总体中抽取样本,一般总是假设满足下述两个条件: (1)随机性为了使样本具有充分的代表性,抽样必须是随机的,应使总体中的每一个

应用数理统计课外大作业范例

《数理统计》 案例分析大作业(范例) 学号 姓名 专业 成绩 国家财政收入的多元线性回归模型 摘要:用Excel 求解Y 与X 之间的初步回归模型,得到初步回归直线方程 1234567 284870.009090.462080.031870.2860660.221980.002920.239963Y x x x x x x x =---+--+然后对此方程进行线性显著性检验和回归系数显著性检验。由20.999R =知Y 与 X 之间存在显著的线性,然而只有自变量27,x x 满足通过t 值检验,从而回归系数 13456,,,,x x x x x 与Y 之间没有显著的线性关系, 说明自变量之间存在多重共线性关系。采用MATLAB 逐步回归方法对数据进行处理,根据程序自动提示得到最优回归方程57733410.6606580.241802y x x ∧ =-+,此时20.997R =,3008F =。最后采用2010年的数据对此方程进行验证,得到结果在误差范围内,表明这个模型可以正确反映影响财政收入的各因素的情况。 一、问题提出 近年来,随着国家经济水平的飞速发展,人民生活水平日益提高,综合国力日渐强大。经济上的飞速发展并带动了国家财政收入的飞速增加,国家财政的状况对整个社会的发展影响巨大。政府有了强有力的财政保证才能够对全局进行把握和调控,对于整个国家和社会的健康快速发展有着重要的意义。所以对国家财政的收入状况进行研究是十分必要的。 国家财政收入的增长,宏观上必然与整个国家的经济有着必然的关系,但是具体到各个方面的影响因素又有着十分复杂的相关原因。为了研究影响国家财政收入的因素,我们就很有必要对其财政收入和影响财政收入的因素作必要的认识,如果能对他们之间的关系作一下回归,并利用我们所知道的数据建立起回归模型这对我们很有作用。而影响财政收入的因素有很多,如人口状况、引进的外资总额,第一产业的发展情况,第二产业的发展情况,第三产业的发展情况等等。

数理统计

一、针对数据1请回答以下问题: 1.试验组与对照组年龄水平有无差异? (1)建立假设,确定检验水准 H0:age1=arg2,实验组与对照组的平均年龄相等 H1:age1≠age2,实验组与对照组的平均年龄不等 α=0.05 (2)统计计算 正态性检验 两组Kolmogorov-Smirnov正态性检验结果P=0.200,实验组与对照组Shapiro-Wilk正态性检验结果P值分别为0.604、0.778,说明两组年龄符合正态分布 成组t检验 描述性结果

检验结果 Levene’s方差齐性检验结果P=0.164,符合方差齐性条件,选择第一行方差齐对应的t检验结果:t=2.182,df=54,p=0.033,差值的均数为7.538,不能认为两组年龄有统计学差异。 2.试验组与对照组性别构成有无差异? 由于对性别构成为无序分类资料的统计分析,多用Pearson χ2检验 (1)建立假设,确定检验水准 H0:实验组和对照组的性别构成是一致的 H1:实验组和对照组的性别构成不一致 α=0.05 (2)统计计算 列出四格表 χ2检验结果

表格中从第2列开始,从左到右分别对应:检验统计量(Value)、自由度(df)、双侧近似概率(Asymp.Sig-sided)、双侧精确概率(Exact Sig.2-sided)、单侧精确概率(Exact Sig.1-sided);从第2行起,从上到下对应Pearson2χ(Pearson Chi-Square)、连续性校正的2χ值(Continuity Correction)、对数似然比方法计算的2χ(Likelihood Ratio)、Fisher’s确切概率法(Fisher’s Exact Test)、线性相关的2χ值(Linear by Linear Association)、有效纪录数(N of Valid Cases)。 表格下方注解”a.”说明本例有0%格子的期望频数小于5,最小的期望频数为11.29,故不需校正,采用未校正2χ检验结果即可,即采用第1行Pearson2χ检验对应的双侧近似概率结果,P>0.05,不能认为两组性别构成有统计学差异。3.试验组治疗前后白细胞有无变化? 用SPSS软件进行统计分析 计算差值,并进行正态性检验 差值的Shapiro-Wilk检验P<0.1,提示差值对应总体为非正态分布。进一步通过Wilcoxon配对符号秩和检验的非参数检验方法分析。 (1)建立假设,确定检验水准

相关文档
相关文档 最新文档