文档库 最新最全的文档下载
当前位置:文档库 › 《概率论与数理统计》结课论文

《概率论与数理统计》结课论文

《概率论与数理统计》学习感想

这是一个特殊的学期,这个学期,我在家完成了所有计划课程的学习,当然这其中就包含李老师的概率论与数理统计课。在本学期,虽然是上的网课,但是老师讲的依旧特别生动,我特别喜欢这门课程,首先是源于这门课程对我将来发展的重要性,再其次就是老师讲课幽默诙谐的风格让我更加喜欢了这门课程,上课过程中丝毫没有感到一点的枯燥,也感受不到老师与我们之间有任何的交流代沟,跟老师的交流感觉到特别的轻松有趣。下面我将基于本学期对概率论这门课程的学习以及我自身的理解,谈谈对这门课学习的一些感受与我特别感兴趣的几个部分。

下面从我理解的角度简单地介绍一下概率论与数理统计这门学科。

概率论与数理统计是研究随机现象统计规律的科学,既是重要的基础理论,又是实践性很强的应用科学。概率论与数理统计是现代数学的一个重要分支,在各种领域内都有着广泛的应用,在教学当中,概率论与数理统计也成为了我们这个专业的高学分必修课程,我对这门课程也有着高度的重视。近二十年来,随着计算机硬件的发展以及各种统计软件的开发,概率论与数理统计方法在金融、经济、工程技术、科学计算、人工智能和机器学习等领域得到了广泛应用。主要内容包括:随机事件、随机变量的分布、随机变量的数字特征、大数定律、中心极限定律、数理统计和回归分析等。

概率论是基于给出随机现象的数学模型,并用数学语言来描述它们,然后研究其基本规律,透过表面的偶然性,找出其内在的规律性,建立随机现象与数学其他分支的桥梁,使得人们可以利用已成熟的数学工具和方法来研究随机现象,进而也为其他数学分支和其他新兴学科提供了解决问题的新思路和新方法。数理统计是以概率论为基础,基于有效的观测、收集、整理、分析带有随机性的数据来研究随机现象,进而对所观察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议。

概率论与数理统计是研究随机现象及其规律性的一门数学学科。研究随机现象的规律性有其独特的思想方法,它不是寻求出现每一现象的一切物理因素,不能用研究确定性现象的方法研究随机现象,而是承认在所研究的问题中存在一些人们不能认识或者根本不知道的随机因素作用下,发生随机现象。这样,人们既可以通过试验来观察随机现象,揭示其规律性,作出决策,也可根据实际问题的具体情况找出随机现象的规律,作出决策[1]。

概率论应用随机变量与随机变量的概率分布、数字特征及特征函数为数学工具对随机现象进行描述、分析与研究,其前提条件是假设随机变量的概率分布是已知的;而数理统计中作为研究对象的随机变量的概率分布是完全未知的,或者分布类型已知,但其中的某些参数或某些数字特征是未知的。概率论研究问题的方法是从假设、命题、已知的随机现象的事实出发,按一定的逻辑推理得到结论,在方法上是演绎式的。而统计学的方法是归纳式的,从所研究地对象的全体中随机抽取一部分进行试验或观测,以获得试验数据,依据试验数据所获取的信息,对整体进行推断,是归纳而得到结论的。因此掌握它特有的学习方法是很重要的。

在我看来,实用性赋予了概率论与数理统计强大的生命力。现实中概率论与数理统计的实际运用无处不在。例如生活中会遇到这样的事例:有四张彩票供三个人抽取,其中只有一张彩票有奖。第一个人去抽,他的中奖概率是25%,结果没抽到。第二个人看了,心里有些踏实了,他中奖的概率是33%,结果他也没抽到。第三个人心里此时乐开了花,其他的人都失败了,觉得自己很幸运,中奖的机率高达50%,可结果他同样没中奖。由此看来,概率的大小只是在效果上有所不同,很大的概率给人的安慰感更为强烈。但在实质上却没有区别,每个人中奖的概率都是50%,即中奖或不中奖。

同样的道理,对于个人而言,在生活中要成功做好一件事的概率是没有大小之分的,只有成功或失败之分。但这概率的大小却很能影响人做事的心态。

如果说概率有大小之分,那应该不是针对个体而言,而是从一个群体出发,因为不同的人有不同的信念,有不同的做事方法。把地球给撬起来,这在大多数人眼里是绝对不可能的。但在牛人亚里士多德眼里,他觉得成功做这事的概率那是100%——绝对没问题,只要你给他一个支点和足够长的杠杆。就像前面提到的抽奖一样,25%、33%和50%这些概率只不过是外界针对这个群体给出的。25%的机率同样能中奖,50%的机率也会不中奖,对于抽奖者个人而言,没有概率大小之分,只有中与不中之分。别人说做这件事相当容易,切莫掉以轻心,也许你做这件事会相当困难。大家都说做这件事相当困难,切莫心灰意冷,也许你做这件事能如鱼得水。成功与否,不在概率大小,而在于自己能否清楚地认识自己:容易的事自己是否具有做这件事必备的素质,困难的事自己是否有克服这个困难的潜质[2]。

在工业生产中,从产品设计到工艺选定,从生产控制到质量检验,都要使用概率论与数理统计的理论与方法,从大量可能的条件组合中,通过分析试验来选定结果;在农业上,有

关选种、耕作条件、肥料选择等一系列问题的解决,都与概率论与数理统计方法的应用有关;医学与生物学是概率论与数理统计方法应用最多的领域之一,人体变异是一个重要的因素,不同的人的情况千差万别,其对一种药物和治疗方法的反应也各不相同,因此,对一种药物和治疗方法的评价,就是概率论与数理统计的问题,不少国家对新药的上市和治疗方法的批准,都设定了很严格的试验和统计检验的要求;此外生活习惯、环境污染对健康的影响,也都要通过概率论与数理统计方法来分析研究;对政策的评估也需要概率论与数理统计,抽样调查已成为研究社会现象一种最有力的工具,抽样调查从其方案的制定到数据的分析,都是以概率论与数理统计的理论和方法为基础[3]。

学好《概率论与数理统计》这门课程,其实有很大的作用,它会对你日常生活中一些涉及概率方面的问题有更加深刻的体会,其他方面也有很多应用,比如现实生活中的彩票问题,可以利用概率的知识来建立数学模型,通过现在电脑的仿真来模拟实际的抽奖,当然这方面需要更加专业的知识了,如果要想得到更加精确的结果,建立的模型就会更加复杂!

在概率论学习过程中,回归分析部分是我印象最为深刻也是最感兴趣的一部分。在我学习概率论之前便对回归分析就有一定的了解,当我在概率论当中在此学习到这部分内容的时候,我希望可以通过概率论的学习,进一步加深对这一部分的了解程度,同时也希望对比一下相同内容在不同学科下的讲解方式。

回归分析主要用于在生产时间和科学实验中研究变量之间的关系,探寻关系之间所具有的规律。在现实的生活中,有一种变量之间的关系成为不确定关系,比如人的身高和体重之间的关系,气温、降水量和农作物之间的产量之间的关系等等,他们之间的关系不能用函数关系式明确的表达出来,但是他们之间又确实存在一定的关系,这种关系便是相关关系,回归分析就是研究变量之间相关关系的一个过程,它主要可以解决如下几类问题:

1.确定几个特定变量之间是否存在相关关系,若存在,求出他们之间关系的数学表达

式;

2.根据一个或几个别变量的值预测或控制另一个变量的值;

3.在共同影响一个变量的几个变量之间找出其中起到重要作用的变量,并确定他们之

间合适的数学表达式。

回归分析有着广泛的应用,下面举例介绍回归分析结合现代数据处理软件在现实当中的

实际应用。

已知某销售公司库存占用资金情况、广告投入的费用、员工薪酬以及销售额等方面的数据(见下表),我们便可以根据这些数据找到销售额与其他变量之间的关系,以便进行销售额预测并为工作决策提供参考依据。

月份库存资金额(x1)广告投入(x2)员工薪酬总额(x3)销售额(y)

175.230.621.11090.4

277.631.321.41133

380.733.922.91242.1

47629.621.41003.2

579.532.521.51283.2

681.827.921.71012.2

798.324.821.51098.8

867.723.621826.3

97433.922.41003.3

1015127.724.71554.6

1190.845.523.21199

12102.342.624.31483.1

13115.64023.11407.1

1412545.829.11551.3

15137.851.724.61601.2

16175.667.227.52311.7

17155.26526.52126.7

18174.365.426.82256.5

我们可以以概率论中的理论知识为基础,借助MATLAB科学计算工具进行多元回归分析,首先我们假定为多元线性回归,运用MATLAB进行拟合,得到如下结果

1.clear

2.close all

3.A=[75.230.621.11090.4

4.77.631.321.41133

5.80.733.922.91242.1

6.7629.621.41003.2

7.79.532.521.51283.2

8.81.827.921.71012.2

9.98.324.821.51098.8

10.67.723.621826.3

11.7433.922.41003.3

12.15127.724.71554.6

13.90.845.523.21199

14.102.342.624.31483.1

15.115.64023.11407.1

16.12545.829.11551.3

17.137.851.724.61601.2

18.175.667.227.52311.7

19.155.26526.52126.7

20.174.365.426.82256.5];

21.[m,n]=size(A);

22.subplot(3,1,1)

23.p=polyfit(A(:,1),A(:,4),1);

24.% 模型估计与作图

25.y1= polyval(p,A(:,1));

26.plot(A(:,1),A(:,4),'+',A(:,1),y1,'-');

27.xlabel('x1(库存资金额)')

28.ylabel('y(销售额)')

29.subplot(3,1,2)

30.p=polyfit(A(:,2),A(:,4),1);

31.% 模型估计与作图

32.y1= polyval(p,A(:,2));

33.plot(A(:,2),A(:,4),'+',A(:,2),y1,'-');

34.xlabel('x2(广告投入)')

35.ylabel('y(销售额)')

36.subplot(3,1,3)

37.p=polyfit(A(:,3),A(:,4),1);

38.% 模型估计与作图

39.y1= polyval(p,A(:,3));

40.plot(A(:,3),A(:,4),'+',A(:,3),y1,'-');

41.xlabel('x3(员工薪酬)')

从上图可以看出,销售额与库存占用资金、广告投入、员工薪酬之间大体呈线性关系,y与x1,x2,x3的关系为三元线性回归模型的假定是可行的。

y 的95.75%可由模型确定,F 值远超过F 检验的临界值,p 值远小于α=0.05,模型从整体上看成立。但是,模型的残差平方和s 2

较大,且参数估计值置信区间都较大,β3的置信区间包含零点,常数项和x 3对因变量y 的影响不太显著。

从残差与置信区间图中可以看到第五个点为异常点,实际上从原始数据可以发现第5个月库存占用资金、广告投入、员工薪酬均比3月份少,为何销售额反而增加?这就可以促使该公司的经理找出原因,寻找对策。下面介绍如何删除异常点,进行改进更准确预测。

删除异常点(第五个点),得到新的回归模型为

12346.69137.432813.43140.1720y x x x ∧

=+++

相较于未删除异常点,各项检验指标明显得到提升。多重判定系数R 2

由0.9575上升为0.9687,F 值、p 值和残差平方和s2都变小,且参数估计值置信区间变窄,由此看来,运用上述的多元线性回归方程便可以对销售额作出预测,以便于该公司今早对未来的销售

下界上界

β0162.0632-580.3603904.4867β17.2739 4.373410.1743β213.95757.164920.7501β3-4.3996-46.779637.9805置信区间参数

参数估计值

R^2=0.9579 F=105.0867 p<0.0000 s^2=10077.9868下界上界

β046.6913-627.2207720.6033β17.4328 4.833310.0332β213.43147.332719.5301β30.1720.-38.009138.3531置信区间

参数

参数估计值

R^2=0.9687 F=134.2231 p<0.0000 s^2=7948.7605

计划作出打算。

通过上述现实生活中的实际生活场景我们看到回归分析在我们的生产生活中的确有着举足轻重的作用,他为我们生产活动提供了大量的方便,从这个问题中也可以进一步拓展到概率论与数理统计在我们现实生活中的应用。在今后即便是概率论的计划课时已经上完,但是我仍不会停止对概率统计的深一步探索,我相信,在将来概率统计的知识将会在我学业道路上助我一臂之力。

【参考文献】

[1]概率论的发展与应用

[2]宋林峰. 概率论在现代工业化生产中的应用研究——河南. 阜阳职业技术学院457001

[3]孙少葆.概率论知识在经济学中的应用研究

相关文档