文档库 最新最全的文档下载
当前位置:文档库 › 第八章 相关与回归分析

第八章 相关与回归分析

第八章 相关与回归分析

第八章作业

调查五位学生《统计学原理》的学习时间与成绩(5分制)情况,调查资料如下表所示:

根据资料:(

(2)建立学习成绩(y)倚学习时间(x)的直线回归方程。

(3)若某同学学习时间为3小时,试估计其成绩。

统计学基础 第八章 相关与回归分析

统计学基础第八章相关与回归分析 【教学目的】 1.掌握相关系数的测定和性质 2.明确相关分析与回归分析的特点 3.建立回归直线方程,掌握估计标准误差的计算 【教学重点】 1.相关关系、相关分析和回归分析的概念 2.相关系数计算 3.回归方程的建立和依此进行估计和预测 【教学难点】 1.相关分析和回归分析的区别 2.相关系数的计算 3.回归系数的计算 4.估计标准误的计算 【教学时数】 教学学时为8课时 【教学内容参考】 第一节相关关系 一、相关关系的含义 宇宙中任何现象都不是孤立地存在的,而是普遍联系和相互制约的。这种现象间的相互联系、相互制约的关系即为相关关系。 相关关系因其依存程度的不同而表现出相关程度的差别。有些现象间存在着严格的数据依存关系,比如,在价格不变的条件下销售额量之间的关系,圆的面积与半径之间的关系等等,均具有显著的一一对应关系。这些关系可由数学中的函数关系来确切的描述,因而也可以认为是一种完全相关关系。有些现象间的依存关系则没有那么严格。当一种现象的数量发生变化时,另一种现象的数量却在一定的范围内发生变化,比如身高与体重的关系就是如此。一般来说,身高越高,

体重越重,但二者之间的关系并非严格意义上的对应关系,身高1.75米的人,对应的体重会有多个数值,因为影响体重的因素不只身高而已,它还会受遗传、饮食习惯等因素的制约和影响。社会经济现象中大多存在这种非确定的相关关系。 在统计学中,这些在社会经济现象之间普遍存在的数量依存关系,都成为相关关系。在本章,我们主要介绍那些能用函数关系来描述的具有经济统计意义的相关关系。 二、相关关系的特点 1.现象之间确实存在数量上的依存关系 如果一个现象发生数量上的变化,则另一个现象也会发生数量上的变化。在相互依存的两个变量中,可以根据研究目的,把其中的一个变量确定为自变量,把另一个对应变量确定为因变量。例如,把身高作为自变量,则体重就是因变量。 2.现象之间数量上的关系是不确定的 相关关系的全称是统计相关关系,它属于变量之间的一种不完全确定的关系。这意味着一个变量虽然受另一个(或一组)变量的影响,却并不由这一个(或一组)变量完全确定。例如,前面提到的身高和体重之间的关系就是这样一种关系。 三、相关关系的种类 现象之间的相互关系很复杂,它们涉及的变动因素多少不同,作用方向不同,表现出来的形态也不同。相关关系大体有以下几种分类: (一)正相关与负相关 按相关关系的方向分,可分为正相关和负相关。当两个因素(或变量)的变动方向相同时,即自变量x值增加(或减少),因变量y值也相应地增加(或减少),这样的关系就是正相关。如家庭消费支出随收入增加而增加就属于正相关。如果两个因素(或变量)变动的方向相反,即自变量x值增大(或减小),因变量y值随之减小(或增大),则称为负相关。如商品流通费用率随商品经营的规模增大而逐渐降低就属于负相关。 (二)单相关与复相关 按自变量的多少分,可分为单相关和复相关。单相关是指两个变量之间的相关关系,即所研究的问题只涉及到一个自变量和一个因变量,如职工的生活水平与工资之间的关系就是单相关。复相关是指三个或三个以上变量之间的相关关系,即所研究的问题涉及到若干个自变量与一个因

第8章 相关分析与回归分析及答案

第八章相关与回归分析 一、本章重点 1.相关系数的概念及相关系数的种类。事物之间的依存关系,可以分为函数关系和相关关系。相关关系又有单向因果关系和互为因果关系;单相关和复相关;线性相关和非线性相关;不相关、不完全相关和完全相关;正相关和负相关等类型。 2.相关分析,着重掌握如何画相关表、相关图,如何测定相关系数、测定系数以及进行相关系数的推断。相关表和相关图是变量间相关关系的生动表示,对于未分组资料和分组资料计算相关系数的方法是不同的,一元线性回归中相关系数和测定系数有着密切的关系,得到样本相关系数后还要对总体相关系数进行科学推断。 3.回归分析,着重掌握一元回归的基本原理方法,一元回归是线性回归的基础,多元线性回归和非线性回归都是以此为基础的。用最小平方法估计回归参数,回归参数的性质和显著性检验,随机项方差的估计,回归方程的显著性检验,利用回归方程进行预测是回归分析的主要内容。 4.应用相关与回归分析应注意的问题。相关与回归分析都有它们的应用范围,必须知道在什么情况下能用,什么情况下不能用。相关分析和回归分析必须以定性分析为前提,否则可能会闹出笑话,在进行预测时选取的样本要尽量分散,以减少预测误差,在进行预测时只有在现有条件不变的情况下才能进行,如果条件发生了变化,原来的方程也就失去了效用。 二、难点释疑 本章难点在于计算公式多,不容易记忆,所以更要注重计算的练习。为了掌握基本计算的内容,起码应认真理解书上的例题,做完本指导书上的全部计算题。初学者可能会感到本章公式多且复杂,难于记忆,其实只要抓住Lxx、Lxy、Lyy 这三个记号,记住它们的展开式,几个主要的公式就不难记忆了。如果能自己把这些公式推证一下,搞清其关系,那就更容易记住了。 三、练习题 (一)填空题 1事物之间的依存关系,根据其相互依存和制约的程度不同,可以分为(函数关系)和(相关关系)两种。 2.相关关系按相关关系的情况可分为()和();按自变量的多少分(单相关)和(复相关);按相关的表现形式分(线性相关)和(非线性相关);按相关关系的密切程度分(完全相关)、(不完全相关)和(不相关);按相关关系的方向分(正相关)和(负相关)。 3.回归方程只能用于由(自变量)推算(因变量)。 4.一个自变量与一个因变量的线性回归,称为(一元线性回归) 5.估计变量间的关系的紧密程度用(相关系数) 6.在相关分析中,要求两个变量都是随机的,而在回归分析中要求自变量是(不是随机的),因变量是(随机的)。 7.已知剩余变差为250,具有12对变量值资料,那么这时的估计标准误差是()。 8.将现象之间的相关关系,用表格来反映,这种表称为(相关表),将现象之间的相关关系用图表示称(相关图)。

高中数学:第八章 方差分析与回归分析

高中数学:第八章 方差分析与回归分析 §1 单因素试验的方差分析 试验指标:研究对象的某种特征。 例 各人的收入。 因素:与试验指标相关的条件。 例 各人的学历,专业,工作经历等与工资有关的特征。 因素水平:因素所在的状态 例 学历是因素,而高中,大学,研究生等,就是学历因素水平;数学,物理等就是专业的水平。 问题:各因素水平对试验指标有无显著的差异? 单因素试验方差分析模型 假设 1) 影响试验指标的因素只有一个,为A ,其水平有r 个:1,,r A A L ; 2) 每个水平i A 下,试验指标是一个总体i X 。各个总体的抽样过程 是独立的。 3)2~(,)i i i X N μσ,且22i j σσ=。 问题:分析水平对指标的影响是否相同 1)对每个总体抽样得到样本{,1}ij i X j n ≤≤,由其检验假设: 原假设0:i j H μμ=,,i j ?;备选假设:1:i j H μμ≠,,i j ?; 2)如果拒绝原假设,则对未知参数21,,,r μμσL 进行参数估计。 注 1)接受假设即认为:各个水平之间没有显著差异,反之则有显著差异。

2)在水平只有两个时,问题就是双正态总体的均值假设检验问题和参数估计问题。 检验方法 数据结构式:ij i ij i ij X μεμδε=+=++,偏差2~(0,)ij N εσ是相互独立的, 11r i i i n n μμ==∑。不难验证,1 0r i k δ==∑。 各类样本均值 水平i A 的样本均值:1 1i n i ij j i X X n == ∑g ; 水平总样本均值:11111i n r r ij i i i j i X X n X n n =====∑∑∑,1 r i i n n ==∑; 偏差平方和与效应 组间偏差平方和: 2 221 1 ()r r A i i i i i i S n X X n X nX ===-=-∑∑g g ;(衡量由不同水平产生的差异) 组内偏差平方和: 2 2 211 1 1 ()()i i n n r r E ij i ij i i i j i j S X X X n X =====-=-∑∑∑∑g g ; (衡量由随机因素在同一水平上产生的差异) 总偏差平方和: 2 2 211 1 ()i n r r T ij i ij i j i S X X n X nX ====-=-∑∑∑; (综合衡量因素,水平之间,随机因素的差异) 定理1(总偏差平方和分解定理) T A E S S S =+。 即2 2 211 11 11 ()()()i i i n n n r r r ij ij i i i j i j i j X X X X X X ======-=-+-∑∑∑∑∑∑g g ,或直接证明。 注:利用11 ()()0i n r ij i i i j X X X X ==--=∑∑即可证明。 定理2(统计特性) 2 ()E ES n r σ=-,2 21(1)r A i i i ES r n σδ==-+∑,2 21 (1)r T i i i ES n n σδ==-+∑。

2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章相关与回归分析习题及满分答案 一、单选题 1.相关分析研究的是( A ) A、变量间相互关系的密切程度 B、变量之间因果关系 C、变量之间严格的相依关系 D、变量之间的线性关系 2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A)。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系 4.相关系数等于零表明两变量(B)。 A.是严格的函数关系 B.不存在相关关系 C.不存在线性相关关系 D.存在曲线线性相关关系 5.相关关系的主要特征是(B)。 A、某一现象的标志与另外的标志之间的关系是不确定的 B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系 C、某一现象的标志与另外的标志之间存在着严格的依存关系 D、某一现象的标志与另外的标志之间存在着不确定的直线关系 6.时间数列自身相关是指( C )。

A、两变量在不同时间上的依存关系 B、两变量静态的依存关系 C、一个变量随时间不同其前后期变量值之间的依存关系 D、一个变量的数值与时间之间的依存关系 7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间 (D)。 A、不存在相关关系 B、相关程度很低 C、相关程度很高 D、完全负相关 8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。 A、无相关 B、存在正相关 C、存在负相关 D、无法判断是否相关 9.相关分析对资料的要求是(A)。 A.两变量均为随机的 B.两变量均不是随机的 C、自变量是随机的,因变量不是随机的 D、自变量不是随机的,因变量是随机的 10.回归分析中简单回归是指(D)。 A.时间数列自身回归 B.两个变量之间的回归 C.变量之间的线性回归 D.两个变量之间的线性回归 11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A ) A. y=6000+24x B. y=6+0.24x C. y=24000+6x D. y=24+6000x 12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关 B.表明现象负相关

第八章、相关与回归分析

第八章、相关与回归分析 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案) 1.若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为( ) A. 不相关 B. 负相关 C. 正相关 D. 复相关 2.判断现象间线性相关关系的密切程度的主要方法是( ) A. 对现象做定性分析 B. 编相关表 C. 绘相关图 D. 计算相关系数 3.相关系数可以说明( ) A. 现象之间的因果关系 B. 现象之间的函数关系 C. 相关关系的方向和密切程度 D. 相关关系的表现形式 4.相关系数r的取值范围( ) A. 0≤r≤1 B. -1<r<1 C. -1≤r≤1 D. -1≤r≤0 5.配合一元线性回归方程对资料的要求是( ) A. 因变量是给定的数值, 自变量是随机的 B.自变量是给定的数值, 因变量是随机的 C. 自变量和因变量都是随机的 D.自变量和因变量都不是随机的 6.产品产量与单位成本的相关系数是-0.88, 单位成本与利润率的相关系数是-0.94, 产量与利润之间的相关系数是0.81, 因此( ) A. 产量与利润的相关程度最高 B. 单位成本与利润率的相关程度最高 C. 产量与单位成本的相关程度最高 D.看不出哪对变量间的相关程度最高 7.每吨铸件成本(元)和每一个工人劳动生产率(吨)之间的回归方程为 , 这意味着劳动生产率提高1吨,单位成本平均将( ) A. 降低269.5元 B. 提高269.5元 C. 降低0.5元 D. 提高0.5元 8.每吨铸件成本(元)和铸件废品率(%)之间的回归方程为, 这意味着( ) A. 废品率每增加1%, 每吨成本平均增加64元 B. 废品率每增加1%, 每吨成本平均增加8% C. 废品率每增加1%, 每吨成本平均增加8元 D. 废品率每增加1%, 则每吨成本为56元 9.下列不属于相关关系的是( ) A.劳动生产率与工资的关系 B.投资额与国民收入的关系

第八章相关与回归分析习题参考答案

二、计算与分析题 1.根据下列资料编制直线回归方程并计算估计标准误差。 (1)已知8 .29.036 2522 ====a r y x σσ解:b=x bx a Y r x y 08.18.2?,08.15 69.0+=+==? =σσ 62 .281.01612=-=-≈r S y y σ(2)已知X 、Y 两变量, ,是的两倍,求相关系数r=? 6.1=xx xy L L y σx σ解:r= 8.02 6 .1== yy xx xy L L L 2.某家俱厂生产家俱的总成本与木材耗用量有关,根据记录资料如下表: 月 份 1234567木材耗电量(千米) 2.4 2.1 2.3 1.9 1.9 2.1 2.4总成本(千克) 3.1 2.6 2.9 2.7 2.8 3.0 3.2 (1)建立以总成本为因变量的回归直线方程。(2)计算回归方程的估计标准误差。(3)计算相关系数,判断其相关程度。解:(1)=a+bx=1.27+0.768x (2)=1592.022=-∑-∑-∑=n xy b y a Y S y (3)r==0.754y x b σσ3、广告的作用测定:在现代营销战中,广告的作用功不可没。受娃娃哈集团的委托,时代统计调查事务所调查研究了1995-2004年期间的娃娃哈集团的广告投入力度与平均销量的问题。其有数据资料整理如下表所示。 年份广告费用(万元) 平均销量(百万箱) 1995199619971998199920002001200220032004 891215161718192123 8.0010.4010.6712.3514.2315.5416.4218.7019.5022.87

第八章相关与回归分析

第八章相关分析 ●第一节相关分析概述 ●第二节直线相关关系的测定 ●第三节回归分析 第一节相关分析概述 ●一、相关关系的概念 ●现象相互之间的数量关系可以从形式上分为两种类型:一类是严格的确定性的函数关 系,另一类是不严格的不确定性的相关关系。 ●相关关系是现象之间确实存在有数量上的依存关系,但这种数量上的关系是不确定的。函数关系的例子 ?某种商品的销售额(y)与销售量(x)之间的关系可表示为y = px (p 为单价) ?圆的面积(S)与半径之间的关系可表示为S= R2 ?企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3 函数关系 1.是一一对应的确定关系 2.设有两个变量x 和y ,变量y 随变量x 一起变化,并完全依赖于x ,当变量x 取 某个数值时,y 依确定的关系取相应的值,则称y 是x 的函数,记为y = f (x),其中x 称为自变量,y 称为因变量 3.各观测点落在一条线上 相关关系(几个例子) 相关关系的例子 ?父亲身高(y)与子女身高(x)之间的关系 ?收入水平(y)与受教育程度(x)之间的关系 ?粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 ?商品的消费量(y)与居民收入(x)之间的关系 ?商品销售额(y)与广告费支出(x)之间的关系 相关关系 1.变量间关系不能用函数关系精确表达 2.一个变量的取值不能由另一个变量唯一确定 3.当变量x 取某个值时,变量y 的取值可能有几个 4.各观测点分布在直线周围 二、相关关系的种类 (1)相关关系按涉及的变量的多少分为单相关、复相关和偏相关。 单相关就是两个变量之间的相关关系。是研究一个因变量与一个自变量的依存关系。 复相关就是多个变量之间的相关关系。是研究一个因变量与两个或两个以上自变量的依存关系。 偏相关就是在复相关研究中,如果假定其它变量不变,仅研究某一个变量对另一个变量的依存关系。 (2)相关关系按方向不同分为正相关和负相关。 正相关是指变量之间存在着同向变动的相关关系,即当一个变量的数值有小变大,另一个变量的数值也相应地由小变大 负相关是指变量之间存在着反向变动的相关关系,即当一个变量的数值有小变大,另一个变量的数值却由大变小。 (3)相关关系按表现的形式不同分为线性相关和非线性相关。 当一个变量变动时,另一个变量也随之发生大致均等的变动,从图形上看,二者对应点分布近似地在一条直线附近,这种相关关系就称为线性相关关系。 当一个变量变动时,另一个变量也随之发生变动,但从图形上看,二者对应点分布

相关文档
相关文档 最新文档