教学课件PPT回归分析.ppt

上传人:小小飞 文档编号:3833959 上传时间:2019-09-28 格式:PPT 页数:48 大小:944.53KB
返回 下载 相关 举报
教学课件PPT回归分析.ppt_第1页
第1页 / 共48页
教学课件PPT回归分析.ppt_第2页
第2页 / 共48页
教学课件PPT回归分析.ppt_第3页
第3页 / 共48页
教学课件PPT回归分析.ppt_第4页
第4页 / 共48页
教学课件PPT回归分析.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《教学课件PPT回归分析.ppt》由会员分享,可在线阅读,更多相关《教学课件PPT回归分析.ppt(48页珍藏版)》请在三一文库上搜索。

1、第五章 回归分析,2011-11-01,教学目的与要求,正确理解相关关系的含义、种类及相关分析的主要内容; 掌握相关关系的测定方法; 掌握回归分析的含义和内容; 掌握一元线性回归分析方法。,(一)函数关系(确定性关系) 函数关系指现象间在数量上存在着确定的、严格对应的依存关系。 特点:对于某一变量的每一个数值,都有另一个变量的确定的值与之相对应,并且这种关系可以用精确的数学函数式表示出来,因此称为函数关系。,一、函数关系与相关关系,第一节 相关分析,(1)是一一对应的确定关系; (2)设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y

2、 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量;,(一)函数关系(确定性关系),第一节 相关分析, 函数关系的例子 某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价); 圆的面积(S)与半径之间的关系可表示为S = r2 ; 企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3 。,第一节 相关分析,(二)相关关系(非确定型关系) 指事物之间的关系数值存在着一定的依存关系,但它们不是确定的和严格依存的,某一现象在其发展

3、变化中,当数量上为一确定值时,与之有联系的其他现象可以有若干个数值与之对应,在这些数值之间表现出一定的波动性,但这些值按某种规律在一定范围内变化。,第一节 相关分析,(1)变量间关系不能用函数关系精确表达; (2)一个变量的取值不能由另一个变量唯一确定; (3)当变量 x 取某个值时,变量 y 的取值可能有几个;,第一节 相关分析,(二)相关关系(非确定型关系), 相关关系的例子 商品的消费量(y)与居民收入(x)之间的关系 商品的消费量(y)与物价(x)之间的关系 商品销售额(y)与广告费支出(x)之间的关系 粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 收入

4、水平(y)与受教育程度(x)之间的关系 父亲身高(y)与子女身高(x)之间的关系,第一节 相关分析,二、相关关系的种类,(一)按相关形式不同,线性相关,非线性相关,(二)根据相关反向划分(在直线相关中),正相关,负相关,第一节 相关分析,(三)按相关的程度,完全相关,不完全相关,不相关(零相关),(四)根据相关关系涉及变量的多少,单相关,复相关,偏相关,第一节 相关分析,三、相关分析,1.确定现象之间有无相关关系。 主要通过定性分析判断和相关图、相关表观察得出结 论。这是相关分析的出发点。 2.确定相关关系的表现形式。 若存在相关关系,就需进一步确定相互关系的表现形 式。例如,是线性相关还是非

5、线性相关,这时相关分析的主 要内容。 3.确定相关关系的密切程度和方向。 通过相关分析,可以判定现象之间相关关系的密切程度和 方向。例如,变量之间是完全相关、不完全相关还是完全不 相关。,第一节 相关分析,主要内容,相关关系的一般判断,定性分析,是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。,定量分析,在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。,三、相关分析,第一节 相关分析,第一节 相关分析,三、相关分析 (一)相关系数 1.简单相关系数的含义:反映密切程度和方向 2.简单相关系数的

6、计算 3.相关系数的性质 (二)决定系数 (三)相关表和相关图 1. 相关表 2. 相关图,第一节 相关分析,1.简单相关系数的含义,相关系数(correlation coefficient),又称积差相关系数(coefficient of product moment correlation),或 Pearson 相关系数(软件中常用此名称) 说明相关的密切程度和方向的指标。 r 样本相关系数,(一)相关系数,第一节 相关分析,2. 简单相关系数的计算,现象间相关的形式特点不同,相关系数的计算方法也不同。 直线相关系数(简称相关系数.)是对两个变量之间 线性相关程度的度量。 特点: 相关系数

7、有正负号。 分析时,两个变量是对等的。(不分自变量 和因变量,两者互换不影响计算结果。) 抽样时,两个变量都是随机变量。 此外还有复相关系数、非线性相关系数等。,(一)相关系数,第一节 相关分析,相关系数的计算公式(皮尔逊相关系数),第一节 相关分析,相关系数r的取值范围:-1r1 r0 为正相关,r 0 为负相关; |r|越趋于1,表示关系越密切;|r|越趋于0,表示关系越不密切。|r|=0, 无相关; |r|=1,完全相关。 相关程度的习惯划分法: 0 |r|0.3, 微弱相关 0.3 |r|0.5, 低度相关 0.5 |r|0.8, 显著相关 0.8 |r|1, 高度相关,3.相关系数的

8、性质,(一)相关系数,第一节 相关分析,是相关系数的平方,用 表示;用来衡量回归方程对y的解释程度。,决定系数取值范围:,越接近于1,表明x与y之间的相关性越强; 越接近于0,表明两个变量之间几乎没有直线相关关系。,(二)决定系数,第一节 相关分析,SPxy/SSx是以x为自变量、y为依变量时的回归系数byx。 若把y作为自变量、x作为依变量 ,则回归系数 bxy =SPxy/SSy ,所以决定系数r2等于y对x的回归系数与 x对y的回归系数的乘积。这就是说,决定系数反映了x为自变量、y为依变量和y为自变量、x为依变量时两个相关变量x与y直线相关的信息 ,即决定系数表示了 两个互为因果关系的相

9、关变量间直线相关的程度。但决定系数介于0和1之间,不能反映直线关系的性质是同向增减或是异向增减。,(三)相关表和相关图 相关表将一个变量按大小顺序排序,另一个 变量对应排列而成的表格。 相关图也称为散点图。一对数据对应坐标图 上一个点,将成对的观察数据表现为坐标图 的散点而形成的图。 编制相关表、图的意义有助于分析者直观 判断相关的有无、方向、形态、密切程度。,第一节 相关分析,相关表,例:为了研究分析某种劳务产品完成量与其单位产品成本之间的 关系,调查30个同类服务公司得到的原始数据如表。,整理后有,第一节 相关分析,相关图,第一节 相关分析,图5-1 广告费与年销售收入之间的相关图,相关图

10、,第一节 相关分析,相关分析中的相关系数可以从数量上说明变量之间相关 关系的方向和密切程度。但它不能反映一个变量发生一定数 量的变化时,另一个变量会相应的发生多少变动。为了解决 这个问题,就必须采用回归分析的方法。 回归分析是指对具有相关关系的变量,依据其关系形 态,选择一个合适的数学模型,用来近似的表示变量之间数 量平均变化关系的一种统计方法。 回归分析的内容很多,按分析变量的多少不同,可分为 一元回归分析和多元回归分析;按分析变量的表现形态不 同,可分为线性回归分析与非线性回归分析等。本节只讨论 一元线性回归分析的理论与方法。,第二节 一元线性回归分析,一、回归分析的概念与种类,回归分析的

11、特点: 1回归分析的两个变量是非对等关系; 2回归分析中,因变量是随机变量,自变量是可控制变量。 回归分析的内容: 1.确定现象之间相关关系的数学模型; 2.测定数学模型的拟合精度。,回归分析与相关分析的区别,相关分析 1、主要描述两个变 量之间相关的方向和密切程度 2、变量 x、 变量 y处于 平等地位。 3、变量 x 和 y 都是随机 变量 4、可以计算一个相关系数。 相关系数取值范围在 0到正负1之间,回归分析 确定因变量y 和自变量x之间数量 变动关系的数学表达式,并对因变 量进行预测 变量y 和变量x不是对等关系。 Y是因变量,是随机变量; x 是自变 量,是确定变量。可以建立y依x

12、或 x依y两个回归方程。 可以计算两个回归系数。回归系数 取值可为正负数、且取值范围不限,二、一元线性回归 1. 一元线性回归模型及基本假定 假定因变量y主要受自变量x的影响,它们之间的简单线性回归模型如下 : 为参数, 为随机误差项。 对于误差项,在回归分析中有如下假设: (1)误差项是随机变量,它的期望值为0; (2)对于所有的x值,误差项的方差 为常数; (3)误差项之间相互独立,即与一个值相联系的误差对与另一个值相联系的误差没有影响; (4)随机误差项服从正态分布。,第二节 一元线性回归分析,二、一元线性回归 2. 一元线性回归方程 描述y的均值E(y)与 x的关系的方程叫做回归方程。

13、 由于 , , 所以 不难看出,简单线性回归方程的图形是一条直线。这条直线被称为总体回归直线。 是回归直线的截距, 是回归直线的斜率,E(y)是给定某个x的值y的均值或期望值。 各实际观测点与总体回归线垂直方向的间隔,就是随机误差项,即,第二节 一元线性回归分析,如果因变量y与自变量x的相关关系是近似直线的关系,则一元线性回归的模型为:,y的估计值或预测值,,截距,回归系数。,确定了a与b的值,直线的位置也就相应地确定了。,二、一元线性回归 3.参数估计最小二乘法,最小二乘法的基本原理就是寻一条总的看来离各散点最近的一条直线,使实际值y 与 相应的理论值 之间的误差达到最小。即:,第二节 一元

14、线性回归分析,设有一组试验数据 (如表),若x,y符合线性关系,总体线性回归模型的图示,Y,X,观察值,观察值,图5-3 线性回归模型,0,残差(Residual):e,图5-4 10名学生的身高与体重散点图,建立样本线性回归方程的方法 最小二乘法,实际观察值与样本回归线上 的点的距离的平方和最小,x,y,e1,e2,e3,e4,最小,残差(Residual):e,根据微积分的极值定理,Q最小的必要条件为:,整理后得如下方程,称最小二乘法的标准方程:,解方程得,a为回归截距(regression intercept),是回归直线与y轴交点的纵坐标,当x=0时, ;b为回归系数(regressi

15、on coefficient),表示x变化一个单位,y平均变化的数量;b的符号反映了x影响y的性质,b的绝对值大小反映了x 影响y的程度。,【例5-1】设某食品感官评定时,测得食品甜度与蔗糖质量分数的关系如表5-1所示,试求y对x的直线回归方程。,表5-1 某食品甜度与蔗糖质量分数,(1)作散点图 以蔗糖质量分数(x)为横坐标,甜度(y)为纵坐标作散点图,如图5-5所示。,图5-5 食品甜度与蔗糖质量分数的关系,表6-3 一元回归计算表,(2)计算回归截距a,回归系数b,建立直线回归方程,(2)计算回归截距a,回归系数b,建立直线回归方程,首先根据实际观测值计算出下列数据:,所以,甜度y对蔗糖质量分数x的直线回归方程为:,然后计算出b、a:,Excel,F检验 t检验,二、一元线性回归 4.回归方程的检验(不作要求),第二节 一元线性回归分析,作业,p73计算题1,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育


经营许可证编号:宁ICP备18001539号-1