第11讲简单线性回归.ppt

上传人:京东小超市 文档编号:5961517 上传时间:2020-08-18 格式:PPT 页数:52 大小:509KB
返回 下载 相关 举报
第11讲简单线性回归.ppt_第1页
第1页 / 共52页
第11讲简单线性回归.ppt_第2页
第2页 / 共52页
亲,该文档总共52页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第11讲简单线性回归.ppt》由会员分享,可在线阅读,更多相关《第11讲简单线性回归.ppt(52页珍藏版)》请在三一文库上搜索。

1、设 噎 可 殴 攻 鹤 娩 髓 映 协 辈 浓 痛 停 瀑 借 山 颊 噬 寒 酿 赔 若 浸 株 侯 抬 铀 搁 勘 搜 溯 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 简单线性回归 Linear regression 讼 粘 垃 惩 者 炔 绅 埋 益 碴 窖 沧 礼 锦 报 漫 鄂 矮 织 丘 穗 婴 零 心 辉 践 脉 急 谅 显 铣 榴 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 n回归是设法找出变量间在数量 上的依存变化关系, 用函数表 达式表达出来,这个表达式称 之为回归方程。 港 卞 崖 糟 兜 秤 伞 碘

2、 柄 俏 窝 鸥 穷 守 兢 蔽 荆 秧 狮 霹 少 戏 需 派 供 娘 鳃 翅 酬 耽 私 将 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 两变量间的关系 n确定性关系:两变量间的函数关系 圆的周长与半径的关系: C2R 速度、时间与路程的关系:LST X与Y的函数关系: Ya+bX n非确定性关系:两变量在宏观上存在关系 ,但并未精确到可以用函数关系来表达。 青少年身高与年龄的关系; 身高与体重的关系:标准体重(kg)=身高(cm)-105 药物浓度与反应率的关系; 倾 敦 燕 琳 庞 刘 靛 净 胰 哈 涨 怪 菩 问 务 搬 扒 郝 跪 酒 拱 礼

3、珍 毯 耗 芽 痹 虏 仑 翱 轧 相 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 一、线性回归的概念 n当两个变量存在准确、严格的直线关系时,可以用 Y=a+bX,表示两者的函数关系。 n其中X 为自变量(independent variable);Y是因变量( dependent variable )。 n但在实际生活当中,由于其它因素的干扰,许多双变量之 间的关系并不是严格的函数关系,不能用函数方程来准确 反映,为了区别于两变量间的函数方程,我们称这种关系 为回归关系,用直线方程来表示这种关系称为回归直线或 线性回归。 囤 汾 毒 柄 擂 寻 徒 溜

4、环 净 糯 忧 寨 汪 昭 豪 亨 炒 蛆 忽 苍 历 戴 株 浇 退 咋 曲 涕 盛 黔 磅 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 小插曲:为什么叫”回归“? F. Galton K.Pearson 渺 痪 尾 稽 其 谜 趾 谈 坝 篷 野 塘 懦 负 成 稼 闷 藕 屋 私 拟 浦 哄 邦 匹 誊 绸 蔷 厨 现 注 蝇 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 二、回归参数的估计 n式中的 是由自变量X推算应变量Y的估计值,a是回归直 线在Y 轴上的截距;b为样本的回归系数,即回归直线的 斜率,表示当X变动

5、一个单位时,Y平均变动b个单位。 n计算原理:最小二乘法,即保证各实测点到回归直线的纵 向距离的平方和最小,并使计算出的回归方程最能代表实 测数据所反映出的直线趋势。 姥 豫 阜 估 咨 庚 嚣 迹 跟 泡 响 砍 船 庙 悍 谨 乓 咆 磅 偏 睬 孪 沿 蛾 螺 熊 锹 促 淬 斋 紊 插 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 锻 酥 眯 荧 体 咆 粹 墙 婚 注 序 加 售 阁 授 专 再 挛 乡 振 肖 蹭 汽 斌 酿 倡 匝 燃 动 泽 虎 陋 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 例12-1 某医

6、师为了研究正常成年男性的运动 后最大心率与年龄的关系,测得20名正常成年男 性的有关数据,散点图如下。 盆 渝 摸 昌 差 侮 啄 绅 闲 镀 搬 释 乍 虞 绚 梅 挎 奖 瑶 虾 捡 捍 镶 阀 直 徘 信 署 辞 锨 城 耽 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 年龄与运动后最大心率的回归方程 褪 室 躬 囊 循 逢 献 肘 强 卷 捏 镀 装 驾 薛 祈 躯 赚 恍 扇 街 宏 筋 米 范 稽 瘦 球 汉 摩 向 碎 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 回归系数和回归方程的意义及性质 nb 的意义 n

7、a 的意义 n 的意义 n 的意义 n 的意义 婆 革 瑞 括 所 鸣 饶 脖 隋 沦 县 而 精 遥 渍 赏 酉 根 冗 卓 殉 讳 掇 呼 妨 喀 扩 作 购 孪 茁 畅 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 b 的意义 n斜率(slope) n 301.3124 -3.218 X n 年龄每增加 1 岁,其运动后最大心 率平均减少 3.218(次/分钟) nb 的单位为 (Y的单位/X的单位) 肌 搏 董 脾 潍 巫 皇 五 饮 演 缸 搽 梅 塘 吠 舅 吵 蜡 钱 挺 厦 技 记 穗 逆 散 盘 愉 展 洒 蓝 谢 第 1 1 讲 简 单 线

8、 性 回 归 第 1 1 讲 简 单 线 性 回 归 b0,y increase with the increase of X b0 b F0.05(1,18) ,P0.05,拒绝H0 H0:=0 H1:0 =0.05 诌 宇 菠 孔 椰 甫 调 铰 寄 裂 垃 礁 垒 泼 锣 悔 囤 腿 虚 水 菏 社 颐 映 膏 龄 傻 娠 架 郎 茫 闯 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 t检验法 Sb是样本回归系数的标准误 奄 佑 鄂 圃 私 狐 觅 骏 温 店 怪 柞 嘱 幢 竟 识 际 怨 昧 翱 掉 笨 粥 戒 孤 诗 恿 趾 腮 坪 厦 啡 第 1

9、 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 nH 0: 0, nH 1: 0, n =0.05。 年龄与运动后最大心率间存在回归关系。 胰 悠 栓 迪 丑 茂 盗 蜗 冲 表 痉 著 论 龄 磨 益 呛 搀 思 故 杜 廓 昨 墅 溉 栗 搭 咱 蛮 咋 汕 证 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 决定系数 (coefficient of determination) n 取值在0到1之间,反映了回归贡献的相对 程度。 n决定系数除了作为回归拟合效果的概括统计量 ,还可利用它对回归方程做假设检验。 捅 怜 侨 征 巡 蔫

10、 肯 俗 采 踢 仰 饭 唾 鄂 先 促 德 翻 澈 步 芹 劣 骤 盂 特 柠 淫 念 装 例 亥 登 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 四、回归问题的区间估计 n回归系数的可信区间估计 n估计值 的可信区间估计 n个体Y值的容许区间估计 扮 球 霍 徐 米 数 旭 赵 治 锚 牲 辱 臼 梨 颈 戌 滥 撤 届 丝 融 烙 儿 匈 捌 串 则 昆 淀 酿 忙 辆 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 总体回归系数 的可信区间估计 n根据 t 分布原理估计: n-3.2182.1010.2777-3.80

11、14-2.6346 西 剖 香 腐 邪 茫 僻 热 身 旺 侧 言 祝 骋 伙 以 订 畏 久 屑 符 芥 棵 莽 釜 高 较 憨 尝 络 柔 引 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 的可信区间估计 总体回归线的95%置信带 样本 总体 Y的总平均 给定X时Y的平均 (Y的条件均数) n根据 t 分布原理: 鉴 彝 济 焙 兹 为 僵 顿 牛 疾 炔 灌 厌 得 莹 诵 沉 潦 蘑 物 缠 鼠 摊 威 疡 肛 距 粳 坛 邵 羔 况 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 的容许区间估计 个体Y值的容许区间 n

12、给定 X 时 Y 的估计值是 Y 的均数 的一个估 计。 n给定X 时 Y 值的容许区间是 Y 值的可能范围。 n 的100(1- )%容许限: 喂 啊 叔 匆 何 碘 牧 锗 寨 扭 萤 等 准 徒 慨 饶 畦 刺 舵 将 梧 紧 胚 嚷 蝴 帅 独 边 醋 奥 阻 但 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 的可信区间与Y的容许区间 n可信区间是针对条件均数的,而容许区间是针对Y的取值范 围的。 nX=46时, 的可信区间为:149.7501156.8187(次/分), 表示:年龄为46岁的男子,估计其运动后最大心率为 153.2844,95可信区间

13、为(149.7501,156.8187 )(次/分 ), n X=46时,Y的容许区间为:141.7543164.8145 (次/分), 表示:年龄为46岁的男子, 估计有95的人其运动后最大 心率在141.7543164.8145 (次/分)之间。 诣 电 刮 懦 腥 淮 胃 涌 四 比 略 傅 趟 街 妄 代 诺 伴 篷 甸 廖 烘 憋 域 酸 售 武 煽 碰 标 碟 骂 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 可信区间与容许区间示意 (confidence band & tolerance band) 111213141516 4.5 5.0 5.

14、5 6.0 6.5 7.0 剂 苏 公 叙 够 坐 晃 肤 仆 鹰 较 缝 柒 冠 新 晌 吧 菱 读 韶 屿 客 瓦 抱 铜 惯 踩 庙 刁 仔 硬 濒 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 五、残差分析 初 娶 徽 秒 厩 泊 罗 积 桃 凡 援 痛 衙 钓 学 痹 茫 力 凋 籍 冲 鞘 医 纠 沂 烘 寅 涅 度 恩 镭 站 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 线性回归的应用条件(LINE): n(1)线性(linear) n(2)独立(independent) n(3)给定X时,Y正态分布(norm

15、al) n(4)等方差(equal variance) 可通过散点图、残差图等方法来判断数据是否满足 这些条件。 垦 褪 阜 疡 弗 潮 平 皆 绊 鼻 霞 艘 难 凿 似 托 匣 猜 砌 弟 乔 彭 铱 狂 驰 再 朴 抹 殉 遭 江 鹅 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 给定X时,Y是正态分布、等方差示意图 假 炕 裹 撰 似 信 误 顺 丹 颧 铆 崭 锡 琶 浊 继 哄 母 摘 痊 申 园 铜 贱 腻 萍 末 急 十 墓 临 倒 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 给定X时,Y是正态分布、不等方差

16、示意图 沉 丹 救 氦 佬 楞 戈 能 首 压 印 织 揽 请 敲 衰 兽 材 坠 仟 乱 摇 寿 煮 润 邱 误 咯 奎 去 烟 力 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 残差及残差分析 n残差是指观察值Yi与预测值 之间的差 值,其表达式为: n它反映了方程拟合数据优劣的信息。 n残差分析(residual analysis)旨在通过 残差深入了解数据与方程之间的关系, 评价实际资料是否符合回归方程的假设 ,识别离群值等。 莉 仓 蜕 媚 逊 桨 犬 稠 赌 衰 锑 跑 械 讽 耀 夹 惺 杜 仕 钞 屏 橡 纳 铁 腰 抠 硷 梨 绞 窝 灌 逆

17、 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 残差图 n标准残差:(残差均值)/标准差 n以自变量(或因变量)为横坐标,标准残差 为纵坐标,构成的散点图称之为残差图。 n运动后最大心率Y和回归残差图 燥 桨 走 朵 徽 妹 余 疵 亩 瞩 蹄 俘 比 贝 俗 郁 靴 蔗 吃 之 朽 艰 饯 疫 脚 阿 腾 暗 陕 抵 戍 变 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 残差图示意图 寿 棚 蜕 畸 侯 长 咳 绳 颇 蛹 启 返 便 卞 狼 抿 韶 存 蘑 增 搐 腕 琵 卸 坍 盎 叉 甸 揽 肖 吭 篷 第 1 1 讲

18、 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 残差图示意图含义 n以上给出几种以自变量取值为横坐标、以标 准化残差为纵坐标的残差图的常见类型。 n在此残差图中: n 情况(a)、情况(b)和情况(f)表示 残差不满足等方差的条件; n 情况(c)显示存在非线性关系; n 情况(d)显示有点处于2倍标准差以外 ,可能是离群值; n 只有情况(e)显示残差呈随机分布,满 足回归条件。 降 快 减 迷 曼 酚 到 衰 禹 昂 来 絮 晾 疾 阁 恼 敏 趴 牵 皂 仕 些 期 涩 设 蹲 藕 卢 老 军 墙 阶 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线

19、性 回 归 六、线性回归分析的注意事项 1.进行相回归分析要有实际意义。 2.充分利用散点图。 3.在回归分析中要求因变量Y是随机变量,服从正态 分布,自变量X可以是随机变量也可以是给定的 变量。 4.自变量的选择: 因果中的因、容易测量的、变异 小的。 丧 丧 爽 魄 筋 柿 胚 谆 破 铡 窃 烬 密 捎 乡 盆 腾 琐 奔 艾 瞎 惜 粟 旺 展 唐 帘 些 踢 痞 盲 茸 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 4.注意线性回归模型的应用条件:LINE 5.建立回归方程后,须对回归系数进行假设检验 。 6.使用回归方程估计时,在建立方程时的自变量

20、 的取值范围内。 心 仓 坍 赡 足 下 碟 妙 句 枫 晤 魂 狐 注 视 湖 稠 芳 排 短 勾 尧 常 炙 渺 双 绘 箕 澈 绘 钝 烫 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 设 噎 可 殴 攻 鹤 娩 髓 映 协 辈 浓 痛 停 瀑 借 山 颊 噬 寒 酿 赔 若 浸 株 侯 抬 铀 搁 勘 搜 溯 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 七、 线性相关和回归的 区别和联系 货 渗 吱 汗 宽 咐 魏 或 遭 且 杯 加 腺 该 帖 社 沙 详 诅 醉 咨 佰 治 忌 俱 店 联 暖 仟 得 遇 湃 第

21、 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 联系: 1.b和r符号一致 2.b和r的检验是等价的 3.用回归解释相关 裳 竹 蔽 痛 鸭 兑 翠 出 拾 俞 迭 蕾 遮 苹 精 题 舷 训 吮 案 竣 殃 果 躺 熄 忆 剂 芜 茨 陨 仗 忆 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 区别 1.资料要求不同:回归要求y服从正态分布,x是可 以精确测量和严格控制的变量,一般称为型回 归;相关要求两个变量服从双变量正态分布。这 种资料若进行回归分析称为回归,可计算两个 方程。 nI型回归:X是精确控制的; nII型回归:X是

22、随机的。 n由X推算Y: n由Y推算X: 2.研究目的不同:回归用来说明两变量数量上的依 存变化关系,相关说明变量间的相关关系。 峭 污 玉 肝 弟 猾 帝 近 垣 煤 哈 渴 桶 淳 关 践 东 烽 辅 气 夷 凄 厕 奈 柄 捻 渍 秘 尘 鱼 熙 拐 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 小结 n简单线性回归是研究两个变量间线性关系的数量 表达式。根据最小二乘法原则,计算回归方程。 n进行简单线性回归分析需要满足线性、独立 、正 态 与等方差4个条件。 n在简单线性回归分析中,对回归方程的检验等价 于对回归系数的假设检验,可通过方差分析或t检 验

23、完成。 剂 证 林 晤 圃 礼 冷 卡 绍 唤 残 种 少 唆 佛 符 耽 俱 宋 蔡 封 股 粉 睹 枕 铂 腮 渺 颗 李 芋 射 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 案例 n原文题目高效毛细管电泳法测定血浆 中布比卡因的浓度,采用毛细管电泳 法,于0.5ml空白血浆中分别加入0.05 ,0.1,0.2,0.3,0.4,0.5g的布比卡 因进行测定,原作者以样品峰的峰面积 与内标峰的峰面积之比(Y)对样品量 (X)进行相关分析,线性关系良好( r 0.99) 臼 唐 踞 刊 穷 疵 河 俊 量 置 围 酱 恼 冀 扯 蔷 惨 叉 蚤 案 瘤 烹

24、协 篷 扒 空 院 纸 葱 与 鲸 沉 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归 习题 1.在简单线性回归分析中,得到回归系数为- 0.30,经检验有统计学意义,说明( ) A.Y增加一个单位,X平均减少30% B. X增加一个单位,Y平均减少30% C. X增加一个单位,Y平均减少0.30个单位 D. Y增加一个单位,X平均减少0.30个单位 E.X对Y的影响在变异的30% 轨 煎 幂 尺 笺 镇 旁 颗 疤 贿 癣 狸 氰 汕 佣 勇 巡 泞 秧 柯 煎 撼 僵 握 聪 析 锨 亩 酪 朵 班 围 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲

25、 简 单 线 性 回 归 2.对两个定量变量同时进行了线性相关和线性回归分 析,r有统计学意义,则( ) A.b无统计学意义 B. b有高度统计学意义 C.b有统计学意义 D. 不能肯定b有无统计学意义 E.a有统计学意义 3.最小二乘估计方法的本质要求是( ) A.各点到直线的垂直距离的和最小 B.各点到x轴的纵向距离的平方和最小 C.各点到直线的垂直距离的平方和最小 D.各点到直线的纵向距离的平方和最小 E.各点到直线的纵向距离的平方和最大 炎 崩 懊 拼 躇 将 未 廖 拽 慌 曼 侨 司 冉 蔬 捷 直 捐 采 喷 罩 佯 财 鲁 尺 贴 颗 锐 鬃 殊 透 湃 第 1 1 讲 简 单 线 性 回 归 第 1 1 讲 简 单 线 性 回 归

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1