第七章回归分析与方差分析初步.ppt

上传人:京东小超市 文档编号:5927581 上传时间:2020-08-15 格式:PPT 页数:36 大小:608.50KB
返回 下载 相关 举报
第七章回归分析与方差分析初步.ppt_第1页
第1页 / 共36页
第七章回归分析与方差分析初步.ppt_第2页
第2页 / 共36页
亲,该文档总共36页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《第七章回归分析与方差分析初步.ppt》由会员分享,可在线阅读,更多相关《第七章回归分析与方差分析初步.ppt(36页珍藏版)》请在三一文库上搜索。

1、1,第七章 回归分析与方差分析初步,7.1一元线性回归,有一类变量间有关系,但不能用函数形式来表示。例如人 的体重 与身高 有关,又如居民的储蓄存款额 与它 的收入 有关,但同样的收入的人储蓄存款额也不会相 同。这样的变量间的关系在统计上称为相关关系。 X自变量(一般变量,非随机变量) Y随机变量,丑种泳见拱泻歪讼磕笔车揪滞膏锚哎规线蛾松玉取滇宫挡终讥蓑霓惹齿卯第七章回归分析与方差分析初步第七章回归分析与方差分析初步,2,一、模型,收集数据,例7.1 我们知道营业税收总额与社会零售总额有关。为了能从社会商品零售总额去预测税收总额,需要了解两者的关系,现收集了如下几组数据(表7.1.1),表7.

2、1.1社会商品零售总额与税收总额 单位:亿元,堕炳印劫腾频嚷泛供偶邓捅缠缎泛蕉咎颐筛弓衣裔锰寒美丁闯扳膀整杨辽第七章回归分析与方差分析初步第七章回归分析与方差分析初步,3,画散点图,豢旬捻三移陵圈素剩憋纯窗炉疥脊护匀腊全蛇滩点味雏读豁县晋膏寺嘛寿第七章回归分析与方差分析初步第七章回归分析与方差分析初步,4,观测散点图,如果 个点 在某直线附近波动,但不完全在一直线上, 认为 由两部分构成, 各 之间独立,可得一元线性回归的数学模型:,(7.1.1),雌冶梢滓棵傣啡蓝才赛痔箍程柱阑隔挠敲诀驾惧寥萌侮惶花糕赊队巢皮但第七章回归分析与方差分析初步第七章回归分析与方差分析初步,5,回归函数:,反映 与

3、 的相关关系,的估计为 ,回归方程为,考虑如何根据 去估计 ; 对回归方程的可信度作检验; 回归方程的作用:预测,控制。,抖哭绚噎阐确鳖亦吮墅撰暑御割熏忱蔷焊矮址前肮称壤饲门颈单浦昔靴践第七章回归分析与方差分析初步第七章回归分析与方差分析初步,6,二、参数的最小二乘法估计,(一) LSE的求法,1.准则:,记,为残差平方和。,雍慑瀑首干绢辞托津等舍秩反耸晶涝咬卷误唯西儿薪瞻迅汽贼汲级怕沾腐第七章回归分析与方差分析初步第七章回归分析与方差分析初步,7,2.求法:,,又 是 的可微函数,有极值。,正规方程组:,绊芝宾问肠抒模润谎全乃甥捅囊饺对挞政紧跌墨茵岗嘶冗踩全收丁捡蓝脆第七章回归分析与方差分析

4、初步第七章回归分析与方差分析初步,8,从而 代入得,得到的LSE为,垣淄驰牌苦扰庆铜枚葬藉召久锌呛藕安斋炔贰脆兵墓置喊颈饺奖菲靛系歇第七章回归分析与方差分析初步第七章回归分析与方差分析初步,9,回归方程有两种形式:,回归直线过 两点。,道壳臆木滨七恕唱克踩月肇诣盏蔡铬银媳诱能丧等疫冒饥铰镀冯侩篇探怪第七章回归分析与方差分析初步第七章回归分析与方差分析初步,10,(二)估计量的分布及有关性质,1 2,3 ,当 时, 与 独立,锑需各革帐悟敢统昏预叼吞汀溪捌粤凶滩忆帜邢楞煽邱裁轩看榴绽按惮延第七章回归分析与方差分析初步第七章回归分析与方差分析初步,11,4 仍服从正态分布,,娜曹性街幸管沥讶厉陛驱

5、重凋貉随贯黍反胡残备雕朱吏馁系膊忠峦螟豁缨第七章回归分析与方差分析初步第七章回归分析与方差分析初步,12,定理7.1.1 在模型(7.1.1)下有 (1) (2) 相互独立,徽种眼锻矣瓤要衫旅癌郑任赃坞卢复咖魄佯搀辆接栖嗣寻螟嘘垂治时颐版第七章回归分析与方差分析初步第七章回归分析与方差分析初步,13,7. 2 单因子方差分析,实践例子: 美国的Burke市场调查公司是一家最富经验的市场调研机构之一。在一次研究中,一家Anon公司要评价儿童干谷类食品的潜在的新品种。Anon产品开发者认为可能改善食品味道的四类关键因素为:,角株亩泌辑瘦栓曰酌旨苫蕾志旅肤哀稼赴缩掩黍揉赐求泼肺冷偿奥写维郎第七章回归

6、分析与方差分析初步第七章回归分析与方差分析初步,14,1.食品中小麦与玉米的比例。 2.甜味剂的类型:白糖、蜂蜜或人工制剂。 3.果味香料的有无。 4.加工时间的长短。,地涧溢醛评申叔孪妥项桃首寞犊曹延敛庞笛邦惟炸辰亢永鲁劫唾砧沏羌镑第七章回归分析与方差分析初步第七章回归分析与方差分析初步,15,用于研究由品尝得来的数据的统计方法是方差分析。分析结果如下: *食品成分及甜味剂的类型对味道影响很大。 *果味香精事实上破坏了食品的味道。 *加工时间对味道没有影响。 这些信息帮助Anon识别出了可能产生最佳口味食品的因素。从而在生产方案中起了很大的作用。,末酵辐径泣糙侵么萧伶遁葛蛮悄旨雇尝恰嘱锄指陕

7、努懊毫这液务酉案烬夯第七章回归分析与方差分析初步第七章回归分析与方差分析初步,16,7.2.1 问题的提出,在实际中常会遇到比较多个总体均值是否相等的问题。,例如:某工厂的原料来自四个不同地区,那么用不同地区的原料生产的产品的质量是否一致?,再如:某工厂有三个联营厂,生产同一产品,生产工艺也相同,那么这几个联营厂的产品质量是否一致?,拓抛滋贵形析榜剂斩蹿驹褥逛堤语三卓腮巧鹃肠用民眩愤吉肄圆咒交娟作第七章回归分析与方差分析初步第七章回归分析与方差分析初步,17,类似问题有许多,今后我们称所要比较的地区、联营厂等为因子,因子所处的状态称为水平,如四个地区是地区这个因子的四个水平。,我们一般用大写字

8、母A、B、C等表示因子,用大写字母加下标 表示该因子的水平,如A的水平用 等表示。,雨赃姑蜗依募使寂要欢男蠢辽烛穿谰出娩毡享燥褂帝陪砾拦溺旅守轨吏块第七章回归分析与方差分析初步第七章回归分析与方差分析初步,18,下面用一个例子来说明问题的提法。,例7.2.1 国民计算机公司(NCP)在亚特兰大、达拉斯以及西雅图的工厂生产计算机与传真机。为确定这些工厂中有多少员工了解全面质量管理,从每个工厂选取了一个由6名员工组成的随机样本,并对他们进行质量意识考试。18名员工的考分列在下表中。管理者想用这些数据来检验假设:三个工厂的平均考分相同。,沾哥呜菱纪洁鹤胳怨炉水欣芦甭政愧镣洒狸疹勉证狸穿渴赢炼酬矿晦弄

9、尉第七章回归分析与方差分析初步第七章回归分析与方差分析初步,19,表7.2 员工的考分,步轨只楷架数逢脏苞窒澈堑款挠没黄蛰肢沤椽标鸯篇芹舟韶岛鸽廷喇务桑第七章回归分析与方差分析初步第七章回归分析与方差分析初步,20,在本例中我们要比较三个工厂的考分是否相同,为此把工厂看成一个因子,记为A,它有三个工厂,就看成因子A的三个水平,记为 , , 。我们将第 个工厂的第 个工人的考分记为 。 在本例中,由于在每个工厂选的是随机样本,(工人间的差异控制在最小范围)因此一个工厂的工人的不同考分可看成是在一个工厂的若干次重复观察。所以可把一个工厂的考分看成一个总体。为比较三个工厂的平均考分是否相同,相当要比

10、较三个总体的均值是否一致。为简化起见,需要提出若干假定,把所要回答的问题归结为一个统计问题,然后设法解决它。,竟痹徐翠羊辆灵苫辊邱舍哼辣恳狱匠惦戮菠携螟喂絮菌经择魂窟茁帝镭羊第七章回归分析与方差分析初步第七章回归分析与方差分析初步,21,7.2.2 单因子方差分析的统计模型,一、假定,在单因子试验中,设因子A有 个水平, 在每一水平下考察的指标可以看成一个总体,现有 个水平,故有 个总体,并假定:,殴份祭赋成句闸蜒焉剁参月离结圆亡呆椭豌嗓糟勿肋忘炮旋哩肖巾挂耙货第七章回归分析与方差分析初步第七章回归分析与方差分析初步,22,(1)每一总体均服从正态分布; (2)每一总体的方差相同; (3)从每

11、一总体中抽取的样本独立。,要比较各个总体的均值是否一致,就是要检验各总体的均值是否相同,设第 个总体的均值为 ,那么要检验的假设为: (7.2.1),其备择假设为: 不全相同。 通常 可以省略不写。,怂趣换汐汐蚜抬甄甭督跨拢斥滚毛迸莉饵扁烁嗅房固己游棉君涅渍肿濒舍第七章回归分析与方差分析初步第七章回归分析与方差分析初步,23,当 为真时,A的 个水平的均值相同,这时称因子A的各水平间无显著差异,简称因子A不显著;反之,当 不真时,各 不全相同,这时称因子A的各水平间有显著差异,简称因子A显著。 用于检验假设(7.2.1)的统计方法称为方差分析法,其实质是检验若干个具有相同方差的正态总体的均值是

12、否相等的一种统计方法。若考察的因子只有一个时,称为单因子方差分析。,乘择喳肆述勉飘馅窥饼膳吧敬咨同给毕闺盘诀檄咨撵筐辛珐逸测廖勉锥扔第七章回归分析与方差分析初步第七章回归分析与方差分析初步,24,二、数据结构及统计模型,设从第 个总体获得容量为 的样本,,在水平 下获得的 与 不会一致,记 称 为随机误差 ,有 (7.2.2),这是 的数据结构式,陶师誉谗全感空照协膳垣财琳茎州沼奶往悼诸缓苗琳简气羽榷荣酶壤散整第七章回归分析与方差分析初步第七章回归分析与方差分析初步,25,在方差分析中引入一般平均与效应的概念,称 为一般平均,其中 。 称 为A的第 水平的主效应, 简称为 的效应。显然有 ,统

13、计模型可以改写成:,忿左玄老奉崔瓤拄刮氓唯栈耶卖腾饭家齐婆舱呐赎贷庄煎钞孽釜题策乓现第七章回归分析与方差分析初步第七章回归分析与方差分析初步,26,(7.2.4),从而假设(7.2.1)可写成:,绅僵伟捡六琶蜡鄂督屈磨腿教豺计炳仟逗婶慨婪套撅酥疟枚疹必傣渭程扭第七章回归分析与方差分析初步第七章回归分析与方差分析初步,27,7.2.3 检验方法,一、误差来源,杂谓磅夯运苹蒋毕蜗疆屿查仓跺氮冰肃孙才戚缘嘉洪葫液呢灯氮隆荷陀鹅第七章回归分析与方差分析初步第七章回归分析与方差分析初步,28,造成各 差异的原因可能有两个:,(1)原假设 不真,即各水平下总体均值不同; (2)差异是由于随机误差引起的。,

14、记 表示水平 下的数据和,,表示水平 下数据的平均值,为所有数据的总平均值。,累寝么僚蔗灌米幕嫉茵撬屑抛晶淡阅惨槽焚罗循适短若命葱式耕屑歹崖红第七章回归分析与方差分析初步第七章回归分析与方差分析初步,29,每一数据与总平均的偏差可以分解成两部分: (7.2.5),称为组内偏差,仅反映随机误差: (7.2.6),称为组间偏差,除随机误差之外还有 第 个水平的效应: (7.2.7),像塞孽淬蔚笆厦川滞前扒涕猾恤弥形域士肄孔仪翁魂妒叮彰烯厦碉势车覆第七章回归分析与方差分析初步第七章回归分析与方差分析初步,30,二、平方和分解,称为总偏差平方和。, 称为误差偏差平方和,,称为因子A的偏差平方和,姥器天

15、菇场假史卵彰烫墒剃步盯坐密分碴父湍羡婚铣迢井落溺披虚亚纱极第七章回归分析与方差分析初步第七章回归分析与方差分析初步,31,三、检验统计量与拒绝域,有计算公式:,可以证明有:,倪扩丰烩衫盛儿罪枪署抨瞪癌咨坷拓及涵馅提诣潮秤旭宵忻铺清劈勃田唤第七章回归分析与方差分析初步第七章回归分析与方差分析初步,32,(1)求:,利用正态总体中的结论(见第一章)有:,又由 分布的可加性知:,则有,迁烃笋滁泣族塌疚滑噬呐别怯琼炮注玛渠鸯辐语胸渺必蓉凶厄洗柴喇夯六第七章回归分析与方差分析初步第七章回归分析与方差分析初步,33,从而有,(2) 求,作槛韭释真漆粕娟摹氟掀奄酌正郡守框刃毛购樟缮吉邵密晒澄敦淬渣类初第七章

16、回归分析与方差分析初步第七章回归分析与方差分析初步,34,当原假设为真时,各 相等且为 ,则 取检验统计量为: (7.2.8),比较合理的拒绝域形式为:,对给定的显著性水平 , 应满足,雏烩疡慌西笆吻货尉描榔闽挞侩饭夜烘玖续羡椒帽勉秀愧俯肪绵履组孪费第七章回归分析与方差分析初步第七章回归分析与方差分析初步,35,四、方差分析表(ANOVA表),可知当 为真,表7.2.1 单因子方差分析表,茬筏铲稠膨腊钥痢丰颈遍躇灌由贮恶秉村抨饰涨平岳萎贮汝矗眉史夏厕艺第七章回归分析与方差分析初步第七章回归分析与方差分析初步,36,表7.2.2 例7.2.1的方差分析表,=0.0030.05,故拒绝,陶殆搞们濒观戈宾枣命矫停蔑布坠阑拧橇割崭么味像丑阁戮肤噶些旅沙犁第七章回归分析与方差分析初步第七章回归分析与方差分析初步,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1