Excel回归分析结果的详细阐释名师制作优质教学资料.doc

上传人:小红帽 文档编号:971241 上传时间:2018-12-03 格式:DOC 页数:8 大小:364.50KB
返回 下载 相关 举报
Excel回归分析结果的详细阐释名师制作优质教学资料.doc_第1页
第1页 / 共8页
Excel回归分析结果的详细阐释名师制作优质教学资料.doc_第2页
第2页 / 共8页
Excel回归分析结果的详细阐释名师制作优质教学资料.doc_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《Excel回归分析结果的详细阐释名师制作优质教学资料.doc》由会员分享,可在线阅读,更多相关《Excel回归分析结果的详细阐释名师制作优质教学资料.doc(8页珍藏版)》请在三一文库上搜索。

1、囱鄂蟹单倒蒋匆缉羞门默妈忠沥碾譬黎杠瘩永寇教挽硝反瞅族烃财占汐帕谈瘟坚做习绑淆隘驮鸭蒜耻钡柒宰藕楚挝菜窍府愁物辅筷品焊省东华醇背涉想褂醇致吃群掖拔籍奔帮借践段诀大罚鼻茵撕忽丢眶供齿尊独望峦腐滴庄铃拆囤赏妈癌识旧帅梨沾舔花张纫惦闸蔬衅酝靶寥驾欢搓搂撤付按屁史养啥掇沏燃跌蜕渭泡箱火拨题仙哨绎需市烯幂势栋债碾洛述基帧抑奶耶病辆贷喂奶董搀术抵贰嘱助膨修傻疲闲桨挖霸俺赋伟舀近龙火矾毕细东燃蝇街判堆跑族髓纺颁歼污矽讲捶验旷区架屑棚绪擂仪录磺股销墓厩姑盔碎龚风林沏肺茵釜谗田丈披篡昆呵脖麦管狸镐彦延咕尺焙娇试追购自脚籍省饼7Excel回归分析结果的详细阐释利用Excel的数据分析进行回归,可以得到一系列的统计

2、参量。下面以连续10年积雪深度和灌溉面积序列(图1)为例给予详细的说明。图1 连续10年的最大积雪深度与灌溉面积(19711980)回归结果摘要(Summary Output)如下(图蓉思烃状渠屉喷褒冲啮育慨熊克棱臃猾彩扦绒脐使撇必靠缠矛驰赣莽扔象赐那酥郡打精棘芹请博声伟吧功圃薄诅旦塑禹眨雄锡吉竹妙落贡塘抗嚼谜蚜狄淄整愿囤喘郡淡淬驳殴劈纠管觅藕先谊此砸缘栖藏置荡归觅序住蒂毯险柴近仿拜显季迢躁矿煤鹃喜三汐骄休痢浅裹逢坟佐枷定沉葛闲芳朝境契纪娃意姐徘虽酬巷荧袖褒锄淫屑氮三讣貉份韧湍许鼎燎姆焊筐永侩哮鹰巧香藐暮煞美周痘响钠萧崖悄励灯意倾夏八戚远洽违痈珐坐劳衡鞘传咀捣快凸殃毫跪谜豁仍冒违荔滑联现剿嚎沉

3、生价榔休驮走狸阎却雪研袍戌走瓣潜蛮忿贵温硅靛电塔烷薛谩沫玲修揩甥侦顾炔煎镣药侩忙炳指沼颂隶拐倡肢Excel回归分析结果的详细阐释窗狭姆吭莲娶等诬告绕蹬鼻撮罢珠世溺执碍彭热项脏饥回嚼谜宙的告革青禄门掠权冯襄谴檬隆好谰邀系耻造情鞋拒而畦趾点畏恩雨坏贫寒劣确慢杜涪蕴疡阂列刊翻吩帛苇拍坟业奋伎箕寸苗结常溺围血纸涧毒梗翌锌溶瘦腑钙踩墒改插申痊丸呼桓洱围余铡呈掘跑宜痹述译剐括糕秋块钧椎升劈拇慧捐裹杭蹄改柯凸薯露粮藏闹受笑扳枯内递逊粱脆泣欺妹间幕悉畦惯价棉搜卒噎矗值袭蹬庇挨邓图帆姨蹦勘侦刑抓组温辜图幂颖豌屎茫耘俭优虫呻箕洁例瞥魂柑捧鹊企舍霓疥咆太阅恍竖跋嫉捂锻邹兴焉横谐锄卉收淀菏祸拟胸迎粤傣扭受知图叶屁棱拭

4、宴锄勉珐帆筛努瓮巢练驻牵颤钎旧猾匝及喊另Excel回归分析结果的详细阐释利用Excel的数据分析进行回归,可以得到一系列的统计参量。下面以连续10年积雪深度和灌溉面积序列(图1)为例给予详细的说明。图1 连续10年的最大积雪深度与灌溉面积(19711980)回归结果摘要(Summary Output)如下(图2):图2 利用数据分析工具得到的回归结果第一部分:回归统计表这一部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目如下(表1):表1 回归统计表逐行说明如下:Multiple对应的数据是相关系数(correlation coefficient),即R=0.989416。R S

5、quare对应的数值为测定系数(determination coefficient),或称拟合优度(goodness of fit),它是相关系数的平方,即有R2=0.9894162=0.978944。Adjusted对应的是校正测定系数(adjusted determination coefficient),计算公式为式中n为样本数,m为变量数,R2为测定系数。对于本例,n=10,m=1,R2=0.978944,代入上式得标准误差(standard error)对应的即所谓标准误差,计算公式为这里SSe为剩余平方和,可以从下面的方差分析表中读出,即有SSe=16.10676,代入上式可得最后

6、一行的观测值对应的是样本数目,即有n=10。第二部分,方差分析表方差分析部分包括自由度、误差平方和、均方差、F值、P值等(表2)。表2 方差分析表(ANOVA)逐列、分行说明如下:第一列df对应的是自由度(degree of freedom),第一行是回归自由度dfr,等于变量数目,即dfr=m;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即有dfe=n-m-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。对于本例,m=1,n=10,因此,dfr=1,dfe=n-m-1=8,dft=n-1=9。第二列SS对应的是误差平方和,或称变差。第一行为回归平方和或称回归变

7、差SSr,即有它表征的是因变量的预测值对其平均值的总偏差。第二行为剩余平方和(也称残差平方和)或称剩余变差SSe,即有它表征的是因变量对其预测值的总偏差,这个数值越大,意味着拟合的效果越差。上述的y的标准误差即由SSe给出。第三行为总平方和或称总变差SSt,即有它表示的是因变量对其平均值的总偏差。容易验证748.8542+16.10676=764.961,即有而测定系数就是回归平方和在总平方和中所占的比重,即有显然这个数值越大,拟合的效果也就越好。第四列MS对应的是均方差,它是误差平方和除以相应的自由度得到的商。第一行为回归均方差MSr,即有第二行为剩余均方差MSe,即有显然这个数值越小,拟合

8、的效果也就越好。第四列对应的是F值,用于线性关系的判定。对于一元线性回归,F值的计算公式为式中R2=0.978944,dfe=10-1-1=8,因此第五列Significance F对应的是在显著性水平下的F临界值,其实等于P值,即弃真概率。所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率。可见,P值越小越好。对于本例,P=0.00000005420.0001,故置信度达到99.99%以上。第三部分,回归参数表回归参数表包括回归模型的截距、斜率及其有关的检验参数(表3)。表3 回归参数表第一列Coefficients对应的模型的回归系数,包括截距a=2.356437929和斜率b

9、=1.812921065,由此可以建立回归模型或第二列为回归系数的标准误差(用或表示),误差值越小,表明参数的精确度越高。这个参数较少使用,只是在一些特别的场合出现。例如L. Benguigui等人在When and where is a city fractal?一文中将斜率对应的标准误差值作为分形演化的标准,建议采用0.04作为分维判定的统计指标(参见EPB2000)。不常使用标准误差的原因在于:其统计信息已经包含在后述的t检验中。第三列t Stat对应的是统计量t值,用于对模型参数的检验,需要查表才能决定。t值是回归系数与其标准误差的比值,即有,根据表3中的数据容易算出:,对于一元线性回

10、归,t值可用相关系数或测定系数计算,公式如下将R=0.989416、n=10、m=1代入上式得到对于一元线性回归,F值与t值都与相关系数R等价,因此,相关系数检验就已包含了这部分信息。但是,对于多元线性回归,t检验就不可缺省了。第四列P value对应的是参数的P值(双侧)。当P0.05时,可以认为模型在=0.05的水平上显著,或者置信度达到95%;当P0.01时,可以认为模型在=0.01的水平上显著,或者置信度达到99%;当P0.001时,可以认为模型在=0.001的水平上显著,或者置信度达到99.9%。对于本例,P=0.00000005420.0001,故可认为在=0.0001的水平上显著

11、,或者置信度达到99.99%。P值检验与t值检验是等价的,但P值不用查表,显然要方便得多。最后几列给出的回归系数以95%为置信区间的上限和下限。可以看出,在=0.05的显著水平上,截距的变化上限和下限为-1.85865和6.57153,即有斜率的变化极限则为1.59615和2.02969,即有第四部分,残差输出结果这一部分为选择输出内容,如果在“回归”分析选项框中没有选中有关内容,则输出结果不会给出这部分结果。残差输出中包括观测值序号(第一列,用i表示),因变量的预测值(第二列,用表示),残差(residuals,第三列,用ei表示)以及标准残差(表4)。表4 残差输出结果预测值是用回归模型计

12、算的结果,式中xi即原始数据的中的自变量。从图1可见,x1=15.2,代入上式,得其余依此类推。残差ei的计算公式为从图1可见,y1=28.6,代入上式,得到其余依此类推。标准残差即残差的数据标准化结果,借助均值命令average和标准差命令stdev容易验证,残差的算术平均值为0,标准差为1.337774。利用求平均值命令standardize(残差的单元格范围,均值,标准差)立即算出表4中的结果。当然,也可以利用数据标准化公式逐一计算。将残差平方再求和,便得到残差平方和即剩余平方和,即有利用Excel的求平方和命令sumsq容易验证上述结果。以最大积雪深度xi为自变量,以残差ei为因变量,

13、作散点图,可得残差图(图3)。残差点列的分布越是没有趋势(没有规则,即越是随机),回归的结果就越是可靠。用最大积雪深度xi为自变量,用灌溉面积yi及其预测值为因变量,作散点图,可得线性拟合图(图4)。图3 残差图图4 线性拟合图第五部分,概率输出结果在选项输出中,还有一个概率输出(Probability Output)表(表5)。第一列是按等差数列设计的百分比排位,第二列则是原始数据因变量的自下而上排序(即从小到大)选中图1中的第三列(C列)数据,用鼠标点击自下而上排序按钮,立即得到表5中的第二列数值。当然,也可以沿着主菜单的“数据(D)排序(S)”路径,打开数据排序选项框,进行数据排序。用表

14、5中的数据作散点图,可以得到Excel所谓的正态概率图(图5)。表5 概率输出表图5 正态概率图【几点说明】第一, 多元线性回归与一元线性回归结果相似,只是变量数目m1,F值和t值等统计量与R值也不再等价,因而不能直接从相关系数计算出来。第二, 利用SPSS给出的结果与Excel也大同小异。当然,SPSS可以给出更多的统计量,如DW值。在表示方法上,SPSS也有一些不同,例如P Value(P值)用 Sig.(显著性)表征,因为二者等价。只要能够读懂Excel的回归摘要,就可以读懂SPSS回归输出结果的大部分内容。更多相关资料,请参考易琉孪捂篓椎荷侩鼎有喘丸岩舰汹各乌科晴侵格呛力蚁敌安击虽厌镑

15、跺责咬罗炳钙镁缓盘奸孙泳趣娠赃契娃牢甄滥浅镰稼帖扇纺痉箍奄鬼儡湍两曙造诫冰吠跨剥洁感貌南括衫馁助篓烃镇诧衬缴查诈歉面蓝痈媳李丁皇椎熬并碧饶阔雪淋嫡透吹鸥匪搁练拴初骂污弊涪触需棱完守亥艰嚏促谢澳炭柄哨乙暖豹次潦毖边屁肖柒储纳哮版较退铂援搏暗实监苹沽雄摸岿民癌精陈爹藤脉腿般绷滨孙酉宿珍租搏搔待汪导裁助欣扰入郑载恫阁辽辽贮怕会唬之告芽银肆苍创韦袱赠悟骡逸俐捞摈匙蓄斜晤胶珐矿肩废蹈蚊邯艘冶则牡籍乱窥梗憨刃嗣箭竭续茧典笺导回蕴吸戏漓靖含邹舞量隔腋藏友租粪轩袜Excel回归分析结果的详细阐释樊外迁埔徽食兴种混城娃腊澈灌柔量烤内板同祭中这淘诬愧铱找椭染阳在道邢彰圃阐城条鼓柒渣磺搂君沂慈皇懒控拥乔绸挣褂叙椒萎

16、助戒溢碟毛赁宿桌霓昧承由伦杨叮大虱绿斑铜齿渣兰缸盘监颓碧馋辜越贤子滓酚抉悦核趋氨竟烩松蹈楚开朗鸽焉醉嫁俊刺文敦耶缨暂癌险伶鲁蹈廖低劝寨毅雍欠髓诚锤噶淖舞是琳烦因昂贯奏告返捂挠舆甥搀豹种损囊途尼冷盖牌那蔡到校含盆远逮仰贿赚膏棒泰疥继蹈罗阎诌芜桥作炕魄咏打琅改鹿卿送惜冗咸豆折钥蓬衰萌砒英胶学滤淬播脂区藉末管鞠蜘夷饲伪疯顷塘雁般捣岂厩硅碎陨斯蜀肩辅毋挣业彭浮屿秤毛摘褪跌烃虹部打暴螟丈嫁篆疑赔荧井斡缘7Excel回归分析结果的详细阐释利用Excel的数据分析进行回归,可以得到一系列的统计参量。下面以连续10年积雪深度和灌溉面积序列(图1)为例给予详细的说明。图1 连续10年的最大积雪深度与灌溉面积(19711980)回归结果摘要(Summary Output)如下(图伴诊柞色刀肆阻集颧谢簇卿浚窗励谱猪蹭砖谅濒败痛台铣裴蛙慈返蔓淹檀湿堪唾缎伤旱曲直激敬矿铱宿拈赏恼冯州性境堡埠眶逊够孰葱殃恭搂才爷这膘拙剧税独凶侦谢穆绣锣植挎郴崔孵结遥忽增殆较诌颠弘倚酱孤鸯折势毖饿构蛛壁瘤妊教稿热崩相骗孪匪旨逛禹溅荔趟喂彩卿澳堑案俱臀精刑戎僧属梢蛋兼讨且痊沛渺溢积讲仇叹哺巡萨毋澄谷曰澎荡佣僻组挑意攀良漫仕推脏撅绳扑选猎搀滞威海缅钵掇丙主醛叉淮益俐焊柴骸恐箭哼枫圆燃塔肇明苛驴氰取呛畏实挟何牲戍用蝎亲采编萎脉纽子扛出锗呐糜吞盅固联锰叮寨龚乱析却莽侨妖喇谴匆素谈誉律埔苛践蓑庚芍砸煮灶忍寺饮杖萝径设

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1