多元线性回归在分析学生成绩相关性中的应用.doc

上传人:scccc 文档编号:13044127 上传时间:2021-12-12 格式:DOC 页数:6 大小:190.50KB
返回 下载 相关 举报
多元线性回归在分析学生成绩相关性中的应用.doc_第1页
第1页 / 共6页
多元线性回归在分析学生成绩相关性中的应用.doc_第2页
第2页 / 共6页
多元线性回归在分析学生成绩相关性中的应用.doc_第3页
第3页 / 共6页
多元线性回归在分析学生成绩相关性中的应用.doc_第4页
第4页 / 共6页
多元线性回归在分析学生成绩相关性中的应用.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《多元线性回归在分析学生成绩相关性中的应用.doc》由会员分享,可在线阅读,更多相关《多元线性回归在分析学生成绩相关性中的应用.doc(6页珍藏版)》请在三一文库上搜索。

1、Vol. 23 . Ns2Apr. 2007第23卷第2期2007年4月大学数学COLLEGE MATHEMATICSC 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved, ki.nclVol. 23 . Ns2Apr. 2007C 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved, ki.nclVol. 23 . Ns2Apr. 2007多元线性回归在分析学生成绩相关

2、性中的应用俞能福(安徽建筑工业学院数理系.安微合肥230022)I1利用多元线性回归分析法根据学生专业课成绩与基础课成绩的相关性建立了回归方程进行定量分析结果为教学研究和管理提供了科学的依据.多元线性回归:逐步回归:专业课:基础课0212. 6| B 1672-1454 (2007) 02-0042-05回归分析是多元统计分析方法中应用最为广泛的一种它用于分析事物之间的统计关系.侧重考察 变量之间的数量变化规律.并通过回归方程的形式描述和反映这种关系,帮助人们准确把握变量受其他 一个或多个变量影响的程度.进而为控制和预测提供科学依据本文应用多元线性回归分析学生成绩的 相关性.2 1一般地我们考

3、虑回归模型y = bu b xi + + bmxm + ,(1)* 其中XI , X2,,是自变量bo ,bl ,.bm是未知参数.是零均值随机变量.如果对(1丿两边求期望.则有多元线性回归方程E(y丿=hi + /» Xi + + bmXm.(2)估计未知参数b是多元线性回归分析的核心任务之一.由于参数估计的工作是基于样 本数据的,由此得到的参数只是参数真值的估计值记为仏仞,,仇,我们用最小二乘法.解得模型 的多元经验回归方程个=仮)+ 仞 Xi + 他 X2 + + bmXm.(3)但存在两个问题:(i) y与-Vi, A-:.,“是否有较好的线性关系,(ii丿对模型加以优化,看

4、能否改进,即 是否存在-V.,层,,"中的某个变量与y无关或它能被其它变量代替,因而回归模型中可以删除这个 变量1 2通过样本数据建立回归方程后一般不能立即用于对实际问题的分析和预测,通常要进行各种统计 检验,包括回归方程的拟合优度检验、回归方程的显蓍性检验、回归系数的显菩性检验等.2 2 1回归方程的相关性检验2005-09-031安散建筑工业学院重点教学研究项目(2004JX17)C 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved, ki.ncl第2期俞能福:多元线

5、性回归在分析学生成绩相关性中的应用45回归方程的显著性检验旨在对模型中因变量与自变量之间的线性关系在总体上是否显著成立做出 推断.回归方程的显著性检验方法之一是通过复相关系数(全相关系数丿复相关系数越接近于1 模型的拟合优度越髙为了削弱参数个数对复相关系数的影响,我们用修正的 复相关系数其平方为nm nm我们也可用检验零假设H。仏=k =几=0的F检验,可以证明.F检验等价于复相关系数的显著 性检验.222回归系数的显著性检验方程的总体线性关系显著不等于每个自变量对因变量的影响都是显菩的.因此.必须对每个自变量 进行显著性检验.即检验Ho.; "0,心0,1,2,,心以决定是否作为自

6、变量被保留在模型中.这一检 验是由对统计量的I检验完成的.223偏相关系数检验偏相关系数是衡童两个变量之间任消除其它变童影响之下的线性相关程度的数量指标我们在选 择自变量因子时.可以根据偏相关系数的大小予以取舍.从而提高相关分析的精确度.3我们知道,一二年级所学基础课的成绩对后续专业课的成绩是有影响的,且它们之间基本上是正相 关的但它们之间关系密切的程度有多大?它们之间又有怎样的内在规律性呢?现在利用多元回归分 析方法,对我院02级信息与计算科学专业100名学生的基础课成绩和专业课成绩进行分析.建立数学 模型进行定量分析可以基于此模型对教学及学生学习给出合理的建议和预测.3. 1正态性检验在我

7、们即将用到的多元统计方法中都是有一个大前提的,那就是假定样本来自加元 正态总体,所作的统计推断的结论是否正确,在某种意义上取决于实际总体与正态总体接近的程度如 何?因此在进行具体的统计分析计算之前有必要对欲处理的数据进行正态性检验,我们用Kolmogorov 检验法检验.结果均近似服从正态分布.现对模型所需变量定义如下自变量山,上,剧,卫,彫,心,出,疋分别为数学分析.髙等代数.解析几何,大学英语复变函数,概 率统计,C语言,离散数学成绩,因变量y为专业课成绩.先后取数据结构,信息论基础,数值分析,数字 信号处理运筹学常微分方程成绩进行分析.为使各变量之间具有可比性,先将原始数据"和

8、y进行 了标准化处理(数据略丿.3. 2根据经验知因变量和自变量之间大致成线性关系.故可建立线性回归模型即模型(1)进行线性回归 分析.3. 33. 3- I利用向前筛选(Forward丿策略建立回归方程在多元线性回归分析中.模型中应引入多少个自变量是需要重点研究的如果引入的变量较少回 归方程将无法很好地解释说明因变量的变化,但是也并非引入的变量越多越好因此有必要采取一些策 略对变量引入回归方程加以控制和筛选我们采用向前筛选策略,它是自变量不断进入回归方程的过 程首先选择与因变量具有最高线性相关系数的变量进入方程,并进行回归方程的各种检验.然后,在 剩余的变量中寻找与因变量偏相关系数最高且通过

9、检验的变量进入回归方程,并对新建立的回归方程 进行各种检验,这个过程一直重复,直到再也没有可进入方程的变量为止在向前筛选策略中.对给定 显著水平,若某个自变量的统计量的概率卩值小于,则该自变量应入选回归方程,若某个自变量的 统计量的概率P值大于,则该自变量不能引入回归方程,引入变量的过程结束,所得方程即为“最优” 方程.数据处理是在SPSS 12 0 for Windows软件中进行的,默认的显菩性水平 为0. 05.3.3.2基础课对专业课的影响及分析现以数据结构与算法的分析为例.利用向前筛选策略求解数据结构与算法的回归方程的计算步骤如下.据预先规定的显蓍性水平=0.05.由表2知离散数学的

10、显蓍性(significance)检验对应的概 率"值为0. 000< 首先选入回归方程的自变量是离散数学.细新计算未进入回归方程的变量的统计量.从表3偏相关(Partial correlation)系数一栏找出最 大值因为C语言的偏相关系数为(X 439, f检验对应的概率卩值为(X 000 <,所以自变量C语言在第2 步进入回归方程.复第步概率统计的偏相关系数最大其值为0. 259./检验对应的概率八值为Q010 v 所以概率统计在第3步进入回归方程.从表3模型3可以看到复变函数的偏相关系数最大其值为a 004 <0.05,/检验对应的概率p值 为0967 &g

11、t;,则引入变量的过程结束所得的方程即为“最优”方程.整个计算过程见表2可以很清楚地看到利用逐步回归法共经过三步完成回归方程的建立,最终的 回归模型为第3个模型根据模型3可得出回归表达式yi = - 4. 225 +0. 174x6 +0. 483x7 + 0. 385 m1 Model Sumnwrv dModelRR SquareAdjusted R SquareStd. Error of the Estimate1.66P 4384328.01064273.546 5377.234143 759'.577 5637.02293a. Predictiors: (Constant)

12、离散数学b. Predictors: (Constant),S散数学.C语言程序设计c. Predictors : (Constant).离散数学.C语言程序设计.概率与数理统计d. Dependent Variable :数据结构与算法2 Coefficients41ModelUnstandardizedCoeff cicntsStandardizedCoefficientstSig.BStd. ErrorBeta1(Constant)25.7995. 7254. 507.000离散数学.627.072.661& 731.0002(Constant)-3. 4927. 985 437

13、 663离散数学 507.069.5347. 289 000C语言程序设计.511.106 3534. 813 0003(Constant)-4. 2257. 757 545 587离散数学.385 082.4064. 714 000C语言程序设计 483 104.3334. 659 000概率与数理统计 174 066.2222 631 010a. Dependent Variable :数据结构与算法3 ExcliKkd VarnNcs dModelBela In(Sig.PartialCorrelationCollinearityStatisticsTolerance1数学分析 047a

14、 537 592- 054.744高等代数 O331 395694 040 811解析几何 002a 029 977 003 923大学英语 031a 387 700 039.898崑变函数.I3841. 501 137 151 669概率与数理统计 262,Z 841 005 277 629C语言稈序设计W4. 813 000 439 8712数学分析-.013b-.166 869 017 738商等代数.057b 747 457 076.808解析几何 O43b 592 555 060 908大学英语.004b.059 953 006.893負变函数 092b1. 097 275.111.

15、660概率与教理统计r 222b2. 631 010 259 6223数学分析 106c-1. 267.208.129 632高等代数 026“- 315 753 032 676解析几何 091c-1. 279 204-.130.857大学英语 06广 820 414 084 802昌屯明社00V 042 967547a. Predictors in the Model: (Constant) 离散数学b. Predictors in the Model: (Constant) 散数学C 语肓程序设计c. Predictors in the Model: (Constant).离散数学.C语言

16、程序设计.概率与数理统计dDependent Variable :数据结构与算法表1的数据项含义依次是:因变量与自变量的复相关系数、判定系数R2、调整的判定系数卅、回归 方程的标准误差.依该表可进行回归方程的拟合优度检验=0. 577.表2的数据项含义依次是偏回归系数、偏回归系数的标准误差、标准化偏回归系数、回归系数检验 中的/统计量的观测值和对应的概率P值依该表可进行回归系数的显著性检验模型3说明离散数 学、C语言和概率统计成绩对数据结构与算法的影响较大回归效果显著.可用于预测分析.表3展示了变量筛选进入方程的过程.例如模型1中的数据项含义依次是在选中离散数学后,如 果其它变量还保留在方程中

17、标准化回归系数、/统计量的观测值和对应的概率P值、容忍度,除C语言 的概率p = 0.00小于 夕卜.其余均大于或等于.利用向前筛选策略,可以得出其它专业课成绩的回归方程,并且进行了回归方程的拟合优度检验、 回归系数的显菩性检验.信息论基础?2 = 35. 5 + 0. 35x6 + 0. 25x8.数值分析:户=21. 1 +0. 17x5 +0. 24x6 +0.29m数字信号处理八=21. 1 +0. 17x5 +0. 24x6 +0. 29x8.运筹学;vs = 39. 2 +0. 17x6 + 0. 28x8.常微分方程:J6 =22.9 + 0. 19劝 +0. 25x4 +0.

18、17x6.3. 4由上述分析我们可以看出专门课的成绩好坏大多受到基础课的综合影响而且这种影响具有如下 特点:1丿数学专业课受数学基础课的影响较大.比如数学分析对常微分方程影响就很大.2丿计算机专业课受计算机基础课的影响较大,比如C语言程序设计和离散数学对数据结构与算法 的影响就很大.3丿计算机和数学相结合的课程会同时受计算机和数学基础课的影响,比如数值分析与试验和数字 借号处理这两门专业课就都受到复变函数、概率论与数理统计和离散数学这三门基础课的影响,其中复 变函数和概率论与数理统计可以认为是数学学科的基础课,而离散数学可以认为是计算机学科的基 © 1994-2009 China A

19、cademic Journal Electronic Publishing House. All rights reserved, #大学数学第23卷础课.我们用多元回归分析法来分析基础课与专业课成绩之间的相关性.为调整课程设置提供了科学的 依据.I1I 1|高恵璇应用多元统计分析M.北京:北京大学出版社.2005.I 2 |朱道元.等多元统计分析与软件SAS| M|.南京:东南大学出版社999. 131薛薇.SPSS统计分析方法及应用M .北京:电子工业出版社.2004.Application of Multivariate Linear Regression in Analysisof t

20、he Correlation of StudentsJ GradesYU Neng-fu(Anhui Institute of Architecture & Industry , Hefei, Anhui 230022 9 China)Abstract : Based on the analysis method of multivariate linear regression. regression equation of the relationship of college basic courses and professional courses have been set

21、 up to make quantitative analysis lhe result of statistical analysis offers a scicntifical foundation for the Icachcr's research anc managemenlKey Mords: multivariate linear regression : stepwise regression : professional course; basic course© 1994-2009 China Academic Journal Electronic Publishing House. All rights reserved. http:/wwucnki.nct

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1