多元统计分析方法与应用练习册.docx

上传人:scccc 文档编号:12952631 上传时间:2021-12-08 格式:DOCX 页数:26 大小:74.42KB
返回 下载 相关 举报
多元统计分析方法与应用练习册.docx_第1页
第1页 / 共26页
多元统计分析方法与应用练习册.docx_第2页
第2页 / 共26页
多元统计分析方法与应用练习册.docx_第3页
第3页 / 共26页
多元统计分析方法与应用练习册.docx_第4页
第4页 / 共26页
多元统计分析方法与应用练习册.docx_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《多元统计分析方法与应用练习册.docx》由会员分享,可在线阅读,更多相关《多元统计分析方法与应用练习册.docx(26页珍藏版)》请在三一文库上搜索。

1、练习册多元统计分析方法与应用南京财经大学26第一章绪论一、填空题1. 多元分析研究的是 统计总体。2. 多元统计中常用的统计量有: ?>和。3. 协方差和相关系数仅仅是变量间 的一种度量,并不能刻画变量间可能存在的 o二、简答题1. 简述多元统计分析的作用。2. 简述矩阵A的特征根与特征向量的求法。第二章 多元线性回归一、 填空题1 .人们通过各种实践,发现变量之间的相互关系可以分成 日W种类型。2. 总离差平方和可以分解为 和 个部分,各自的自由度为和,其中 总离差平方和中所占比重越大,则线性回归效果越显著。3. 回归方程显著性检验时通常采用的统计量是 4. 偏相关系数是指多元回归分析

2、中, 的相关系数。5. 最优回归方程是 勺回归方程。6. 偏回归平方和是指 值。7 . Spss中回归方程的建模方法有 > 、二、简答题1. 简述复相关系数与偏相关系数。2. 简述逐步回归分析方法的具体实施步骤。二、计算题1. 现收集了92组合金钢中的碳含量 x及强度y,且求得:x = 0.1255, y = 45.7989 Lxx = 0.3019 Lxy = 26.5126 Lyy = 2941.03(1) 求y关于X的一元线性回归方程;求y与x的相关系数;(3) 列出对方程作显著性检验的方差分析表(4) 在x=0.1时,求?的点估计及置信度为0.95的置信区间(5) 在x=0.1时

3、,求y的概率为0.95的精确预测区间与近似预 测区间。四、SPSS操作题1. 下面列出在不同重量下弹簧的长度:重量x(克)51015202530长度y(cm)7.258.128.959.9010.9011.80(1) 在直角坐标系下作散点图,并判断Y关于X的相关关系是否线性;(2) 求出Y关于X的一元线性回归方程;(3) 对所求得的回归方程作显著性检验,列出方差分析表;(4) 求出Y与X间的相关系数;(5) 在X=16时,求Y的概率为0.95的预测区间。2. 在某化工产品的生产中,影响产品收率 y主要变量是反应时间x1 的反应温度x2,为提高收率希望找出y关于x1,x2的回归方程,现通 过试验

4、获得如下数据:序号X1X2y13015039.323016040.034015040.944016041.553515540.363515540.573515540.783515540.293515540.6(1)求Y关于XI、X2的线性回归方程;(2) 对所求得的方程作显著性检验,在0=0.05时你的结论是什么?(3) 对各回归系数作显著性检验。(a=0.05)(4) 对回归方程的残差进行正态性、独立性、随机性及奇异值检 验。(5) 回归方程的回归平方和、残差平方和各为多少。(6) 求回归方程的复相关系数,并对拟合优度进行检验,若消除 白变量个数及样本个数对回归方程的影响,拟合优度宜采用哪个

5、指 标,其值为多少。(7) 在排除其它因素的影响后,白变量 X1与因变量Y之间的相 关程度是多少。(8) 当排除其它因素对X2的影响后,X2进入回归方程,R2增加 了多少?(9) XI、X2与Y的简单相关系数分别是多少?3. 某服装厂发现本厂的服装销售额与该厂所在城市的服装销售总额及人均衣着用品的支出额关系密切。现有26期的原始数据如下:X1179.6226.2327.4463.4620.2935.41175658.1468.5539.3697.1894.91050.9X212.5716.4821.421.531.1440.0540.7621.5226.0930.9938.7146.1955.

6、13y0.192.072.162.924.857.1412.066.627.739.0110.7813.2216.84X1740.2687.1956.41223.31441.3 1561.31683.51466.51621.71465.81632.52207.62498.6X247.4534.0354.5971.2382.8986.2292.7273.6481.1373.5081.9399.63113.63y18.93 12.3318.34P 23.5228.7728.6528.5621.4022.1321.6121.4630.0136.60(1) 以服装厂所在城市服装销售总额为白变量 X1,

7、以人均衣着用 品支出额为白变量X2,该厂服装销售额为因变量 Y建立二元线性 回归方程。(2) 若了解到明年本城市服装销售总额 X1为2700万元,X2将是128元,试求明年该厂服装销售额的预测值及预测区间(a=0.05)(3) 对回归方程的显著性作检验;(4) 对每一个回归系数的显著性作检验;(5) 求出回归方程的复相关系数;(6) 对回归方程的残差作奇异值检验4. 在经济流通领域中,某公司的年销售额 Y与个人可支配收入X1 , 价格X2,研究与发展费X3,广告费X4等项有关。(数据见光盘中“习 题数据库”中204.sav文件)(1) 试根据资料用逐步回归的方法建立线性回归方程。(引入变量、

8、剔除变量的临界值为1.5)(2) 变量进入回归模型的顺序是什么,哪些变量未进入方程。(3) 最终方程的拟合优度如何,请评价之。5 .某地区大春粮食产量y和大春粮食播种面积x1、化肥用量x2、肥 猪发展头数x3、水稻抽穗扬花期降雨量x4的数据见光盘中“习题库 数据” 205.sav文件,试用逐步回归分析,寻求大春粮食产量的预报 模型(选取引入和剔除检验临界值为 2.5)。6 .某种水泥在凝固时放出的热量 y(卡/克)与水泥中四中化学成分有关,现测得13组数据,见光盘中“习题库数据” 206.sav文件,(1) 用逐步回归法建立线性回归方程(检验临界值为4)(2) 对白变量X4的状态进行说明。第三

9、章主成分分析一、 填空题1. 主成分分析是通过适当的变量替换,使新变量成为原变量的并寻求 种方法。2. 主成分分析的基本思想是 3. 主成分的协方差矩阵为!阵。4. 主成分表达式的系数向量是 特征向量。5 .原始变量协方差矩阵的特征根的统计含义是6. 原始数据经过标准化处理,转化为均值为 ,方差为 的标准值,且其 I阵与相关系数矩阵相等。7. 因子载荷量的统计含义是 8. 样本主成分的总方差等于 ?9. 变量按相关程度为,在 度下,主成分分析的效果 较好。10. 在经济指标综合评价中,应用主成分分析法,则评价函数中的 权数为°11. SPSS中主成分分析采用 令过程。二、简答题1.

10、简述主成分的概念及几何意义。2. 简述量纲对主成分分析的影响及消除方法。3. 列举样本主成分的性质。4. 提取样本主成分的原则。5. 简述主成分分析的适用范围及基本步骤。6. 思考主成分分析法的应用。二、计算题1. 设三个变量(x1,x2,x3)的样本协方差矩阵为:s计算前三个主成分各白的贡献率和累积贡献率 s2r 0222s r s s r.22I 0 s r s试求主成分及每个主成分的方差贡献率。2.在一项研究中,测量了 376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:Y1Y2Y3Y4Y5Y6头长x10.350.530.76-0.05-0.040.00头宽x20.330.70-

11、0.640.000.00-0.04肱骨x30.44-0.19-0.050.530.190.59尺骨x40.44-0.25-0.020.48-0.15-0.63股骨x50.43-0.28-0.06-0.51-0.670.48胫骨x60.44-0.22-0.05-0.48-0.700.15特征值4.570.710.410.170.080.06(1) 解释6个主成分的实际意义。(3) 对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。3. 在一项对杨树的性状的研究中,测定了 20株杨树树叶,每个叶片 测定了四个变量:叶长(x1),2/3处宽(x2), 1/3处宽(x3) ,1/2处宽(

12、x4)。 这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为:1 =2.920 U= (0.1485,-0.5735,-0.5577,-0.5814)2 =1.024 U2 = (0.9544,-0.0984,0.2695,0.0824)3 =0.049 U3 =(0.2510.7733,-0.5589,-0.1624)4 =0.007 U4 = (-0.0612,0.2519,0.5513,-0.7930)(1) 写出四个主成分,计算它们的贡献率。(2) 计算四个变量在前两个主成分上的载荷,由因子载荷矩阵,你认为这两个主成分应该如何解释?你能给它们分别起个名字吗?(3) 根据原始数据和

13、(1)中的结果,可以计算出20株杨树叶的第一、二主成分得分,试以这两个主成分y1和y2为坐标,在(y1,y2)平面上按因子得分为坐标描出这20个样本点。4. 对纽约股票市场上的五种股票的周回升率x1,x2,x3,x4,x5进行了主 成分分析,其中x1,x2,x3分别表示三个化学工业公司的股票回升率, x4,x5表示两个石油公司的股票回升率,主成分分析是从相关系数矩阵出发进行的,前两个特征根和对应的标准正交特征向量为:1 = 2.857 U1 = (0.464,0.457,0.470,0.421,0.421)2 =0.809 U2 =(0.240,0.509,0.260,-0.526,-0.58

14、2)(1) 计算这两个主成分的方差贡献率。(2) 能否对这两个主成分的意义作一个合理的解释,并给两个主成分命名。四、SPSS操作题1. 下面是8个学生两门课程的成绩表:12345678英语x110090707085555545数学x26585709085455565(1) 求出两个特征根及其对应的单位特征向量;(2) 求出主成分,并写出表达式;(3) 求出主成分的贡献率,并解释主成分的实际意义;(4) 求出两个主成分的样本协方差矩阵;(5) 第1个样本主成分与第2个变量样本之间的相关系数为多少(6) 求出8个学生第一主成分得分并进行排序2. 某中学十二名女生的身高x1,体重x2的数据如下:12

15、3456789101112身高155153157154158152160156158157159161体重484648454946484551474850(1) 两个变量的协方差矩阵与相关系数阵;(2) 两个特征根及其对应的单位特征向量;(3) 主成分的表达式并解释各贡献率的大小意义和主成分的实际意义;(4) 如果舍弃主成分y2,则哪一个原变量的信息损失量最大;(5) 画出全部样本的主成分散点图。3. 根据下列某地区11年数据X1(总产值)X2(存储量)X3(总消费)y(进口额)1149.34.2108.115.92161.24.1114.816.43171.53.1123.219.04175

16、.53.1126.919.15180.81.1132.118.86190.72.2137.720.47202.12.1146.022.78212.45.6154.126.59226.15.0162.328.110231.95.1164.327.611239.00.7167.626.3(1) 计算地区总产值、存储量和总消费的相关系数矩阵。(2) 求特征根及其对应的特征向量。(3) 求出主成分及每个主成分的方差贡献率;(4) 利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)第四章因子分析一、填空题1 .因子分析是把每个原始变量分解为两部分因素,一部分是 另_部分为?2. 变量共同度

17、是指因子载荷矩阵中 3 .公共因子方差与特殊因子方差之和为 。二、简答题1. 比较因子分析和主成分分析模型的关系,说明它们的相似和不同 之处。2. 能否将因子旋转的技术用于主成分分析,使主成分有更鲜明的实 际背景。二、计算题1. 已知x=(x1,x2,x3,x4,x5)'的样本相关系数矩阵R为0.8101R= 0.451 0.642110.9340.902 0.886 0.720:0.725 0.522 0.882试用主对角线外每一行的最大值来估计约化相关系数矩阵R*的主对角线上的相应元素,并近似地计算出因子载荷矩阵A的第一列元素2 .设变量x1,x2和x3已标准化,其样本相关系数矩阵

18、为:10.630.45R= 0.6310.350.45 0.351-(1) 对变量进行因子分析。(2) 取q=2进行正交因子旋转。3. 为了考察学生的知识水平,常用学生的考试成绩来评定,某校对33个学生的3门功课进行分析,得相关系数矩阵:1英语 2数学 3音乐1.00 0.64 0.51R= 0.64 1.00 0.51 0.51 0.51 1.00-取两个公因子(1) 计算约化相关系数矩阵(2) 计算因子载荷矩阵(3) 计算各变量的公共因子方差和特殊因子方差(4) 写出因子模型四、SPSS操作题1. 10名初中男生身高、胸围、体重的数据资料如下:身高x1(cm)胸围x2(cm)体重x3(kg

19、)149.569.538.5162.577.055.5162.778.550.8162.287.565.5156.574.549.0156.174.545.5172.076.551.0173.281.559.5159.574.543.5157.779.053.5(1) 利用因子法、方差最大旋转法计算因子载荷阵 A(2) 分别计算各变量的公共因子方差和特殊因子方差, 判断哪个因子能概括原始信息的大部分,为什么(3) 写出方差最大正交旋转因子模型,并分析各因子的实际含义(4) 计算各个样本点的因子得分第五章聚类分析一、填空题1 .聚类分析是建立一种分类方法,它将一批样哂或变量按照它们在性质上的 行

20、科学的分类。2. Q型聚类法是按 行聚类,R型聚类法是按进行聚类。3. Q型聚类统计量是 ,而R型聚类统计量通常采用4. 在聚类分析中需要对原始数据进行无量纲化处理,以消除不同量 纲或数量级的影响,达到数据间可同度量的目的。常用的无量纲化方 法有以下几种: >> 5 .六种Q型聚类方法分别为 ?>> O6.快速聚类在SPSS中由 程实现。二、简答题1. 简述系统聚类法的基本思想及主要步骤2. 简述最长聚类法的聚类步骤。3. 简述快速聚类的基本思想及主要步骤。二、计算题2 .从20个工厂抽了同类产品,每个产品测了两个指标,欲将各厂的 质量进行分类,测得的数据如下(已作了适

21、当变换)1234567891011121314151617181920X10022445667-4-2-3-3-5100-1-1X26553431210322021-1-2-1-3试用欧氏距离,将每个样本与其距离最近的凝聚眯进行初始归类(用密度法取聚点)。四、SPSS操作题1. 某校从高中二年级女生中随机抽取 16名,测得身高和体重数据如卜表:序号身高(cm)体重(kg)序号身高(cm)体重(kg)116049916045215946101604431604111157434169491216350516250131615161654814158457165521515948815443161

22、6148试分别利用最短距离法、最长距离法、重心法、类平均法、中间距离法将它们聚类(分类统计量采用绝对距离),并画出聚类图 2.从不同地区采集了七块花岗岩,测其部分化学成分如下:1234567SiO275.2075.1572.1972.3572.7473.2973.72TQ20.140.160.130.130.100.0330.033FeO1.862.111.521.371.411.070.77CaO0.910.740.690.830.720.170.28K2O5.214.934.654.874.993.152.78试作如下分析:(1) 样本间用欧氏距离,并用系统聚类的诸方法对样本进行聚类。(2

23、) 将数据标准化后,仍用欧氏距离,然后用系统聚类的诸方法对样本进行聚类(3) 对五个变量进行聚类第六章判别分析一、填空题1 .判别分析是要解决在研究对象已 情况下,确 定新的观测数据属于已知类别中哪一类的多元统计方法。2. 用判别分析方法处理问题时,通常以 为衡量新样本 点与各已知组别接近程度的指标。3. 进行判别分析时,通常指定一种判别规则,用来判定新样本的归属,常见的判别准则有?4. 在p维空间Rp中,点与点之间的接近和疏远尺度用 来衡量,最简单的就是或5. 类内样本点接近,类间样本点疏远的性质,可以通过与 大小差异表现出来,而两者的比值能把不同的类区别开来。这个比值越大,说明类与类间的差

24、异越 ,分类效果越。6. Fisher判别法就是要找一个由p个变量组成的,使得 各白组内点的 尽可能接近,而不同组间点的尽可能疏远。二、简答题1. 判别分析的分类。2. 判别的基本思想3. 简述两个类别的判别及判别准则。4. 简述Fisher判别规则及具体判别步骤。5. 简述逐步判别基本原理。三、计算题1. 某地区将农村经济类型分为三类:G1 一较富裕类型,G2一中等类 型,G3较贫困类型。每种类型以五个指标为依据:x1=±地生产率 =农村社会总产值/总土地面积(百元/每亩),x2=劳动生产率=农村社会 总产值/农村劳动力(百元/每个劳动力),x3=A均收入=农村经济纯收 入/农业人

25、口(百元/每人),x4=费用水平=总费用/总收入,x5=农村工 业比重=农村工业产值/农村社会总产值。每种类型分别有容量为 ni=5,n2=8,n3=4的样本(每个个体以县为单位),其数据如下:12345678G1(较X13.853.514.125.013.67富裕)X26.755.734.454.685.84X34.794.013.683.644.27X40.850.810.890.780.87X50.590.600.480.530.64G2(中X13.613.654.112.983.212.873.354.00等)X24.053.744.133.693.553.783.814.27X32.

26、652.863.152.903.132.602.712.97X40.900.910.930.890.880.940.950.90X50.450.430.410.410.480.390.380.44G3(较X13.233.032.542.11贫困)X24.083.213.502.98X31.852.031.511.07X40.960.940.970.99X50.380.250.340.21(1)试作费歇尔判别(2)试以x3,x5为变量,建立三个类别的直线判别函数(3) 试以x1,x2,x3,x4,x5为变量,建立马氏距离判别函数(4) 进行逐步判别分析2. 设两个二维总体有公共协方差,从二总体中

27、分别抽取了容量为9和8的样本,其数据如下:123456789G1X1X220.214.228.58.424.614.826.515.229.011.936.79.636.018.027.69.525.016.0G2X1X221.67.523.24.517.89.214.47.211.05.518.96.315.48.016.17.8(1) 建立直线判别函数,并判定点(23.1, 9.2)归属于哪类?(2) 采用费歇尔判别来确定(23.1, 9.2)的归属采用马氏距离判别法则确定点(23.1, 9.2)属于哪一类。四、SPSS操作题1. 一个城市的居民家庭,按其有无割草机分为两组,有割草机的一

28、组记为G1,另一组记为G2。割草机工厂欲判断一些家庭是否习割草 机,从G1和G2分别随机抽取12个样本单位,调查两项指标:x1 = 家庭收入,x2=房前房后土地面积。资料如下表,试用Fisher判别法建立判别函数。G1有割草机家庭G2无割草机家庭X1(千美兀)X2(平方千英尺)X1(千美兀)X2(平方千英尺)20.09.225.09.828.58.417.610.421.610.821.68.620.510.414.410.229.011.828.08.836.79.616.48.836.08.819.88.027.611.222.09.223.010.015.88.231.010.411.0

29、9.417.011.017.07.027.010.021.07.42. 胜利油田某地段三条地震测线提供构造指标x1,x2,及速度变量x3,x4,x5共5个指标。表中给出的有油气显示的5个指标数据(共10组数据)设为G1类,表中给出的无油气显示的5个指标数据(共11组 数据)设为G2类。已知G1类与G2类的协方差阵桢,试判别给定的 三组数据归属哪一类。G1类一有油气显示的数据表构造指标速度指标X1X2X3X4X5120214242202142432024424420274245203041462030421715442248324712492744411103644225G2类一无油气显示的数据表构造指标速度指标X1X2X3X4X5120181752203617733217414432178005325341462021177732324148154442492030176103211800112144441待判样本数据表构造指标速度指标X1X2X3X4X5120551632321480031544214

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1