spss样本聚类案例分析要点.pdf

上传人:tbuqq 文档编号:5198190 上传时间:2020-02-19 格式:PDF 页数:16 大小:1.03MB
返回 下载 相关 举报
spss样本聚类案例分析要点.pdf_第1页
第1页 / 共16页
spss样本聚类案例分析要点.pdf_第2页
第2页 / 共16页
spss样本聚类案例分析要点.pdf_第3页
第3页 / 共16页
spss样本聚类案例分析要点.pdf_第4页
第4页 / 共16页
spss样本聚类案例分析要点.pdf_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《spss样本聚类案例分析要点.pdf》由会员分享,可在线阅读,更多相关《spss样本聚类案例分析要点.pdf(16页珍藏版)》请在三一文库上搜索。

1、原数据 1.1 样本聚类( Q 聚类) 聚类表 阶群集组合 系数 首次出现阶群集 下一阶群集 1 群集 2 群集 1 群集 2 1 5 7 .855 0 0 3 2 11 12 1.379 0 0 7 3 2 5 1.772 0 1 5 4 10 14 1.776 0 0 7 5 2 6 2.451 3 0 8 6 8 13 2.772 0 0 10 7 10 11 4.322 4 2 12 8 1 2 4.557 0 5 12 9 3 4 4.895 0 0 13 10 8 15 5.500 6 0 11 11 8 9 7.740 10 0 13 12 1 10 8.314 8 7 14 1

2、3 3 8 12.790 9 11 14 14 1 3 16.650 12 13 0 通过系数做出其散点图 群集成员 案例5 群集4 群集3 群集 1:Case 1 1 1 1 2:Case 2 1 1 1 3:Case 3 2 2 2 4:Case 4 2 2 2 5:Case 5 1 1 1 6:Case 6 1 1 1 7:Case 7 1 1 1 8:Case 8 3 3 3 9:Case 9 4 3 3 10:Case 10 5 4 1 11:Case 11 5 4 1 12:Case 12 5 4 1 13:Case 13 3 3 3 14:Case 14 5 4 1 15:Cas

3、e 15 3 3 3 1.2 变量聚类( R 聚类) 近似矩阵 案例矩阵文件输入 总人口从业人员土地面积耕地面积财政收入粮食产量 总人口1.000 .857 .698 .714 .512 .043 从业人员.857 1.000 .597 .570 .643 .277 土地面积.698 .597 1.000 .856 .044 -.147 耕地面积.714 .570 .856 1.000 -.001 -.335 财政收入.512 .643 .044 -.001 1.000 .342 粮食产量.043 .277 -.147 -.335 .342 1.000 聚类表 阶群集组合 系数 首次出现阶群集

4、 下一阶群集 1 群集 2 群集 1 群集 2 1 1 2 .857 0 0 3 2 3 4 .856 0 0 3 3 1 3 .645 1 2 5 4 5 6 .342 0 0 5 5 1 5 .129 3 4 0 群集成员 案例5 群集4 群集3 群集 总人口1 1 1 从业人员1 1 1 土地面积2 2 1 耕地面积3 2 1 财政收入4 3 2 粮食产量5 4 3 2.K均值聚类 原数据 描述统计量 N 极小值极大值均值标准差 身高月平均增长率19 .34 11.03 1.8842 2.56342 体重月平均增长率19 .49 50.30 5.6363 11.71814 胸围月平均增长

5、率19 .16 11.81 1.4958 2.79339 坐高月平均增长率19 .14 11.27 1.7111 2.80709 有效的 N (列表状态)19 输出结果: 初始聚类中心 聚类 1 2 3 4 5 Zscore( 身高月平均增长率) 3.56781 1.39883 .66153 .04907 -.60240 Zscore( 体重月平均增长率) 3.81150 1.16603 .35959 -.12513 -.43918 Zscore( 胸围月平均增长率) 3.69236 1.32606 .58861 -.00923 -.47104 Zscore( 坐高月平均增长率) 3.4052

6、9 1.94826 .14212 -.04669 -.55255 迭代历史记录 a 迭代聚类中心内的更改 1 2 3 4 5 1 .000 .000 .000 .208 .183 2 .000 .000 .000 .000 .000 a. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝 对坐标更改为 .000 。当前迭代为 2 。初始中心间的最小距离为 .996 。 聚类成员 案例号月份聚类距离 0 1 1 1 .000 2 2 2 .000 3 3 3 .000 4 4 4 .208 5 6 4 .258 6 8 4 .312 7 10 4 .194 8 12 5 .297 9

7、 15 5 .245 10 18 5 .065 11 24 5 .070 12 30 5 .112 13 36 5 .045 14 42 5 .119 15 48 5 .051 16 54 5 .103 17 60 5 .166 18 66 5 .074 19 72 5 .183 20 . . . 21 . . . 22 . . . 23 . . . 24 . . . 25 . . . 最终聚类中心 聚类 1 2 3 4 5 Zscore( 身高月平均增长率) 3.56781 1.39883 .66153 .02859 -.47855 Zscore( 体重月平均增长率) 3.81150 1.1

8、6603 .35959 -.19084 -.38115 Zscore( 胸围月平均增长率) 3.69236 1.32606 .58861 -.20255 -.39974 Zscore( 坐高月平均增长率) 3.40529 1.94826 .14212 -.01106 -.45429 最终聚类中心间的距离 聚类1 2 3 4 5 1 4.407 6.375 7.442 8.099 2 4.407 2.236 3.146 3.830 3 6.375 2.236 1.163 1.784 4 7.442 3.146 1.163 .727 5 8.099 3.830 1.784 .727 ANOVA 聚

9、类误差 F Sig. 均方df 均方df Zscore( 身高月平均增长率) 4.469 4 .009 14 500.431 .000 Zscore( 体重月平均增长率) 4.476 4 .007 14 662.430 .000 Zscore( 胸围月平均增长率) 4.455 4 .013 14 346.563 .000 Zscore( 坐高月平均增长率) 4.472 4 .008 14 563.652 .000 F 检验应仅用于描述性目的,因为选中的聚类将被用来最大化不同聚类中的案例间的差别。观测到的显著 性水平并未据此进行更正,因此无法将其解释为是对聚类均值相等这一假设的检验。 每个聚类中

10、的案例数 聚类1 1.000 2 1.000 3 1.000 4 4.000 5 12.000 有效19.000 缺失6.000 3.线性回归 研究变量间的非确定性关系,构造变量间经验公式的数理统计方法称为回归分析。根据 自变量的个数,分为一元线性回归和多元线性回归。 3.1 一元线性回归 http:/ 原数据 输入移去的变量 b 模型输入的变量移去的变量方法 1 咖啡类饮料销售 量, 固体冲泡饮 料销售量 , 茶饮 料销售量 , 碳酸 饮料销售量 a . 输入 a. 已输入所有请求的变量。 b. 因变量 : 果汁销售量 模型汇总 模型 R R 方调整 R 方 标准 估计的误 差 1 .997

11、 a .994 .992 .44012 a. 预测变量 : (常量 ), 咖啡类饮料销售量, 固体冲泡饮料销售 量, 茶饮料销售量 , 碳酸饮料销售量。 Anova b 模型平方和df 均方F Sig. 1 回归338.056 4 84.514 436.306 .000 a 残差1.937 10 .194 总计339.993 14 a. 预测变量 : (常量 ), 咖啡类饮料销售量, 固体冲泡饮料销售量, 茶饮料销售 量, 碳酸饮料销售量。 b. 因变量 : 果汁销售量 系数 a 模型非标准化系数标准系数 t Sig. B 标准 误差试用版 1 (常量 ) 17.296 .470 36.830

12、 .000 碳酸饮料销售量.043 .018 .170 2.427 .036 茶饮料销售量.265 .021 .726 12.852 .000 固体冲泡饮料销售量-.004 .034 -.009 -.117 .909 咖啡类饮料销售量-.238 .013 -.455 -18.640 .000 a. 因变量 : 果汁销售量 3.2 多元线性回归 原数据 输出结果: 输入移去的变量 b 模型输入的变量移去的变量方法 1 X4, X1, X2, X3 a . 输入 a. 已输入所有请求的变量。 b. 因变量 : Y 模型汇总 b 模型 R R 方调整 R 方 标准 估计的误 差 1 .894 a .

13、799 .726 .619 a. 预测变量 : (常量 ), X4, X1, X2, X3。 b. 因变量 : Y Anova b 模型平方和df 均方F Sig. 1 回归16.779 4 4.195 10.930 .001 a 残差4.221 11 .384 总计21.000 15 a. 预测变量 : (常量 ), X4, X1, X2, X3。 b. 因变量 : Y 系数 a 模型非标准化系数标准系数 t Sig. 共线性统计量 B 标准 误差试用版容差VIF 1 (常量 ) -.182 .442 -.412 .688 X1 .142 .158 .133 .900 .387 .834 1

14、.200 X2 .245 .213 .258 1.145 .276 .359 2.784 X3 .210 .224 .244 .936 .369 .268 3.729 X4 .605 .245 .465 2.473 .031 .516 1.938 a. 因变量 : Y 共线性诊断 a 模型维数 特征值条件索引 方差比例 ( 常量 ) X1 X2 X3 X4 1 1 4.538 1.000 .01 .01 .00 .00 .00 2 .218 4.558 .08 .30 .03 .11 .01 3 .114 6.304 .12 .22 .19 .00 .39 4 .092 7.013 .67 .39 .07 .01 .19 5 .037 11.020 .12 .08 .71 .87 .41 a. 因变量 : Y 残差统计量 a 极小值极大值均值标准偏差N 预测值1.02 4.62 2.25 1.058 16 残差-.743 .981 .000 .530 16 标准 预测值-1.164 2.245 .000 1.000 16 标准 残差-1.200 1.583 .000 .856 16 a. 因变量 : Y

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1