聚类分析实验指导书-R.doc

上传人:李医生 文档编号:5706597 上传时间:2020-07-23 格式:DOC 页数:6 大小:851KB
返回 下载 相关 举报
聚类分析实验指导书-R.doc_第1页
第1页 / 共6页
聚类分析实验指导书-R.doc_第2页
第2页 / 共6页
聚类分析实验指导书-R.doc_第3页
第3页 / 共6页
聚类分析实验指导书-R.doc_第4页
第4页 / 共6页
聚类分析实验指导书-R.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《聚类分析实验指导书-R.doc》由会员分享,可在线阅读,更多相关《聚类分析实验指导书-R.doc(6页珍藏版)》请在三一文库上搜索。

1、数据挖掘实 验 报 告 院 (部): 管理工程学院专 业:信息管理与信息系统实验项目: 聚类分析实验班 级: 信管112姓 名: 李朝阳学 号: 2011021702 聚类分析实验指导书实验目的:1熟悉R语言的相关对象与函数的用法2掌握利用R进行聚类分析的基本步骤实验内容:说明:本实验采用iris数据集,下面中的数据集如无上下文说明,即是指irisiris以鸢尾花的特征作为数据来源,数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性,是在数据挖掘、数据分类中非常常用的测试集、训练集。四个属性分别为:花萼长度、花萼宽带、花瓣长度、花瓣宽度三类分别为:setosa, vers

2、icolor, virginica(山鸢尾、变色鸢尾和维吉尼亚鸢尾)1对数据集进行初步的统计与分析(1) 数据集的维度-dim(2) 数据集中的列名-names(3) 数据集的内部结构-str(4) 数据集的属性-attributes(5) 查看数据集的前五条数据情况(6) 查看数据集中属性Sepal.Length前10行数据(7) 显示数据集中每个变量的分布情况-summary(8) 数据集列Species中各个值出现频次(9) 根据列Species画出饼图-pie(10) 算出列Sepal.Length的所有值的方差-var(11) 算出列iris$Sepal.Length和iris$Pe

3、tal.Length的协方差-cov(12) 算出列iris$Sepal.Length和iris$Petal.Length的相关系数-cor(13) 画出列iris$Sepal.Length分布柱状图(14) 画出列iris$Sepal.Length的密度函数图(15) 画出列iris$Sepal.Length和iris$Sepal.Width的散点图(16) 绘出矩阵各列的散布图-plot2使用knn包进行Kmean聚类分析(1) 将数据集进行备份newiris-iris,将列newiris$Species置为空newiris$Species-NULL,将此数据集作为测试数据集(2) 在数据集newiris上运行Kmean聚类分析, 将聚类结果保存在kc中。在kmean函数中,将需要生成聚类数设置为3(kmean(newiris,3)(3) 创建一个连续表,在三个聚类中分别统计各种花出现的次数-table(4) 根据最后的聚类结果画出散点图,数据为结果集中的列Sepal.Length和Sepal.Width,颜色为用1,2,3表示的缺省颜色

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1