商务智能理论与应用-数据聚类讲义.ppt

上传人:scccc 文档编号:14467921 上传时间:2022-02-06 格式:PPT 页数:22 大小:404KB
返回 下载 相关 举报
商务智能理论与应用-数据聚类讲义.ppt_第1页
第1页 / 共22页
商务智能理论与应用-数据聚类讲义.ppt_第2页
第2页 / 共22页
商务智能理论与应用-数据聚类讲义.ppt_第3页
第3页 / 共22页
商务智能理论与应用-数据聚类讲义.ppt_第4页
第4页 / 共22页
商务智能理论与应用-数据聚类讲义.ppt_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《商务智能理论与应用-数据聚类讲义.ppt》由会员分享,可在线阅读,更多相关《商务智能理论与应用-数据聚类讲义.ppt(22页珍藏版)》请在三一文库上搜索。

1、2022/2/6,数据仓库与数据挖掘,1,数据聚类,2022/2/6,数据仓库与数据挖掘,2,6.1 引例,聚类分析的定义聚类分析是将物理的或者抽象的数据集合划分为多个类别的过程,聚类之后的每个类别中任意两个数据样本之间具有较高的相似度,而不同类别的数据样本之间具有较低的相似度,2022/2/6,数据仓库与数据挖掘,3,6.1 引例,聚类分析示例数据集,聚类分析的数据集没有类别属性,2022/2/6,数据仓库与数据挖掘,4,6.2 聚类分析概述,数据挖掘技术对聚类分析的要求:可伸缩性 处理不同类型属性的能力 发现任意形状聚类的能力 减小对先验知识和用户自定义参数的依赖性 处理噪声数据的能力 可

2、解释性和实用性,2022/2/6,数据仓库与数据挖掘,5,6.2 聚类分析概述,通常聚类算法可以分为以下几类: 划分聚类方法 层次聚类方法 基于密度的聚类方法 基于网格的聚类方法,2022/2/6,数据仓库与数据挖掘,6,6.3 聚类分析中相似度的计算方法,6.3.1 连续型属性的相似度计算方法 6.3.2 二值离散型属性的相似度计算方法 6.3.3 多值离散型属性的相似度计算方法 6.3.4 混合类型属性的相似度计算方法,2022/2/6,数据仓库与数据挖掘,7,6.3.1 连续型属性的相似度计算方法,欧氏距离(Euclidean distance)曼哈顿距离(Manhattan dista

3、nce)明考斯基距离(Minkowski distance),2022/2/6,数据仓库与数据挖掘,8,6.3.2 二值离散型属性的相似度计算方法,数据样本的二值离散型属性的取值情况,2022/2/6,数据仓库与数据挖掘,9,6.3.2 二值离散型属性的相似度计算方法,对称的二值离散型属性不对称的二值离散型属性,2022/2/6,数据仓库与数据挖掘,10,6.3.3 多值离散型属性的相似度计算方法,多值离散型属性的相似度d为数据集中的属性个数,u为样本xi和xj取值相同的属性个数,2022/2/6,数据仓库与数据挖掘,11,6.3.4 混合类型属性的相似度计算方法,对于包含混合类型属性的数据集

4、的相似度通常有两种计算方法:将属性按照类型分组,每个新的数据集中只包含一种类型的属性;之后对每个数据集进行单独的聚类分析 把混合类型的属性放在一起处理,进行一次聚类分析,2022/2/6,数据仓库与数据挖掘,12,6.4 k-means聚类算法,6.4.1 k-means聚类算法的基本概念 6.4.2 SQL server 2005中的k-means应用,2022/2/6,数据仓库与数据挖掘,13,6.4.1 k-means聚类算法的基本概念,划分聚类方法对数据集进行聚类时包含三个要点: 选定某种距离作为数据样本间的相似性度量 选择评价聚类性能的准则函数 选择某个初始分类,之后用迭代的方法得到

5、聚类结果,使得评价聚类的准则函数取得最优值,2022/2/6,数据仓库与数据挖掘,14,6.4.1 k-means聚类算法的基本概念,k-means聚类算法的操作步骤,2022/2/6,数据仓库与数据挖掘,15,6.4.2 SQL server 2005中的k-means应用,创建 Analysis Services 项目 创建数据源 创建数据源视图 创建k-means挖掘结构 设置k-means挖掘结构的相关参数 建立k-means挖掘模型 查看挖掘结果,2022/2/6,数据仓库与数据挖掘,16,6.5 层次聚类方法,6.5.1 层次聚类方法的基本概念 6.5.2 层次聚类方法应用举例,2

6、022/2/6,数据仓库与数据挖掘,17,6.5.1 层次聚类方法的基本概念,层次聚类方法最常用的相似性度量有:最小距离 最大距离,2022/2/6,数据仓库与数据挖掘,18,6.5.1 层次聚类方法的基本概念,层次聚类方法最常用的相似性度量有:均值距离 平均距离,2022/2/6,数据仓库与数据挖掘,19,6.5.1 层次聚类方法的基本概念,凝聚型层次聚类的操作步骤,2022/2/6,数据仓库与数据挖掘,20,6.5.2 层次聚类方法应用举例,参考书本P144145,人有了知识,就会具备各种分析能力,明辨是非的能力。所以我们要勤恳读书,广泛阅读,古人说“书中自有黄金屋。”通过阅读科技书籍,我们能丰富知识,培养逻辑思维能力;通过阅读文学作品,我们能提高文学鉴赏水平,培养文学情趣;通过阅读报刊,我们能增长见识,扩大自己的知识面。有许多书籍还能培养我们的道德情操,给我们巨大的精神力量,鼓舞我们前进。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1