第二章用MicrosoftExcel2007进行数据挖掘.ppt

上传人:本田雅阁 文档编号:3475239 上传时间:2019-08-31 格式:PPT 页数:43 大小:3.18MB
返回 下载 相关 举报
第二章用MicrosoftExcel2007进行数据挖掘.ppt_第1页
第1页 / 共43页
第二章用MicrosoftExcel2007进行数据挖掘.ppt_第2页
第2页 / 共43页
第二章用MicrosoftExcel2007进行数据挖掘.ppt_第3页
第3页 / 共43页
第二章用MicrosoftExcel2007进行数据挖掘.ppt_第4页
第4页 / 共43页
第二章用MicrosoftExcel2007进行数据挖掘.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《第二章用MicrosoftExcel2007进行数据挖掘.ppt》由会员分享,可在线阅读,更多相关《第二章用MicrosoftExcel2007进行数据挖掘.ppt(43页珍藏版)》请在三一文库上搜索。

1、2.1 表分析工具的安装 2.2 分析关键影响因素工具 2.3 检测类别工具 2.4 从示例填充工具 2.5 预测工具 2.6 突出显示异常值工具 2.7 应用场景分析工具 2.8 预测计算器工具 2.9 购物篮分析工具 2.10 表分析工具的技术概述,第二章 用Microsoft Excel 2007进行数据挖掘,2.1 表分析工具的安装,1、安装sql server 2008 企业版,2、安装office 2007 企业版,3、安装SQL Server 2008 Data Mining Add-Ins for Microsoft Office 2007 企业版 下载地址: http:/ 表

2、分析工具的安装,2.1 表分析工具的安装,2.1 .1 配置具有权限管理的Analysis Service,开始所有程序 Microsoft SQL 2008 数据挖掘外接程序 服务器配置实用工具,2.1 .1 配置具有权限管理的Analysis Service,下一步,2.1 .1 配置具有权限管理的Analysis Service,下一步,2.1 .1 配置具有权限管理的Analysis Service,下一步,2.1 .1 配置具有权限管理的Analysis Service,下一步,2.1 .1 配置具有权限管理的Analysis Service,完成,2.1 .1 配置具有权限管理的A

3、nalysis Service,开始使用,2.1 .1 配置具有权限管理的Analysis Service,选择第二项,2.1 .1 配置具有权限管理的Analysis Service,下一步,2.1 .1 配置具有权限管理的Analysis Service,完成,2.1 .2 配置没有管理权限的Analysis Service,没有权限,只能向服务器管理员要,没有权限,也可以安装sql server 2008体验版,2.1 .2 配置没有管理权限的Analysis Service,2.1 .2 配置没有管理权限的Analysis Service,2.1 .3 使用该插件的要求,数据要求保留列

4、头,要求套用表格格式,点数据区域有 分析设计工具,焦点在数据区域 外则没有,如图,2.2 分析关键影响因素工具,场景:,一位商店经理在一次活动中收集顾客的统计信息。这些信息和顾客的购买 活动一起保存在数据库中。在某个时间,该经理在Excel中加载所有这些信息, 希望找出顾客的人口统计信息与他们购买(或不购买)某个商品的相关性。,分析关键影响因素工具就可以完成这个任务。它会分析表中所有列于某个目标 列之间的相关性,并生成一个报表,标识出对目标列有重要影响的列,并详细 解释这个影响有多大,操作演示:,2.2 分析关键影响因素工具,主影响因素报表,2.2 分析关键影响因素工具,生成区别报表:,区别报

5、表中的影响因素与主报表中的影响因素不同。 主报表中的的一些影响因素在区别报表中没有.,2.3 检测类别工具,处理大量的数据实体时,最好把它们分为一定数量的可管理组,使属于一 个组的所有实体都非常类似。这样就不需要处理成百上千个实体,而可以处理 少量的类似对象组。这个过程称为聚类或分割,非常便于完成许多数据分析或 业务过程。,检测类别表分析工具可以找出数据中的自然组,他会分析数据,找出列值 最常见的组合,然后根据这些常见的模式定义组。他会详细描述已标识出的组 ,给原始数据中的没一行标记改行所属的组名。,2.3 检测类别工具,2.4 从示例填充工具,从示例填充数据挖掘工具扩展了Excel的自动填充

6、功能,它不仅仅考虑了 选中单元格的内容,而是对表列起作用,检测把目标列与同一行上其他列链接 起来的模式,把这些模式扩展到新行上。,运行工具,解释结果,细调结果,2.4 从示例填充工具,2.4 从示例填充工具,2.5 预测工具,假定一位零售公司的经理收集了不同地区、不同产品的销售数据。分析 这些信息,就可以预测未来的销售情况。预测工具可以分析一系列数值信息 ,找出控制数字信息序列演化的模式,从这些模式中推断出其未来的演化趋势,这个工具分析数据,获得如下类型的模式。 趋势:有持久性的系列产品的演化方向。 周期:时间发生的时间间隔。 交叉性:显示了同一时刻或不同时刻一个序列的值与另一个序列值之间的关

7、系,2.5 预测工具,2.6 突出显示异常值工具,突出显示异常值工具可以找出干草堆中的针。更准确地说,该工具可以找 出干草堆中不是干草的所有东西。其目标是在Excel中找出与其他行不相似的 行,这些行可能来自于数据输入错误,或行是正确行,但是不常见。,使用这个工具可以找出数据输入错误,还可以清理数据,再作进一步的分析,使用工具:,操作演示,2.6 突出显示异常值工具,996行,工具发现该顾客的汽车数是0,而大多数上班地点距离家5-10英里的 专业人士至少有一辆车,所以出现了异常。,2.6 突出显示异常值工具,2.6 突出显示异常值工具,更复杂的交互操作:,视图-新建窗口-全部重排,2.7 应用

8、场景分析工具,表分析工具的应用场景分析组件包含2个工具-假设和目标查询,John 的IQ是100,他没有奖学金,计划上大学 Kevin的IQ是110,也计划上大学,但得到了每年10000美元奖学金 Janet是一个非常优秀的学生,不打算上大学,问题?需要提供多少奖学金,她才能上学。,使用目标查询工具,(1)要指定目标(Plans to attend college的值是yes) (2)选择要修改的列(Schikarship列的值) (3)让工具搜索Schikarship列中所有可能值,找到一个使达到目标的可能 行最大的值,使用将设工具,需要为数据表中的任一列指定新值,看看这个假设的改变会如何影响结果列 直接在janet行的Scholarship列指定值5000,看看这会如何影响Janet的大学 计划,2.7 应用场景分析工具,使用目标查询工具,2.7 应用场景分析工具,对数字目标使用 目标查找工具,2.7 应用场景分析工具,对整个表使用 目标查找工具,2.7 应用场景分析工具,假设工具,2.8 预测计算器工具,挑选顾客进行跟踪,查看顾客 购买自行车的可能性,2.8 预测计算器工具,运行工具,2.8 预测计算器工具,预测计算电子表格,大于阀值,可能买自行车 小于阀值,可能不大,2.9 购物蓝分析工具,2.9 购物蓝分析工具,2.9 购物蓝分析工具,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1