数据挖掘技术的企业CRM系统的设计方案与实现.doc

上传人:scccc 文档编号:13426095 上传时间:2021-12-25 格式:DOC 页数:15 大小:388.50KB
返回 下载 相关 举报
数据挖掘技术的企业CRM系统的设计方案与实现.doc_第1页
第1页 / 共15页
数据挖掘技术的企业CRM系统的设计方案与实现.doc_第2页
第2页 / 共15页
数据挖掘技术的企业CRM系统的设计方案与实现.doc_第3页
第3页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《数据挖掘技术的企业CRM系统的设计方案与实现.doc》由会员分享,可在线阅读,更多相关《数据挖掘技术的企业CRM系统的设计方案与实现.doc(15页珍藏版)》请在三一文库上搜索。

1、基于数据挖掘技术的企业 CRM系统的设计与实现河北金融学院 郭佳 许明摘要: CRM <Customer Relationship Management)是客户关系管理的简称,它是一个系统性的工程,是技术和管理相结合的产物。 CRM 实 现了企业由以产品为中心向以客户为中心的转变,客户首次作为一种资 源纳入企业的管理视野。本文以企业销售业绩为对象,利用决策树分类 算法中的 ID3 算法,得到支持决策,从而挖掘出理想客户,建立满足公 司需求的 CRM 挖掘系统。关键字:客户关系管理;数据挖掘;决策树分类算法; ID3 算法一、客户关系管理与数据挖掘技术1. 客户关系管理的概念客户关系管理

2、<CRM Customer Relationship Management)自 Gartner Group 提出概念以来,许多研究机构都基于自己的理解提出 了 CRM 的不同定义。归纳众多国内外著名公司以与学者对 CRM 的理解,我们可以从以下 几个层面来理解 CRM 。(1>CRM 是一种现代经营管理理念。(2>CRM 包含的是一整套解决方案。(3>CRM 意味着一套应用软件系统。2. 数据挖掘的概念从技术上定义,数据挖掘 (Data Mining ,简称为 DM> 是一种半自 动地从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取出 隐含在其中的、人们事

3、先不知道的、但又是潜在有用的信息和知识的过 程。数据挖掘从数据中提取人们感兴趣的可用信息和知识,并将提取出 来的信息和知识表示成概念、规则、规律和模式等便于人们理解与利用 的形式。如果从企业角度说,数据挖掘是一种新的客户信息处理技术,其主 要特点是对企业数据库中的大量业务数据进行抽取、转换、分析和其他 模式处理,从中提取辅助企业决策的关键性数据。因此,数据挖掘也可 被描述为:是提取有用信息的数据产生过程,是从大量数据中挖掘出隐 含的、先前未知的、对决策有潜在价值的知识和规则,并能够根据已有 的信息对未发生行为做出结果预测,为企业经营决策、市场策划提供依 据的过程。二、天鹏进出口公司 CRM 系

4、统分析1. 天鹏进出口公司实施 CRM 的可行性分析 首先是市场需求的原因。企业销售成功的关键在于针对客户的需 要,提供产品和服务来满足这种需要,然后通过对客户关系的管理,确 保客户满意和再次交易。然而过去的企业大多以为他们的产品和服务无 与伦比,客户会一如既往的使用他们的产品。现在,客户变的越来越大 胆和挑剔,他们不仅要求优质的产品,而且需要优质的服务。天鹏公司 发现各部门的信息化程度越来越不能适应业务发展需要,需要提高日常 业务的自动化和科学化。这是客户关系管理应运而生的需求基础。其次,技术的进步推进了 CRM 的发展。计算机、通讯技术、网络应 用技术的保证使得构建 CRM 系统的想法不再

5、停留在梦想阶段。办公自动 化程度、员工计算机应用能力、企业信息化水平、企业管理水平的提高 都有利于客户关系管理的实现。天鹏公司经过多年的发展,市场经济的观念已经深入人心。公司的 工作重点正在经历着从以产品为中心向以客户为中心的转移。在引入客 户关系管理的理念和技术时,不可避免的要对企业原来的管理方式进行 改变,创新的思想将有利于企业员工接受变革。因此发展 CRM 的时机已 经成熟,通过 CRM 对该企业的客户资源进行有效的管理,不但会提高企 业收益,也将改变企业运行的战略思维。2.天鹏进出口公司实施数据挖掘的可行性分析 对该公司客户进行分类的数据挖掘是可行的,因为公司的客户资料 已达到了数据挖

6、掘所需要的海量,而公司的经营者也希望获得更大的利 润,所以一般都支持数据挖掘,希望充分利用已有的数据信息;而且公 司的信息化建设比较好,数据比较完备,网络设置和员工的计算机水平 都比较好。而且为了适应业务发展的需要,公司先后在上海、天津、匈牙利设 立了办事处和分支机构,拉近公司与客户之间的距离,从而更加方便快 捷的将国际领先的产品和优质规范的服务源源不断的呈现给广大客户。 另外,当公司管理者需要对公司的贸易策略进行修改,对公司的进货量 进行调整的时候,往往需要对以前的数据进行分析,而对于海量数据人 们根本无从下手,分析数据只能凭借决策者的直觉,这样对数据是一种 无形的浪费。在公司实行数据挖掘的

7、目的就是从日积月累的海量数据中发现隐藏 在数据中的潜在规则,根据这些规则,将客户合理分类,进而根据其特 点制定“一对一”的个性化贸易策略。3. 天鹏进出口公司 CRM 系统需求分析 一个企业业务流程是系统设计的关键,要实施开发 CRM 系统,必须 确定系统的功能需求,这就必须先了解企业的业务流程,从业务流程中 分析系统的需求。(1> 客户信息管理客户信息包括客户名称、所属国家地区、详细地址、电话传真、电 子邮箱、开户银行、银行账号、增值税信息等。(2> 活动信息管理活动管理系统模块主要记录与客户之间的联系计划信息,以便与时 和客户取得联系,随时了解客户的情况,保证稳定的客户来源。(

8、3> 销售信息管理销售管理系统模块主要是对与客户之间的销售进行管理,包括销售 和销售列表两部分。销售部分用于记录与客户进行的销售事件,销售列 表部分用于对与客户发生的销售进行统计。(4> 服务信息管理服务管理系统模块主要是记录客户的反馈事件信息与其处理方式, 并对服务信息进行统计,帮助企业更好的把握服务的动态趋势。(5> 费用信息管理 与客户联系就必然会产生费用,费用管理系统模块主要记录与客户 之间发生的费用信息,以控制和客户发生的费用。(6> 分析管理 分析管理系统主要用于对系统中的数据进行列表分析与图表分析, 在该模块中始终贯穿着数据挖掘的思想。(7> 报表管

9、理 报表管理系统主要用于对系统中的数据进行报表显示与数据文件生 成,方便用户打印和下载,可以更快捷的将数字信息变为实际纸张上的 信息。(8> 库存管理 库存管理模块主要是对销售的产品进行有效的管理与其相应的进 货,可分为库存管理、库存详表、进货管理和进货详表几部分。(9>E-mail 管理E-mail 管理系统是为了使用户能够方便的联系客户,也是 CRM 的 一个重要组成部分,使得用户可以方便的管理所属客户的电子邮件地 址,并具有分类群发的功能。(10> 后台管理 后台管理是对负责系统管理和维护的用户进行授权,对系统部门进 行管理;对客户、销售、服务等信息进行实时查询和汇总,

10、提供分析数 据列表和图表,并生成便于打印和下载的数据报表和数据文件,提供给 管理高层进行分析和决策。三、天鹏进出口公司 CRM 系统设计1.系统结构设计分析人员数据仓库1TETL工具(抽取、转换、装载工具 >外部数据 历史数据交易数据图1 CRM系统结构图2.系统数据挖掘模型的设计(1>用于分类的训练数据源组在本文研究的企业数据中,首先是将不同部分的数据进行集成,然后是对数据进行概化处理,将低层次的原始数据概化为高层次的概念,以便于进行数据挖掘。将具体的客户年龄概化为<=30、31-50、>50三个年龄段,分别代表青年、中年和老年客户,将产品价格分为高、中、低三档等,具

11、体见表1,将企业CRM系统数据库中销售与客户信息经汇 总后得到的信息资料。它有 4个属性:客户年龄段、文化程度、销售地 区、产品档次,类别是销售业绩,分为好和差两类。表1训练样本集合attribut eageeducatio narealevelclass1<=30HIlowbad2<=30HIhighgood3<=30Hnmediumbad4<=30Hnhighgood5<=30LIhighgood6<=30LIlowgood7<=30Lnlowgood8<=30MIhighgood9<=30MImediumgood10<=30Mn

12、mediumgood11<=30MIlowgood1231-51MImediumgood1331-51Mnmediumgood1431-51MIlowbad1531-51HIhighgood1631-51HImediumgood1731-51HIlowgood1831-51Hnhighbad1931-51Hnlowbad2031-51LIhighgood2131-51LIlowgood2231-51Mnhighbad2331-51MIhighgood24>50MIhighbad25>50Mnhighbad26>50MImediumgood表2训练数据中各属性的说明属性说

13、明age客户的年龄段educatio n文化程度area业务销售地区 t本地区, n外地)level产品档次class销售状况(2天鹏进出口公司CRM系统中决策树分类算法的应用决策树分类是一种从无次序、无规则的训练样本集中推理出决策树表示形式的分类规则的方法。在各种决策树分类算法中,ID3算法是最具有影响力的,接下来以企业销售业绩为对象,介绍 ID3算法在CRM系统 中分类模型的建立。由表1可知:类标号属性有两个不同的值,因此有两个不同的类 即 m=2 )设类C1对应于good,类C2对应于bad。类good 有18个样 本,类bad有8个样本。为了计算每个属性的信息增益,先使用 ,所以初始信

14、息熵为:产品档次和销售区域。先看 age属性,观察age的每个样本值的good、bad 分布,对每个分布分别计算信息熵:当 age<=30 : sii =9 s 21 =2 时,l(sii ,S2i >=-当 age 在 3I-50 间:si2 =8 S22=4 时,l(si2,S22>=当 age>=50 : si3=1 s 23=2 时,l(si3,S23>=如果样本按age划分,对一个给定的样本分类所需的信息熵为:E(age>=|=0.8192 类似的,可以得到:E(educati on>=0.7669E(producti on>=0.85

15、3E(area>= 二利用上述属性对当前分支节点进行相应样本集合划分所获得的信息 增益分别为:Gain (age> = I(s 1 ,S2>- E(age> =0.8905-0.8192=0.0713 Gain( educatio n> = I(s1 ,S2>- E(educatio n> =0.8905-0.7769=0.1236Ga in( producti on> = I(s1,S2>- E(producti on> =0.8905-0.853=0.0375Gai n(area> = I(s 1 ,S2>- E(ar

16、ea> =0.8905-0.783=0.1075Gai n( equipme nt> =1.576 - 0.873 = 0.703由上述结果可知,属性educati on具有最高信息增益,因此成为决策树根节点的测试属性。如下所示:8I <=30 highgood5I <=30highgood9I <=30 mediumgood6I <=30 lowgood10n <=30mediumgood7n <=30 lowgood11I <=30 lowgoo d20n <=30highgood12I 31-50 mediumgoo d21I

17、31-50 lowgoo d13n 31-50mediumgoo d14I 31-50 lowbad22n 31-50highbad23I 31-50highgood24I >=50 highbad25n >=50highbad26I >=50 mediumgood1I <=30 lowbad2I <=30 highgoo d3n <=30 mediumbad4n <=30highgoo d15I 31-50 highgoo d16I 31-50 mediumgoo d17I 31-50 lowgoo d18n 31-50highbad19n 31-5

18、0low -1bad图2决策树根节点的测试属性good类,因此对应分P2的样本类别不定,P2子集分别递归调用在样本中对属性 education 的3个取值进 行分支,3个分支对应3个子集,分别为:P11,2,3,4,15,16,17,18,19; P2 =8,9,10,11,12,13,14,22,23,24,25,26P3二5,6,7,20,21。其中P3的样本都为支标记为 good ,P1和因此需要对P1子集和ID3算法。在P1中可求出余下的三个属性:age、production 、area的信息增益因为area属性的信息增益最大,所以以它为该分支的节点,再向下图3经数据分类生成的决策树因

19、此,对于样本 X=(age二 “ 31-50 ”,education=“ low ”,level二“medium ” , area二 “I” , ID3 算法分类预测其 class 为 good 。我们用IF-THEN形式的分类规则提取图3决策树中表示的知识,企业可以从中发现销售规律,以便制定未来更有效的营销策略。例如:(1>IF education=“H ” AND area= “ 1”OR(area=“u” >AND age=“ <=30 ”ANDproductio n=“ high ”THENachievement二“ good ”(2>IF education=

20、“ H ” AND area= “ 1”AND age=“ 31-(3>IF education=“H” AND area= “I” AND age= “<=30AND production=“ 177“ low ”THEN achievement= “bad ”(4>IF education= “M ” ANDproduction=“high ”ANDage= “ <=30 ”OR(age=“ 31-50 ”AND area=“I”>THENachievement= “a|”good ”(5>IF education= “M ” ANDproduction

21、=“high ”ANDage= “ >=50 ”OR(age=“ 31-50 ”AND area=“U” >THENachievement= “bad ”前三条分类规则说明该企业的高档产品对于本地区受过高等教育的 年轻客户的吸引力较大,低档产品对该类客户的吸引力较小;该企业的 各档次产品对于本地受过高等教育的中年客户吸引力均较大。后两条规则说明企业的高档产品对于受过中等教育的年轻客户或者 本地的中年客户吸引力较大;高档产品在受过中等教育的老年客户或者 外地区的中年客户中不很受欢迎。因此该企业可以加大高档产品在年轻 客户中的宣传以与各档次产品在本地受过高等教育的中年客户中的宣 传,他

22、们是该企业的一个重点客户群。在外地区针对受过中、高等教育 的中年与老年客户的销售业绩还有待提高。该企业的产品对于教育程度 较低的客户群销售业绩比较平稳。四、 天鹏进出口公司 CRM 系统中数据挖掘技术的实现1.决策树挖掘技术的实现在 SQL Server2000Analysis Manager 控制台上,可按下述步骤使 用 Microsoft 决策树挖掘技术。(1> 在 Analysis Manager 控制台左侧树型结构中,找到指定服务器 和分析数据库,右击“挖掘模型”,新建挖掘模型。(2> 完成“选择源类型”和“选择源多维数据集”对话框,进入“选 择数据挖掘技术”对话框,在 S

23、QL Server 的 AnalysisServices 中提供了 两类数据挖掘模型,即决策树模型和聚集挖掘模型,本系统采用 Microsoft 决策树模型。(3> 进入“选择被预测实体”对话框,在“源多维数据集的度量 值”、“事例级别的成员属性”和“其他维度的成员”三个选项中选择 合适的内容。(4> 进入“选择培训数据”对话框,选定培训数据的维度层次。(5> 进入“创建维度和虚拟多维数据集”对话框,填写新建内容和名 称。(6> 填写模型名称,并选定“保存并开始处理”选项。 待新建的挖掘模型处理结束后,将出现“ OLAP 挖掘模型编辑器”窗 口,列出新建的挖掘模型。2.

24、天鹏公司 CRM 系统的实现天鹏公司的 CRM 系统实现了对客户销售、市场、价值和服务的全面 管理,能实现客户基本数据的记录、跟踪,客户市场的划分和趋势研 究,以与客户支持服务情况的分析,并能在一定程度上实现业务流程的 自动化。在系统分析模块中可以实现销售分析、客户地域分布分析、客户价 值分析、服务趋势分析和服务构成分析等。每种分析功能又可以按照多 种条件进行分析,例如在进行客户价值分析时还可以选择按交易次数、 交易金额、时间范围等条件具体分析。针对不同的分析功能,分析结果可以选择以报表形式或者以图表形 式进行显示。报表显示主要是将从数据库中读取的数据按照一定的格式 显 示 出 来 , 主 要

25、 通 过 vbscript 函 数 实 现 。 图 表 显 示 主 要 是 利 用 VML<Vector Markup Language,矢量标记语言)来实现。在 VML 中单个元素被定义为形状 <shape ),大多数形状是由矢量 路径描述的。形状有很多属性,例如:名称 <title )、样式 (style> 、填充 (fill> 、填充颜色 (fillcolor> 等。本文中分析模块利用的就是 VML 的基本 元素,通过画线、填充和样式的控制来实现柱状图的显示。五、结论 本文在研究客户关系管理系统、数据挖掘技术和相关算法的基础 上,分析了数据挖掘技术在该

26、公司 CRM 系统中应用的可行性 ,建立了天 鹏进出口公司 CRM 系统的挖掘算法模型,实现了对该公司客户群体以与 客户销售等情况的细分,建立了满足公司需求的 CRM 挖掘系统。 参考文献1 郑伟民 .数据挖掘纵览 .计算机世界 .1999(5>2 黄刚 .数据挖掘工具与其选择 .计算机世界 .1999(5>3杨辉.数据挖掘分类优化方法研究上海交通大学博士论文.19994郑伟民.数据挖掘纵览计算机世界.1999(55黄刚.数据挖掘工具与其选择.计算机世界.1999(56杨辉.数据挖掘分类优化方法研究.上海交通大学博士论文.1999出师表两汉:诸葛亮先帝创业未半而中道崩殂,今天下三分

27、,益州疲弊,此诚危急存亡 之秋也。然侍卫之臣不懈于内,忠志之士忘身于外者,盖追先帝之殊 遇,欲报之于陛下也。诚宜幵张圣听,以光先帝遗德,恢弘志士之气, 不宜妄自菲薄,引喻失义,以塞忠谏之路也。宫中府中,俱为一体;陟罚臧否,不宜异同。若有作奸犯科与为忠 善者,宜付有司论其刑赏,以昭陛下平明之理;不宜偏私,使内外异法 也。侍中、侍郎郭攸之、费祎、董允等,此皆良实,志虑忠纯,是以先 帝简拔以遗陛下:愚以为宫中之事,事无大小,悉以咨之,然后施行, 必能裨补阙漏,有所广益。将军向宠,性行淑均,晓畅军事,试用于昔日,先帝称之曰“能”,是以众议举宠为督:愚以为营中之事,悉以咨之,必能使行阵 和睦,优劣得所。

28、亲贤臣,远小人,此先汉所以兴隆也;亲小人,远贤臣,此后汉所 以倾颓也。先帝在时,每与臣论此事,未尝不叹息痛恨于桓、灵也。侍 中、尚书、长史、参军,此悉贞良死节之臣,愿陛下亲之、信之,则汉 室之隆,可计日而待也。臣本布衣,躬耕于南阳,苟全性命于乱世,不求闻达于诸侯。先帝 不以臣卑鄙,猥自枉屈,三顾臣于草庐之中,咨臣以当世之事,由是感 激,遂许先帝以驱驰。后值倾覆,受任于败军之际,奉命于危难之间, 尔来二十有一年矣。先帝知臣谨慎,故临崩寄臣以大事也。受命以来,夙夜忧叹,恐托 付不效,以伤先帝之明;故五月渡泸,深入不毛。今南方已定,兵甲已 足,当奖率三军,北定中原,庶竭驽钝,攘除奸凶,兴复汉室,还于旧 都。此臣所以报先帝而忠陛下之职分也。至于斟酌损益,进尽忠言,则 攸之、祎、允之任也。愿陛下托臣以讨贼兴复之效,不效,则治臣之罪,以告先帝之灵。 若无兴德之言,贝y责攸之、祎、允等之慢,以彰其咎;陛下亦宜自谋, 以咨诹善道,察纳雅言,深追先帝遗诏。臣不胜受恩感激。今当远离,临表涕零,不知所言。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1