数据挖掘应用案例RFM模型分析与客户细分-沈浩老师.docx

上传人:scccc 文档编号:12980097 上传时间:2021-12-09 格式:DOCX 页数:15 大小:401.36KB
返回 下载 相关 举报
数据挖掘应用案例RFM模型分析与客户细分-沈浩老师.docx_第1页
第1页 / 共15页
数据挖掘应用案例RFM模型分析与客户细分-沈浩老师.docx_第2页
第2页 / 共15页
数据挖掘应用案例RFM模型分析与客户细分-沈浩老师.docx_第3页
第3页 / 共15页
数据挖掘应用案例RFM模型分析与客户细分-沈浩老师.docx_第4页
第4页 / 共15页
数据挖掘应用案例RFM模型分析与客户细分-沈浩老师.docx_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《数据挖掘应用案例RFM模型分析与客户细分-沈浩老师.docx》由会员分享,可在线阅读,更多相关《数据挖掘应用案例RFM模型分析与客户细分-沈浩老师.docx(15页珍藏版)》请在三一文库上搜索。

1、Insight这里,我先给各位朋友拜年,祝大家新春快乐!兔年就要过去了,本命年的最后一天再不更新博客有点对不住大家!正好刚帮某电信行业完成一个数据挖掘工作,其中的 RFM模型还是有一定代表性,就再把数据挖掘 RFM模型的建模思路细节与大家分享一下吧! 手机充值业务是一项主要电信业务形式, 客户的充 值行为记录正好满足 RFM模型的交易数据要求。根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标:最近一次消费(Recency)、消费频率(Frequency)、消费金额(Monetary)。我早期两篇博文已详述了RFM思想和

2、旧M Modeler操作过程,有兴趣的朋友可以阅读!RFM模型:R(Recency)表示客户最近一次购买的时间有多远,F(Frequency)表示客户在最近一段时间内购买的次数,M (Monetary)表示客户在最近一段时间内购买的金额。般原始数据为3个字段:客户ID、购买时间(日期格式)、购买金额,用数据挖掘软件 处理,加权(考虑权重)得到RFM得分,进而可以进行客户细分, 客户等级分类,CustomerLevel Value得分排序等,实现数据库营销!重要挽留宣户重要发展舂尸M个这里再次借用数据挖掘与数据分析的 RFM客户RFM分类图。本次分析用的的软件工具:旧M SPSS Statist

3、ics 19 , RM SPSS Modeler14.1 , Tableau7.0 ,EXCEL 和 PPT因为RFM分析仅是项目的一个小部分分析,但也面临海量数据的处理能力,这一点对计算机的内存和硬盘容量都有要求。先说说对海量数据挖掘和数据处理的一点体会:(仅指个人电脑操作平台而言) 一般我们拿到的数据都是压缩格式的文本文件,需要解压缩,都在G字节以上存储单位,一般最好在外置电源移动硬盘存储;如果客户不告知,你大概是不知道有多少记录和字段的; Modeler挖掘软件默认安装一般都需要与C盘进行数据交换,至少需要 100G空间预留,否则读取数据过程中将造成空间不足海量数据处理要有耐心, 等待3

4、0分钟以上运行出结果是常有的现象,特别是在进行抽样、合并数据、数据重构、神经网络建模过程中,要有韧性,否则差一分钟中断就悲剧了,呵呵; 数据挖掘的准备阶段和数据预处理时间占整个项目的70% ,我这里说如果是超大数据集可能时间要占到 90%以上。一方面是处理费时,一方面可能就只能这台电脑处理,不能几台电脑同时操作;多带来不同,这是我一直强调的体验。所以海量数据需要用到抽样技术,用来查看数据和预操作,记住:有时候即使样本数据正常,也可能全部数据有问题。建议数据分隔符采用" |”存储;如何强调一个数据挖掘项目和挖掘工程师对行业的理解和业务的洞察都不为过,好的数据挖掘一定是市场导向的,当然也

5、需要IT人员与市场人员有好的沟通机制;数据挖掘会面临数据字典和语义层含义理解,在 MetaData元数据管理和理解上下功夫会事半功倍,否则等数据重构完成发现问题又要推倒重来,悲剧;,每次海量大数据挖掘工作时都是我上微博最多的时侯,它真的没我算的快,只好上微博等它,哈哈!传统RFM分析转换为电信业务 RFM分析主要思考:模型R(近度)F(岫M(呻营户最近一次莒户一定时期喜户一定时期传统的RFM模型购实距离分析内购娈该企业内购实该企业点的时何产品的次敌产品的履金额客户最后一次吾户一定时期客户一定时期电倍业RFMIS型交费跆圈分析内交费的次致内的交萄总颔点的时间这里的RFM模型和进而细分客户仅是数据

6、挖掘项目的一个小部分,假定我们拿到一个月的客户充值行为数据集(实际上有六个月的数据),我们们先用 旧M Modeler软件构建一个 分析流:硕"3"血疝m加乒讪心口数据结构完全满足RFM分析要求,一个月的数据就有 3千万条交易记录!/ £io 二 Edl 0 会MW.”i坦出 TMt A IC.OWrwordti n30402097 记录5ygryc.guIUldg5«3 心 32Q1 -()<-( r10*02M加网邮2Q11-W-91WQ21»34»9的仰5mo电9芯株函zan-«-gii地?mavj342011-

7、QC-01imirtoaOl w-flil1CMKJiwO?1W32SIMO2巧通巧坦8D1 UK-01IMO214173?"19210131却-0W 2011-flt-flT !0 lliiIMO101M02151174139网tl,网t1瑚?292211<2D 1 i-QJ1地20imi1W021451952 2*J155576201146-412D11-0-4T1WUIMO冲蚀姬却MSIMO2UE51t2292Q11-M-1T1H0?1西1花丽UEi1186H虻77殳施SDlMf-411J50 IMO1MQ71 邮gygM11-04-aiIMOmnn?细*IMO2J

8、87;E23?£6勃IF Ofi»0Ji 蛀22502Dn.fl-flilIMO湖沥剥酣201T农-归IMO21&2S75O062D11-l>£-0tmo加W2011 04-011瑚22»23«$5420TH-itIMO20 讦 0«4iK>#0:31 E:I El E4;H1 t!Ifll ElRFM模型的RFM汇总节点和RFM 分析节点产生 R(Recency)、F(Frequency)、M (Monetary);J0匕 | 上助 9 i 就taw fl 5.鸟 5屋TjiHff - I*击一覆 9CO isK

9、Cnd!" 711jtQO3J_21I3H4JD3)3SQ9Q32igiEJ«»51T4IGOCWI枷心6枷10graaat14i1WiJTO3072731t4jjHfi1?$2-511E453T013St231(44130iimHSKM171MUrT2-5 3164222722CCOOSHE 遇&登 4?43*000JJ2-li 1M4K27tii20000J<El臼Wt7s1721114441181订115泗K皤1735000a2191M43JI5121项珈JLHIHHO>R!-_JrO =时寻#nry U"血rvh ltf I

10、二处B曲LiLil力LI二打i.bl Liy:二LTklLJ:LijTj接着我们采用RFM分析节点就完成了 RFM模型基础数据重构和整理;T»*http; / /5打打打尹亚15上1,5口暗就皿1皿由现在我们得到了 RFM 模型的 Recency_Score、Frequency_Score 、Monetary_Score 和RFM_Score ;这里对RFM得分进行了五等分切割,采用 100、10、1加权得到RFM得分 表明了 125个RFM魔方块。传统的RFM模型到此也就完成了, 但125个细分市场太多啦无法针对性营销也需要识别客 户特征和行为,有必要进一步细分客户群;另外:RFM

11、模型其实仅仅是一种数据处理方法,采用数据重构技术同样可以完成,只 是这里固化了 RFM模块更简单直接,但我们可以采用 RFM构建数据的方式不为 RFM也可 用该模块进行数据重构。Tableau软件进行描述性分析:(数据挖掘软件在描述我们可以将得到的数据导入到 性和制表输出方面非常弱智,哈哈)PagesColumnsFiftersMirks-t«- Automatic Text* i SUM (Numb,.Color* I She I:) I0-Level of 蚀切IR.EHVSRecency ScoreMonetiry ScoreScoreRecwcy ScortLfgnrtury

12、 Score1234E1iwess m3117 245UJCrft桃226,8911473779 IDJ*9131.8B73nr m12 3A&41.0211&1891.184夸13428056IflSM15,&574-J7251410725 6011S.9727286.86371li: 263 96611:14 117.S392m网I7t 1Uir.mt-.2M5.5Y13BO 6+414 IB?170 AM6S.722S.44941S61243 0767773C757561® S5S55 509” w43削r.36932 049311CB.28566

13、63;3SIQ 751E.0012.BE7 *3.319170.2MX.43910.娜319.41 D7763isi.ces117,71611D7445-21224 B7BS61D614M456 42&62 30210 119n.572如却14175一 STB44 6339歹317504.0岖,2.0196130121.M6H物w伯312.4505.6531IS.01111:79625.S1T4.还1795871.177162.006tD5_25351 6237 4093O.3&58f,S?8250 5£40 839243355.907S978XQ672LU5柘蜘S8

14、 1731G.0B420.1A23raras3 13268 TW6f.1Z1Z4.4414Z.-DZt11JBS74223d1 CHE,30136_3ff0S,httpojic/ujeutj我们也可以进行不同块的对比分析:均值分析、块类别分析等等PagesColumns_ Frequency ScoreRaws咆吹丫 SwrvM<?rwtarY ”僧 IFiltersMarki,-bc Automatic*Test. (AJ/fi(Mowt-Cobrf "G(wh“ 1Size-1-CHLevcf Dm*IFtetfusncy ScoreRecEncy Sc- Monetary

15、 Sc.12346M% U? i 1 '-Ha * " * Ja r r£3 =气 f 3二二:.二£ f,:二*4 = :=-1 j j- -.5 i. .j ;)*5-*. j j jf-:-: EllAqM如 I 1 fi j 7- . -. r1 - L、I 7 : J ?;£3 '; f :-干'-4 _.尬.:亲4 =124:.它£76:=72-V:. ?-二:E 5:.S5439.704ArG(vourheH£' E血 i31M A4一;.、-M 理bt:E 3r 1=.:*'3,

16、;Tfi.eCT强,31941Sh 口区 F亦口。.邸 3 sjhm 陌门这时候我们就可以看出Tableau可视化工具的方便性接下来,我们继续采用挖掘工具对R、F、M三个字段进行聚类分析,聚类分析主要采用:Kohonen、K-means 和 Two-step 算法:曲huciJ力lu小旬述甲匚um这时候我们要考虑是直接用R(Recency)、F(Frequency)、M (Monetary)三个变量还是要进行变换,因为R、F、M三个字段的测量尺度不同最好对三个变量进行标准化,例如:Z得分(实际情况可以选择线性插值法,比较法,对标法等标准化)!另外一个考虑:就是R、F、M三个指标的权重该如何考虑

17、,在现实营销中这三个指标重要性显然不同!有资料研究表明:对 RFM各变量的指标权重问题,Hughes,Arthur认为RFM在衡量一个问题上的权重是一致的,因而并没有给予不同的划分。而 Stone,Bob通过对信用卡的实证分析,认为各个指标的权重并不相同,应该给予频度最高,近度次之,值度最低的权重;这里我们采用加权方法:WR=2 WF=3 WM=5 的简单加权法(实际情况需要专家或营销人员测定);具体选择哪种聚类方法和聚类数需要反复测试和评估,同时也要比较三种方法哪种方式更理想!下图是采用快速聚类的结果:gkf. M Stttrftoall CkHtfl1 ffikn a IE 1 H *«>* LcEBMql* IV irRallt-a Qrflor jIOJIIC-'/ibhri?jsiijl i£D;hj<bJjyLihjLurrj以及kohonen神经算法的聚类结果:O K J"

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1