数据挖掘技术在提升电信业欠费控制能力上应用.doc

上传人:rrsccc 文档编号:10457758 上传时间:2021-05-17 格式:DOC 页数:9 大小:79.50KB
返回 下载 相关 举报
数据挖掘技术在提升电信业欠费控制能力上应用.doc_第1页
第1页 / 共9页
数据挖掘技术在提升电信业欠费控制能力上应用.doc_第2页
第2页 / 共9页
数据挖掘技术在提升电信业欠费控制能力上应用.doc_第3页
第3页 / 共9页
数据挖掘技术在提升电信业欠费控制能力上应用.doc_第4页
第4页 / 共9页
数据挖掘技术在提升电信业欠费控制能力上应用.doc_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《数据挖掘技术在提升电信业欠费控制能力上应用.doc》由会员分享,可在线阅读,更多相关《数据挖掘技术在提升电信业欠费控制能力上应用.doc(9页珍藏版)》请在三一文库上搜索。

1、数据挖掘技术在提升电信业欠费预测及控制能力上的应用摘要:数据挖掘是目前发展迅速、应用广泛的一种从海量数据中抽取出潜在的、有价值的知识的过程。基于数据挖掘技术海量数据提取和知识发现的特点,本文主要基于数据挖掘技术在提升电信业欠费控制能力上进行分析与研究。基于电信客户是理性的和经济的这一基本前提,可以采用决策树,神经网络,关联规则分析等数据挖掘算法和统计分析技术,通过对电信客户的历史业务行为进行深入分析,从而预测其在未来时间的欠费倾向。 关键字:数据挖掘 欠费 预测引言 欠费问题是困扰通信行业的主要难题之一,长期居高不下的欠费用户量不仅关系到运营商的切身利益,更影响消费行业的平衡运作,欠费金额的激

2、增不仅是对运营商切身利益的损害,更造成了国有资产的潜在流失,使国家蒙受损失。因此,追讨欠费是当前通信行业亟待解决的问题。虽然,现有电信业务经营分析过程中,根据业务人员在工作中积累的经验,已对部分欠费数据作出分析,如:欠费金额、欠费用户数、当月欠费用户数、逾期欠费用户数等。但是,针对已发生欠费行为的用户做出分析,分析范围有限,不能达到控制欠费及预测欠费的目的,最终结果还是不停的追讨欠费。所以,做好电信欠费的防范工作,及早遏制欠费的发生才是当前一项紧迫且意义重大的任务,只有及时有效的预测欠费用户,才能有针对性的采取精准化营销措施,挽回这部分用户,进而控制欠费的发生,提升电信业自身对欠费用户的控制能

3、力。本文主要以欠费用户预测为研究主题,以提升欠费控制能力为目标,以神经网络算法和决策树分类算法作为理论支撑,展开深入研究。1、 基本原理1.1 设计思想研究过程主要以客户的历史业务行为为依据,预测其在未来时间的欠费倾向。在模型建设完毕后,只要输入该客户的相关数据变量即可根据模型输出结果判断其在未来时间的欠费概率,从而采取相关控制行为。如下图所示:输 入欠费概率(0.87)输 出29全球通347元/月长春男图一 欠费用户预测模型效果图1.2 算法原理 基于上述设计思想,在具体应用过程中主要用到的数据挖掘算法有神经网络算法和决策树算法。神经网络算法的实施过程是由输入变量至输出变量的一个数据清洗沉淀

4、过程。输入层结构由输入变量(属性)来定。每个属性为一个输入结点。输出层结构由输出结果来定。有几个输出值,就有几个输出结点。隐藏层 层数和结点数点的确定:主要靠经验。初始权值的确定:取决于对问题的了解和先验知识,哪部分作用强,权值就设得大些。训练过程:一个神经元连接权重调整的过程。前向传播阶段:输入层隐层输出层,反向传播阶段:计算输出的结果和目标结果的差距 经输出层隐层输入层 ,反推神经元连接的权重调整,对每个输入样本重复上述步骤,直到网络收敛为止。决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。

5、本质上决策树是通过一系列规则对数据进行分类的过程。决策树算法构造决策树来发现数据中蕴涵的分类规则如何构造精度高、规模小的决策树是决策树算法的核心内容。决策树构造可以分两步进行。第一步,决策树的生成:由训练样本集生成决策树的过程。一般情况下,训练样本数据集是根据实际需要有历史的、有一定综合程度的,用于数据分析处理的数据集。第二步,决策树的剪技:决策树的剪枝是对上一阶段生成的决策树进行检验、校正和修下的过程,主要是用新的样本数扼集(称为测试数据集)中的数据校验决策树生成过程中产生的初步规则,将那些影响预衡准确性的分枝剪除。2、 模型设计2.1 变量选取选取某月某地区欠费用户的业务行为数据作为研究样

6、本,采用神经网络算法思想挖掘欠费用户的业务行为特征。可建立以下变量:a) 通话消费进度 b) 总消费进度 c) 最大/小缴费金额 d) 用户剩余免费时长 e) 呼叫主要集中的时段 f) 短信主要集中的时段 g) 查询话费次数 h) 在网时长i) 通话消费频率j) 总消费频率验证变量选取的代表性。如:我们对某一欠费用户在一个月中的通话行为进行日分析,可看出该用户的通话消费进度,如下图所示:图二 欠费用户通话消费进度图可见该用户属于月末突击消费的类型,该类型用户欠费可能性极大。下图为所选样本中某个用户的消费进度图,可见该用户属于消费较少的用户,且月末也有突击消费现象存在。图三 消费进度图2.2 利

7、用神经网络算法挖掘欠费用户特征将已准备好的变量集由输入层输入,经由隐含层对数据作出处理后,传到输出层。如果输出层输出的信号与期望的输出不符,则反向传播。误差的反向传播是将实际输出与期望输出之间的误差以某种形式通过隐含层再向输入层反传,并且在反传的过程中,将误差分摊给各层的所有单元,用来获得各层单元的误差信号,用这个误差信号去修正各单元的连接权,然后再进行信号的正向传递,这种信号正向传递和误差的反向传播的过程是周而复始地进行,连接权值也相应不断地进行调整,这个过程就是网络学习训练的过程,直到网络输出的误差足够小或者达到了我们的预设值,或者进行到预设的学习次数,网络的学习训练才结束。对输出层得到的

8、数据结果进行分析,该结果集即为欠费用户的特征集。2.3 利用决策树分类算法进行用户预测根据神经元输出结果中的欠费用户特征,对随机抽取的单用户业务行为数据进行分析,待分析的数据的范围大于或者等于上述特征集。根据决策树分类算法思想,分析该用户的业务行为数据是否满足上述特征集,如果满足即将其归为准欠费用户,业务人员需要采取相关营销策略争取这部分用户,尽量避免其欠费行为在当月月结时产生。反之,经过分析后,该用户的业务行为不满足上述特征集,那么该类用户属于正常在用用户,业务人员可以不采取相关营销措施。如下图所示以图形的表现形式,展现了决策树分类思想的流程图。当然,在模型建设的过程中,决策树算法多以多分支

9、形式的属性图结果展现,图四 决策树分类算法流程图3、效果评估 如下图所示为某一地区某月的用户数据:网别类型欠费用户数预测欠费用户数命中用户准确率3G手机173581140231800265706%3G-上网卡5770390028067194%2G8897576985074208546025%固定电话1070764877176441084304683%无线市话7902356693330705833%宽带13357799335573525773%公用电话3089197312446305%其他9456734548716631%小计2365017977974847086534814%可见预测模型还是能

10、够有效的预测出欠费用户,在模型使用的过程中仍需要不断的完善,使其对欠费用户预测的准确率上有所提升,从而实现该模型的更大价值。4、结束语本文主要基于数据挖掘算法中神经网络算法和决策树分类算法的算法思想,对样本数据集中海量的数据信息进行挖掘,从中挖掘出学习者从表象很难识别的内在数据特征,从而加以应用,以此作为用户分类的依据,从而实现用户预测的功能,可将这部分预测用户,用于OCS计费系统,实时监控这部分用户的计费波动,进而实现控制欠费。本文在模型设计与建设过程中,存在很多不足之处,在实践应用过程中还需继续完善。参考文献【1】 李别 基于神经网络的数据挖掘算法 广东技术师范学院学报 2005,(4)。【2】 胡小刚 数据挖掘中决策树分类算法的研究 华中师范大学 2002.12.1 。【3】【4】【5】【6】 【7】 (注:文档可能无法思考全面,请浏览后下载,供参考。可复制、编制,期待你的好评与关注)【8】【9】

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1