关联规则在通信告警分析中的应用研究.docx

上传人:rrsccc 文档编号:8909518 上传时间:2021-01-24 格式:DOCX 页数:2 大小:13.21KB
返回 下载 相关 举报
关联规则在通信告警分析中的应用研究.docx_第1页
第1页 / 共2页
关联规则在通信告警分析中的应用研究.docx_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《关联规则在通信告警分析中的应用研究.docx》由会员分享,可在线阅读,更多相关《关联规则在通信告警分析中的应用研究.docx(2页珍藏版)》请在三一文库上搜索。

1、关联规则在通信告警分析中的应用研究摘要:随着收集和存储在数据库中的数据规模越来越大,人们对从这些数据中挖掘相应的关联知识越来越有兴趣。移动通信网络监控告警的结构化数据从形式上来说是一种多维数据,对于这类数据如何有效地进行关联规则的挖掘,是本文深入研究探讨的一个问题。关键词:关联规则;通信告警;数据挖掘;序言 关联规则是表示数据库中一组对象之间的某种关联关系的规则,关联规则挖掘的主要对象是交易(Transaction)数据库。这种数据库的一个主要应用是零售业,比如超级市场的销售管理。条形码技术的发展使得数据的收集变得更容易、更完整,从而可以存储大量的交易资料。关联规则就是辨别这些交易项目之间是否

2、存在某种关系1。这种关联规则提供的信息可以用作商品目录设计、商场货架的布置、生产安排、具有针对性的市场营销等。 1.关联规则挖掘概述 1.1挖掘关联规则的步骤 (1)根据最小的支持度,在大量事务寻找高频率出现的频繁项集(Itemset)。 (2)根据最小的置信度,找到的频繁项集产生关联规则。 其中第二个步骤比较容易,一般经过第一步的筛选后的频繁项集都不会很多,通过子集产生法就可以产生关联规则。 1.2关联规则挖掘的分类 市场购物分析仅仅是一种关联规则挖掘的应用。事实上,有许多不同类型的关联规则知识挖掘。可以根据以下标准对这些关联规则挖掘方法进行分类: (1)根据关联规则所处理的具体值来进行分类

3、划分 若一个规则仅描述“数据项是否出现”这种情况间的联系,那么这种关联规则就是一个布尔关联规则。若一个规则描述的是定量数据项(或属性)之间的关系,那么它就是一个定量关联规则,在这些规则中,数据项(或属性)的定量数值可以划分为区间范围。 (2)根据规则中数据的维数来进行分类划分 若一个关联规则中的项(或属性)仅涉及一个维,那么它就是一个单维关联规则。若一个规则涉及两个或更多维,那么它就是一个多维关联规则挖掘。 2、应用于通信告警表单的 Apriori 算法改进 至今已提出了许多 Apriori 算法的改进方法。本文对通信告警表单关联规则挖掘的算法采用的正是添加了如下改进技术的Apriori算法。

4、 2.1哈希(hash)表技术 利用hash表技术可以帮助有效地减少候选k-项集Ck( k1)所占用的空间。 本实验中,在结构化数据中的4个属性(告警时间,设备类型,告警种类,告警等级),我们用符号 I xy 代表第x个属性的第y个选项,如 I12代表“告警时间”属性中的选项“evening busy time”,I23代表“设备类型”属性中的选项“transcoder”等。就组合而言2-项集共有33+44+12+12+12+12=73种。对一个2-项集 I x1y1Ix2y2,定义一个 hash 函数h(x,y)=(x1+x2)10+(y1+y2)mod73,之后,在扫描表单数据库以便从候选

5、1-项集 C1 中产生 1-频繁项集 L1 时,就可以为每个表单数据产生所有的 2-项集并将它们哈希到hash表的不同栏目中,且增加相应栏目的计数。 2.2数据划分 利用数据划分技术来挖掘频繁项集而只需扫描整个数据库两次。它包含两个主要处理阶段。第一阶段,算法将表单数据库D分为n个互不相交的部分;若数据库D中的最小支持阈值为min_sup,那么每个部分所对应的最小支持频度阈值为: min_sup number_of_transaction_of_partition 对于每个划分(部分),挖掘其中所有的频繁项集;它们被称为是局部频繁项集,利用一个特别的数据结构记录包含这些频繁项集的表单记录的TI

6、D,以便使得在一次数据库扫描中就能够发现所有的局部k-频繁项集,k=1,2,。 就整个表单数据库D而言,一个局部频繁项集不一定就是全局频繁项集;但是任何全局频繁项集一定会出现从所有划分所获得的这些局部频繁项集中。 3、通信告警表单的多维关联规则挖掘 如果在表单数据库中的数据是以多维形式定义存储的,那么就不能使用简单的单维布尔关联规则挖掘方法了。包含两个或更多的谓词的关联规则就称为多维关联规则2。我们的通信告警表单数据库记录了数据的属性信息,包括告警时间,设备类型,告警种类,告警等级等。将表单数据库中的这些属性看成谓词,那么挖掘包含多个谓词的关联规则是很有价值的。如: Time(X,”morni

7、ng busy”)equipment type(X,”transcoder”)alarm kind(X,”linkFailure Event”) 事实上,这种方法可以用于一切非连续型数据的关联规则挖掘,因为在求1-频繁项集的时候我们就对其作了一定限制,而上述Apriori关联规则的挖掘算法从第3步之后的计算都会按照限制去计算,所以,我们可以得出一个结论,就是在求非连续型数据的关联规则挖掘问题中,都可以用以上适应性改进的Apriori算法求解。 结束语 本文根据移动通信网络监控告警结构化数据的具体形式,对经典的Apriori 算法作了应用于移动通信网络监控告警的适应性改进,采用改进后的Apriori 算法对移动通信网络监控告警结构化数据进行了数据挖掘,从而证明了关联规则挖掘算法应用于通信告警数据分析中的可能性及必要性。 参考文献 【1】 刘强,杨岳湘,黄高平. 一种基于相关度统计的告警事件关联算法. 计算机应用与软件,2010,(06) 【2】 吴萍,朱东来. 网络告警关联规则挖掘系统的研究与设计. 计算机应用与软件,2008,(03) 【3】 沈云斐,李丹,陶琨,覃征. 基于关联规则和情景规则的网络告警分析模型. 小型微型计算机系统,2007,(02)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1