利用二次归并的Deep Web实体匹配方法.docx

上传人:rrsccc 文档编号:8908792 上传时间:2021-01-24 格式:DOCX 页数:2 大小:12.45KB
返回 下载 相关 举报
利用二次归并的Deep Web实体匹配方法.docx_第1页
第1页 / 共2页
利用二次归并的Deep Web实体匹配方法.docx_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《利用二次归并的Deep Web实体匹配方法.docx》由会员分享,可在线阅读,更多相关《利用二次归并的Deep Web实体匹配方法.docx(2页珍藏版)》请在三一文库上搜索。

1、利用二次归并的Deep Web实体匹配方法5.3DWEMM-TM与WEP方法的比较为了验证DWEMM-TM方法的有效性,将其与文献中的WEP方法进行比较,WEP方法的边权重采用JS(Jaccard Scheme)计算方式。DWEMM-TM与WEP的查准率、查全率和F值如表3所示。从表3可以看出,DWEMM-TM模型的查全率不及WEP方法,但查准率明显高于WEP方法,从综合指标F值来看,DWEMM-TM仍然优于WEP方法。DWEMM-TM与WEP的CPU执行时间如图3所示。从图3可以发现,DWEMM-TM和WEP均随着匹配对象数量规模的扩大而呈线性增长,但DWEMM-TM模型的增长速度更加缓慢一

2、些,其原因主要是由于DWEMM-TM模型的关系识别器MI采用了高效的删减策略与匹配方法,有效地缩减了匹配空间,大大减少执行代价相对较高的属性匹配器AM需要处理的数据量,从而获得了较好的运行效率。6结语Deep Web数据的迅速增长对实体匹配的效率和性能提出了更高要求。本文借鉴聚类思想,将实体匹配看作类簇归并过程,提出基于二次归并的Deep Web实体匹配方法DWEMM-TM,将不同的匹配关系分阶段交予不同的处理模块,使匹配逐渐精化,并通过引入自匹配,实现两次归并间的自动转接和不同匹配策略的自动选择。实验结果表明,DWEMM-TM方法在缩减匹配空间、降低复杂数据处理量和提高匹配精度方面有不错表现

3、,达到了性能与效率的双重提高。参考文献:【1】陈丽君,林怀忠.一种用于深层网接口集成的模式匹配方法.计算机工程,2012,38(12):42-44. (CHEN L J, LIN H Z. Pattern matching method for Deep Web interface integration . Computer Engineering, 2012, 38(12): 42-44.)【2】KPCKE H, RAHM E. Frameworks for entity matching: a comparison . Data & Knowledge Engineering,

4、2010, 69(2): 197-210.【3】HAN X, SUN L, ZHAO J. Collective entity linking in Web text: a graph-based method / SIGIR 11: Proceedings of the 34th Annual ACM SIGIR Conference on Research and development in Information Retrieval. New York: ACM, 2011: 765-774.【4】RASTOGI V, DALVI N, GAROFALAKIS M. Large-sca

5、le collective entity matching . Proceedings of the VLDB Endowment, 2011, 4(4): 208-218.【5】WANG Z, LI J, WANG Z, et al. Cross-lingual knowledge linking across Wiki knowledge bases / WWW 12: Proceedings of the 21st International Conference on Word Wide Web. New York: ACM, 2012: 459-468.【6】FAN J, LU M,

6、 OOI B C, et al. A hybrid machine-crowdsourcing system for matching Web tables / Proceedings of the 2014 IEEE 30th International Conference on Data engineering. Washington, DC: IEEE Computer Society, 2014: 976-987.【7】崔晓军,肖红宇,丁立新.基于距离的自适应Web数据库记录匹配方法.武汉大学学报(理学版),2012,58(1):89-94. (CUI X J, XIAO H Y,

7、DING L X. Distance-based adaptive record matching for Web database . Journal of Wuhan University (Science Edition), 2012, 58(1): 89-94.)LIU W, MENG X. A holistic solution for duplicate entity identification in deep Web data integration / SKG 10: Proceedings of the 2010 Sixth International Conference

8、 on Semantics, Knowledge and Grids. Washington, DC: IEEE Computer Society, 2010: 267-274.徐红艳,党晓婉,冯勇,等.基于BP神经网络的Deep Web实体识别方法.计算机应用,2013,33(3):776-779. (XU H Y, DANG X W, FENG Y, et al. Method of Deep Web entities identification based on BP network . Journal of Computer Applications, 2013, 33(3): 776-779.)出处:计算机应用

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1