[算法,数据,问题]一种有效缓解数据稀疏问题的协同过滤推荐算法.docx

上传人:scccc 文档编号:13444621 上传时间:2021-12-26 格式:DOCX 页数:4 大小:68.61KB
返回 下载 相关 举报
[算法,数据,问题]一种有效缓解数据稀疏问题的协同过滤推荐算法.docx_第1页
第1页 / 共4页
[算法,数据,问题]一种有效缓解数据稀疏问题的协同过滤推荐算法.docx_第2页
第2页 / 共4页
[算法,数据,问题]一种有效缓解数据稀疏问题的协同过滤推荐算法.docx_第3页
第3页 / 共4页
[算法,数据,问题]一种有效缓解数据稀疏问题的协同过滤推荐算法.docx_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《[算法,数据,问题]一种有效缓解数据稀疏问题的协同过滤推荐算法.docx》由会员分享,可在线阅读,更多相关《[算法,数据,问题]一种有效缓解数据稀疏问题的协同过滤推荐算法.docx(4页珍藏版)》请在三一文库上搜索。

1、一种有效缓解数据稀疏问题的协同过滤推荐算法(摘要)传统协同过滤推荐算法依据共同评分项目计算用户相似度,进而产生推荐项目, 然而,随着用户和商品数量的不断增加,用户共同评分的项目会越来越少,甚至没有,因此 传统协同过滤推荐算法对用户之间相似度的衡量将会越来越不准确,从而影响推荐系统的性 能。针对这一问题,本文对用户相似度的计算方法进行了改进,提出直接相似度和间接相似 度的概念,同时引入关键人物权重,进一步提高推荐系统的准确性。(关键词)电子商务:推荐系统:协同过滤:直接相似度;间接相似度:关键人物DOI: 10. 3969/j. issn. 1008-0821. 2016. 03. 013(中图

2、分类号)TP301 (文献标识码)A (文章编号)1008-0821 (2016) 03-0076-04(Abstract) In traditional collaborative filtering reconraendation Algorithm, similarity of users is often calculated based on common ratings, and then the recommended items are produced. However» with the increasing number of users and product

3、s» the common rated items will be less and less» and even no. So the measure of the similarity of users will be more and more inaccurate» and thus it will affect the performance of the recommendation system.In order to solve this problem, the method of calculating the similarity of us

4、ers is improved and the concepts of direct similarity and indirect similarity are put forward. At the same time, in order to further improve the accuracy of the recommendation system, the key figure is introduced into the system.(Key wordsz e-commerce; recommending system: collaborative filtering: d

5、irect similarity; indirect similarity: key figures随着电子商务的迅速发展,电子商务网站平台的商品越来越多,同时相当多的用户面临 着海量的商品往往不知如何下手,必须花费大量的时间和精力来寻找所需的信息,因此智能 推荐系统在电子商务网站中尤为重要°协同过滤推荐是目前最好的一种推荐技术1,其根据 用户的评分数据进行项目推荐。传统的协同过滤推荐技术虽然一段时间内发挥了很大的作用, 然而随着电子商务网站规模的不断扩大,协同过滤推荐技术面临着众所周知的严重问题2: (1)“稀疏性”问题:用户-项目评价矩阵非常稀疏:(2) “冷启动”问题:一个新的

6、商品出 现时,用户对其评分会特别少,甚至没有,那么这个商品就不容易被推荐出去。另外,一个 新用户加入时,由于没有对任何项目进行过评价,系统就无法对其进行推荐。(3)“可扩展性” 问题:面对用户和商品数量的日益增多,系统的性能会越来越低。为了解决数据稀疏而导致的推荐结果不准确问题,许多学者提出了各自不同的方法。目 前常用的方法有以下几种:(1)数据填充:在计算用户相似性之前,首先对原始的用户-项目 评分矩阵进行填充,从而降低其稀疏性,提高推荐准确度。郝立燕等3根据原始矩阵中评分 数据的特征,采用SOFT-IMPUTE算法对评分矩阵进行填充,然后利用填充后的矩阵计算用户 相似性,进而做出推荐预测。

7、张玉芳等4采用分两步对原始评分矩阵进行填充的方法。首先 在利用传统协同过滤推荐算法寻找目标用户邻居集时,只考虑相似度比较高的用户作为目标 用户邻居,进而对评分矩阵进行第一次填充,然后将第一步填充后的矩阵作为新的用户-项目 矩阵,在此基础上进行第二次填充,此方法可以很好的解决数据稀疏问题。黄永锋等5在原 始评分矩阵基础上,首先根据用户访问过的项目的特征及访问频率对用户访问过但没有给出 评价的项目进行填充,从而降低原始评分矩阵的稀疏度,提高推荐准确性。(2)聚类技术: 在计算用户相似性之前,首先对用户或项目进行聚类,从而降低预测计算量,提高推荐质量。 黄国言等6及崔春生等7提出对用户进行聚类的方法

8、,前者根据用户对项目评分的相似性 对用户进行聚类,后者根据用户的兴趣度对用户进行聚类,进而分别在各聚类内部计算用户 相似性,产生推荐项目。吴潮等8提出对用户和项目两个方而分别聚类并互相结合的方法, 在已有聚类中寻找用户最近邻居集,实现对用户的推荐。(3)矩阵分解:对原始评分矩阵进 行分解,从而降低评分矩阵维数,提高推荐精确度。李改等9分析了传统的矩阵分解模型 (SVD)的弊端,并对其进行了改进,提出了带正则化的基于迭代最小二乘法的矩阵分解方法, 此方法提高了传统推荐算法的抗稀疏性。杨阳等10提出增量奇异值矩阵分解的方法,对评 分矩阵进行梯度分解,从而有效的解决矩阵稀疏的问题。以上几种方法均在一

9、定程度上缓解了评分矩阵的稀疏性问题,并取得了一定的成果,但 在计算用户形似度进而寻找最近邻居集时,仍局限于用户共同评分项目,而大多数用户共同 评分项目极少,此时用户相似度的计算只受几个项目评分的影响,计算结果很容易出现偏差。 尤其当用户兴趣爱好一致但不存在共同评分项目时,系统则无法计算其相似性。针对这一问 题,本文对传统协同过滤推荐技术中计算用户相似度及产生推荐项目的方法进行改进,使用 户相似度的计算不再仅仅依据用户共同评分项目,同时兼顾用户未评分项目,并引入关键人 物权重,进而进一步提高推荐质量。1传统协同过滤推荐算法协同过滤推荐算法的主要思想是,利用现有用户群过去的评价数据来预测当前用户的

10、购 买意向3。这种方法的潜在假设是,如果某些用户对一些项目的评价相似,那么他们对其他 项目的评分也是相似的。通过相似性计算发现和当前用户相似的N个近邻,根据兴趣相似的 用户群的评价,计算产生对某些项目的预测评分,最后根据预测值将排名最前的k个项目推 荐给当前用户。算法一般分为3步:建立用户-物品评分矩阵,计算用户相似度并寻找近邻 集,产生推荐项目11。11建立用户-物品评分矩阵推荐系统经常利用用户对已购买物品的评分作为推荐系统的数据源,一般定义用户集 U=UL U2,Um,物品集定义为1=口, 12,,In,通常用户-物品评分矩阵用矩阵Rm Xn来表示,其中的每一项Rij表示第i个顾客对第j个

11、商品项的评价值12,通过获得的 评价值来反映顾客的购买兴趣。通常以15表示用户对物品的偏好程度,没有评分的项目用 0代替。12计算用户相似度并寻找近邻集在这一步先计算用户之间的相似度,然后根据相似度寻找到用户的最近邻居集。在协同 过滤推荐系统中,确定相似用户集,一般采用的方法是Pearson相关系数3。给定评分矩阵 R,用户a和用户b的相似度sim (a, b)可以用公式(1)来表示。由以上实验结果可以看出,本文所改进的推荐算法,对推荐结果有明显的改善。随着目 标用户最近邻居数目的增加,虽然两种推荐算法的MAE值都呈下降趋势,但当邻居数较多时, 本文推荐算法的优势越来越明显,推荐结果更加准确。

12、由此可见,本文所提出的协同过滤推 荐算法可以增强推荐系统的抗稀疏性,提高推荐系统的推荐质量。4结论随着电子商务网站的迅速发展壮大,智能推荐系统在电子商务网站中发挥着越来越重要 的作用,而推荐算法决定了推荐系统的性能。计算用户相似度是协同过滤推荐算法中最为关 键的一步,本文在计算用户相似度时充分考虑直接相似度、间接相似度以及关键人物权重三 个方而因素,实验结果证明,本文所改进的计算用户相似度的方法比传统的计算方法更合理 更准确。尤其对于评分项目极少的用户,可以根据间接相似度寻找其近邻集,进而产生推荐 项目。因此本推荐算法不仅可以很好的解决评分矩阵数据稀疏问题,同时还可以在一定程度 上缓解系统冷启

13、动问题。参考文献1许海玲,吴潇,李晓东,等.互联网推荐系统比较研究J.软件学报,2009, 20 (2): 350-362.2夏建勋,吴非,谢长生.应用数据填充缓解稀疏问题实现个性化推荐J.计算机工程 与科学,2013, 35 (5): 15-19.3郝立燕,王靖.基于填充和相似性信任因子的协同过滤推荐算法J.计算机应用,2013, 33 (3): 834-837.4张玉芳,代金龙,熊忠阳.分步填充缓解数据稀疏性的协同过滤算法J.计算机应用 研究,2013, 30 (9): 2602-2605.5黄永锋,草罗春.一种有效缓解协同过滤推荐评价数据稀疏问题的算法J.东华大学 学报:自然科学版,20

14、13, 39 (1): 83-87.6黄国言,李有超,高建培,等.基于项目属性的用户聚类协同过滤推荐算法J.计算 机工程与设计,2010, 31 (5): 1038-1041.7崔春生,吴祈宗,王莹.用于推荐系统聚类分析的用户兴趣度研究J.计算机工程与 应用,2011, 47 (7): 226-228.8吴潮,王永吉,王哲,等.两阶段联合聚类协同过滤算法J.软件学报,2010, 21(5): 1042-1054.9李改,李磊.基于矩阵分解的协同过滤算法J.计算机工程与应用,2011, 47 (30): 4-7.10杨阳,向阳,熊磊.基于矩阵分解与用户近邻模型的协同过滤推荐算法J.计算机应用,2012, 32 (2): 395-398.11曾庆辉,邱玉辉.一种基于协作过滤的电子图书推荐系统J.计算机科学,2005, 32 (6): 147-150.12刘东辉,彭德巍,张晖.一种基于时间加权和用户特征的协同过滤算法J.武汉理工 大学学报,2012, 34 (5): 144-148.13刘庆鹏,陈明锐.优化稀疏数据集提高协同过滤推荐系统质量的方法J.计算机应 用,2012, 32 (4): 1082-1085.14郭均鹏,王启鹏,宁静,等.基于符号数据与非负矩阵分解法的混合推荐算法J.系 统管理学报,2015, 24 (3): 372-378.(本文责任编辑:孙国雷)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1