基于Web使用挖掘的电子商务个性化服务研究.doc

上传人:rrsccc 文档编号:8877063 上传时间:2021-01-22 格式:DOC 页数:7 大小:128.50KB
返回 下载 相关 举报
基于Web使用挖掘的电子商务个性化服务研究.doc_第1页
第1页 / 共7页
基于Web使用挖掘的电子商务个性化服务研究.doc_第2页
第2页 / 共7页
基于Web使用挖掘的电子商务个性化服务研究.doc_第3页
第3页 / 共7页
基于Web使用挖掘的电子商务个性化服务研究.doc_第4页
第4页 / 共7页
基于Web使用挖掘的电子商务个性化服务研究.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《基于Web使用挖掘的电子商务个性化服务研究.doc》由会员分享,可在线阅读,更多相关《基于Web使用挖掘的电子商务个性化服务研究.doc(7页珍藏版)》请在三一文库上搜索。

1、基于Web使用挖掘的电子商务个性化服务研究第28卷第8期武汉理工大学学报信息与管理工程版Vol. 28 No. 8 2006年8月OURNALOF WUT(INFORMATION &M ANAGEMENT ENGINEERING) Aug.2006 文章编号:1007-144X(2006)08一0114一04基于Web使用挖掘的电子商务个性化服务研究刘建涛(武汉理工大学管理学院,湖北武汉430070) 摘要:基于国内外最新研究成果对电子商务中个性化服务的Web使用挖掘进行了深入研究。介绍了个性化服务系统的内涵,提出了Web使用挖掘的基本过程和关键技术,围绕模式识别,研究了其中的一些关键

2、的数据挖掘技术与算法。最后针对电子商务的个性化服务提出了基于Web使用挖掘的体系结构,并对其工作流程进行了简略的介绍。关键词z电子商务;Web使用挖掘P个性化服务中国法分类号:F270.7文献标识码:A银行的个人网上银行的登录界面。最左边的个性1引言化定制栏是个人根据自己的需求来添加各种服在网络环境下,个性化信息服务逐渐成为信务,选择的结果就显示在个性化定制栏里,这样方息管理领域中一个新的研究热点,并且日益受到便用户进行有个性化的查询和操作。社会的关注。个性化信息服务涉及到信息服务理然而另外一种更加有效、自动化程度更高的.念、服务方式、服务机制的变化以及相关的技术、方法是系统根据当前用户的浏览

3、模式来动态调整政策与外部环境的支撑。随着近几年的发展,个性站点结构与内容,根据用户的行为特征为其提供化信息服务已经被广泛应用到很多领域,出现了个性化服务,如推荐用户可能感兴趣的内容,或者各种各样的个性化信息服务的形式,如个性化导在电子商务中为用户推荐可能会购买的商品等。航、个性化网站以及个性化图书馆等。尤其是在电这里指的是后者,具体的内容包括网站结构的分子商务领域,根据不同用户的特点对用户进行个析和改进,用户的分组和用户组特征提取,确定推性化服务,以吸引更多的访问者成为自己的客户,荐内容等。这种技术普遍使用了数据挖掘的原理提高已有客户的忠诚度,增强网站的交叉销售能或思想,使站点呈现给用户的内容

4、不再千篇一律,力,已经成为许多电子商务企业追求的目标。而是更加方便,内容也更为丰富。2 个性化服务系统3 电子商务中Web使用挖掘个性化服务是指针对不同用户提供不同的服3. 1 Web使用挖掘分析流程务策略和服务内容的服务模式,其实质就是以用Web使用挖掘lJ是从用户的网络行为中抽户需求为中心的Web服务。一般来说,任何可以取用户感兴趣的模式。通过对用户浏览网站的使使网站服务更适合用户访问特征的措施,都可称用数据收集、分析和处理,建立起用户行为和兴趣为网络服务个性化。个性化服务在早期时,往往是模型,这些模型可以帮助理解用户行为,改进站点一种静态的概念,它包含在站点的定义中:用户通结构以及为用户

5、提供良好的个性化信息服务。由过注册申请一块定制的区域,里面包含用户需求于个性化推荐所面临的关键问题是需要对大量非信息的定义,每次用户兴趣的改变通过更新个人注册用户的行为模型进行深层理解,传统的协同定义信息来实现。如图1所示,它是一个中国工商过滤方法很难处理非注册用户的情况,Web使用收稿日期:2006-04-10. 作者简介:刘建涛(1976一),男,陕西安康人,武汉理工大学管理学院硕士研究生.第28卷第8期刘建涛3基于Web使用挖掘的电子商务个性化服务研究115 A 、一、飞i口-、t;一飞.卢 血 、队、泸川h川气卢飞、丸飞、气山Ii,、 B叶川抽惰;忡罐出量.耀自首页l争.?liI 1;

6、 rUi 申国工商银行金融寂-i?-声肝号:l旦理旦旦旦旦旦强国血描叫知附费:仨37FFiT二三-;-i iF1 P: I翩翩320216刷1附96391d强崎种:仄隔一百?汇;辑:些丁:到.;重曰图1中国工商银行个人网上银行的登录界面挖掘能较好处理这类问题;同时,借助于Web使果紧密相关,其内容包括:用挖掘可以从传统的基于使用数据的静态建模转(1)数据净化。主要任务是去除原始数据中的换到基于用户操作行为的动态建模,在系统里帮;脏数据;,即那些与挖掘无关,甚至有可能影响挖助改善用户的网络使用经验。因此,基于Web使掘结果的数据。同时也要对数据的属性进行必要用挖掘建立的个性化系统是实现良好个性化

7、服务的删除,只留下与挖掘相关的数据属性。的一个有效途径。(2)用户识别。包括如何在海量的数据中找出Web使用挖掘的基本步骤为z数据收集,数属于同一用户的记录;如何在用户访问时认出该据预处理,模式识别,模式分析,其分析流程如图2用户,以便迅速找出对应该用户的挖掘结果和推所示。荐集。用户识别是后续步骤有效性的重要前提,也是Web挖掘的难点之一。(3)会话识别。将用户访问信息按照一定时间段(例如每小时)进行划分,每一时间段内的用户访问集合作为一个用户会话。会话识别的意义在于可以将不同时间段内的用户访问区分开,而不图2Web使用挖掘的分析流程至于将时间间隔很长的2次用户访问看作一次。3.2 数据收集(

8、4)事务识别。用户会话是Web日志挖掘中数据收集就是要记录用户访问行为,主要方惟一具备自然事务特征的元素,但是,可能它对于式有:某些挖掘算法来说粒度太粗,需要利用分割算法(1)在服务器端进行数据收集。用户的访问行将其转化为更小的事务,这里只是借用了;事务;为被Web服务器自动记录于Web日志文件中,也的叫法,也称作情景识别。常用的事务分割方法可利用服务器应用程序进行收集等。Web日志文有:引用长度、最大向前路径和时间窗口。件是Web使用记录挖掘的主要数据来源。(5)路径补充。在Web日志中记录的用户访(2)在客户端进行数据收集。目前客户端的数问信息有些是不完整的。例如,当用户通过本地缓据主要依

9、靠远程Agent获得,可以通过Java或存访问网页时,在服务器端的日志中就不会有相avaScrip实现。应记录。这时可以采用一些启发性规则,结合网页(3)在代理端进行数据收集。也使用类似Web拓扑进行推理,补全用户访问路径巧。服务器的日志文件,记录Web页面请求和服务器3.4 模式识别的响应。然后要对预处理后的数据进行模式识别,即3.3 数据预处理实施挖掘算法。模式识别的基本方法有:原始数据需要经过处理后才能有效实施挖掘(1)统计分析。虽然严格来说统计不属于数据算法,数据预处理的质量与Web挖掘的效率和结挖掘的范畴,但是可以通过Web统计工具得到用116 武汉理工大学学报信息与管理工程版200

10、6年8月户平均停留的时间、平均访问路径长度、经常出错数据管理部分页面等有用信息。|用户注册信息|离线处理(2)关联规则,即发现给定的数据集中数据项If fim1t I 之间的有意义联系或相关联系。例如,访问A网页|交易数据库|的用户有多大比例同时也访问了B网页,如果该EE|3122 | Web日志| 比例超过给定值,就可以认为该关联规则是有意义的,下一次有用户访问A网页时,就可以将B网页推荐给他。对于商品推荐也可采用关联规则来在线处理发现知识。(3)聚类分析,即将物理或者抽象对象的集合分组成为由类似的对象组成的多个类的过程。属于同一个类的对象可以作为一个整体来对待。例如,如果通过聚类发现若干个

11、网页属于同一网页聚类,图3基于Web使用挖掘的体系结构当用户访问其中一页时,可推荐类中其他页面。又Web日志记录的是用户访问网站在服务器端留如,用户聚类中的用户具有相似的访问习惯或购物下的记录。一般的Web日志的内容包括:IP地址、兴趣,可以依此对他们提供相同的个性化服务。请求日期时间、方法(POST/GET)、被请求页面(4)序列模式,即发现用户在一定的持续时间的URL,HTTP版本号、返回码、传输字节数、用内的访问序列。例如,当发现有一定比例的用户购户使用的操作系统以及浏览器类型、页面请求的买甲商品后一个月又购买了乙商品,那么,当发现来源地等。购买了甲商品的用户时,可以在一段时间后向他为了

12、满足电子商务个性化服务的要求,根据推荐乙商品。电子商务的特点,还需要引入交易数据库、用户注(5)频繁访问组,即发现用户最频繁访问的路册信息等进行数据挖掘。交易数据库存放的电子径。例如,当发现用户经常顺序访问以下网页序列商务网站用户交易的情况,包括用户查询记录,用(A-B-C-D),那么,可以将D网页作为推荐链户的购物过程记录(用户将什么商品移入/移出购接直接放在A网页中,方便用户访问。物篮等),用户交易结果,另外还包括对产品的评(6)依赖建模,即发现一种表示各Web变量之间的依赖性的模型。通过该模型分析用户行为,预价,问卷调查结果等。这些信息丰富了数据挖掘所测用户后续动作,增加在线推荐的准确性

13、问。需要的可用信息。用户注册信息是指用户所登记3.5 模式分析的个人资料。这些交易信息、注册信息也是商品在模式分析的目的是根据实际应用,通过观察线推荐的主要数据来源。和选择,把发现的统计结果、规则和模型转换为知对于初次访问和未注册用户的访问行为,通识,经过筛选后用来指导实际的电子商务行为。开过统一分配一个匿名标识进行记录。针对这些记发各种Web分析技术和工具,可辅助分析人员加录的数据挖掘,可以采用IP地址识别用户。如果深理解并使各种挖掘方法得到的模式获得充分利IP地址相同,可以采用IP地址结合代理进行用户用。如webwiz(pitkow)系统可将的访问模识别。当2条记录的IP地址相同而代理不同

14、时,可式可视化;webminer则采用类SQL语言的知识以认为这2条记录来自不同的用户。查询机制;也可以利用存储Web使用数据的数据4.3 工作过程仓库,采用OLAP方法发现数据中的特定模式。通过图3可以看出,Web挖掘和在线推荐的特征获取和规则生成是离线处理的,而当用户访4 个性化Web使用挖掘体系结构问该网站时通过个性化智能Agent进行在线服4.1 Web使用挖掘的体系结构务。挖掘算法和推荐策略可以根据不同类型站点在电子商务个性化服务中,基于Web使用挖的要求来具体选择,挖掘结果和推荐集通过个性掘的体系结构如图3所示。化智能Agent反馈给用户。电子商务网站的会员4.2 数据来源用户登录

15、网站以后,其访问信息将会被记录到服Web使用挖掘的主要数据来源有Web日志4J务器端。这些数据将在经过预处理后,在专用的数第28卷第8期刘建涛:基于Web使用挖掘的电子商务个性化服务研究117 据挖掘模块中,通过具体的挖掘算法和推荐策略动跟踪用户访问行为,不需要用户提供主观的评来进行模式识别和模式分析。用户访问信息也会价信息,适合电子商务个性化服务的要求。随着电传到个性化智能Agent,Agent进行用户识别后,子商务的日益普及,对Web使用记录的处理也将根据用户的标识向挖掘模块抽取对应用户的挖掘不断受到人们的重视,而寻找更具有Robust的挖结果和推荐集,将其可视化地反馈给用户,达到个掘算法

16、以及如何对挖掘的结果进行更深层的评价性化服务的目的。采用Agent代理访问技术,将在正是目前研究的重点。线的挖掘和推荐工作交给个性化智能Agent去做,这样可以减轻Web服务器的压力,而且还可参考文献:以提高系统的智能化,使个性化服务具有自主性、lJ 夏火松.数据仓库与数据挖掘技术M.北京:科学自学习、应激性和合作性等特点。出版社,2004.对于初次访问和注册用户可以采用Web2J 水俊峰.面向智能Web站点的数据挖掘技术研究及GIS5技术进行电子商务个性化服务。来自同一应用D.武汉z武汉理工大学,2003.地点,如同一个城市、同一个社区的用户可能有相3J朱明.数据挖掘MJ.合肥:中国科学技术

17、大学出同或者相似的访问模式、交易习惯和消费兴趣等,版社,2002.而IP地址在一定程度上与地理位置相关。因此,4J WOON Y K, NG W K ,LI X. Efficient web log m?可以通过判别用户IP地址所在的地理范围,利用ining for product developmentC. In Proceedings 以前对应该IP地址地理范围的用户的挖掘结果,2003 International Conference 3 on Cyberworlds 来预测和估计该用户的访问习惯、消费行为等,对2003: 294-301. 其进行个性化服务,从而提高客户的成功率。5J

18、毛克彪.基于WebGIS的电子商务数据挖掘研究JJ.测绘学院学报,2003,20(3) :180-182. 5 结束语Web挖掘可以处理大规模的数据量,并且自Research 00 Persooalized Service of E -Commerce ased 00 ,布ebUsage Mioiog Liu Jiantao Abstract: Based on the latest researches, web usage mining applied in personalized service of e -commence is studied. Firstly, the conno

19、tation of personalized service is introduced. Then the basic process and critical technology of web usage mining are presented. Based on the mode identification, a mining algorithm is researched. Finally, an architecture of personalized service of e-commence based on web usage mining is put forward and the work flow is introduced. Key words: e -commerce; web usage mining; personalized service Liu Jiantao: Postgraduate; School of Management, WUT, Wuhan 430070, China. 编辑:王志全

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1