基于标签技术和群体绩效评价的多媒体检索.doc

上传人:rrsccc 文档编号:8837618 上传时间:2021-01-19 格式:DOC 页数:22 大小:117.50KB
返回 下载 相关 举报
基于标签技术和群体绩效评价的多媒体检索.doc_第1页
第1页 / 共22页
基于标签技术和群体绩效评价的多媒体检索.doc_第2页
第2页 / 共22页
基于标签技术和群体绩效评价的多媒体检索.doc_第3页
第3页 / 共22页
基于标签技术和群体绩效评价的多媒体检索.doc_第4页
第4页 / 共22页
基于标签技术和群体绩效评价的多媒体检索.doc_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《基于标签技术和群体绩效评价的多媒体检索.doc》由会员分享,可在线阅读,更多相关《基于标签技术和群体绩效评价的多媒体检索.doc(22页珍藏版)》请在三一文库上搜索。

1、基于标签技术和群体绩效评价的多媒体检索 情报杂志 .第卷第期年月匝胍 .基于标签技术和群体绩效评价的多媒体检索?白劲波赵金楼 李泓波.哈尔滨工程大学经济管理学院哈尔滨;.黑龙江工程学院计算机科学与技术系 哈尔滨;.哈尔滨工程大学计算机科学与技术学院哈尔滨摘要多媒体文档的有效检索是现代企业实现知识管理和知识共享的关键,但目前对多媒体对象和内容的有效检索还没有令人满意的技术和解决方案。针对目前普遍采用的基于关键词的文档检索方法在多媒体文档检索中存在的问题,提出了基于标签技术和由企业中群体执行的绩效评价机制的多媒体检索问题解决方案,构建了引入绩效评价的文档管理平台标签系统的?模型,设计了文档管理平台

2、标签系统的业务逻辑,给出了标签绩效评价指标洲算方法。绩效评价和标签技术的有机结合有效保证了标签的数量和质量,检索的效率和质量会在系统的自学习、群体意识和群体知识库的知识发现过程中不断提高,可以满足绝大多数企业的日常需要。关词知识管理 多媒体检索标签技术绩效评价中圈分类号. 文献标识码 文章编号一一伽咀&砒蚰 诎野蛐色?.蛐 蚰啪廿伽 触?. 咖锄甥啪。缸鸭,.;缅 ;删把.叩咖 【釉船锄耐融她,佣柚 .地油 ;釉 做时.地曲抽他 陪姆。 .萨咖锹酬垤删雠似鲫萨删呦赋眦萨撕衙删蛔嗡一?伪。, 协鲫持触出 衄孵缸细枷 研珊啦盯骼讲眺 锄 ?他砸咄.嘲 即俗。弦?盯珥嚣咖罨置研 删 忸 也砌 ?鹤蛐

3、?蜘 切 忙 砸 ?昕,妇妯砖鹞 咖哪锄啦咖 . 啪伍 髂 曲匕纽 印辩把瞰眦础 醛柚 晌哪锄嘣 韶面. 鼬 伦吐 圮删盯瑚撇妞 .蚰啦嘧嘶柚协百怔虻幻 哆 乜出诵明 哆 呲酬 咖鸵卸唱。锄妇 吼撕 . 咐 母把咖蜥咖咖髓眦邓匿鹤.面刚删 龃删昀伽由萨删哪喀伽啪 盱釉柚育嘉薯薹墨芸嚣雹慧僦鬻竺荤世纪是知识经济的时代,企业管理中出现了诸 核心内容,其主要任务就是要管理好企业相关的智力修回日期:一一收稿日期:埘一基金项目:囡家自然科学基金。网络簟力及信息扩散机理研究”鳙号:。作者简介:白劲波一.女.博士研究生。副教授.研究方向:系统工程、数据挖掘等;赵金楼一。男,教授。博士生导师,研究方向:工业管

4、理与信息化、数据挖掘等;李泓渡一。男,博士研究生,研究方向:数据挖掘、机器学习等。万方数据情报杂志 第卷资本,充分实现知识的共享,提高企业的应变和创新能 应用于知识管理中文档管理平台的多媒体检索。目力。从内涵方面来说,知识管理就是以知识为核心的 前,类似的研究在国内外文献中还比较鲜见。管理,通过确认和有效利用已有的和获取的知识,并通解决方案设计思想及相关概念过对各种知识的连续性管理提高企业的创新能力和创造价值的能力,以满足企业现有的和未来开拓市场机 .解决方案设计思想按关键词进行检索仍然是目前最成熟、应用最广泛的检索方式。多媒体检索会的需要的一种过程?。其中,构建管理平台以实现文档的存储和管理

5、、文档挖掘与检索是知识管理的一 如果能够使用关键词检索技术并能保证较高的检索准确率,无疑是多媒体检索问题最可行、最经济的解决方个非常重要和具体的内容。文档管理平台上的信息检索是实现知识快速共享 案。利用多媒体的外部特征进行检索,虽然有着较低的检索准确率且检索结果很难揭示多媒体的内在内的一个重要途径。目前,一些大的公司和企业如、等都有自己的知识管理系统旧,并构建 容,但如果在外部特征的基础上补充对多媒体内容的了具有自身特色的文档管理平台。总的说来,现存的 文本描述当然,描述文本要客观、科学、全面,是多媒这些平台上的文档检索都是基于关键词的检索。随着 体内容的真实文本映像,然后再按关键词进行检索,

6、发展,企业积累了大量的文档。这些文档中不但存在 无疑会提高检索的准确率。多媒体外部特征及其内容文本描述基础上的关键词检索,正是本文的多媒体检着文本,还存在着视频、音频、图形、图像、驱等大量多媒体对象和内容。虽然传统的按关键词进行检索的 索问题解决方案的设计思想。根据既定的设计思想,容易看出如何进行多媒体方式依然在检索领域占据着统治地位,如、和百度的检索方式都是按关键词进行检索,但这 内容的转化是解决方案中非常关键的一环。如果要求种检索方式往往会忽视文档中多媒体的内在内容,检 知识管理部门将这些多媒体内容转化为文本即用文索结果的准确率往往比较低。对多媒体对象和内容的 本对媒体内容进行描述,不但工

7、作量大、成本高,而检索是学术界研究的难点和热点问题,目前还没有令 且管理人员不一定具备相应的专业知识,转化过程中人满意的技术和解决方案。本文的主要目的就是应用 的准确性、全面性和科学性也难以保证。为解决该问近年来比较流行的标签技术忙川并结合绩效管理机 题,本方案中引入了标签技术。.标签技术近年来,标签作为一个简单、实用制,提供一个解决知识管理中多媒体检索问题的切实可行的解决方案。 和灵活的方法越来越受到大家的重视并得到广泛应用。标签技术的主要原理为:由多个不同的主体对某相关工作简介些客体进行标注以表征客体的多维特征,表征出来的目前来看,多媒体检索的研究主要有两大方 多维特征富含大量潜在有用的信

8、息,这些信息可被进向驯:一个方向是基于多媒体外部特征的检索,另 一步提取、加工,并应用于一些特定的目的。标签技术已被应用于多个领域,常见的例子如即一个方向是基于多媒体内容的检索。多媒体的外部特时通讯工具中的好友印象描述。当我们把鼠标指征一般指的是媒体的名称、作者、创建时间、类型等。利用关键词检索技术只能对多媒体的外部特征进行检 向好友列表中的某个好友名字时,往往能看到别人对此好友的评价,这些评价由被评价者的好友给出,索,检索结果的质量难以保证。基于内容的多媒体检索直接对多媒体图像、音频、视频内容进行分析,抽 从而具有一定的可靠性,可被腾讯公司用于进一步的挖掘、分析如确定用户的年龄段、工作性质、

9、爱好倾取多媒体内容的特征和语义,利用这些内容特征建立索引库,并进行检索。具体地说,基于内容的检索主要 向等,以便于市场细分和进行有针对性的产品营销。再如,合作环境下的基于标签的信息发布对象选是利用媒体对象的语义、视觉特征、听觉特征和文本信息来进行检索,如图像中的颜色、纹理、形状,视频中的 择系统也是一个充分、灵活运用了标签技术的实例旧。该系统借助组织内部人员相互标注的标签,运场景、镜头运动,声音中的音调、响度、音色等旧“。由于基于内容的检索技术还很不成熟,检索准确率比较 用计算机技术提取标签内容并与从欲发布信息中提取低,所以该检索方式尚不能投入实际应用。 的关键词进行匹配,从而选出前个匹配分数

10、最高的目前,现代企业在面对多媒体检索问题时,只能采 人员作为信息发布的对象并发布邀请,这不但用前述的两种检索方式。为了克服这两种检索方式的 节省了大量的人力和物力,还为组织的其他应用奠定了基础。不足,本文基于标签技术和群体绩效评价机制,提出了一个新的多媒体检索问题解决方案。该方案将标签技 很显然,由于标签为多人从多个角度对某人进行术和由企业内群体执行的绩效评价机制有机结合,并 的描述,所以标签内容是他的一个具有一定可靠性、科万方数据第期 白劲波,等:基于标签技术和群体绩效评价的多媒体检索学性和完整性的多维特征文本映像。但在深入考察这 索,需要对平台中的所有多媒体文档记录其名称、类型、上传时间等

11、信息,并要为每一文档分配一个唯一标两个例子之后,我们容易发现这两个实例中还存在一识。为了统计每位员工添加标签的数量,需记录每位定的缺陷;进一步的考察还表明,类似的缺陷也存在于其他应用标签技术的系统中。这两个实例的缺陷主要 员工的相关信息,为每位员工分配一个唯一标识,并要对每位员工添加的标签进行记录。为了保证标签的质表现为两大方面。一个方面是对于标签的质量没有评量,任一员工添加的标签最终能否计入绩效要依赖于价机制。在即时通讯工具的例子中,虽然某个人的标签为好友所加,但其内容未必客观。例如,有些标 组织中其他成员对其所添加标签的评价支持或反对,因此为了评价标签质量,需要记录每个标签的支签中的内容存

12、在着吹捧、讨好,甚至戏谑性的诋毁成份。另外,有的标签则是由网上刚刚建立联系的网友 持票数和反对票数,对于反对票数超过一定比率的标所加,所加标签内容的可靠性又进一步打了折扣。由 签记为无效签,反对票数低于该比率的标签则记为有效签。在进行绩效得分测算时,从保护员工贴签积极此可见,这些标签的内容有些“失真”,有的可能是严重“失真”。类似地,的标签系统中也存在着类似 性的角度出发,对无效签不进行奖惩,只计算有效签。同时,考虑到绩效评价的相对合理性,为防止某一员工的问题:一个杂役可能会给一个比自己电脑知识多的在临近绩效评价时添加了一个不贴切的标签,其他员电工添加“ 刚”的标签。考虑电工所处的工还没来得及

13、反对即被作为有效签计人绩效,需要为周围环境?真正的 林立,当然有理由认为这样的标签也是“失真”的。毫无疑问,这些 标签的有效性设定一个追溯期限比如一个绩效评价“失真”的标签会导致岳续的挖掘和分析结果不准确、 周期,在计算绩效得分时不考虑仍处于追溯期的标签,为此,需要记录每个标签的添加时间。同时,对其受邀对象不正确等后果。另一个方面是对添加标签的行为没有激励机制。用户都有这样的体会,当用 他员工所添标签进行评价的员工,其评价行为对组织鼠标指向好友列表中的好友名字时,绝大多数好友的 知识共享目标的有效实现是有贡献的,应将其对其他成员所添加标签的有效评价即支持有效签和反对有名字后面都没有其相应描述,

14、即便有一些存在描述,描述的内容也很少。在的例子中,可以想见,由于 效签记人其最终的测算得分,为此,需要记录每位员对添加标签的行为没有相应的激励机制,一定会有一 工对于其他员工所添标签的支持记录和反对记录。根据以上分析,应用数据库设计规范,得些人未被添加标签或被添加标签的数量比较少。概括地说,标签评价机制的缺失易导致不科学、不客观的描 到引入绩效评价的文档管理平台标签系统的?模型如图所示。述,激励机制的缺失易导致描述的不完整。绩效评价是现代企业管理的重要机 员工员工制,不但可以对员工或部门的工作业绩、?姓名?性别工作行为等进行全面系统评价,而且可以?出乍日期 记录于 标签记录.提供激励机制以促成

15、组织目标的达成。?部门标识拌标签内容?十?入职期?添加时间用于为了克服标签技术应用中存在的标签质?职务?支持票数?电话?反对票数量没有评价机制和添加标签行为没有激。地址有效/无效。备注励机制两大缺陷,可以将标签质量和添加 用于标签数量作为评价指标纳入绩效评价体系,与员工的绩效工资、职级评定等挂钩,从而激发员工不断添加高质量标签的积极性,其具体措施和方法详见下一节。解决方案图 文档管理平台标签系统的?模跫.数据建模组织内成员为多媒体.业务逻辑为了实现通过标签对多媒体文档文档添加标签的数量和质量决定了文档检索的效率和的快速、准确检索,文档管理平台标签系统的主要功能质造。为了激励组织成员添加标签的积

16、极性,保证添包括标签添加、标签评价、标签排序,具体业务逻辑如加标签的质肇,本方案将每位员工添加标签的数量和下:质量的测算得分作为评价指标纳入绩效评价体系。为了,实现对文档添加一定数量的高质量的标签, .允许组织中的每个员工对任一文档添加标签。并最终利用这些标签实现多媒体文档的快速、准确检 系统将根据文档标识和标签内容检索标签记录,如果万方数据情报杂志 第卷没有重复内容,则将该标签记入标签记录;如果存在相 溯期仍标记为有效的标签;反对有效签指该员工投了同内容的标签,则需比对员工标识,如果员工标识不 反对票且在时间超过追溯期后被标记为无效的标签;支持有效签指该员工投了支持票且在时间超过追溯期同,则

17、将该标签的支持票数加,并将该标签自动记人支持记录,同时给出提示信息“标签已存在,本次操作 后仍被标记为有效的标签。我们认为上述三种标签就其对保证文档检索效率将记人你对该标签的支持记录”,如果员工标识相同,和质量的贡献来说是存在差异的。有效签是对文档做则不做任何记录,只需给出提示信息,提示员工“不能出的相对准确的描述,保证了检索查全率,具有开创对同一文档添加重复标签”。性,因此可认为其贡献相对较大。反对有效签和支持.标签的质量由整个组织的所有成员共同评价和有效签是对他人开创性描述的评价,与有效签相比,贡保证,允许组织中的每个员工对其他员工添加的任一献相对较小。反对有效签的贡献在于剔除对文档相对标

18、签表示支持或反对,但不允许员工对自己添加的标不准确的描述,保证了检索查准率。支持有效签的贡签进行评价,同时也不允许员工对其他员工添加的标献在于调整标签顺序,提高检索速度。而对于检索来签重复评价。比如,员工为文档添加了一个标签说,首先是要全面、准确,其次是要高效,因此可以认为“数据挖掘”,那么这个标签是否准确,要由组织中的反对有效签与支持有效签相比贡献相对大一些。从激其他员工对其做出评价支持或反对,当某一员工励员工积极添加标签、添加高质量标签的角度出发,在对该标签投了支持票时,将该标签的支持票数加,并计算标签绩效得分时应为每种标签按贡献大小分配不将该文档标识、标签内容及员工的员工标识记人支同的权

19、重。若以埘。、:、埘,分别表示鸭、和持记录,反之,若投的是反对票,则将相应内容记入反的权重,则应有埘,细:细。由此,可按如对记录,并将该标签的反对票数加。下公式测算每位员工的标签绩效得分:.为了提高文档检索效率,需要计算每个标签的以船,抛,玩,埘地支持率,并根据同一文档各标签的支持率动态调整各埘埘标签的顺序。支持率越高的标签对文档的描述越贴具体的权重配置可按企业的激励力度和策略进行切,因此要始终保持支持率高的标签排在前面,这样可适当调整。例如,可给定仲,硼.,鸭.,此以有效提高文档检索时标签的匹配速度。支持率时若员工的有效签个数、反对有效签个数和支持有可用如下公式计算:效签个数分别为、,则其标

20、签绩效得分为:以,支持票反对票,.。塞擅璺麴上述计算方法虽然为每类标签根据其对文档检索耻 苴釉拭旧【支持票数反对票数效率和质量贡献的不同分配了不同的权重系数,但从其中,支持票数反对票数即没有其他员工本质上看该得分仅能体现员工添加标签的数量指标,对该标签进行评价时,将该标签的支持率记为,这而对员工添加标签的质量评价并未有所体现。为此,是出于对原始贴签人积极性和贡献进行保护的考虑。为了实现标签的质量控制与评价,在标签绩效得分中.为了提高文档检索的准确率,需要计算每个标还应加入标签质量系数。签的反对率。当标签的反对率超过预设的阈值时,则显然,标签的支持率和反对率是标签质量的一个修改标签记录中该标签的

21、“有效/无效”属性值,将该直观的真实评价,支持率高的标签质量自然就高,支持标签标志为无效签如用表示有效,表示无效,超率低的标签质量自然就低,因此对于有效签和支持有过一个绩效评价周期后,无效签将不再显示。反对率效签可取其相应标签的支持率均值骼作为其质量系可用如下公式计算:数,而对于反对有效签可取其相应标签的反对率均值一月尺作为其质量系数。由此,得到标签绩效得分新的测.标签绩效评价指标测算为了测算每个员工算公式如下:的标签绩效得分,在每个绩效评价周期的期末,要根据标签记录、支持记录和反对记录生成员工标签业绩报人心,抛,埘尺.抛表。根据前文数据建模和业务逻辑的分析,在计算员埘 始埘,嬲略工标签绩效得

22、分时,基于保护积极性和评价合理性的其中,硒为该员工添加的所有有效签支持率的原则,只考虑超过追溯期如一个绩效评价周期的有均值,为该员工添加的所有反对有效签反对率的效签个数、反对有效签个数和支持有效签个数。其中,有效签是指标签记录中时间超过追 均值,为该员工添加的所有支持有效签支持率的万方数据第期 白劲波,等:基于标签技术和群体绩效评价的多媒体检索均值。比如,在前面的例子中,若员工所添加的参考文献个有效签的支持率分别为、.、.、,则其尺:. 侯贵松.知识管理与创新.北京:中国纺织出版社,:.;个反对有效签的反对率分别为.和.,则其 舾,删 锄. 淄:心 】尺.;个支持有效签的支持率分别为.、.、吼

23、 锄 懿.啪.,则其尺.,故最终的标签绩效得分为:以,柚朗,:一.,.砒. 吡: 即叶口 ,.?衙习【撕】 .咖.。姐蜘,:?上述改进的测算公式全面反映了员工添加标签的,?咖. 锄数量和质量指标,既可以有效激发员工添加标签的积柚锄朗 】.哦 姐&极性,又可以保证添加标签的质量。,:?舱:柏. 锄 小结和展望锄.,:? “,柚 粕,棚多媒体内容的检索是现代企业在实现知识管理过锄“. 伽咖盯: 研独程中构建文档管理平台的核心、关键内容,本文提出的? 一.方案具有如下一些特点:,:?地即.具体实现具有经济性、简单性和实用性。方案协谢,锄 。 . 砘粕柚一蚰 唧.中相关数据库的构建可以使用免费的数据库

24、系统如“咖吐 叫 锄,编程费用低廉,企业不必购买额外设备。:?.具有自学习特征。由于在多媒体检索过程引入饥唧.瞰髓? . ,了群体动态绩效评价机制,所以文档管理平台始终处曲.卸 姐甜: 伽 .伽卜于不断的自我进化过程中,查准、查全率会随着时间的皿撕叩饥.。:一【 . , .,盈办锄 .体%推移越来越高。卜百【.帆 吐砖谢锄五.检索结果具有鲜明的现实性、实时性。由于该砒粕融,:踮一方案保证了标签可以反映群体的意志、倾向以及对文.?忍巾, ,档的最新理解,所以整个文档管理平台具有推陈出新】 ? 锄 解沁舀:的特征。,:一.丌 .高度的自动化特征。只有员工和文档的一些基觚%.【 朋髓啦.础哺嘶本信息

25、需要管理人员录入,其他功能都由系统自动管 ,矗 .暂吐理。强。:一.体现了知识发现过程。员工基于自身的知识库, .,柚 盯 .对标签进行判别的行为极其类似于机器学习技术中的砖印抑 曲撕:?关联规则发现。在本方案中,所有员工变成了并行的、 豁 艰.曲锄:即. ,分布式的、拥有自身意识并超越一般意义的机器学习,?:一系统,多媒体对象的内容和标签构成关联规则,主宰标觚他,狃 , 地.“签沉浮的支持度、可信度等阈值无须专家预设,而由群圮砌 印哺 跖舒 体意识自发确定。北锄 .删撕。蛆【血,.引入了群体绩效评价机制,是绩效评价研究中:?的一个新探索和新尝试。 . 锄?.伽 ,:?综合来看,本文的多媒体检索解决方案可以满足绝大多数企业的日常需要。但是,对于一些特殊的企。? 髓. 哦砸? ,业和部门,如法律执行部门,它们对媒体的内在内容往唱舀 删 丑 锄髓往有一些特殊的需求,如要求提取音频文档中的指纹酣 晒. 删:特征,本方案尚不能满足这方面的需要。满足一些特 删蚰:,:?殊企业和部门的特殊需求,是下一步的研究方向。 下转第页万方数据

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1