毕业论文(设计)基于Topic Maps 的叙词表再工程35055.doc

上传人:土8路 文档编号:10476614 上传时间:2021-05-18 格式:DOC 页数:10 大小:479KB
返回 下载 相关 举报
毕业论文(设计)基于Topic Maps 的叙词表再工程35055.doc_第1页
第1页 / 共10页
毕业论文(设计)基于Topic Maps 的叙词表再工程35055.doc_第2页
第2页 / 共10页
毕业论文(设计)基于Topic Maps 的叙词表再工程35055.doc_第3页
第3页 / 共10页
毕业论文(设计)基于Topic Maps 的叙词表再工程35055.doc_第4页
第4页 / 共10页
毕业论文(设计)基于Topic Maps 的叙词表再工程35055.doc_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《毕业论文(设计)基于Topic Maps 的叙词表再工程35055.doc》由会员分享,可在线阅读,更多相关《毕业论文(设计)基于Topic Maps 的叙词表再工程35055.doc(10页珍藏版)》请在三一文库上搜索。

1、基于Topic Maps的叙词表再工程朱良兵1,纪希禹21.四川大学公共管理学院 成都6100642. 四川大学公共管理学院 成都610064摘要本文介绍了叙词表的定义、词间关系的种类以及传统叙词表存在的不足,总结了主题图技术的内涵、发展历程及其优点,选择了18个主题词作为研究样本,分析其词间关系并进行建模,用Ontopia公司提供的三个免费工具分别进行创建、浏览和可视化主题图。关键词叙词表 主题图 知识组织Reengineer the Thesaurus Based on Topic MapsZhu LiangbingJi Xiyu1. the School of Public Admini

2、stration, Sichuan University,Chengdu,Sichuan 6100642. the School of Public Administration , Sichuan University,Chengdu,Sichuan 610064AbstractThe article firstly introduces the definition of thesaurus and the kinds of relationship between descriptors, and the shortage of the traditional thesaurus.The

3、n summarizes the meaning , history and merit of Topic Maps. Finally chooses eighteen descriptors as the research swatch, analyzes and models the relationship between them, uses three free tools to create, browser and visualize the topic map.KeywordsThesaurus;Topic Maps;Knowledge Organization;Relatio

4、nship Information 在网络信息海量增长的现实面前, 只有对信息主题进行更好的识别才能在浩如烟海的信息资源中及时、准确地获得信息。为此, 图书情报界迫切需要对传统的信息管理工具加以创新, 以利于网络资源的描述和发现。叙词表独有的知识组织体系和语义结构在组织和检索网络信息资源方面将发挥重要作用, Topic Maps作为一个ISO国际标准,提出了一种基于主题的元数据组织和描述方式,提供了语义级的数据导航和组织方式,是一个表达和交换结构化信息的元数据模型,将对叙词表在网络环境下的改进和重塑中发挥重要作用。1叙词表概述1.1 叙词表的定义 叙词法形成于上世纪50年代末,是在吸取元词法、

5、标题法及分面组配式分类法等知识组织方法优点的基础上发展起来的。根据GB13190-91汉语叙词表编制规则,叙词表是将文献、标引人员或用户的自然语言转换成规范语言的一种术语控制工具;它是概括各门或某一学科领域并由语义相关、族性相关的术语组成的可以不断补充的规范化的词表。1.2叙词表词间关系的种类叙词表由叙词及叙词之间关系组成, 采用参照符号显示并清楚地区分叙词间基本语义关系。叙词表中包括以下3 种关系:1) 等同关系( Equivalence Relationship) , 又称同一关系、用代关系, 包含同义、近义以及用代关系, 这种关系含有概念相同或用法相同的关系。揭示等同关系有利于增加检索入

6、口和根据检索系统需要对标引和检索的专指度进行控制。2) 等级关系(Hierarchical Relationship) , 又称属分关系, 这种关系包含属种、整部和多层级关系, 每种层级关系的下位词都必须与上位词的概念类型相同, 即两者都必须属于同一范畴内的事物、行为或性质。揭示等级关系有助于通过它扩大和缩小查找范围, 提高族性检索能力。3) 相关关系(Associative Relationship) , 又称类缘关系, 是确立由标引和检索角度需要相互关联的一种关系。相关关系是揭示叙词间各种主要联系、扩大检索范围、进行相关信息查找的重要手段。相关关系范围广、种类多、灵活性大, 很难严格界定。

7、叙词语言对语义关系的揭示方法, 主要通过各种语义参照符号来反映和联系。其语义参照系统见表1 , “Y、D、S、F、Z、C”一系列语义关系符号, 显示出叙词之间同义、属分、相关关系, 形成了叙词表的语义关系网。语义参照关系参照项中文符号英文符号作用同义关系用YUSE从非叙词指引到叙词代DUF从叙词指引到非叙词属分关系属SBT从下位叙词指引到上位叙词分FNT从上位叙词指引到下位叙词族ZTT从下位叙词指引到最高位叙词相关关系参CRT从某一叙词指出其相关叙词 表1 叙词的语义参照关系其中,“Y”和“D”揭示的是词间同义关系,可帮助用户区分规范和非规范检索词;“S”、“F”、“Z”揭示的是词间属分关系,

8、可帮助用户扩检或缩检;“C”揭示的是词间相关关系,可帮助用户获得当前检索主题的相关信息。13 传统叙词表存在的不足 叙词表和主题图相比而言,存在一些不足之处。叙词表中的术语均是规范的科学语言;而主题图中的主题可以用自然语言和半自然语言来表达。在组织结构上,叙词表中知识点的分布是线性的、一维的;而主题图中的知识点分布是网状的,它不单纯是一张平面的网格,而是一个在四维空间中伸缩的网状结构。叙词表相对稳定,结构保守而单一,不可能经常修订;而主题图是一个开放体系,其底层知识库与主题集合可以随着学科领域的更新和发展随时进行修正和更新。叙词表中只包含“用、代、属、分、参、族”这样简单的语义关系;而主题图中

9、主题之间的关系,可以被描述得更广泛、深入、细致和全面。2 Topic Maps概述2.1 Topic Maps的定义概括地说,主题图是一种用于描述信息资源的知识结构的数据格式,定位某一知识概念所在的资源位置,也可以表示知识概念间的相互联系。 主题图实际上在信息资源的上层构建了一个结构化的语义网,它独立于技术平台,描述主题之间的关系及主题与具体资源的联系,通过揭示概念之间的关系,将用户指引到相关的资源。建构主题图,其目的在于建立一个个人化的知识导航界面,并给使用者一个能快速掌握轻松学习知识的操作界面。主题图被誉为信息管理和知识管理之间的桥梁,是信息世界中的GPS定位仪,它可以提供信息资源的直观的

10、导航。2.2 Topic Maps的发展历程主题图的概念最初是由W3C提出的,并由国际标准化组织SGML委员会第三工作小组的研究人员开发,用来实现索引和辞典构建过程的形式化。这些早期努力演变的结果就是ISO/IEC13250:2000,这项国际标准定义出了Topic Maps的完整模型,它采用ISO10744:1997HyTime的标准来定义主题图的语法,因此又被称为HyTM。主题图虽然早于XML出现,但是XML与Web的迅速发展导致出现了XML Topic Maps,即XTM。XTM是由Topic Maps 组织负责订立,它的基础是ISO/IEC13250模型,但是定义的是一种XML语法,并

11、限制它只能通过URI实现。2002年经过修订的第二版(ISO/IEC13250 :2002)同时包含HyTM和XTM两种语法。2.3 Topic Maps的优点主题图吸收了叙词表在词汇控制方面的思想,可以用两种机制(基本名base name和别名variant name)来定义叙词表中的用代关系,实现词汇控制,并在传统叙词表的用、代、属、分、族、参的简单关系基础上,具有灵活定义概念间关系的类型的功能,使用者可以根据领域概念的特点灵活地定义概念之间的关系。在主题图中所表达的概念之间的关系比叙词表更为具体和确切。Topic Maps体系模型如图1所示:它的基本思想实际上是我们非常熟悉的,理解它最通

12、常的起点就是传统的书后索引。索引是一本好书中主要论题、领域的浓缩,主题地图的基本概念与之相似,有“主题Topic”(论题或名词的名称);有“主题关联Association“(参看,参考);以及“主题资源Occurrence”(页码、或者位置描述)。与书后索引相比,主题图更加一般化,以此满足更加广阔的数字信息领域的需要,它定义了一个数据模型,并基于该模型描述底层信息内在的知识结构,用“语境范畴Scope”来确定描述的领域,为用户绘制了一副相关论题简明而富有指导价值的整体蓝图,并以知识的方式组织和管理相关的Web信息资源。换句话说,主题图提供了一个可自定义的信息路由策略,来帮助用户有效地操纵数字资

13、源,而信息路由策略则体现了内涵于信息之中的知识。图1 Topic Maps 模型组成与此同时,主题图并不包含在所描述的信息当中,它是与信息无关的独立导航层,对于相同的底层资源,我们可以应用不同的主题图来动态地改变信息路由策略,也就是说用不同的知识看待相同的问题,这恰恰反映了不同知识结构的人看待相同的资源所表现出来的不同视角。 3研究范围界定 本研究选取管理科学主题词表(1996年2月第1版)作为研究样本,以主题词“情报学”为中心,选取与之相关的词汇作为研究对象。为了避免词汇数量和词间关系永无止境,我们只选取其中18个与“情报学”相关的主题词,我们对这18个主题词及其替代词进行关联性分析后,归纳

14、出其词间关系,并制表如下:主题词代(D)参(C)属(S)分(F)用(U)情报信息科技情报、经济情报、战略情报、战术情报、商业情报、军事情报、飞行情报信息情报档案信息、科技信息、固定信息、环境信息、经济信息、决策信息、动态信息、外部信息、直接信息、管理信息、质量信息情报产业咨询业信息产业管理信息系统管理情报系统信息系统质量管理信息系统、成本管理信息系统信息经济学情报经济学信息渠道情报源情报分析情报研究经济信息.经济情报信息竞争信息、市场信息经济信息系统信息系统市场信息物价信息、商情经济信息情报机构信息机构情报技术信息技术情报检索信息检索检索手工检索、自动化检索、追溯检索情报搜集信息搜集情报研究情

15、报分析科技情报研究科技情报技术情报科技信息情报专利技术情报科技信息技术信息科技情报信息企业科技信息自动化检索情报检索光电检索、计算机检索表2 本研究所采用的18个主题词及词间关系4对叙词间的语义关系建模 确定所采用的词汇及其关联性后,便可开始着手构建语义网络。语义网络是AI研究领域中的一种表现形式,包含节点(Nodes)与连接(Links),节点通常代表客体、概念或某特殊领域的情境,连接则代表节点间的语义关联。主题词subject上位词Broader Term同义词Synonym Term相关词Related Term下位词Narrow Term属分关系同义关系相关关系属分关系 图2 叙词表词

16、间关系之语义关系模型根据表2所列出的叙词之间的关系,可提出以下的语义模型:以“主题词”为中心,其同义关系为“同义词”;属分关系为“上位词”、“下位词”;相关关系为“相关词”。此模型如图2所示。举例来说,如以表2中的主题词“科技情报”为例,将其语义关系按图2的方法展开,结果如下:科技情报技术情报科技信息情 报专利技术情报上位词(BT)同义词(UF)相关词(RT)下位词(NT) 图3 以“科技情报”为例之语义关系图5构建主题图5.1 用Ontopoly构建主题图 Ontopoly是挪威的Ontopia公司提供的,由本体驱动的、基于Web的Topic Maps构建和管理工具,Ontopia公司是世界

17、上领先的专注于Topic Maps技术的研究和应用的公司。一个主题图是由本体和该本体的实例组成的,你可应用Ontopoly对它们进行编辑。 Ontopoly的强大功能和灵活性的关键在于它是建立在主题图的ISO国际标准之上的。这就使得Ontopoly可以支持各种知识结构,范围包括简单的索引和分类法,从叙词表到术语表,以及风头正健的本体。 本实验选用“主题词”作为主题类型(Topic Types);选用Ontopoly中自带的“Description”作为主题资源类型(Occurrence Types);根据表1所列出的三种叙词间关系作为关联类型(Association Types);用“叙词”和

18、“非叙词”作为“同义关系”这种关联类型的角色类型(Role Types),用“上位叙词”和“下位叙词”作为“属分关系”这种关联类型的的角色类型,由于“相关关系”是一种对称关系(symmetric relation),所以只需一个词来作为“相关关系”这种关联类型的角色类型,在此用“相关词”来担当此任。最后,根据以上原则构建出主题图,代码片段如下: 科技情报 科技情报是有关最近期间在各种重要的科学技术领域内,反映国内外的成就和动向,为经济建设和为决策服务的重要信息。 5.2 用Omnigator浏览主题图Omnigator也是由Ontopia公司提供的一个免费浏览器,使用Omnigator可以让你

19、通过一个标准的Web浏览器运行并浏览任何主题图,支持LTM、HYTM、XTM、RDF多种格式。该浏览器简易而友好的用户界面为用户快速、轻易而直观地获得所需信息提供了可能。Omnigator使用简单的基于HTTP协议的客户机/服务器模式,需要Tomcat作为Web服务器。使用Omnigator不仅仅可以对主题图进行浏览,还可以管理、合并主题图,以及对插件、全文索引进行管理,用主题图查询语言Tolog对主题图进行查询,验证主题图的有效性,更换Omnigator的显示模式、视图、皮肤(Model、View、Skin,简称MVC)等等功能。如图4是本文设计的主题图在Omnigator中的浏览结果的一个

20、截屏。 图4 用Omnigator浏览主题图5.3 用Vizigator可视化主题图 Vizigator是Ontopia公司提供的一个免费的主题图可视化工具。主题图模型描述了蕴涵于信息中的知识结构,这种模型反映了人类思考方式的典型关联模式。通常图形图象比烦琐的文字描述让人更容易抓住知识要点,Vizigator使用一个图形化接口提供了一个额外的主题图导航方式。它以不同颜色、不同形状来区分主题图的各个部分,节点代表主题,节点与节点之间的连线代表主题之间的联系。尽管Vizigator可独立作为可视化工具使用,也可很方便地作为基于文本的浏览方式的一个补充。如图5是本文设计的主题图在Vizigator中

21、的可视化呈现结果。图5 用Vizigator可视化浏览主题图6 结语本文成功地提出了一个以主题图构建叙词表的语义网络模型、方法与步骤,并从现有叙词表中选择18个主题词及其替代词作为研究样本,归纳出其词间关系并构建语义关系图,再以挪威Ontopia公司提供的免费工具Ontopoly建立主题图,最后以Ontopia提供的免费浏览器Omnigator浏览主题图,以Ontopia公司提供的免费可视化工具Vizigator对主题图进行可视化呈现,顺利的完成了一个实验性质的叙词表主题图。展望未来,主题地图是一项结合了知识工程和知识组织的新技术,更是一种分布式的知识表示法,若能有效的加以运用可以整合众多分散

22、于网络上的知识库,从而建构出一个强大的知识管理系统。不过,主题图亦将如同其它新兴的标准和技术一样,一方面在各个领域展示出巨大潜力,另一方面则将遭遇各种问题的严厉挑战,是否真能成为知识组织的利器,或是成为知识管理的有效解决方案,仍然是一个颇值得探讨的议题,亦是我们未来的研究重点之一。参考文献1秦铁辉. 信息时代的“全球定位系统”主题地图. 江西图书馆学刊,2005,35(1)2马建霞. 主题图技术在数字化知识组织中的应用. 现代图书情报技术,2004(7)3 张佩云,吴江,贾晖. 主题地图标准及其应用研究. 安徽大学学报(自然科学版),2004,28(3)4何建新. 主题图及其应用. 中国索引.

23、 2005,3(1)5韩泽春. 主题地图 一种有效的知识组织与揭示方法. 忻州师范学院学报,2005,21(4)6 Lars Marius Garshol. Metadata? Thesauri? Taxonomies? Topic Maps!. http:/ March,22,2006)7 Dagobert Soergel. Building a More Meaningful Web: From Traditional KnowledgeOrganization Systems to New Semantic Tools. http:/www.sigir.org/forum/2003F/j

24、cdl03_soergel.pdf(Accessed March,23,2006)8 Steve Pepper. The TAO of Topic Maps. http:/ (Accessed March,23,2006)9 Steve Pepper,Graham Moore.XML Topic Maps(XTM)1.0. http:/www.topicmaps.org/xtm/(Accessed March,24,2006)10 张琪玉.情报语言学基础(增订第二版本).武汉大学出版社,199711 魏铁进.管理科学主题词表.机械工业出版社,199612 Ontopia.Ontopoly:Th

25、e Topic Map Editor Users Guide.http:/(Accessed March,25,2006)13 Ontopia.Omnigator:The Topic Map Browser Users Guide. http:/(Accessed March,26,2006)14 Ontopia.Omnigator:The Ontopia Vizigator Users Guide. http:/(Accessed March,27,2006) (来稿时间:2006-04-06 责编:冉文格)作者简介朱良兵,男,1977年生,四川大学情报学在读硕士研究生,主要从事信息系统理论

26、与技术的学习研究。 纪希禹,男,副教授,硕士导师,主要从事信息管理与信息系统的研究,发表专著两部。Editors note: Judson Jones is a meteorologist, journalist and photographer. He has freelanced with CNN for four years, covering severe weather from tornadoes to typhoons. Follow him on Twitter: jnjonesjr (CNN) - I will always wonder what it was like t

27、o huddle around a shortwave radio and through the crackling static from space hear the faint beeps of the worlds first satellite - Sputnik. I also missed watching Neil Armstrong step foot on the moon and the first space shuttle take off for the stars. Those events were way before my time.As a kid, I

28、 was fascinated with what goes on in the sky, and when NASA pulled the plug on the shuttle program I was heartbroken. Yet the privatized space race has renewed my childhood dreams to reach for the stars.As a meteorologist, Ive still seen many important weather and space events, but right now, if you

29、 were sitting next to me, youd hear my foot tapping rapidly under my desk. Im anxious for the next one: a space capsule hanging from a crane in the New Mexico desert.Its like the set for a George Lucas movie floating to the edge of space.You and I will have the chance to watch a man take a leap into

30、 an unimaginable free fall from the edge of space - live.The (lack of) air up there Watch man jump from 96,000 feet Tuesday, I sat at work glued to the live stream of the Red Bull Stratos Mission. I watched the balloons positioned at different altitudes in the sky to test the winds, knowing that if

31、they would just line up in a vertical straight line we would be go for launch.I feel this mission was created for me because I am also a journalist and a photographer, but above all I live for taking a leap of faith - the feeling of pushing the envelope into uncharted territory.The guy who is going

32、to do this, Felix Baumgartner, must have that same feeling, at a level I will never reach. However, it did not stop me from feeling his pain when a gust of swirling wind kicked up and twisted the partially filled balloon that would take him to the upper end of our atmosphere. As soon as the 40-acre

33、balloon, with skin no thicker than a dry cleaning bag, scraped the ground I knew it was over.How claustrophobia almost grounded supersonic skydiverWith each twist, you could see the wrinkles of disappointment on the face of the current record holder and capcom (capsule communications), Col. Joe Kitt

34、inger. He hung his head low in mission control as he told Baumgartner the disappointing news: Mission aborted.The supersonic descent could happen as early as Sunday.The weather plays an important role in this mission. Starting at the ground, conditions have to be very calm - winds less than 2 mph, w

35、ith no precipitation or humidity and limited cloud cover. The balloon, with capsule attached, will move through the lower level of the atmosphere (the troposphere) where our day-to-day weather lives. It will climb higher than the tip of Mount Everest (5.5 miles/8.85 kilometers), drifting even higher

36、 than the cruising altitude of commercial airliners (5.6 miles/9.17 kilometers) and into the stratosphere. As he crosses the boundary layer (called the tropopause), he can expect a lot of turbulence.The balloon will slowly drift to the edge of space at 120,000 feet (22.7 miles/36.53 kilometers). Her

37、e, Fearless Felix will unclip. He will roll back the door.Then, I would assume, he will slowly step out onto something resembling an Olympic diving platform.Below, the Earth becomes the concrete bottom of a swimming pool that he wants to land on, but not too hard. Still, hell be traveling fast, so d

38、espite the distance, it will not be like diving into the deep end of a pool. It will be like he is diving into the shallow end.Skydiver preps for the big jumpWhen he jumps, he is expected to reach the speed of sound - 690 mph (1,110 kph) - in less than 40 seconds. Like hitting the top of the water,

39、he will begin to slow as he approaches the more dense air closer to Earth. But this will not be enough to stop him completely.If he goes too fast or spins out of control, he has a stabilization parachute that can be deployed to slow him down. His team hopes its not needed. Instead, he plans to deplo

40、y his 270-square-foot (25-square-meter) main chute at an altitude of around 5,000 feet (1,524 meters).In order to deploy this chute successfully, he will have to slow to 172 mph (277 kph). He will have a reserve parachute that will open automatically if he loses consciousness at mach speeds.Even if

41、everything goes as planned, it wont. Baumgartner still will free fall at a speed that would cause you and me to pass out, and no parachute is guaranteed to work higher than 25,000 feet (7,620 meters).It might not be the moon, but Kittinger free fell from 102,800 feet in 1960 - at the dawn of an infamous space race that captured the hearts of many. Baumgartner will attempt to break that record, a feat that boggles the mind. This is one of those monumental moments I will always remember, because there is no way Id miss this.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1