文献检索章节二计算机检索基础知识.ppt

上传人:本田雅阁 文档编号:3206747 上传时间:2019-07-31 格式:PPT 页数:37 大小:192.01KB
返回 下载 相关 举报
文献检索章节二计算机检索基础知识.ppt_第1页
第1页 / 共37页
文献检索章节二计算机检索基础知识.ppt_第2页
第2页 / 共37页
文献检索章节二计算机检索基础知识.ppt_第3页
第3页 / 共37页
文献检索章节二计算机检索基础知识.ppt_第4页
第4页 / 共37页
文献检索章节二计算机检索基础知识.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《文献检索章节二计算机检索基础知识.ppt》由会员分享,可在线阅读,更多相关《文献检索章节二计算机检索基础知识.ppt(37页珍藏版)》请在三一文库上搜索。

1、文献检索课 二 计算机检索的基础知识,林 英 图书馆信息咨询部 ,课程安排,电子信息资源检索,电子信息资源的概念: 以数字化的形式,把文字、图形、图像、声音、动画等多种形式的信息存放在光、电、磁等非印刷型介质上,以电信号、光信息号的形式传输,并通过网络通信、计算机或终端等方式再现出来的一种信息资源。,电子信息资源的特点: 1、组织形式发生变化:由传统的文本、线性,发展成超文本、超媒体等多种形式,并组成相互联系、非线性的网状结构。 2、数字化:存储密度高,容量大。 3、内容丰富多样:从文字、图表到多媒体信息,文献类型多样,涉及领域宽广。 4、数据具有通用性、开放性、动态性 5、信息资源体积小、数

2、量大 6、传播方式的无限性,不受时间、空间限制 7、检索功能强大,使用方便、快捷。,信息检索系统 概念:按某种方式建立起来的供读者查找信息的一种有层次的体系,是表征有序信息特征的集合体。分为两大类型:印刷型检索系统和计算机检索系统。 印刷型检索系统 1、文献型检索工具 (1)目录 以报道文献出版或收藏信息为主要功能的工具。如全国总书目。 (2)题录 是将图书、报刊等文献中论文的篇目按照一定的排检方法编排而成,供人们查找篇目出版的工具。如全国报刊索引 (3)文摘 以精练的语言把文献信息的重要内容、观点、数据等摘录下来,并按一定的著录规则与排列方式编排起来,供读者检索使用的一种检索工具。 2、非文

3、献型检索工具 主要指参考工具书。如词典、百科全书、年鉴、年表、名录等。,计算机检索系统的类型 1.文献型数据库 文献型数据库是指能直接提供文献线索和文献原文的数据库,即数据库记录的对象为文献信息时。包括目录型数据库、题录型、文摘型和全文型数据库。 (1)目录型数据库 是对信息外表特征予以揭示和报道,以整个出版单位或收藏单位为基本著录单元,如“本”、“种”、“件”等。著录内容包括书(刊)名、作者、出版年月、出版地及收藏情况等。可分馆藏目录(如各图书馆的馆藏机读目录数据库OPAC)、联合目录、出版发行目录等。,(2)题录、文摘型数据库 题录型:是将单篇文献的“篇”、“章”等为著录单元,如一篇论文、

4、一份报告、一件专利等。如全国报刊索引。 文摘型:在题录的基础上每个著录单元再加上文摘。如美国工程索引、科学文摘等。 (3)全文数据库 指存储文献全文或其中主要部分内容的源数据库。存储内容主要有各种图书、期刊论文、法律条文及案例、新闻报道等。它将二次文献的检索同原文献的获取融为一体。,2.非文献型数据库 指一种能够直接提供具体的术语、事实和数值等信息的数据库。包括术语型数据库、事实型数据库和数值型数据库。 (1)术语型数据库 指专门存储并揭示各类名语、术语、词语的检索工具。大多是辞书、词典、百科全书等数字化版本。 (2)事实型数据库 指存储简单而独立存在的非文献信息,如机构、人物、产品、地理位置

5、、事件等实体信息。 如:各种人物数据库、机构名录数据库、产品或商品数据库等。 (3)数值型数据库 一种以自然数值形式表示、计算机可读的数据集合。,信息检索技术 布尔逻辑检索 利用布尔逻辑算符将一些具有简单的、表达某一主题概念的检索单元(或检索标识)组配成一个具有复杂概念的检索式,以满足课题检索的要求。主要通过“和(and,*)”、“或(or,+)”、“非(not,-)”等将检索词联络起来 。,运算优先级顺序为NOT、AND、OR,可以用括号“( )”改变它们的运算顺序。 如A and (B or C),检索顺序为先B或C,然后再与A,逻辑算符举例 查找关于“动物保护”的文献: “动物”和“保护

6、” 可以用“逻辑与”组配,表示为“动物 AND 保护”,检出记录中既涉及动物又涉及保护的相关文献。 查找有关冬虫夏草的文献: 冬虫夏草又称冬虫草、虫草 ,“冬虫夏草”、“冬虫草”、“虫草 ”三者要用逻辑或组配,表示为“冬虫夏草 or 冬虫草 or 虫草”,检索出文献中包含三者任意一种即被检出。 查找关于国外建筑特色的文章: 国外即不包括中国 ,建筑和中国之间为逻辑非的关系,表示为“建筑 not 中国”,检索结果排除了中国建筑的相关文献。 检索西红柿种植技术的相关文章: 西红柿” 又称“番茄”,表示为“西红柿+番茄”;“种植”的同义词有“栽培”、“培育”,表示为“种植+栽培+培育”;检索表达式为

7、:(西红柿+番茄)*(种植+栽培+培育),词组检索: 通常在所检索词上加“”对所检索词视为词组处理 例如:“动物保护”,表示动物保护是个词组,检索结果动物和保护不能分开。若不加“”,检索结果可以是动物保护、动物多样性保护、动物栖息地保护、动物资源保护等形式。 截词检索 又称部分一致检索,是在检索词的适当位置进行截断,然后使用截词符代替,利用截断的词的一部分进行检索,检索词与文献部分一致性。 截词检索是预防漏检,提高查全率 尤其适用于英语,常用于处理词语的单复数,不同拼写方式,相同词根的相近意义词,以及动词的不同形式等。 截词的类型:按照截词的位置,分为后截词 (前方一致),前截词(后方一致),

8、中截词(中间一致和中间不一)。 截词符:不同的检索系统所使用的截词符不同,常用的有“*”、“?”,“*”、“?”的比较 “*”,无限截词,代表多个字符如regard*, 代表regard, regarding, regardless, 等 absorb* “?”有限截词,代表0个或1个字符,如“wom?n”,则包含“woman,women”; 可以用“n?”来代表多个字符 前截词、后截词、中间截词的比较 前截词 将截词符放在词根的前边,后方一致,表示在词根前方有无限个或有限个字符变化。如:*computer 将检索出 computer、 minicomputer 、microcomputer等

9、单词的文献。 后截词 将截词符放在词根的后面,前方一致。如:grow* ,系统将检索出含有grow、growth、growing等词的所有记录 中间截词 是将截词符号置于检索词的中间,而词的前后方一致。通常用于英、美不同拼写形式的词(英语单词)进行检索。如:colo?r 可检出的词为colour(英音)、color(美音)。,位置检索技术 利用位置逻辑算符来限定检索词与检索词之间的位置关系,从而使检索出的文献更确切地符合用户要求,提高查准率。 在不同的检索系统中,所采用的位置算符是不同的,功能也有差异。 (W) (WITH)算符:表示两个检索词紧挨着,词序不能颠倒,中间不能有其他词,但可以有空

10、格和标点符号。也可以用() A(W)B AB两词靠近,次序为A先B后。 例如:communication(w)satellite或者communication()satellite,只检索出communication satellite, communication-satellite的记录 (nW) 算符:表示两个检索词之间插有n个词,但顺序不能颠倒。 A(nW)B AB两词靠近,次序为A先B后,中间最多可加n个词。 例如:communication(2w)satellite,只检索出communication satellite、communication-satellite,commun

11、ication through satellite、communication on the satellite词组的记录。,(N)(Near)算符:表示两个检索词为相邻关系,两个词之间不能插入任何词,但词序可以颠倒。 A(N)B :AB两词靠近,次序可变。 如 building (N) construction可检索出buildingconstruction, construction building, construction-building的记录 (nN)算符:表示两个检索词之间可以插入 n 个词并且词序可以颠倒 A(nN)B:AB两词靠近,次序可变,中间最多可加n个词。 例如:in

12、formation(1N)retrieval可检索出information retrieval , information and retrieval, retrieval of information的记录。,限制检索技术 限制检索是通过限制检索范围,缩小检索结果,达到精确检索的方法。 检索方式主要有:限定字段检索和限定范围检索 限定字段检索:将检索词限定在特定的字段中。 如:题名(TI,title)、关键词(KW,keyword)、主题词(DE, descriptor)、 文摘(AB,abstract)、全文(FT, Full text)、作者(AU,author)、期刊名称Journal

13、(JN)、出版国Country(CO)、出版年份Publication Year(PY)、语种 Language(LA)等等。,字段检索表达方式一般有两种: (1)后缀方式 ,将检索词放在字段代码之前,之后用字段限定符号:in 或/;如:zhe jiang forest* college in AD 即在地址字段中出现浙江林学院的即被检中。Furniture/TI即家具一词出现在题目中。 (2)前缀方式, 将检索词放在所限定的字段代码之后,如用在著者(AU)、刊名(JN)、出版年(PY)、语种(LA)等字段后,例如:AU=Evans,A., LA=Chinese 限定范围检索: 是通过使用限定

14、符来限制信息的检索范围,以达到优化检索的方法。 不同的检索系统略有不同,常通过使用的有:“=、=、:” 等。 例如: PY=1995 即限定出版年份为1995及以后的文献; 出版年=1996:2005即1996年至2005年的文章 二次检索: 指在前一次检索的结果中进行另一概念的检索。,分析给出下列课题的检索式 现代家具设计的研究 化学信息学与生物信息学开放性比较 社会保障基金投资问题研究 刺槐组织培养研究,计算机检索的步骤 课题分析 选择检索系统 确定检索途径和检索方法 确定检索词 制定检索策略,编制检索式 实施检索、分析检索结果、索取原文 调整检索式,优化策略,课题分析 主要指明确检索目的

15、与要求 分析课题的主要内容及所涉及学科范围,以便确定有关检索标识(分类)、检索途径和选择合适的检索工具。 分析课题所需信息的类型、文献量、年代范围、涉及语种、有关著者、机构等。 确定课题对查新、查准和查全的指标要求,例如: 若要了解某学科、理论、课题等最新进展和动态,则要检索最近的文献信息,强调“新”字; 若要解决研究中某具体问题,找出技术方案,则要求检索有针对性、能解决实际问题的文献信息,强调“准”字; 若要撰写综述、述评或专著等,要了解课题、事件的前因后果、历史和发展,则要检索详尽、全面、系统的文献信息,强调“全”字。,选择检索系统 主要是根据课题的检索要求选择合适的检索工具或数据库,如:

16、 查找图书可用OPAC书目数据库;查学科术语或数据等可用事实型数据库、参考工具书或网络搜索引擎;撰写学位论文、申请研究课题,需要了解研究对象的历史、现状和发展,要求检索文献全面、彻底,检索覆盖的年份也较长,尽可能选用一些收录年份较长的综合型和专业数据库。 考虑权威性数据库; 数据库的学科专业范围是否与课题的学科相吻合; 需要的是题录、文摘信息还是全文信息,还是事实、图形、数据等; 数据库收录的文献类型、年限、更新周期,所需文献信息在国别和语种是否符合检索需求等。,确定检索途径和检索方法 检索途径主要有:分类、主题、著者、序号。 分类途径: 按文献内容的学科分类体系查找文献的途径。 在印刷型检索

17、工具中主要有分类目录和分类索引。 在计算机检索系统中,则把文献按分类聚类,通过层层点击进行检索,或利用系统提供的分类号进行检索 主题词/关键词途径: 按表达文献主题内容的主题词或关键词作为标识查找文献的途径。 在计算机检索系统中,都提供主题词和关键词检索途径,输入某一主题词或关键词,可检索出文献标题、文摘或正文中包含该的文献。,题名途径:是根据文献的标题或名称,包括书名、刊名、篇名等来查找文献的途径 著者途径:是根据已知文献著(编、译)者的名称查找文献的途径。 代码途径:如标准号、专利号、ISSN号等 时间途径:以文献的时间范围查找文献的途径。,检索方法:一般有直接检索法、间接检索法、追溯检索

18、法和循环检索法四种。 直接检索法 又称浏览法,是通过广泛阅读、浏览近半年的各类文献资料来获得所需的最新信息。同时,在课题确定后,可阅读百科全书、专业手册、年鉴等参考工具书,了解课题的相关背景知识。 缺点:费时费力,具有一定的盲目性和偶然性。,间接检索法 又称系统检索法,指借助于检索工具或系统查找所需文献的方法。常用的有顺查法、倒查法和抽查法。 顺查法: 是以所查课题的起始年代为起点,由远而近按时间顺序查找文献的方法,适合于大课题的检索。优点是查全率高,缺点是工作量大。 倒查法: 是由从最新的文献开始,由近到远进行查找的方法。特点是效率高,查得的文献比较新颖,时常用于科技查新。 抽查法:是根据检

19、索需求,抓住课题研究发展迅速、出版文献较多的时间段进行集中检索。 用这种方法能获得一指具有代表性、反映学科发展水平的文献。,追溯法:利用文献末尾所附的参考文献为线索查找文献的方法,这种检索方法基于文献之间的引用和被引用揭示了文献主题之间存在着某种内在的联系。 追溯引文法:先查出一批与检索课题有关的文献,再以这批文献后面的参考文献作为线索,查找文献的方法。 引文索引法:利用引文索引,从被引文献开始查找引用它的全部论文的方法。 交替检索法:间接检索法和追溯法的结合。先利用检索工具查得一批相关文献,然后再利用这批文献所附的参考文献进行追溯查找,如此交替使用,直至满足检索需求为止。,确定检索词 概念的

20、分析: 任何一个特定的检索课题,往往都是用若干个概念表达的 ,将检索课题从不同角度对课题内容进行概念分析,并针对每一个概念,选择尽可能多的检索词。主题概念转化而成的检索词应能准确、完整地表达检索课题的内容。,如:检索课题:“土壤环境条件对豆科作物固氮作用的影响” 如果就从课题的题目中选择主题词:土壤环境、豆科作物、固氮作用,这显然会造成很大的漏检率。我们应利用自已所学的专业知识对课题进行深入细致的分析,把那些与课题关系密切、能全面、准确表达课题内容实质的词一起作主题词。 决定土壤环境条件的温度、湿度、PH值等; 豆科作物中的大豆、花生等; 固氮作用中起重要作用的根瘤菌、固氮菌等。,隐含概念的分

21、析 有些课题的实质性内容往往很难从课题的名称上反映出来,有些课题单从字面上选择主题词会失之偏颇。课题的隐含的概念和相关的内容需要从课题所属的专业角度作深入分析,才能够提炼出能够确切反映课题内容的检索概念。 如:检索“人造金刚石”方面的文献,其中“人造(manmade)的含义包括有“人工合成(synthetic)在内,单选用“manmade”检索会漏掉许多有用的文献;检索“古代家具设计”的相关文献,古代包括明代、清代、宋代等朝代,不能仅以古代作为检索词。,同义词应尽量选全:同一概念的几种表达式 同一名词的单数、复数、动名词、过去分词等用截词解决,如:child ,children 规范称谓、俗称

22、、全称、简称等,如:盘丽鱼俗称七彩神仙鱼 充分利用选定主题概念的上位或下位概念 找不到课题对应的主题词时,可采用最近一级的上位词。 如:“山核桃产品加工”方面的文章,如果“山核桃加工”没有检索记录的话,就得选“核桃加工”作检索词 充分考虑相关的词,如研究三带双锯鱼的生活习性,假如找不到相关的文献,可以查找同属或同种的鱼类的研究资料,借以参考。,少用或不用对检索课题意义不大的词 一般不选用动词、形容词、禁用词,少用或不用不能表达课题实质的高频词。 词义泛指过度大的词:如“展望”趋势、现状、近况等,“应用”作用、用途、用法等, 词义延伸过多的词:如“制造”制备、生产、加工、工艺等,“提炼”精炼、提

23、取、萃取、回收,以及诸如“有机物”、“无机物”、“病虫害”等外延十分宽的概念等,一般都应转换成具体的方法或材料、化合物及具体的病害与虫害的名称表示。,制定检索策略,编制检索式 检索策略通过编制检索式,选择检索途径来实施。检索式是检索策略的逻辑表达式,指利用布尔逻辑运算符、位置算符、截词符和字段符等,对各检索词进行准确、合理地逻辑和位置组合,编制出检索提问式。 再配合选择检索点,即检索入口,通常的检索入口,如:题名、著者、主题词、关键词、分类、引文、文摘、全文、出版年等。 明代家具的美学研究:(明式家具+明代家具)*(审美+美学) 实施检索、分析检索结果、索取原文,调整检索式,优化策略 当命中文

24、献太少时,应进行扩检,提高查全率 (1) 准确把握检索对象及目的,选择合适的数据库。 (2) 降低检索词或分类号的专指度。 (3) 更多地采用学科分类途径来扩大检索范围。 (4) 减少逻辑“与”及逻辑“非”的使用,增加逻辑“或”及截词检索技术的使用。 (5)将检索途径调整到更宽泛的字段中。 (6) 不限定检索对象的文献类型、时间段、文种等。,当命中文献太多时,可对检索策略进行细化,提高查准率 (1) 准确把握检索对象及目的,选择合适的数据库。 (2) 提高检索词或分类号的专指度。 (3) 更多地采用专用名词及特性检索的途径。 (4) 选择逻辑“与”及逻辑“非”的使用。 (5) 减少或不采用逻辑

25、“或”及截词检索技术的使用。 (6) 限定检索词出现的字段及在段落、文句中的位置。如将检索词的查找范围限制在篇名和叙词字段中。利用文献的外表特征限制检索,不选“全文检索”。 (7) 限定检索对象的文献类型、时间段、文种及其它特征。 (8) 将检索词向下位类收缩,提高检索的专指性; (9)在检出记录中选取新的检索词对结果进行再次限制。,构建以下课题的检索式,松毛虫的防治策略研究 论家具设计中的简约主义,松毛虫的防治策略研究 松毛虫 and (防治 or 预防) 检索式:松毛虫*(防治+预防) 论家具设计中的简约主义检索词之间的关系: 检索词之间的关系:家具 and (简约主义 or 简约风格) 检索式:家具*(简约主义+简约风格),

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1