信息检索策略与课题分析.ppt

上传人:本田雅阁 文档编号:2844265 上传时间:2019-05-27 格式:PPT 页数:43 大小:414.55KB
返回 下载 相关 举报
信息检索策略与课题分析.ppt_第1页
第1页 / 共43页
信息检索策略与课题分析.ppt_第2页
第2页 / 共43页
信息检索策略与课题分析.ppt_第3页
第3页 / 共43页
信息检索策略与课题分析.ppt_第4页
第4页 / 共43页
信息检索策略与课题分析.ppt_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《信息检索策略与课题分析.ppt》由会员分享,可在线阅读,更多相关《信息检索策略与课题分析.ppt(43页珍藏版)》请在三一文库上搜索。

1、信息检索策略与课题分析,,本讲内容,基本概念 1.1 检索课题 1.2 检索工具 1.3 主题词 1.4 关键词 信息检索策略 检索步骤 课题分析 检索途径 时间范围 检索方法 信息检索效果评价 经验分享,1 .1 基本概念:检索课题,检索要解决的问题或待解决的重大事项 一个论文题目 一个任务 一个解决方案,1 .2 基本概念:检索工具,检索工具又称检索系统。是人们用来报道、存储和查找各类信息的工具。包括印刷型、缩微型等。 网络信息检索工具类型 搜索引擎 搜索软件 网络目录 学科信息门户 数据库 OPAC 网络参考工具,1 .3 主题词,主题词 主题词(subject word subject

2、 terms)又称叙词,是专门为文献标引或检索而从自然语言的主要词汇中挑选出来并加以规范化的词或词组。 主题词是以自然语言为基础,经过标准化处理的词语。它能直接表达文献所论及或涉及的事物(即主题),而不管该文献是从哪个角度、从什么学科来论述该事物(即主题)。 用主题词检索往往能比用关键词检索得到更多的检索结果。,1.4 基本概念:关键词,概念 关键词是指那些出现在文献的标题(篇名、章节名)以至摘要、正文中,对表达文献主题内容具有实质意义的语词,亦即对揭示和描述文献主题内容来说是重要的、带关键性的(可作为检索“入口”的)那些词语。不加规范或只作极少量的规范化处理。 注意 一般是两个单元词(不可再

3、分的词)组成一个关键词,如“金融危机”。如:“犯罪的心理”犯罪心理 关键词可以在题名、关键词、主题词、摘要、全文等中进行检索。,2 信息检索策略,执行一个课题的检索是有过程、分步来完成的,检索步骤和检索方法的科学安排称为检索策略(retrieval strategy),它是为实现检索目标而制定的全盘计划或方案。 【广义】检索策略:是在充分分析课题内容实质的基础上, 选择检索工具与检索径、发掘检索点、确定检索词及其相互间的逻辑关系, 到给出检索顺序的最佳实施方案等一系列的科学措施。 【狭义】检索策略:把检索提问标识(检索途径+检索词+逻辑组配)与检索提问式(即检索式)的构造称作信息检索策略。,2

4、.1 信息检索步骤,分析检索课题,明确信息需求 选择检索工具,了解检索系统 确定检索途经,选定检索方法 实施检索策略,浏览初步结果 调整检索策略,获取所需信息,信息检索步骤示意图,分析检索课题 1.主题内容 2.时间范围 3.信息类型 4.检索语种,主 题 概 念,确定检索途径 1.分类途径 2.主题途径 3.题名途径 4.著者途径 5.其它途径,选择检索方法 1.顺查法 2.倒查法 3.抽查法 4.追溯法 5.交替法,信 息 线 索,确定一次信息出处 1.缩写还原为全称 2.音译转换成原名 3.信息类型,选择检索工具 1.馆藏目录 2.图书馆 信息检索系统,获取一次信息,选择检索工具 1.索

5、引、文摘 2. 全文数据库,2.2 课题分析,检索课题的分析,即主题分析,以明确课题所包含的概念成份及其相互关系。这是检索策略制定的根本出发点,也是检索效率高低或成败的关键。检索课题的分析要明确以下问题: 分析课题的主要内容其所涉及的学科范围。 确定关键词(同义词、近义词、上词)。 所需文献的类型、语种、年代及文献量的范围。 对查新、查准、查全的指标要求,及其侧重。,2.2.1 检索需求,一般检索需求类型,查找某概念的确切含义 如:什么是“blog” 查找某概念的背景知识 如:谁最先发现青霉素 查找某些事物的数值及量化指标,特征型知识 一般通过事实型、数值型数据库和搜索引擎获得。,查找某一学科

6、的一般知识 如:关于分子生物学有哪些专著 查找学科专业领域的新进展 如:有关纳米技术的研究综述 查找课题相关的专业文献 最常见的!,关联型知识 文献数据库。,更多,电子元器件的技术特性数据,可用有关的电子元器件类手册、产品目录、样本或书查找; 查过去某年度某种电气电子类产品的产销、贸易、市场概况,可用有关年鉴类资料; 查国内外哪些大学招收电气电子类研究生,可查大学类的机构名录或校方的招生简章资料; 查“自动化”一词的概念与含义,可用百科全书、学科术语类解释辞典和相关手册; 查电子产品的电路图,可用相应的电路图集或手册; 查钱学森的主要论著和贡献,可用名人录;等等。 毕业论文写作查文献数据库。

7、日常信息检索用搜索引擎。 ,2.2.2 主题分析:主题概念与检索词,你得到什么检索结果,取决于你怎么提问。 看一则幽默: 有一位女子,开出的征男友条件有三条: 1.要帅 2.要有车 3.要有海外背景 帅+车+海外 数据库帮她搜索的结果会是什么? 你拿什么到数据库中去检索?,2.2.2.1 主题分析的一般技巧,主题:论述的对象和研究的问题 明确检索课题(信息需求)。进行简单的主题概念分析后,得到几个关键词。 从自己的信息环境中选择任何形式的信息源(课本、笔记、图书馆、数据库、参考工具书、网络、人),去查阅资料,了解检索课题相关的一些知识与信息,找到准确、全面的主题概念(同义词、近义词、上位词、下

8、位词、相关词等),分析检索词间的逻辑关系,选择合适的数据库。 边检索边学习。不但地明确自己的信息需求,对检索结果进行评价,适时调整检索策略。 信息检索是在掌握全面知识(如:信息环境、检索知识、检索策略等的要求高)的基础上的灵活运用。,2.2.2.2 概念组配,概念组配是叙词语言的基本原理。 概念组配与字面组配在形式上有时相同,有时不同;而从性质上来看两者区别是很大的。字面组配是词的分析与组合(拆词);概念组配是概念的分析与综合(拆义)。例如:,字面组配 模拟+控制模拟控制 香蕉+苹果香蕉苹果,概念组配 模拟+控制模拟控制 香蕉味食品+苹果香蕉苹果,汉语主题词表 10个分册,2.2.2.3 分析

9、检索的内容实质,从镀锌残渣中回收锌 工艺? 实际是:从高品位镀锌残渣中分离铁 所以检索需求可以这样表述: “从锌块中分离铁”,2.2.2.4 隐性主题的处理-主题概念具体化,请分析主题概念。,“耐热钢”,课题:高温下使用的不锈钢,“不锈钢”,隐性主题具体化,如:酸洗费液的处理 处理:“回收”、“再生”,如:煤灰利用 具体利用:?,检索式: (粉煤灰+煤炭)*(利用+砖+水泥+混凝土+路基+),2.2.2.5 找出核心概念,简化逻辑关系,并不是概念越多越好! 抓住主题的核心:最能表达检索课题内容,而且具有实际检索意义的关键词。 如“利用稻米皮糠提取天然食品色素” 稻米、皮糠、提取、天然、食品色素

10、 稻米、食品色素,排除检索意义不大的词,排除检索意义不大而且比较泛指的概念 如:展望、发展趋势、现状、近况、生产工艺、应用、利用、作用、方法、影响、制备、结果 不要望词生义,2.2.2.6 明确概念间的逻辑关系,同义词、近义词是或的关系 用上位词 即扩检,如“教育心理学” 用下位词 即缩检,如“智育心理”、“德育心理”、“美育心理”、“教学心理学”、“学习心理学”、“教师心理学”、“学生心理学”等。 若多个下位词都用来检索,相对于一个上位词来说,一般是扩检。 一个下位词相对于一个上位词来说,一般是缩检。,2.2.2.7 一般可以选择的词,表示具体事物名称的名词术语,如汽车、变压器、反应堆、水稻

11、、坐标仪等; 表示事物的状态或现象的名词术语,如强度、失真、土壤熟化、日冕、船舶过载等; 表示科学分类的名词术语,如数学、物理学、中医学、电子学、建筑工程、水利工程等; 表示研究方法、技术方法的名词术语,如分析(化学)、针刺手法、有限元法、结构功能法、力学性能试验等;,本页面内容参考汉语主题词表,表示工艺方法、加工技术的名词术语,如铸造、锻造、热处理、焊接、酿造、取心钻进、爆破成型、激光切割等; 表示化学元素、化合物、金属材料与合金的名词术语,如钠、氧原子、族元素、钠化合物、硅化物、硫酸、钛络合物、钉胺、呋喃、吡啶、醇聚四氟乙烯、丁二酸()以及如金属板耐蚀钢、耐蚀合金等; 表示国家名称、地名、

12、组织机构名称及人名的专有名词以及文献类型、文献载体的名词术语,,2.2.2.8 课题分析实例,1.检索课题:网络资源的知识产权保护 关 键 词:网络资源/网络信息资源/知识产权保护/版权/著作权限/合理使用 2.检索课题:经济领域犯罪的心理分析 关 键 词:经济犯罪/犯罪心理分析 3.检索课题:关于经济领域诈骗行为心理剖析 关 键 词:经济诈骗/诈骗心理 /经济犯罪/犯罪心理分析,2.2.2.9专业词的翻译问题,http:/ 例:中外网络文化比较研究 Web2.0、博客文化、网络社区、大众文化 网络:network、internet、net、web、netware 文化:culture、cul

13、tural、 其它词:web2.0 、blog、community、 pop,试一试:,东南亚家电市场研究,2.3 检索途径(检索项目),分类途径 主题途径 关键词、主题词 摘要、全文 著者途径:作者,可以是人名、单位名 题名途径 :篇名、题目、标题等 机构途径:单位 代码途径 : ISSN号、专利号、报告号、合同号 其他途径 来源:文献出处。如期刊名称,出版社等信息,2.4 时间范围,对文献发表的时间范围进行限定是检索中常用的策略 文献老化规律的应用 文献的半衰期:某学科领域现时还在利用的全部文献中的一半是在多长的时间内发表的。例如:物理学文献的半率期是4.6年,即是说:现时仍在利用的物理学

14、文献的50,其出版年龄不超过4.6年。 学术信息的半衰期一般是35年。许多信息的老化如艺术品、经济信息、市场信息等表现出跳跃性。有时突然失效,有时永不失效。 查阅文献信息时尽量选取较新的文献。同时要顾及较早的文献。一般性研究可选择近10年来的文献即可。了解背景资料的则要长得多。 对发达国家的文献的利用可以在中文文献年限的基础上增加310年。,2.5 检索方法,检索方法一般有: 直接检索法 间接检索法 顺查法 倒查法 抽查法 追溯检索法 交替检索法;,直接检索法,是指直接通过浏览、查阅文献原文而获取所需文献信息的方法。这种方法不依靠检索工具,所以不是严格意义上的检索方法 优点:能够明确判断文献所

15、包含的信息是否需要 缺点:是难以获得全面的文献,且费时费力,具有一定的盲目性和偶然性。 如果检索课题单一,文献相对集中,又熟悉检索书刊,可用这种检索方法。 对于有多个主题、文献离散度较大的课题,则不宜用此法 由于直接检索具有准确性和实用性优势,能满足用户直接获取文献的要求,因而是文献检索的必要手段。,间接检索法,间接检索法是借助于检索工具查获所需文献的方法,包括顺查法、倒查法和抽查法。 顺查法 是经过分析,确定查找的起始年代,再利用选定的检索工具由远及近地逐年查找文献的方法。 它适用普查一定时间的全部文献,查全率较高,并能掌握课题的来龙去脉,了解其研究历史、研究现状和发展趋势。 倒查法 此法与

16、顺查法相反,是按照时间范围,利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止。 由于这种方法重点是查检近期文献,所以能获得较新的文献信息,节省检索时间。 然而不如顺查法查全率高,容易产生漏检的现象。,抽查法 是根据检索需求,针对所属学科处于发展兴旺时期的若干年进行文献查找。 用这种方法能获得一批具有代表性、反映学科发展水平的文献,检索效果和效率较高,但必须熟悉学科发展的特点。,追溯检索法,追溯检索法也叫扩展法、追踪法。此法不是利用确定的检索工具,而是利用已知文献的某种指引,如文献附的参考文献、有关注释、辅助索引、附录等,追踪查找文献。 根据已知文献的指引,查找到一批相关文献;再根据相

17、关文献的有关指引,扩大并发现新的线索,去进一步查找。如此反复追踪扩展下去,直到检索到切题的文献。 用追溯法检索文献,最好利用与研究课题相关的专著与综述,因为它们所附的参考资料既多且精。 在检索工具不全、文献线索很少的情况下,可采用此法。 作用 用较少的文献引出较多的文献 了解科学研究的前期工作基础、相关文献、经典著作、主要作者、重点期刊等。,追溯检索的更多应用,文章参考文献更多文章 文章作者文章 作者文章 作者团体更多作者文章 链接网站更多链接 期刊论文图书 图书期刊论文,小结,顺查法:时间上,远近 查全率高 到查法:时间上,近远 查准率高 抽查法:研究的高级阶段 检索效率高 追溯法(引文法)

18、 : A.一次文献参考文献一次信息参考文献 近远 B.一次文献引用该一次信息的文献新的一次文献 实际是由“远近 ”越查文献越新 交替法(综合法),交替检索法,交替检索法是间接检索法和追溯检索法的结合 先利用检索工具查得一批相关文献,然后再利用这批文献所附的参考资料进行追溯查找,扩大线索,从而得到更多的相关文献,如此交替使用,直至满足检索需求为止。,2.6 检索工具,与检索主题相关的检索工具有哪些?*(主要看数据库的学科覆盖范围) 与检索需求的文献类型相关的检索工具有哪些?(如:哪些数据库或网站中含有会议论文) 语种、年限、结果形式(全文还是文摘) (如检索19891994年的文献,选择维普还是

19、CNKI),如何了解检索工具,注重信息环境的了解和平时积累。 在利用新的检索工具前花几分钟了解一下数据库是一个良好的信息素质。 如何获得数据库的检索帮助 一般数据库界面上都有“帮助”或者“检索指南”。 图书馆等文献机构发布数据库时提供的使用帮助。 通过Google等搜索引擎搜索。 如:filetype:ppt 读秀,39,逻辑检索 逻辑算符 逻辑组配,检索途径 检索项 题名|主题,浏览模式 分类|主题| |文献类型,匹配模式 精确|模糊 |截词检索,检索模式 初级检索| 高级|专家,结果处理 排序|选择| 获取|使用,特色功能 与 拓展服务,3 信息检索效果评价,在信息检索过程中要经常提醒自己

20、: 查全率:相关信息是否都检索出来了?有没有遗漏的? 查全率=(检索出的相关信息量/系统中的相关信息总量)x100% 查准率:检索出来的信息是否密切相关?无关信息多否? 查准率=(检索出的相关信息量/检索出的信息总量)x100%,课题检索中的应用 若要了解科技的最新动态、学科的进展、了解前沿、探索未知,则强调一个“新”字; 若要解决研究中的具体问题,则要强调一个“准”字; 若要了解一个全过程,撰写综述、作鉴定、报成果,就要回溯大量文献,要求检索的全面、详尽、系统,则要强调一个“全”字。,4 经验分享,经常提醒自己:是否真的完全知道自己需要什么样的信息? 检索是用词去检索,而不是一个句子。 检索词的选取和逻辑组配 信息检索是一个多步骤的过程! 在检索过程中实时选择和保存合适的文献。 要有大的信息环境观 Ask Libraries,撰写论文的文献检索一般方法,从搜索引擎入手到数据库检索 从综述论文开始到具体研究内容的论文 针对要撰写论文大纲中的小标题去检索 从中文文献(数据库)到外文文献(数据库) 先检索出较少的经典文献,再扩大检索、阅,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1