信息检索基础.ppt

上传人:本田雅阁 文档编号:2844241 上传时间:2019-05-27 格式:PPT 页数:41 大小:1.49MB
返回 下载 相关 举报
信息检索基础.ppt_第1页
第1页 / 共41页
信息检索基础.ppt_第2页
第2页 / 共41页
信息检索基础.ppt_第3页
第3页 / 共41页
信息检索基础.ppt_第4页
第4页 / 共41页
信息检索基础.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《信息检索基础.ppt》由会员分享,可在线阅读,更多相关《信息检索基础.ppt(41页珍藏版)》请在三一文库上搜索。

1、文献特征以及文献标引,第一节,第二节 知识组织与信息检索,第三节 信息检索途径、方法与步骤,一、文献特征,二、文献标引基础 1、文献标引 2、分类表标引 3、主题标引,第一节 文献特征及文献标引,文献的外部特征 题名 著者 版本 出版年 载体形态,一、文献特征,文献的内容特征 主题词 关键词 分类号,1、文献标引 标引就是将文献和提问的内容特征用情报检索语言的形式表达出来的过程 文献标引步骤:,二、文献标引基础,【例】一篇题为代德景问题的机械算法的文章,经分析,它谈的是“代德景问题”的“计算机证明”(概念标引),我们把它标引成如下形式: “代德景问题,定理证明”(主题标引) “”(分类标引:是

2、中国图书分类法“定理证明”的分类号) 这样我们从主题词“代德景问题”“定理证明”的主题角度,以及从“”的分类角度都可以查到这篇文献。,文献标引案例,2、分类表标引 中国图书馆分类法(原称中国图书馆图书分类法)是新中国成立后编制出版的一部具有代表性的大型综合性分类法,是当今国内图书馆使用最广泛的分类法体系,简称中图法。中图法使用字母与数字相结合的混合号码,基本采用层累制编号法。包括马列主义、毛泽东思想;哲学;社会科学;自然科学;综合性图书五大部类。,二、文献标引基础,二、文献标引基础,2、分类表标引 分类表标引四大属性 (1)网罗性 (2)体系性 (3)明确性 (4)可查性,【例】计算机在图书馆

3、管理中的应用一书应该分到计算机类还是图书馆类?应该用什么符号作该类的分类号? 解决这类问题,我们必须依据文献分类法来进行分类。分类表就是分类法的具体体现。 计算机在图书馆管理中的应用有二个主题内容:计算机应用、图书馆管理。依据中国图书馆分类法有二组类目可供考虑:图书馆学、图书馆事业;计算机的应用。,分类表标引案例,3、主题标引 主题词表 主题词表是对检索和标引用词进行规范并显示其中关系的词表,有以下作用: (1)通过同义词的互见对检索和标引用词进行规范,将不同形式的同义词转换成事先选择好的唯一形式,从而避免由于对同义词的不同选择而造成的漏检。,二、文献标引基础,3、主题标引 主题词表 (2)通

4、过上位词、下位词的显示来增加机器的缩检和扩检功能。 (3)通过内容互有关联的主题词的“参见”提高检全率。,二、文献标引基础,3、主题标引 下面是英国INSPEC数据库采用的主题词表的格式:,二、文献标引基础,3、主题标引 主题标引有两种方式:第一,用主题词标引,即选择主题词表中的词对文献进行标引;第二,用自由词标引,即当文献的主题在主题词表中找不到合适的词来表达,就用词表之外的词进行标引。,二、文献标引基础,【 例】 一篇题为 代德景问题的机械算法 的文章, 经分析, 它谈的是 “ 代德景问题” 的“计算机证明” ( 概念标引) , 我们把它标引成如下形式: “代德景问题, 定理证明” ( 主

5、题标引) “” ( 分类标引: 是中国图书分类法 “定理证明” 的分类号) 这样我们从主题词 “代德景问题” “ 定理证明” 的主题角 度, 以及从 “ ” 的分类角度都可以查到这篇文献。,二、文献标引基础,一 信息检索概念,三 信息检索系统,二 信息检索语言,知识组织与信息检索,第二节,一、信息检索概念,信息检索就是利用过滤技术对信息进行条件限制。 案例:李开复从30万图片邮件中找出20封邮件(离开微软到GOOGLE)。 方法:把图片转换为文字,再检索。,1分类检索语言 中国图书馆图书分类法(简称中图法) 中国科学院图书馆图书分类法(简称科图法) 杜威十进分类法(DDC)与国际十进分类法(U

6、DC) 美国国会图书馆分类法(LC),二、信息检索语言,中国图书馆图书分类法, 中国科学院图书馆图书分类法 (简称科图法),设置5大部类25大类 马克思列宁主义、毛泽东思想 哲学 社会科学 自科科学 综合性图书,科图法,00 马克思列宁主义、毛泽东思想 哲学 社会科学 历史、历史学 经济、经济学 政治、社会生活 法律、法学 军事、军事学 文化、科学、教育、体育 语言、文字学 文学 艺术 49 无神论、宗教学,50 自然科学 51 数学 52 力学 53 物理学 54 化学 55 天文学 56 地质、地理科学 58 生物科学 61 医药、卫生 65 农业科学 71 技术科学 90 综合性图书,D

7、DC:Dewey Decimal Classification 根据培根关于知识分类的思想,将人类知识分为记忆(历史)、想象(文艺)和理性(哲学、即科学)三大部分,并将其倒置排列,展开为10个大类 。 UDC:Universal Decimal Classification 又称通用十进分类法,杜威十进分类法(DDC)与国际十进分类法(UDC),000 总论 100 哲学 200 宗教 300 社会科学 400 语言 500 自然科学和数学 600 技术(应用科学) 700 艺术、美术和装饰艺术 800 文学 900 地理、历史及辅助学科,0 总类、科学和知识 1 哲学、心理学 2 宗教、神学

8、 3 社会科学 4 (语言) 5 数学和自然科学 6 应用科学、医学、技术 7 艺术、娱乐、体育 8 语言、语言学、文学 9 地理、传记、历史,杜威十进分类法(DDC)与国际十进分类法(UDC), 美国国会图书馆分类法(LC),LC共分20个大类,其中历史占3个大类,军事占2个大类。,A 总论 B 哲学、心理学、宗教 C 历史辅助科学 D 历史:世界史及世界古代史 E/F 历史:美洲史 G 地理、地图、人类学、娱乐 H 社会科学 J 政治学 K 法律 L 教育 M 音乐 N 美术 P 语言、文学,Q 自然科学 R 医学 S 农业 T 技术 U 军事科学 V 海军科学 Z 目录学、图书馆学,分类

9、号是字母与数字的组合,如: SB191.P64 爆裂玉米 SB351.C7 甜玉米,2、主题检索语言 直接以自然语言中代表事物、问题和现象的术语作为表达信息主题内容的检索词。,二、信息检索语言,3、关键词语言 从文献内容中抽出来的词或者词组,这些词或者词组作为文献内容的标识和查找目录索引的依据,关键词不需要规范化。,一 信息检索途径,三 信息检索步骤,二 信息检索方法,文献检索途径、方法和步骤,第三节,1、信息检索使用的工具 互联网及其搜索工具 数据库及其检索平台 数据库提供的检索形式:一般检索/二次检索、高级检索 其他检索工具,三、信息检索系统,一、信息检索途径,1、内容特征途径,(1)主题

10、途径 主题途径是按文献信息的内容主题进行检索的途径,对课题进行主题概念分析,提炼主题概念,选择能表达主题概念的语词,确定主题词、关键词、叙词或标题词。,一、信息检索途径,(2)分类途径 分类途径是一种按照文献信息所属学科(专业)类别进行检索的途径。对课题内容进行分类分析,按分类法进行分类,获取分类号。,3、代码途径 许多文献信息具有惟一的或一定的代码,如化学分子式、结构式、化学物质登记号等。根据各种代码编制成了不同的代码索引,在已知代码的前提下,利用代码途径能查到所需文献,满足特性检索的需要。利用代码途径,需对代码的编码规则和排检方法有一定的了解,往往可以从代码判断文献的种类、出版的年份等,有

11、助于文献检索的进行。,一、信息检索途径,2、外表特征途径,一、信息检索途径,题名途径 题名途径是根据文献信息的题名来查找文献的途径,文献信息的题名包括书刊名称、论文名称、专利名称、标准名称等。,一、信息检索途径,责任者途径 责任者途径是根据已知文献责任者来查找文献信息的途径。文献责任者包括个人责任者、团体责任者、专利发明人、专利申请人等。利用责任者检索文献信息,主要利用作者索引、个人目录、个人作者索引、团体作者索引、专利权人索引等。,机构名称途径 根据机构名称检索该机构出版或发表的文献信息情况,以了解和统计该机构的学术和科研成果。检索工具中的团体著者索引提供了由机构名称检索文献的途径。,一、信

12、息检索途径,编号途径 编号途径是根据文献信息出版或发布时给出的编号来检索文献信息的途径。这些号码包括图书ISBN号、连续出版物ISSN号、专利申请号、专利号、标准编号、报告合同号和论文存取号等。,一、信息检索途径,其他途径 有些检索工具还编有一些特殊索引,可以通过特殊途径找到所需文献信息。如引文索引、会议索引等。,其他途径 有些检索工具还编有一些特殊索引,可以通过特殊途径找到所需文献信息。如引文索引、会议索引等。,一、信息检索途径,A常用法 包括顺查法、倒查法、抽查法三种。 B追溯法 包括参考文献法和科学引文法。 参考文献法:利用已有文献的参考文献查找相关文献的方法 科学引文法:从被引用文献查

13、找引用文献的方法。 C综合法 常用法与追溯法的结合,二、信息检索方法,A信息需求分析(主题内容、学科范围、时间范围、信息类型) B选择检索工具(题录、文摘、索引) C确定检索途径(主题、分类、责任者、其他) D选择检索方法(常用法、追溯法、循环法) E查找文献线索 F识别文献来源 G获取原始文献(馆藏目录确定馆藏地点、全文数据库、馆际互借/文献传递),三、信息检索步骤,为提高检索查准率,常将检索范围限定在某个字段或某个范围中。常用的字段有: 题(篇)名(Title , TI) 文摘(Abstract Field,AB) 叙词或主题词(Descriptor,DE;Subject,SU) 著者(A

14、uthor,AU) 著者机构(Corporate Source,CS或Affiliation,AF) 刊名(Journal Name,JN或Source Title,ST) 出版年(Publication Year,PY) 文献类型(Document Type,DT或Type,TY) 语种(Language,LA) 分类号(Classification,CC),字段限制检索,了解“纳米银粒子” 方法:用Google搜索,初步了解。也可以查找期刊论文,或咨询有关专家。 纳米技术是近几年发展起来的一门新技术,不完全成熟。美国及英法等国2000年前后才将纳米研究列入国家重点发展领域。 纳米银是直径小

15、于100纳米的金属银单质,一般在2050纳米。纳米银是以原子结构组成的银粒子,而不是银离子。纳米银不带电荷,是固体粉末。是通过物理化学方法将金属银单质加工成颗粒直径小于100纳米的金属银单质。,(4)案例:“纳米银粒子的制备研究”,选择检索词,构建综合检索式 (纳米银粒子纳米银纳米银粉)*制备 确定学科范围 物理学、化学、材料科学,(4)案例:“纳米银粒子的制备研究”,确定检索年代、文献类型、检索方法、检索数据库 时间范围:2000年 文献类型:期刊论文、会议论文、研究报告、专利 检索方法:倒查法、追溯法相结合 使用的数据库 中文:CNKI、万方、重庆维普 外文:EBSCO、Elsevier、Springer、ProQuest、INSPEC、ISI Web of Science,(4)案例:“纳米银粒子的制备研究”,根据检索任务分析并提取检索词,列出综合检索式。 列出拟使用的信息检索系统。 1.有限大小神经元细胞膜离子通道随机性的温度效应 2.基于超宽带(UWB)技术的测距方法研究 3.激光超声技术及其在金属无损检测方面的应用 4.虚拟天文台数据访问服务(VO-DAS)之任务调度及VO-DAS的应用 5.有效动力论研究高温QCD物质的粘滞系数,课堂练习,谢谢大家!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1