信息源与信息检索一般原理.ppt

上传人:本田雅阁 文档编号:3246024 上传时间:2019-08-05 格式:PPT 页数:67 大小:1.75MB
返回 下载 相关 举报
信息源与信息检索一般原理.ppt_第1页
第1页 / 共67页
信息源与信息检索一般原理.ppt_第2页
第2页 / 共67页
信息源与信息检索一般原理.ppt_第3页
第3页 / 共67页
信息源与信息检索一般原理.ppt_第4页
第4页 / 共67页
信息源与信息检索一般原理.ppt_第5页
第5页 / 共67页
点击查看更多>>
资源描述

《信息源与信息检索一般原理.ppt》由会员分享,可在线阅读,更多相关《信息源与信息检索一般原理.ppt(67页珍藏版)》请在三一文库上搜索。

1、信息源与信息检索一般原理,刘竟 信息咨询部,江苏大学图书馆馆员培训,提纲,信息源 信息检索基本知识 检索原理 检索语言 检索技术 检索步骤,1 信息源及其类型,学习目标: 信息源的概念和类型; 掌握文献的类型,了解各类型文献的特点 在学习和研究中学会有针对性地选择不同类型的文献,1.1 信息源的概念,信息源是产生信息的源泉,也是人们获得信息的来源. 信息是物质的一种属性,因此“万物皆是信息源”,所有能给人们提供信息的环境、人或事物都被看做是信息源。 如果从更专业化的角度来看待“信息”的话,那么可以将信息源理解为:人们在科研、生产及其他一切人类活动中产生并积累下来的成果和各种原始记录,以及对这些

2、成果和原始记录加工整理后得到的产品。,1.2 信息源的类型,文献信息源:以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息。这类信息源是当前数量最大、利用率最高的信息源。如:图书、学术论文等。 非文献信息源:非文字记录性信息的来源,如口头言论传播的信息、参观考察、会议、展览等无文献记录或不做记录的信息来源。,文献 记录有人类精神信息的、且便于存贮或传递的人工固态附载物记录知识的载体 文献的特点: 知识是文献的本质属性; 载体是文献的存在形式; 记录是构成文献的重要手段; 新陈代谢是文献发展、运动的规律。,1.3 文献及其类型,1.3.1 按载体形态划分 1.3.2 按文献加工层次

3、划分 1.3.3 按出版类型划分,1.3 文献及其类型,1.3.1 按载体形态划分 印刷型(Printed Form) 缩微型(Micro Form) 声像-视听型(Audio-Visual Form) 电子型 (Electronic Form),1.3 文献及其类型,1.3.2 按文献加工层次划分 一次文献(专著、报纸、期刊、特种文献) 二次文献(目录、题录、索引、文摘) 三次文献(专题报告、综述、手册、百科全书),1.3 文献及其类型,1.3.3 按出版类型划分 图书 期刊 会议文献 专利文献 学位论文 政府出版物 标准 ,1.3 文献及其类型, 图书 ( Book ),通过图书可以了解他

4、人关于某个专门问题的研究或对实践经验的系统论述。 特点:知识内容更成熟、更稳定、更可靠。 缺点:出版周期长、内容更新慢, 若要对某些问题获得较全面、系统的了解,或对不熟悉的领域有个初步、基本的了解,阅读有关图书是个较好的办法。,一般分为两类:阅读型;工具型 唯一标识:ISBN号(国际标准书号), 期刊,期刊是一种有固定名称、有连续的卷、期年月顺序号,并计划无限期出版的连续出版物。,特点:出版周期短 内容新颖 是科研人员获取信息的重要来源。,看哪些期刊论文?,据统计,目前世界上科技期刊已达1012万种 *在收集和阅读文献信息时,应首先选择本专业的核心期刊。 核心期刊:指刊载该专业论文数量较大(信

5、息量较大),学术水平较高的,能反映本学科最新研究成果及本学科前沿研究状况与发展趋势的,倍受该学科专业读者重视的期刊。,核心期刊的评定,北大中文核心期刊要目总览 4年更新一次 http:/ 2008年版 图情类核心期刊表 CSSCI南大中国社会科学引文索引 http:/ CSSCI来源期刊(20082009年) SCD(科学引文数据库)源期刊,是中国大学评价课题组研发。自2006年开始用于中国大学评价和中国大学研究生院评价 每年更新一次。 图情、档案类核心期刊表, 专利文献(Patent Document),广义:包括专利申请书、专利说明书、专利公报和专利检索工具,以及与专利有关的一切资料 狭义

6、:指各国专利局出版的专利说明书。 专利号是识别专利文献的重要依据。 例如:US:828496 专利文献具有新颖性、创新性和实用性的特点. 备注: 7月8日(星期三)15:3016:20 中外专利数据库的检索与利用(王秀红), 会议文献,主要指在各种学术会议上发表的论文。 特点: 专业性强、内容新、针对性强、学术水平高、出版发行较快、信息传递及时。 会议文献大部分是本学科领域内的新成果、新理论、新方法。,学位论文(Dissertation/thesis),为获得某种学位而撰写的科学论文。 一般不出版发行,保存在授予学位单位的图书馆里。,标准文献(Standard Literature),定义:狭

7、义的标准指按规定程序制订、经公认的权威机构批准的一整套在特定范围内须执行的规格、规则、技术要求等规范性文献;广义的标准指与标准化工作有关的一切文献。,特点:具有约束力;时效性;针对性。 标准文献的识别特征是标准号,通常由标准代号、顺序号、颁布年代构成。标准代号:GB、ISO、ANSI、IEC、EN,其他还有: 科技报告、档案文献、政府出版物、报纸、新闻稿、产品样本、统计资料等文献类型。,2 信息检索基本知识,学习目标: 检索原理 检索语言 检索技术 检索步骤,2.1 信息检索原理,从已存储的文献资源中找出与用户情报提问相关的文献信息。 广义的信息检索全称为“信息存储与检索”(Informati

8、on Storage and Retrieval),包括信息存储和信息检索两个方面。 狭义的信息检索仅指广义的信息检索的后半部分,即信息检索部分。 信息检索的实质是反映和寻求提问标识与检索标识之间相匹配的信息。,2.1 检索原理,思考: 1.前面几种文献类型的外表特征和内容特征有哪些? 2.文献的标题是外表特征还是内容特征?,2.2 检索语言,用来描述文献特征和表达检索提问的一种专门语言,是用于文献标引和检索提问的约定语言。 在信息存贮过程中,使用检索语言描述信息的内容特征和外表特征,从而形成文献标识; 在信息检索过程中,使用检索语言描述检索提问,从而形成提问标识。 当提问标识与文献标识完全匹

9、配或部分匹配时,需要的信息就被检索出来了。,2.2 检索语言,描述文献 信息特征,2.2.1 分类语言,又称分类法, 将文献主题概念按知识学科性质进行分类和系统排列 并用号码(分类号)表达各种概念,中国图书馆分类法 中图法 将学科知识分为5大基本部类,22个基本大类 分类标识即分类号,由字母和数字组成 采用等级列举表达从属关系,中图法简表,A 马、列、毛、 邓理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理,N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药

10、、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学 Z 综合性图书,F 经济 F0 经济学 F1世界各国经济概况、经济史、经济地理 F2经济计划与管理 F20国民经济管理 F21经济计划 F22经济计算、经济数学方法 F23会计 F230 会计学 F231 会计簿记方法 F232 会计设备 F233 会计工作组织与制度 F234 各种会计和簿记 F234.1 社会会计 F234.2 成本会计 F234.3 管理会计 F234.4 财务会计 F234.5 国际会计 F3农业经济 F4工业经济,中国科学院图书馆图书分类法(科图法) 中国人民大学图书馆图书分类法

11、(人大法) 国际十进分类法 UDC 杜威十进分类法 DDC 国际专利分类表IPC,主题语言,也称主题法,是一种用语词标识处理原始信息、组织主题检索工具或检索系统的检索语言。主题语言又分为标题词语言、单元词语言、关键词语言和叙词语言。,2.2.2 主题语言,1)叙词语言 叙词语言是以自然语言词汇为基础,以概念组配为基本特征,适应现代信息需求而发展起来的一种信息检索语言类型。 叙词又称描述词、叙述词,是以概念为基础,经过优选和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需要的语词。 叙词语言的特点:直观,专指性强,组配性高,结构严谨,标引能力强。 叙词语言示例:汉语主题词

12、表、英国科学文摘使用的INSPEC Thesaurus、美国工程索引93年后使用的Ei Thesaurus等。,图书馆员 D 图书馆工作人员 D 图书馆工作者 D 图书馆馆员 D 图书馆管理人员 D 图书馆管理员 D 图书馆人员 C 图书馆工作 C 图书馆领导,图书馆工作人员 Y 图书馆员,图书 D 多语文图书 D 普通图书 D 书籍 别集 畅销书 丛书 地方丛书 辑佚丛书 自助丛书 族姓丛书 单行本 电子图书 多卷书 复本书 ,汉语主题词表示例,2)关键词语言 关键词语言是直接选用文献信息中的自然语言作基本词汇,并将那些能够揭示文献信息题名或主题意旨的关键性自然语词作为关键词进行标引的一种检

13、索语言。,扩展学习阅读书目,2.3 计算机检索技术,2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 原文检索 2.3.4 加权检索,逻辑“与”:and ;* 逻辑“或”:or;+ 逻辑“非”:not; -,2.3.1 布尔逻辑检索,1)“与”逻辑乘 用于表达两个或两个以上检索词之间的相交关系或限定关系运算。 逻辑“与”检索能增强检索的专指性,使检索范围缩小。,2.3.1 布尔逻辑检索,用符号“and”或“*”表示, 其逻辑表达式为: A * B 或 A and B (交集) 例如:查找有关“英语歌曲在英语教学中的应用”的文献: “ 英语歌曲 * 英语教学 ” 或 “英语歌曲 AND

14、 英语教学”,2.3.1 布尔逻辑检索,2)“或”逻辑和 用于表达两个或两个以上检索词之间的并列关系。 逻辑“或”检索扩大了检索范围,提高检索信息的查全率。,用符号“or”或“+”表示 其逻辑表达式为:A or B 或 A+B (并集) 如逻辑式 “enterprise OR company”或者 “enterprise + company” 表示文献中只要含有检索词中任何一个或两个同时存在的文献为命中文献.,此算符适于连接有同义关系或相关关系的词。,2.3.1 布尔逻辑检索,3)“非”逻辑差 用于表达两个或两个以上检索词之间排除不需要的检索词的运算 可以缩小检索范围,增强检索的准确性。,此运

15、算适于排除那些含有某个指定检索词的记录。,用符号“not”或“-” 其逻辑表达式为: A not B 或 A-B 如逻辑式 “英语语法 NOT 构词法” 表示检索除构词法以外的、有关英语语法方面的文献,2.3.1 布尔逻辑检索,逻辑算符的运算次序: 在有括号的情况下,先执行括号内的运算;有多层括号时,先执行最内层括号中的运算,逐层向外进行。 例如:(A+B)*C-D 在没有括号的情况下,And、Or、Not的运算次序,在不同的系统中有不同的规定。,2.3 计算机检索技术,2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 原文检索 2.3.4 加权检索,2.3.2 截词检索,截词检索:

16、利用检索词的词干或不完整词形进行查找的过程。 可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间。 尤其在英文检索系统中检索时,若遇到名词的单复数形式,词的不同拼写法,词的后缀变化时,均可采用此方法。 如: comput*,常用的截词符有:*, #,?,!,$ 注:不同的数据库所用的截词符不一样,使用前应先查一下各数据库的帮助加以确认,2.3.2 截词检索,截词的方式有多种,可以分为有限截词、无限截词 有限截词一个符号表示一个字母 如:wom?n 可检索出:woman,women(中间截断) 无限截词一个符号表示任意多个字母 如:comput* 可检出:Computer, co

17、mputers, computering,2.3.2 截词检索,2.3.2 截词检索,按照截词的位置,可分为: 1)后截断、前方一致 Comput*computer,computers,computing 2)前截断、后方一致 *computerminicomputer,microcomputer, 3)中间截断、前后一致 Fib*board fiberboard,fibreboard,2.3 计算机检索技术,2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 原文检索 2.3.4 加权检索,“原文”是指数据库中的原始记录。 原文检索即以原始记录中的检索词与检索词间特定位置关系为对象的

18、运算。 原文检索是直接使用自由词的检索方法。,2.3.3 原文检索,1)记录级检索:要求检索词出现在同一记录中,不管在该记录的哪一字段含有所输入的检索字符,即:在所有字段中检索。 “all fields”、“任意字段” 2)字段级检索:用字段对检索词加以限定 题名=(英语语法) ;TI=(“英语语法”) 3)子字段或自然句级检索 4)位置检索,2.3.3 原文检索,4)位置检索:要求检索词之间的相互位置满足某些条件,2.3.3 原文检索,注:在不同的数据库中,位置算符的表达方式和检索功能有可能不同,具体应用时应参看数据库的使用说明。,例: Tax (W8) reform Tax (N5) re

19、form,2.3 计算机检索技术,2.3.1 布尔逻辑检索 2.3.2 截词检索 2.3.3 原文检索 2.3.4 加权检索,在每个提问词后面给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和。权值之和达到或超过预先给定的阈值,该记录即为命中记录。 例如:Q=英语 (1) 口语 (3) 教学 (2) 阈值=4 1.提高英语口语水平的几点建议 (权值总和=4) 2.高职学校英语教学存在的问题与对策 (权值总和=3),2.3.4 加权检索,2.4 计算机检索的一般步骤与方法,(一)分析检索课题、明确检索要求 (二)制定检索策

20、略 (三)选择数据库 (四)实施检索,反馈调整 (五)获取原文 (六)整理和利用文献,(一)分析检索课题、明确检索要求 课题的内容是什么?主要解决什么问题?获取何种相关文献? 课题分析要从以下几个方面进行: (1)分析课题内涵 (2)分析文献需求类型 (3)分析查找年代 实例:基于社会化标签的大众分类研究,计算机检索步骤,(二)制定检索策略 1对课题进行词切分,选择检索词 2选择布尔逻辑运算符、位置算符、截词符等 3. 构造检索式 注意:尽量收全检索课题的同义词、相关词,计算机检索步骤,基于社会化标签的大众分类研究,基于|社会化标签|的|大众分类|研究,社会化标签 and 大众分类,课题:,词

21、切分:,检索式:,(三)选择相关数据库,应注意以下几点: 1数据库收录的文献内容 2数据库收录的文献的出版类型 3数据库中收录文献的时间范围 4数据库的更新情况,计算机检索步骤,(四)实施检索,反馈调整 当检索结果很多或很少甚至为零时必须对初步拟订的检索策略进行调整。 扩大检索范围的方法(逻辑“或”、截词等、字段扩展、位置算符号等) 缩小检索范围的方法(逻辑“与”、字段限制等) 实例:基于社会化标签的大众分类研究,计算机检索步骤,(五)获取原文,1)查找全文数据库下载 2)到网上找免费资源,GOOGLE学术搜索,如法律法规、新闻、一些OA电子期刊和科技报告等。 3)向收藏单位借阅或联系复制,图

22、书馆原文传递 馆内馆外,本地区外地区,选择适合要求的馆藏目录进行查找。 4)发动朋友。让朋友利用他周围的资源检索,将全文mail给你。 5)向著者索取,计算机检索步骤,(六)整理和利用文献,文献管理软件(NoteExpress;ENDNOTE),计算机检索步骤,2.4.2 计算机检索的一般步骤与方法,(一)分析检索课题、明确检索要求 (二)制定检索策略 (三)选择数据库 (四)实施检索,反馈调整 (五)获取原文 (六)整理和利用文献,小结,信息源 信息源的概念和类型 文献的类型及其特点 信息检索基本知识 检索原理 检索语言 检索技术 检索步骤,思考题,1.文献类型有哪些?若想了解某课题的最新研究成果,可选择哪些文献类型?为什么? 2.自拟一课题,思考和阐述计算机信息检索的一般步骤。,谢谢大家! 欢迎提问,共同探讨!,2008版北大核心期刊目录(图情) (共19种),中国图书馆学报 图书情报工作 情报学报 大学图书馆学报 图书馆杂志 图书馆论坛 图书馆 情报科学 图书馆建设 现代图书情报技术,图书情报知识 情报资料工作 情报理论与实践 情报杂志 图书馆工作与研究 图书馆理论与实践 图书馆学研究 图书与情报 国家图书馆学刊,返回,CSSCI来源期刊(20082009年) (图情、档案类 共6种),返回,SCD2008收录源刊(图情、档案) (共6种),返回,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1