信息检索2.ppt

上传人:李医生 文档编号:7218527 上传时间:2020-11-06 格式:PPT 页数:25 大小:203.50KB
返回 下载 相关 举报
信息检索2.ppt_第1页
第1页 / 共25页
信息检索2.ppt_第2页
第2页 / 共25页
信息检索2.ppt_第3页
第3页 / 共25页
信息检索2.ppt_第4页
第4页 / 共25页
信息检索2.ppt_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《信息检索2.ppt》由会员分享,可在线阅读,更多相关《信息检索2.ppt(25页珍藏版)》请在三一文库上搜索。

1、1,具有广泛影响的定义,信息是事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。,2,载体依附性,无限共享性,永不枯竭性,开发增值性,应用时效性,信 息 的 特 征,信息的特征,存在普遍性,3,二、知识(knowledge),汉语词典中解释为:人们在改造世界的实践过程中所获得的认识和经验的总和。 知识 是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。 因此,知识是系统化、理论化的信息集合。,4,三、情报(information, intelligence ),辞源:“定敌情如何,而报于上官者”为情报。 辞海:“战时关于敌情之报告,

2、曰情报。,情报 是运用一定的媒体(载体),越过空间和时间传递给特定用户,解决科研、生产过程中的具体问题所需要的特定知识和信息。,5,四、 文献(document),是指记录有知识或信息的一切载体。具体地说,用一定的方式(文字、图像、声音等)将信息符号记录在一定载体(纸张、磁盘、光盘等)上的知识都称之为文献。文献是知识的外在表现形式。 四个要素:信息内容 信息符号 记录方式 载体材料,6,一、信息源(Information Sources),(一)定义 个人为满足其信息需要而获得信息的来源,称信息源。(联合国教科文组织1976年文献术语) 信息源是“人们在科研活动、生产经营活动和其它一切活动中所

3、产生的成果和各种原始记录,以及对这些成果和原始记录加工整理得到的成品”。,7,2.按信息源内容加工深度划分为: 零次文献 是指未经出版发行或未进入社会交流的最原始的文献。如:底稿、工程图纸、个人通信、实验记录等。 特点:内容新颖,但不成熟,不公开交流,难以获得。,(二)信息源的类型及特点,8,一次文献 是指以作者本人取得的成果为依据而创作的论文、报告等经公开发表或出版的各种文献。也称做原始文献,如专著、学术论文、专利说明书、科技报告等。 特点:形态上多样,内容上原创,出处上分散。内容新颖丰富,叙述具体详尽,参考价值大。,(二)信息源的类型及特点,9,二次文献 是按特定目的对一定范围或学科领域中

4、大量分散的,无组织的一次文献进行整理加工,以使之有序化而形成的文献。是报道和查找一次文献的检索工具,如各种目录、索引、文摘和各种书目型数据库。 特点:是对一次文献加工重组而成,不是新的信息。,(二)信息源的类型及特点,10,三次文献 是根据二次文献提供的线索,选用大量一次文献的内容,经过筛选、分析、综合和浓缩而再度出版的文献。如综述、专题评述、年鉴、百科全书、参考工具书等。 特点:在内容上具有综合性,在功效上具有参考性。,(二)信息源的类型及特点,11,二、医学信息素养的内涵主要包括: 信息意识:是个体对信息重要性的认识程度和对信息是否具有特殊的、敏锐的感受力和持久的注意力,即对信息的捕捉、分

5、析、判断和吸收的敏感性。 信息知识:是指与信息有关的理论、知识和方法。 信息能力:是对信息的搜集获取能力、分析鉴别能力和综合利用能力。 信息道德:是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的伦理规范。,12,一、 信息检索的定义,狭义的信息检索是指从信息集合中找到所需信息的过程; 广义的信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。,13,三、信息检索的类型,文献检索(Document retrieval) 事实检索(Fact retrieval) 数据检索(Data retr

6、ieval),检索语言,分类语言,主题语言,标题词 元词 叙词 关键词,描述信息内容特征的语言,描述信息外表特征的语言,书/刊名,著者/团体著者,出版事项,代码/序号,叙词(Descriptor),是能表达文献主题并经过严格规范化处理的词语,又称主题词。 特 点:具有概念性、描述性、组配性。 如我国汉语主题词表(1980出版)、美国医学主题词表等。,关键词语言,关键词(Key words)是直接从文献或网页的标题、文摘或全文中抽选具有实质意义、能表达文献实质内容,未经规范化处理的关键性自然语言词汇。,关键词语言的特点,优点: 易于实现自动抽词和编制索引,尤其是计算机自动编制索引。 表达主题直观

7、,检索入口多,能及时反映新事物新概念。 缺点: 关键词取自标题或者文摘、全文,用词不规范,忽略了同义词、近义词、简称等等同关系,易漏检。 关键词语言对于文献或者网页的主题没有深入分析,不能准确地揭示文献实质内容,准确性较差。,检索途径,概念:检索途径是指用文献信息数据库中记录的某一特征作为检索起点或检索入口 检索途径通常表现为字段检索 类型:,揭示文献外表特征,揭示文献内容特征,检索途径,一、 分类途径,检索标识是分类号或分类词。 二、主题途径(主题词) 三、 关键词途径(关键词) 四、著者途径(作者名称) 五、题名途径(文献提名) 六、号码途径(号码索引) 七、其他途径(化学物质登记号检索、

8、分子式检索等。),信息检索技术,一、布尔逻辑检索(notandor) 二、截词检索 三、位置检索(常用的关系符号是(W)、(N)、(F)、(S) (四)限定字段检索,信息检索策略,1.分析检索课题,明确目的和要求 2.选择合适的检索工具 3.选择检索途径,确定检索标识 4.编制检索表达式,调整检索策略 5.浏览检索结果,获取原始文献。,检索步骤图示:,分析课题,明确检索需求,选择合适的检索工具,选择检索途径,确定检索标识,构筑检索提问式,输入计算机,浏览检索结果,调整、选出满意的结果,获取全文,第六节 检索效果评价,检索要领是为实现检索结果的准确和全面: 所以检索结果主要通过查全率、查准率两个

9、指标来进行评价。 查全率:系统进行检索时,检出的相关文献量与系统文献库中相关文献总量的比率。 查准率:系统中检出的相关文献量与检出的文献总量的比率。,调整检索策略提高查全率和查准率 -P38 提高查全率的方法: 主题词与关键词结合进行检索 主题词检索时进行扩展检索和使用全部副主题词 分类检索时进行扩展和全部复分检索 删除某个不太重要的概念组面,减少AND运算 多用同义词or运算检索 多用截词检索,提高查准率的方法: 提高检索词的专指度,换用专指度较强的规范词或自由词;用主题词检索,不用或少用自由词检索。 对主题词进行加权检索。 增加“与”连接,进一步限定主题概念。 用逻辑“非”限制与提问不相关的文献的输出。 限定检索词所在的可检字段,如限制年限、语种、文献类型等。 调整位置算符等。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1