第五部分中文检索工具和数据库.ppt

上传人:本田雅阁 文档编号:3123798 上传时间:2019-07-13 格式:PPT 页数:58 大小:146.02KB
返回 下载 相关 举报
第五部分中文检索工具和数据库.ppt_第1页
第1页 / 共58页
第五部分中文检索工具和数据库.ppt_第2页
第2页 / 共58页
第五部分中文检索工具和数据库.ppt_第3页
第3页 / 共58页
第五部分中文检索工具和数据库.ppt_第4页
第4页 / 共58页
第五部分中文检索工具和数据库.ppt_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《第五部分中文检索工具和数据库.ppt》由会员分享,可在线阅读,更多相关《第五部分中文检索工具和数据库.ppt(58页珍藏版)》请在三一文库上搜索。

1、第五章 中文检索工具和数据库,第一节 国家科技图书文献中心数据库,国家科技图书文献中心(NSTL)由中国科学院文献情报中心、工程技术图书馆(中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院、中国化工信息中心)、中国农业科学院图书馆、中国医学科学院医学信息研究所等图书情报机构组成,是一个虚拟式的科技文献信息资源服务机构。中心收藏有中外文期刊、图书、会议文献、科技报告、学位论文等各种类型、各种载体的科技文献信息资源。 网址:http:/,第一节 国家科技图书文献中心数据库,数据库提供的服务项目包括: 1文献检索与原文提供 提供该中心成员馆馆藏文献检索和原文提供两种服务。非注册用户

2、可以免费进行文献检索,注册用户可以在文献检索的基础上请求、订购文献原文。 NSTL以电子邮件、普通函件、平信挂号、特快专递和传真等多种方式为用户提供原文服务。原文正常获取时间为两个工作日。,第一节 国家科技图书文献中心数据库,2网络版全文数据库 NSTL购买的网络版电子期刊,包括:“科学”周刊电子版(ScienceOnline)、英国皇家学会(The Royal Society)4种“会刊”和“会志”的中文版期刊、英国Maney出版公司的材料科学方面的15种网络版全文期刊,用户可以免费阅读、下载。,第一节 国家科技图书文献中心数据库,3联机公共目录查询 供查找NSTL各成员单位的馆藏联合目录,

3、包括期刊、图书、报告、会议录、学位论文等。目前主要提供馆藏期刊联合目录查询服务。 4期刊分类目次浏览 以文摘形式报道了近万种外文期刊以及其他类型文献,包括中文期刊、会议论文、学位论文等的内容,可供检索的二次文献数据量已达到1000多万条。其全文均可在成员馆查到并索得。,第一节 国家科技图书文献中心数据库,5文献题录数据库检索 数据库分为题录、文摘、书目、成果、计量基准等八大类,共21个数据库。这些数据库可免费检索,如需获取原文,可与相应的收藏成员馆联系。,第一节 国家科技图书文献中心数据库,6网络信息导航 提供网上科技信息资源指南、科技信息分类导航、科技文献机构导航服务,即通过成员图书馆提供的

4、各种有代表性的研究机构、大学、期刊和文献资源、协会以及公司的网站,为用户提供基于分类的因特网信息的导航和国内外主要科技文献机构的站点导航。用户可以通过分类或机构名称查找网上资源。,作业,题目:利用国家科技图书文献中心数据库( http:/ )检索国外有关辣椒色素标准的文献。 要求: 写明题目; 写明使用的数据库名称 ; 写出检索表达式(包括逻辑表达式、检索字段的限定等) ; 写出得到检索结果的数量,并将其中第一篇抄录下来。,第二节 中文科技期刊数据库,维普资讯公司出版,是目前国内容量最大的,集题录文摘及全文检索功能于一身的综合性文献数据库之一。它收录1989年至今国内出版的数学、化学、生物、农

5、业、环保、地球、矿业、机械、无线电、轻工、航空、建筑、情报医学及综合性期刊以及港台核心期刊8000余种,累计报道文献1370余万篇,并以每年150万篇的速度递增。 网址:http:/ 中文科技期刊数据库,检索功能: 1 快速检索 2 传统检索 (1)专辑及分类导航检索 (2)简单检索 (3)复合检索:包括二次检索和逻辑组配检索。 3 分类检索 4 高级检索 5 期刊导航检索,作业,题目:利用中文科技期刊数据库(http:/ )的高级检索界面检索有关碳酸氢钠在医学上的应用方面的文献。 要求: 写明题目; 写明使用的数据库名称; 保证查全率; 4写出检索表达式(包括逻辑表达式、对同义词的处理、检索

6、字段的限定等); 5写出得到检索结果的数量,并将其中第一篇抄录下来,第三节 万方数据资源系统,万方数据资源系统(http:/ )是一个大型综合性信息资源系统,其报道的信息类型包括事实型动态信息、文摘题录信息和全文信息。 1 数据库 (1)“科技文献”栏目 “科技文献”栏目收录了国内40多个科技信息机构开发的32个数据库,主要数据库有:中国化工文摘数据库 、中国计算机文献数据库 、人口与计划生育文献数据库 等。该栏目数据库为非全文数据库,可免费检索。,第三节 万方数据资源系统,(2)“学位论文“栏目 该栏目的中国学位论文文摘数据库(CDDB)供用户免费检索。CDDB由中国科技信息研究所编制,收录

7、了我国自然科学领域各高等学校、研究生院及研究所的硕士、博士生及博士后论文,年更新记录3万余条。万方数据资源系统还有学位论文的全文数据库,订购用户才能使用。,第三节 万方数据资源系统,(3) “会议论文“栏目 该栏目的中国学术会议论文文摘数据库(CACP)收录了国家级学会、协会、研究会组织召开的各种学术会议论文,每年涉及1000余个重要的学术会议,范围涵盖自然科学、社会科学的各个领域,并保持年新增3万篇的数据量,该数据库可供用户免费使用。万方数据资源系统还有会议论文的全文数据库,订购用户方可使用。,第三节 万方数据资源系统,2检索功能 (1) 简单检索 (2) 高级检索 (3)二次检索 3检索技

8、术 (1) 精确检索:“” (2) 限制字段 (3)逻辑运算 (4)其他:位置算符(G限定为前后2词在一个字段、.为前后2词相邻),第四节 引文索引,1 编制原理 选择一定范围内的优秀期刊作为来源文献,按其报道文献的著者字顺编成来源索引(著者索引)、将各篇来源文献引用的参考文献,按被引用者姓名字顺编成引文索引。主要供从著者角度检索文献,追溯及考证文献间的引用关系,评价文献质量。 期刊论文引用关系示例附图 2 中国科学引文索引 中国科学引文索引(China Science Citation Index,简称CSCI)是由我国中科院文献信息中心编辑出版 。收录我国数学、物理、化学、天文学、地理学、

9、生物学、农林科学、医药卫生、工程技术、环境科学和管理,2 中国科学引文索引,等领域出版的中英文科技核心期刊和优秀期刊近千种,其中核心库来源期刊670种,扩展库期刊为378种,已积累从1989年到现在的论文记录近100万条。以这些期刊作为来源文献,将其引用的参考文献编制成引文检索体系,目前已累积引文记录400万条。 网址:http:/ 要求: 1 使用基本检索界面检索 2 写明查到的引用文献的篇数,并将第一篇文题、作者及来源摘抄下来。,第四节 引文索引,3 中文社会科学引文索引 由南京大学和香港科技大学联合研制,是用来检索中文社会科学领域的论文收录和文献被引用情况。 该数据库收录马克思主义、哲学

10、、宗教学、语言学、中国文学、外国文学、艺术学、历史学、考古学、经济学、管理学、政治学、法学、社会学、民族学、新闻与传播学、图书情报与档案学、教育学、体育学、统计学、心理学、社科总论、高校综合性社科学报、人文、,3 中文社会科学引文索引,经济地理、环境科学等社会科学领域的中文期刊419种,另加港台澳地区及海外华文期刊16种,数据年更新 。 网址:http:/ CALIS数据库,CALIS(China Academic Library & Information System)是中国高等教育文献保障系统(http:/ )的英文缩写,是经国务院批准的我国高等教育“211工程”总体规划中两个公共服务体

11、系之一。到目前为止,已完成的数据库有:,第五节 CALIS数据库,1CALIS高校学位论文库:其文献来源于“211工程”的83所重点学校的硕、博士学位论文。目前该库只收录题录和文摘,没有全文。全文服务通过CALIS的馆际互借系统提供。 2CALIS联合书目数据库:是全国“211工程”100所高校图书馆馆藏联合目录数据库 。,第五节 CALIS数据库,3CALIS会议论文数据库:收录了来自“211工程”所属重点高校主持的国际会议的论文(每年20个左右),其中大多数的会议提供正式出版的会议论文集。 4CALIS中文现刊目次库:收录成员馆收藏的国内重要中文学术期刊的篇目,这些期刊内容涉及社会科学和自

12、然科学的所有学科。,作业,用CALIS数据库检索,哪个图书馆藏有唐代文学家韩愈所注论语 要求: 1 写明检索该书使用CALIS数据库名称 2 写出检索策略 3 写出一个藏有该书的图书馆名称,第六节 中国人民大学书报资料中心复印报刊资料索引总汇,中国人民大学书报资料中心对国内公开出版的3000余种报刊上,质量较高的社会科学、人文科学文献进行不同层次的复印、整理加工,以多种形式向社会提供信息资料产品和服务。该中心编辑出版的两种主要信息产品复印报刊资料专题系列刊物和报刊资料索引系列刊物,是查考当前报刊论文资料的基本检索工具。,第六节 中国人民大学书报资料中心复印报刊资料索引总汇,该检索工具分印刷版、

13、光盘版和网络版。数据库汇集了自1978年以来的百余个专题刊物上的全部题录。,第六章 英文检索工具和数据库,第一节 科学引文索引 科学引文索引(Science Citation Index,简称SCI)是一种综合性的引文检索工具,由美国科学技术信息研究所(Institute For Scientific Information,简称ISI)编制。是通过引文链检索有关文献,以及评价期刊质量的工具。 SCI有印刷版、光盘版和网络版三种版本,其基本原理相同,印刷版SCI出版情况如下图:,第一节 科学引文索引,第一节 科学引文索引,SCI首先选用约3000种世界顶尖期刊作为来源出版物,按其发表论文作者编

14、成“来源索引”,按来源出版物上发表的论文所引用的参考文献作者(引文作者)姓名字顺编成“引文索引”。 在研究某一专业课题时,可先利用“引文索引”检 索到与某著者(被引用著者)研究方向相同,发表 在高质量的来源出版物上的论文著者,再以该论文 著者作为引文著者,继续进行此类检索,从而得到 该课题方向的众多的研究著者及其论文线索。,SCI著录格式: Ansariah 89 Am J Obstet cynec 103 511 PENTTILAMI HORMONE MET 8 299 00R,第二节 社会科学引文索引,除科学引文索引外,ISI还出版社会科学引文索引(Social Science Citat

15、ion Index, SSCI)和艺术与人文科学引文索引(Art & Humanities Citation Index, A&HCI),收录高质量的社会科学期刊。 两种工具的作用、编排结构与方法与SCI相同。,第三节 工程索引和科学文摘,工程索引(The Engineering Index,简称EI)和科学文摘(Science Abstracts,简称SA)世界著名的大型检索工具,在相关学科检索工具中具有权威性。前者主要用于检索工程技术文献,后者主要用于检索物理、电气、电子、计算机等方面的文献。就报道文献的质量而言,EI在工程类检索工具中首屈一指。,第四节 OCLC FirstSearch,

16、Online Computer Library Center, Inc.(联机计算机图书馆中心,简称OCLC)是一个非营利性、成员制、联机计算机图书馆服务和研究机构,旨在推进公众检索世界信息和减少信息利用的费用。OCLC是世界上最大的文献信息服务机构之一,迄今为止,世界上已有84个国家和地区的45000余个图书馆将OCLC的服务应用于文献的查询、获取、编目、借阅和图书资料的保存上。,第五节 OCLC FirstSearch,CALIS(中国高等教育文献保障系统)的全国工程中心采用年订购的方式购买了OCLC FirstSearch基础组的12个数据库的使用权。这些数据库多为综合性库,内容涉及工程

17、与技术、商务和经济、人文和社会科学、医学、教育、大众文化等领域。这些数据库是:,第五节 OCLC FirstSearch,1目录页文章索引(ArticleFirst) ArticleFirst是OCLC自建数据库,是为期刊目录页中的文章所作的索引 。该数据库从1990年至今已收录15000多种学术期刊资料,主题覆盖商业、科学、人文科学、社会科学、医药、技术、通俗文化等领域,收录对象主要为英文期刊,兼收部分其它语种的期刊。每日更新。,第五节 OCLC FirstSearch,2在科学和人文学领域中的拉丁美洲期刊索引(ClasePeriodica) 报道拉丁美洲各学科期刊近300种,期刊语种为西班

18、牙文、葡萄牙文、法文和英文。每季更新。 3联机电子学术出版物(OCLC Electronic Collections Online,ECO) ECO是OCLC自建全文数据库,收录1995以来,各领域的4800多种期刊,可检索到书目、文摘信息和全文文章。每日更新。,第五节 OCLC FirstSearch,4教育学信息库(ERIC) ERIC(Educational Researchs Information Center)是美国教育部教育资源信息中心编制的数据库,由ACCESS ERIC出版。其报道内容包括对发表在Resources in Education(RIE)月刊上的非期刊资料与每个月

19、发表在Current Index to Journals in Education(CIJE)上的期刊文章的注释参考。收录对象为从1966至今的2000余种期刊资料,第五节 OCLC FirstSearch,5美国政府出版物(GPO) 由U.S. Government Printing Office(美国政府出版署)创建,报道美国政府文件,包括美国国会的报告、听证会、辩论与纪录;司法资料,以及由行政部门(国防部、国务院、总统办公室等)颁布的文件。报道内容覆盖了从1976年7月以来的资料。每月更新。,第五节 OCLC FirstSearch,7国际学术会议论文索引(PapersFirst) 8国

20、际学术会议录索引(Proceedings) 9OCLC成员馆所收藏期刊的联合列表库(UnionLists) 10科学、人文科学、教育和商学全文库(WilsonSelectPlus) 该库收录1994至今,1600多种期刊的文章。提供经过索引和摘要的记录,附有全文,期刊文章每周更新。,第五节 OCLC FirstSearch,11世界年鉴(WorldAlmanac) 包括传记、百科全书款目、各种事实与统计资料。 12世界范围图书、web资源和其他资料的联合编目库(WorldCat) OCLC自建数据库之一,是为世界各国图书馆中的图书及其它资料所编纂的目录,含有由OCLC成员图书馆编目的所有的记录

21、,提供了数以百万计的书目记录,覆盖400个语种。,第五节 OCLC FirstSearch,OCLC 提供基本检索、高级检索和专家检索三个检索界面(其检索界面见教材)。分别供对数据库熟悉程度不同,或检索要求不同的人使用。 其中专家检索界面可进行人工输入组配。,第五节 OCLC FirstSearch,OCLC的检索技术: 1词组检索技术 如输入的检索式是由几个词构成,系统将默认各词之间是逻辑“与”关系,如欲将其作为词组检索,需用引号将其括起。 2位置运算 (1)W(WITH):“A WITHn B”表示A、B两词要按输入顺序同时出现在记录中,两词间插入词不能超过n(1n25)个。,第五节 OC

22、LC FirstSearch,(2)N(NEAR):“A Nn B”表示A、B两词同时出现在记录中,两词间插入词不能超过n(1n25)个,两词前后顺序可不计。 3截词检索 (1)无限截断:“*”表示单纯的无限截断;“+”用来表达名词的复数,主要是“s”或“es”。 (2)有限截断:“#”代表一个字符;“?”代表由多个字符组成的字符串。有限截词符不能用在词头。,第七章 综合性全文数据库系统,全文数据库(full-text database)是一种存储文献全文或其中的主要部分的源数据库。按出版方式,全文数据库可分为两类:一类是与印刷型文献平行出版的电子版全文库,另一类是纯电子出版物,无相应的印刷型

23、文本。 全文数据库标引方法简单,报道文献快速,其缺点是:存储空间消耗太大,还存在法律和费用高等问题。,第一节 中文全文数据库,一、CNKI及中国知识资源总库 CNKI是China National Knowledge Infrastructure(中国国家知识基础设施)的缩写。该工程由清华同方光盘股份有限公司、中国学术期刊电子杂志社等联合承担。中国知识资源总库是CNKI推出的由海量知识信息资源构成的学习系统和知识挖掘系统 ,其数据库包括源数据库(第一次发表的文献全文)和专业知识仓库(专业知识和知识元库)。其数据库主要有: 中国期刊全文数据库、中国优秀博硕士学位论文全文数据库、中国重要报纸全文数

24、据库、中国重要会议论文全文数据库、中国专利数据库、中国图书全文数据库、中国年鉴全文数据库等。,一、CNKI及中国知识资源总库,CNKI有光盘、镜像和网络三种服务方式。 (一)主要数据库 1 中国期刊全文数据库 中国期刊全文数据库(CJFD)报道1979年以来国内公开出版的7000多种核心期刊与专业特色期刊的全文内容,分理工A、B、C,农业、医药卫生,文史哲,政治经济法律,教育与社会信息综合,电子技术与信息科学九大专辑,126个专题文献数据库。,(一)主要数据库,2 中国优秀博硕论文全文数据库 报道国内300家博士培养单位的优秀博硕论文全文,收录数据从2000开始,中心站日更新数据。 3 中国重

25、要报纸全文数据库 收录2000年以来近千种重要报纸刊载的学术性、资料性文献,年报道80万篇。数据日更新。,(二)检索途径与方法,(1)选择检索用数据库与专辑 (2)检索途径: A 检索式途径 a 初级检索 b 高级检索 c 专业检索 B导航检索:专辑导航、中图分类法、期刊导航,作业,一、使用CNKI中国期刊全文数据库检索“东亚国家的道德观”一题 分别将检索字段限定到文题、摘要、全文,逐个查出以“道德观”、 “道德观 *东亚”、“道德观 *中国”、 “道德观*日本”、“道德观*韩国”、 “道德观*蒙古”所检索出的论文篇数。 二、 查中国教育报记者就有关独立学院问题对潘懋元先生的访谈文章(2004

26、年登载于该报)。 写明:使用数据库、检索策略、文章题名。,作业,三、 利用中图分类法途径检索有关中国封建社会的选举制度方面的文章,写出其中一篇篇名。课后思考:针对这个作业分析分类检索途径与自由词检索途径的特点。 四、概念解释 1 说明什么是按相关度排序。 2 使用“经济过热” 作为检索词,“检索项”限定为“题名”,结合该实例说明精确检索和模糊检索的区别。,二、万方数据资源系统,http:/ 提供数字化期刊、学位论文全文、会议论文全文、西文会议全文、法律法规全文。 (一)数字化期刊全文数据库 收录各学科期刊4000多种,收录年限回溯至1998年。 (二)中国学位论文全文数据库 收录全国211重点

27、高校和重要科研院所学位论文30万篇,年更新10万篇。数据回溯到1999年,少量数据至1987年。,二、万方数据资源系统,是国内唯一的学术会议文献全文数据库。收录1998年以来国家一级学会召开的全国性学术会议,少量回溯到1993年,每年增加记录4万条。,三、人大复印资料全文数据库,只有光盘,报道人大复印资料全文。,第二节 外文全文数据库,一、EBSCOhost系统全文数据库 EBSCOhost (http:/ )为EBSCO Publishing公司于1994年推出的网上全文数据库。目前可提供近百种数据库为图书馆服务,涵盖了综合学科、商管财经、生物医药、人文历史、法律等领域期刊的电子版全文,以及

28、部分当今全球知名的索引摘要数据库。我馆订购和可利用的数据库有:,一、EBSCOhost系统全文数据库,1 ASP(Academic Search Premier):是当今世界最大的多学科学术期刊全文数据库,提供8000多种期刊的文摘和索引;4700种学术期刊的全文,含3600 多种同行评审全文期刊。数据库报道范围几乎覆盖了所有的学术研究领域,包括:社会科学、人文科学、教育学、计算机科学、工程学、物理学、化学、语言学、艺术、文学、医学、种族研究等。数据库每日进行更新。,一、EBSCOhost系统全文数据库,2 BSP(Business Source Premier)是针对商学院和与商业有关的图书

29、馆设计的。作为世界上最大的全文商业数据库,BSP收录文献超过7400种(其中1100 种同行评审全文商业出版物),包括:学术期刊、贸易和商业期刊、专著、1419种国际经济报告、产业报告和年鉴、市场研究报告。该数据库收录几乎包括所有与商业相关的主题范畴,学科领域包括:管理、市场、经济、金融、会计、国际贸易等。收录许多世界上最著名的商业类期刊,特别是在管理学和市场学方面,如:Harvard Business Review、California Management Review。,一、EBSCOhost系统全文数据库,3 ERIC (Educational Resource Information

30、 Center)(教育资源信息中心) :ERIC是美国教育部的教育资源信息中心数据库,收录980多种教育及和教育相关的期刊文献的题录和文摘。 4 Newspaper Source (报纸资源):Newspaper Source收录159种美国地方报纸、18种国际性报纸、6个新闻专线、9个报纸专栏,包括基督教科学箴言报、洛山矶时报等194种报纸的全文。 另外还收录4种美国全国性报纸的索引和摘要。,作业,用BSP检索关于健康保险(Health insurance)方面的文献 要求: 1 若用主题途径检索,该课题应使用哪个词作为检索用主题词。 2 找出、写下该主题词的上位、下位主题词和相关主题词的数量,并分别写下其前2个,说明如何保证查全率? 3 使用该主题词和如上写下的前两个上位、下位、相关主题词进行扩展检索后,按相关度排序,写出可查到全文的检索结果数量,写下第一篇的文题。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1