第二讲科技文献检索原理1.ppt

上传人:本田雅阁 文档编号:3156464 上传时间:2019-07-17 格式:PPT 页数:41 大小:2.04MB
返回 下载 相关 举报
第二讲科技文献检索原理1.ppt_第1页
第1页 / 共41页
第二讲科技文献检索原理1.ppt_第2页
第2页 / 共41页
第二讲科技文献检索原理1.ppt_第3页
第3页 / 共41页
第二讲科技文献检索原理1.ppt_第4页
第4页 / 共41页
第二讲科技文献检索原理1.ppt_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《第二讲科技文献检索原理1.ppt》由会员分享,可在线阅读,更多相关《第二讲科技文献检索原理1.ppt(41页珍藏版)》请在三一文库上搜索。

1、,文献信息源和文献分类法,第二讲 科技文献检索原理,主要内容要点,文献信息源简介 文献检索语言与工具 科技文献检索的途径和方法,文献信息源简介,1.1 文献概念的界定 国际标准化组织文献情报术语国际标准(ISO/DIS5217)中对文献的定义:“在存储、检索、利用或传递记录信息的过程中,可作为一个单元处理的、在载体内、载体上或依附载体而存储的信息或数据的载体。”中华人民共和国国际标准文献著录总则(GB3792.1-83)中将文献定义为:“文献是记录有知识的一切载体。”,现在学术界通用的定义是:文献是指用文字、图形、符号,或用音频、视频等技术手段记录人类知识的一切物质载体,或称其为固化在某种物质

2、载体上的知识。构成文献的三个基本要素是:物质载体;信息媒体;一定的知识内容。物质载体是物理的,而信息媒体(指信息或知识内容的表达方式或技术手段)是逻辑的。 文献除了知识性之外,还具有:一,专指性,即记录知识的载体,器皿上有知识,但器皿不是文献(可以是文物);二,传递性,记录在大山上的知识不是文献,不能传递,可以是文物。,1.2 文献信息的特点(11个特点),载体和媒体必须同时具有、缺一不可。 对于同一载体,可以有多种媒体同时并存。 载体之间和媒体之间的相互可转换性。 文献信息的基本形式是载体+媒体,但反之不一定成立。 思考问题:水泥地上练字是不是文献?,文献信息内容的最大包容性。 文献信息内容

3、的知识性。 文献信息中知识的非直接利用性。 文献信息与信息的区别。 软件和硬件、物理的和逻辑的、智力产品的物超所值现象。 文献信息的趋于低成本的传播原理。 文献的藏传用功能。,1.3科技文献的形式按文献的载体形式划分,印刷型文献 缩微型文献 机读型文献 声像型文献 光盘型文献 网络型文献,1.4 科技文献的级别按文献被加工处理的深度划分,一次文献(Primary Document): 通常是指由作者以自己的研究成果为基础创作或撰写的文献,如期刊论文、科技报告、专利说明书、会议论文、学位论文等。它们通常或多或少包含着著者的创见,是对知识的第一次加工(创造性)。,二次文献(Secondary Do

4、cument) 指文献工作者将大量的分散的、无序的原始文献加以筛选,留下有价值的文献,再经过加工整理,或按文献的内容特征(如主题、分类),或按文献的外部特征(如著者、题名等),进行提炼、浓缩、简化、编辑成系统的工具性文献,如文摘、索引、书目等检索工具,专为查找原文之用,这是对知识的第二次加工(有序化)。,三次文献(Tertiary Document) 指利用二次文献系统地检索出一批有关的文献,并对其运用科学的方法和专业知识进行深入 研究后撰写的新的文献。它们可以是图书(专著)或期刊论文等等,与一次文献非常相像,但有不同于一次文献。三次文献可以再分为:文献型又称为知识浓缩型,如综述、述评、专著之

5、类。 数据型,如字典、词典、数据手册、百科全书等。其中文献型三次文献主要供文献检索,其所含信息和知识都较为密集;数据型三次文献主要提供数据、事实检索。,一次 文献,二次文献,三次文献,是检索对象、检索目标 它的生产者是广大的作者 是对知识的第一次加工,具有创造性,是检索工具和手段 是图书、情报信息分析整理工作人员的产品 是对知识的第二次加工,是数据信息有序化的过程,是情报研究成果,它既可以作为检索手段,也可以作为检索目标 是既懂专业有熟悉专业情报信息的专家的研究成果 是对知识的再加工,既是有序化的,又带有一定的创造性,并常常在形式上也返回到一次文献,由博到约、由分散到集中、由无序到有序、再由有

6、序到有机的结构化、系统化的过程,1.5 十大文献信息源,图书文献 国际标准书号 ISBN( International Standard Book Number ) ISBN号定长为10位,前面添加ISBN的标识,10位数字分解为四个部分(1)地域号,代表国家、地区、语言区,例如7指代中国,0和1指英语国家,2指法语区,3指德语区,4指日语区,5指前苏联,88指意大利,9971指新加坡等。(2)是出版社号(3)是书号(4)是计算机校验位。ISBN号前三个部分都是变长结构,但总长不变。,ISBN-10 7-301-07371-2 CSBN 7-301-07371-2/TP0759 ISBN-13

7、 978-7-301-07371-1,ISBN-10与ISBN-13(EAN-13) 新的国际标准书号在国际上简称“ISBN-13”。而前缀码979将作为ISBN-13备用的新系列号码,在978系列号码用尽后开始启用。2008年第二季度开始发放以“979”为前缀的ISBN号。对于“978”前缀的ISBN号尚未用完的国家,国际ISBN中心宣布,仍继续使用“978”前缀。在使用ISBN-13时,EAN-13条码与ISBN-13数字码需同时排列,且ISBN-13数字码应排在EAN-13物品条码上方,它包括国际标准书号的标识符“ISBN”、数字号码以及数字号码各标识组间的连字符“-”。而与物品条码编码

8、相同的13位数字则应连续排列(无连字符和空格)在物品条码下方,其前也无须添加国际标准书号的标识符“ISBN” 。 EAN:European Article Number(欧洲商品号),中国标准书号 中国标准书号共分两部分,第一部分为ISBN,是主体部分;第二部分为中国图书馆图书分类法基本大类类号和种次号。类号除工业技术诸类图书用两个字母外,其他各学科门类图书均用一个字母。种次号是同一出版社出版同一学科门类图书的顺序号,由出版社自行编定。类号与种次号之间用中圆点()隔开。第一部分和第二部分分两行排列,也可用斜线隔开,排成一行。,期刊(连续出版物) 科技期刊属于周期性出版物,具有品种多、数量大、报

9、道速度快、内容新颖、能及时反映当前科技状况等特点。科技期刊是一次文献,是传递科技信息、交流学术思想使用的最基本、最广泛的手段,也是文献检索课需要检索的重点。 连续性、周期性和报道专题的多样化是期刊最显著的特征。期刊正式的名称为“连续出版物”。,期刊的外部文献特征: 刊名和编辑单位一般不变 定期出版、连续出版 有固定的名称和连续性编号,如年、卷、期 一般不再版,也不重印。 常见的期刊形式:月刊(monthly)、周刊(weekly)、双月刊(bimonthly)、季刊(quarterly)、年刊(yearly)等,国际连续出版物标号ISSN( International Series Stand

10、ard Number): 是根据国际标准ISO3297制定的连续出版物国际标准编码,其目的是使世界上每一种不同题名、不同版本的连续出版物都有一个国际性的唯一代码标识。国际标准连续出版物号由两组四位数字组成,中间由符号“-”来连接。ISSN编号定长8位,前7位是刊物代号,末位是计算机校验位。例如:材料科学与工程学报的ISSN号为“1004-793X” 计算机工程的ISSN号为“1000-3428” Print ISSN和Online ISSN:印刷型和电子型连续出版物,ISSN号码印刷在杂志封面的右下角,科技报告 是一种既像书又像刊的一次文献形式,是关于某项科研成果的正式报告或是进展中阶段性的实

11、际记录。 会议文献 会议录中收集的论文或报告均是会议文献。科技会议文献应为一次文献,其特点是内容新颖、学术性强、能反映某专业国内外的最新发展水平,其文献形式为会议录,也常常以期刊专集的形式出现。,政府出版物 专利文献 所谓专利,是用专利法来保护科技发明的产权的制度。当专利申请案提出后和批准时,即公布由专利申请人呈交的专利申请说明书,阐明该项发明的目的、用途、技术梗概和专利权限,这些就是专利文献。,标准文献 它主要是针对工农业产品、工程建设的质量、规格以及检验方法等所做的技术规定,是从事生产、建设的一种共同技术依据。作为一种规章性的技术文件,具有一定法律约束力。 学位论文 产品样本 技术档案,东

12、北大学图书馆学位论文数据库,上述的会议文献、科技报告和专利文献、标准文献常被称为特种文献。它通常是指那些在出版发行方面或获取途径方面比较特殊的文献,或者难于搜求或具有某种解决纠纷的意义。,2.1 文献分类法,分类法产生得最早、用的最多的是图书分类法,是按照图书的内容、形式体裁和读者用途等,在一定的哲学思想的指导下,运用知识分类的原理,采用逻辑方法编织出来的。这是一种从总到分、从一般到具体,层层划分、逐级展开的分门别类的符号代码体系。可分为纯数字码分类法和字母数字混合制分类法。一般分类法都是由类号和类目组成的集合。,中国图书馆图书分类法(简称中图法),中图法把一切知识门类按照“五分法”分为马列、

13、毛泽东思想,哲学,社会科学,自然科学,综合性图书五大部类,在此基础上细分为22个大类。 1981年被国家正式批准为国家标准的图书分类法。 标记符号采用拼音字母和阿拉伯数字相结合的混合号码制,技术比较先进; 注释比较详细。,中图法大类简表(第四版),A 马克思主义、列宁主义、毛泽东思想、邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化.科学.教育.体育 社会科学 H 语言、文字 I 文学 J 艺术 K 历史、地理,N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 自然科学 T 工业技术 U 交通运输

14、V 航空、航天 X 环境科学、安全科学 Z 综合性图书,中国科学院图书馆图书分类法(简称科图法),1958年由中国科学院图书馆编写,1974年、1979年、1994年分别进行了修订。总体结构为5大部类,下分为25大类。 其自然科学部分的类目举类详细,系统性强;标记符号采用纯数字符号,单纯简洁,易写易记。 号码分为两部分,第一部分采用顺序制,从00-99分配二十五个大类及其主要类目。第二部分采用小数制,以容纳细分类目:在号码编制技术上采用双位法,借号法和交替类等方法,使号码组配灵活,伸缩性助记性强。,举例:,最新大学英语四,六级考试备考指南 主编:孙翠兰 出版:北京大学出版社 H310.42 /

15、 V4-中图法分类号 / 第四版 41.68055 / V3-科图法分类号 / 第三版,杜威十进分类法和美国国会图书馆图书分类法,在美国或英语国家最常见的是杜威十进分类法(DDC: Dewey Decimal Classification)和美国国会图书馆图书分类法(LC: The Library of Congress),前者适合中小型图书馆,后者适合大型的或国家图书馆使用。 杜威十进分类法受美国圣路易斯市图书馆哈利斯分类法的影响,根据17世纪英国哲学家培根关于知识分类的思想 ,将人类知识 分为记忆(历史)、想象(文艺)和理性(哲学、即科学)三大部分,并将其倒置排列,展开为10个大类(下列类

16、名引自DC第20版),国际十进分类法,UDC( Universal Decimal Classification)国际十进分类法 国际通用的多文种综合性文献分类法。原由比利时人P.-M.-G.奥特莱和H.-M.拉封丹在杜威十进分类法第6版的基础上编成。 1899年起陆续以分册形式出版法文本(第一册为物理科学卡片目录手册),1905年汇编成世界书目手册, 1927年的法文增订版改名国际十进分类法。后由国际文献联合会 (FID)统一主持对它的修订工作。,UDC由主表和辅助表及索引组成。主表分为以下10大类(据1989年英文中型版): 0 总类、科学和知识 1 哲学、心理学 2 宗教、神学 3 社会

17、科学 4 (语言) 5 数学和自然科学 6 应用科学、医学、技术 7 艺术、娱乐、体育 8 语言、语言学、文学 9 地理、传记、历史 UDC 的辅助表有语言、文献类型、地点、民族和种族、时间、观点、材料、人物等8个。,分类法与信息技术,文献分类法与信息技术的结合始于上世纪60年代,当时人们主要致力于分类法的机读化。艾瑟顿(Atherton P.)与弗里曼(Freeman R.)在美国物理学会的支持下,把国际十进分类法(UDC)转换成机读形式,建立了第一个以分类法为索引语言的联机检索系统。80年代刘(Liu S.)与斯文诺纽斯(Svenonius E.)开发了采用杜威十进分类法(DDC)的杜威联

18、机检索系统(DORS, Dewey-Online Retrieval System),将分类法的等级结构作为查寻主题词的辅助工具。1991年美国国会图书馆正式推出分类数据的USMARC格式,这是世界上第一个分类法机读格式标准。此后UNIMARC也研制出相应的分类数据机读格式。标准化的分类法机读格式为分类数据的交换与控制创造了条件。,MARC,MARC是Machine Readable Catalog(ue)的缩写,意即“机器可读目录”,即以代码形式和特定结构记录在计算机存储载体上的、用计算机识别与阅读的目录。MARC可一次输入,多次使用,是信息技术发展和资源共享要求的产物。,CNMARC,CN

19、MARC是中国机读目录(China Machine-Readable Catalogue)的缩写, 是用于中国国家书目机构同其它国家书目机构以及中国国内图书馆与情报部门之间,以标准的计算机可读形式交换书目信息。,分类法的缺点,分类法虽然比较具有学科的系统性,但它所能反映的这种科学系统性,只是在一定的限度之内。现代科学由于边缘学科、交叉学科的出现,各门学科互相渗透,互相结合,日益使直线序列的分类法难以反映多元性的知识空间,因而不能确切地代表科学体系。,分类法的优点, 与主题法相比,分类法的族性检索功能有其独特的优势。实践表明,大多数用户的情报需求不是十分明确的,按类浏览、触类旁通是他们获取信息的

20、主要方法。分类法的等级分类体系可以展示上下位类与同位类,能够引导用户逐步查找到所需的信息。 分类法具有聚类作用,可以改善其他检索途径的检索效果。一些试验表明,用分类法对主题途径检索结果进行控制,可大大提高检索的查全率和查准率。,分类法的优点,分类法在多语言环境中能超越语言障碍,对信息资源进行有效的检索与揭示。主题词是建立在自然语言基础上的,如果检索入口的语种不一致,在没有多语种转换机制的情况下,就很难进行有效的检索。而使用分类标记的分类法就不存在语言障碍的问题。 分类法适用于非文本信息资源的组织与管理。数值、图形、图像、声音等非文本信息资源随着多媒体技术的发展,在信息资源,尤其是网络信息资源中所占的比例越来越高。非文本信息资源的主题概念不像文本信息资源那样容易用自然语言来提取与概括,因此使用分类法可以比较方便地通过聚类与分类标记对非文本信息资源进行组织与管理。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1