科技论文写作 (2).doc

上传人:椰子壳 文档编号:3967820 上传时间:2019-10-11 格式:DOC 页数:31 大小:965.50KB
返回 下载 相关 举报
科技论文写作 (2).doc_第1页
第1页 / 共31页
科技论文写作 (2).doc_第2页
第2页 / 共31页
科技论文写作 (2).doc_第3页
第3页 / 共31页
科技论文写作 (2).doc_第4页
第4页 / 共31页
科技论文写作 (2).doc_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《科技论文写作 (2).doc》由会员分享,可在线阅读,更多相关《科技论文写作 (2).doc(31页珍藏版)》请在三一文库上搜索。

1、第一章 引言1今天我们要讨论的主题是科技论文写作相关的信息检索知识。对于科技论文写作和信息检索之间的关系,我们不妨可以辩证地来加以理解:首先,科技论文写作的过程离不开信息检索;其次,科技论文写作的成果本身也是信息检索的主要对象。因此,在讨论科技论文写作的问题时,适当地掌握一点信息检索的知识,了解一点常用的信息资源,有利于更好地完成科技论文的写作。 2那么,本次讲座所讨论话题的一个根本的出发点在于:在科技论文的写作过程中,何时需要和需要怎样的信息检索?(参见PPT-p2)我们分成两个方面来谈:第一节何时需要信息检索首先,何时需要信息检索的问题。1我们先看一下论文的类型。提到论文,通常我们会想到两

2、种类型的论文,一种是学术论文,另一种是学位论文。其中学术论文又可以区分为理论性的学术论文、技术性的学术论文,以及综述性的学术论文;学位论文依所申请学位的高低又可以分为学士论文、硕士论文和博士论文。(参见PPT-p4)这两种类型从篇幅和形式上就可以加以区别。我们今天要讨论的科技论文的写作,主要是指前一种论文,也就是学术性论文的写作;当然,我们讨论信息检索的对象时,则既包括学术论文,又包括学位论文。另外,根据发表场合的不同,学术论文还可以区分为发表在学术刊物上的期刊论文,以及发表在学术会议上的会议论文。这是我们信息检索时最常见的两种论文类型。2我们再看一下论文的写作过程。一篇科技论文的典型的写作过

3、程可以分为三个阶段,各阶段的主要工作如下:第一阶段:论文选题阶段。通过调查研究,查阅文献资料,选择研究课题,撰写开题报告或文献综述。第二阶段:论文研究阶段。开展课题研究(如设计、实验、调查、观察等),进一步获取资料、研究资料,形成论文写作所需的材料。第三阶段:论文撰写阶段。 编拟写作题纲,形成初稿,反复修改以发现问题,并继续收集各种资料,最终定稿成文。(参见PPT-p5)3我们可以清楚地看出,上述三个阶段均包含了资料的收集或获取。而这个资料的收集或获取的过程,也就是信息检索的过程。所以,我们说,信息检索贯穿在整个科技论文的写作过程之中。4刚才我们把论文分成学术论文和学位论文两种类型,其依据是关

4、于科技论文写作的一个国家标准。也即,GB/T7713-1987科学技术报告、学位论文和学术论文的编写格式。这个标准对科技论文的撰写和编写格式作了规定,如:前置部分的題名、作者机构、摘要和关键词,以及主体部分的引言、正文、结论、致谢和参考文献。(参见PPT-p7)5这是一篇典型的科技论文,从中我们可以看出科技论文结构中的几个主要部分。(参见PPT-p8)上述组成部分,尤其是前置部分的題名、摘要和关键词等,也构成了期刊论文信息检索的主要依据。第二节需要怎样的信息检索?1接下来,我们要讨论的话题是:在科技论文的写作过程中,需要怎样的信息检索?对这一问题,我们又可以分为两个方面来谈。其一,哪些信息资源

5、可以被用来撰写科技论文?其二,如何利用信息资源撰写科技论文?(参见PPT-p10)要回答第一个方面,实质上是要弄清信息资源的类型及其分布,而第二个方面的实质是如何获得与科技论文相关的信息资源。为此,我们有必要对信息资源作一些了解。2对于文献信息资源,通常按照其加工程度,我们可以将其划分为一次信息、二次信息和三次信息。其中,一次信息是指那些未经加工的、不具备检索入口的原始资源信息,包括:图书、期刊、学位论文、会议论文、科技报告、专利、报纸、技术标准、政府出版物、产品样本、科技档案等。二次信息是指将分散、无组织的一次信息,根据一定的方法,经过整理、归纳、简化,把可供检索信息的特征甘肃下来而形成的有

6、组织、有系统的信息类型,多为文摘索引类的具有标引检索性质的信息资源。三次文献通常是在一、二次信息的基础上,通过评价筛选,以简练的文字编写而成,提供检索入口并能被用户直接利用的信息资源,多为年鉴、百科全书、词典等工具书类的信息类型。(参见PPT-p11)3文献信息资源的加工过程及其内容,我们可以看下面这张图:(参见PPT-p12)由此可以看出,信息的产生主要依托于一次文献,而信息的利用则更多地依赖二次和三次文献。我们今天所要讨论的信息检索,主要是针对二次文献而言的;而信息检索的最终对象,则多是一次文献。4再看文献信息资源的载体形态,文献信息资源有以下几种类型:1)印刷型文献-包括书、刊、报等。具

7、有便于阅读和流传等优点。但存贮密度太低,体积笨重,占据储藏空间过多,以及难于实现自动输入、处理和检索。 2)电子型文献-包括计算机文档、数据库、光盘等。具有存贮密度高,自动存取速度快,原有记录可以改变、抹去或更新等优点。但需要有相应的计算机及其他先进技术设备才能阅读和利用。3)缩微型文献-具有存贮密度高,体积小,传递和保存方便等优点。其缺点是不能直接阅读,需借助于缩微阅读机。 4)声像型文献-包括:唱片、录音带、幻灯片、电影片、电视片、录像带、录像盘等。 具有直观真切,形象生动等优点。(参见PPT-p13)5不同类型的文献,有不同的检索方式。在计算机发明和普及之前,信息检索主要是针对印刷型文献

8、而言的,在这期间,纸本形式存在的检索工具书在相当长的历史时期发挥了非常重要的作用。21世纪中期以后,随着信息时代的到来,信息资源的数字化加工和网络化传递,尤其是因特网和WEB的普及,使得针对电子型文献尤其是数字信息资源的网络信息检索成为信息检索的主流。我们今天所讨论的信息检索,正是在网络条件下,针对数字化信息资源的检索。第二章 信息检索对象的多样性 1信息检索的对象是信息资源。事实上,信息资源是多样的。在科技论文的写作过程中,这种信息资源的多样性不仅仅表现在信息资源类型的多样方面,还表现在同一种信息资源其存在形式也具有多样性。2以科技论文写作中最重要的选题阶段需要查询的图书为例,要想判断一个选

9、题的价值,需要全面、快速、准确和方便地查找到与特定选题有关的经典性著作。为此,在信息检索前,我们首先需要了解与之相关的经典性著作有哪些?哪里有? (参见PPT-p15)要回答这个问题,需要查找图书的书目信息,也就是进行书目信息检索。第一节图书馆目录1几乎所有的公共和高校图书馆在因特网上均有自己的主页。在国内,收录图书最多、最全面的图书馆当属中国国家图书馆(http:/),它是中国的国家总书库,也是世界上收录中文图书最多的图书馆;此外,港澳台地区也均有各自中央图书馆性质的公共图书馆,如香港公共图书馆、澳门中央图书馆、台湾国立图书馆等,也是查找中文图书信息的重要场所。(参见PPT-p16)2同样地

10、,查找外文图书信息可以到在其它国家的中央图书馆的主页。如,美国国会图书馆、英国国家图书馆和日本国会图书馆等。(参见PPT-p17)3大多数著名高校的图书馆均有数目庞大的藏书,因此,高校,尤其是著名高校的图书馆的主页,也是重要的图书信息收录场所。如北京大学图书馆、哈佛大学图书馆等。4另外,一般而言,一所高校的强势学科均会有较强的图书资料做支撑,因此,查找图书信息时,尤其是要注意了解与论文选题所处专业对口的高校图书馆的图书收藏情况。在宝钢,与钢铁冶金相关的国内高校如东北大学、国外高校如匹兹堡大学等。第二节网上书店目录1在大多数人的眼里,网上书店的书目信息只有在想购买图书时才会使用。实际上,网上书店

11、,尤其是著名的网上书店的书目信息是非常有价值的书目数据库,不仅数据量大、信息详实、更新及时,而且可检索性也非常强。2当当网旗下的当当图书,网址为http:/。当当图书是国内最大的网上书店之一,自称为“网上最大的中文书店”,也是我国超过10万品种的网上书店。通过高级检索,可实现图书书名、著译者、出版社、ISBN、出版时间等检索项,对图书的著录信息包括内容简介、目录、书摘与插图等内容;值得一提的是,类似于读者评论、编辑推荐、购买本书的顾客还买过、浏览本书的顾客还看过等信息的加入,则是网上书店的一大特色。3国外网上书店中,最著名的当属亚马逊书店,它是世界上最大的网上书店,其书目多达百万册。亚马逊书店

12、的网址为http:/www. 。此外,巴诺书店(http:/)和哈佛书店(http:/)也是较为著名的国外网上书店。有意思的是,巴诺书店也自称是因特网上最大的网上书店(The Internets Largest Bookstore)。4网上书店的另一大特色是图书的新颖、及时。由于传统图书从出版到发行,再从图书馆采购到借通需要一个较长的周期,读者从图书馆借阅到一本图书时,往往距离出版时间已经很长。而网上书店的书目信息则可以在第一时间检索到,这对于希望了解和掌握国外最新、最前沿技术进展的学术论文选题来说,显得至关重要。第三节出版社网站上的书目1出版社是图书的生产单位,也是由书稿成为图书的第一道环节

13、。因此,在出版社网站上查询书目信息,是在第一时间了解、掌握最新技术进展的最直接的方法。2以高等教育出版社为例,它的网址是http:/ FirstSearch中的数据库WorldCat,这是全球最大的联合书目系统,收录了OCLC成员图书馆的馆藏,覆盖了300多种语言,且每日更新。2超星数字图书馆是国内最早提出并研发成功的基于互联网的数字图书馆之一。目前超星已数字化160万种中文图书,其中可销售的电子图书100万种,2000年以后出版的新书种类为30万种,囊括了解放后所有已经出版的中文图书的90%,中文图书拥有量全球第一。除了百万册规模的电子图书数据库外,超星公司还提供了“读秀学术搜索”,提供基于

14、6亿页中文资料的深入内容的章节和全文检索服务。3除超星数字图书馆之外,国内用户使用较多的数字图书馆还有方正Apabi数字图书馆和书生之家数字图书馆等。其中,方正电子图书是方正Apabi数字内容资源的核心部分,在销电子图书涵盖了500家出版社的45万种电子图书。4此外,如果不了解在网上该“进”哪一个数字图书馆时,可以利用搜索引擎,键入“digital libraries”,就会得到系统按评分大小排列的数字图书馆名单及其简要介绍。排名前位的如The Berkeley Digital Library SunSITE(http:/sunsite.berkeley.edu)、Library Spot(h

15、ttp:/)等。5有的数字图书馆也链接其他数字图书馆,如中国数字图书馆(国家图书馆办)的“数字图书馆导航”;新西兰数字图书馆的主页,按字顺列出推荐的数字图书馆名单。台湾大学图书资讯学系的导航收集了数字图书馆的相关资源,以及取得这些资源的方法。清华大学也列出了与本校学科建设密切相关的国外虚拟图书馆,如WWW Virtual Library、Edinburgh Engineering Virtual Library等。第五节Google Books和Google Print1利用Google Books和Google Print计划也是查询图书信息非常有效的信息资源。2其中Google Books

16、(http:/ Books和一些特定的工具(如http:/ Books搜索到的图书的全部内容并将其转换为PDF格式。3Google Print(http:/ 信息检索的方法和途径第一节信息检索的含义1要弄清楚什么是信息检索,我们可以用以下一句话来说明问题:“Whats searching like? Finding a needle in a haystack”。这句话表明了两层含义:1)信息检索的目的明确,但结果不可能100%让人满意;2)信息检索是大海捞针,有难度,但不同的方法效率是不一样的。正是因为这两点,才证实了信息检索是有章有循的,对信息检索方法和技巧的的恰当运用,有利于信息检索取得

17、良好的效果。这也是我们今天学习信息检索的目的所在。2信息检索的基本原理可分为以下两个步骤;1信息存储过程:将大量分散的文献信息搜集起来,根据其内容特征或外表特征进行标引,形成表征这些文献信息的特征标识,并存储在一定的载体上,成为有查询功能的检索工具。2信息检索过程:用户根据自己的信息需求,提出检索提问,然后使用有关的标引语言(也称检索语言)将拟定的检索提问规范成检索标识,用于检索的过程。3由此可见,信息检索的实质是一个匹配(Match)过程,即:用户使用检索语言对自己的信息需求予以描述,并在一定的信息资源系统中进行描述匹配的过程。信息检索有广义和狭义之分。广义的信息检索包括了信息的存储和检索两

18、个过程。其中前一过程将信息按一定方式组织和存储起来以形成检索工具或系统;后一过程则利用已有检索工具或系统查找出相关的信息。狭义的信息检索则特指广义信息检索的后一过程,也即信息查询的过程。3信息检索根据不同的标准,可以区分为多种类型。按检索内容分,信息检索可分为文献检索、数据检索和事实检索等。其中文献检索是将存储在数据库中的关于某一主题文献的线索查找出来的检索,它通常通过目录、索引和文摘等二次文献,以原始文献的出处为检索目的;数据检索是将经过选择、整理和鉴定的数值数据存入数据库中,根据需要查出可回答某一问题的数据的检索;事实检索是将存储于数据库中的关于某一事件发生的时间、地点和经过等情况查找出来

19、的检索。按组织方式分,信息检索可分为全文检索、超文本检索和超媒体检索等。其中全文检索是将存储在数据库中整本书、整篇文章中的任意内容信息查找出来的检索;超文本检索是对网络结点和信息链构成的网络中信息的检索;超媒体检索是对存储的文本、图像、声音等多种媒体信息的检索。此外,信息检索还可以按检索设备分为手工检索、光盘检索、联机检索和网络检索等。后三者均属于机器检索也即计算机检索的范畴。第二节检索方法1信息检索的方法多种多样,分别适用于不同的检索目的和检索要求。在信息检索过程中,具体选用哪种检索方法,由于客观情况和条件的限制不尽相同,但归纳起来,常用的信息检索方法有工具检索法、回溯检索法和交替检索法。工

20、具检索法又称常规法,是以主题、分类、作者等为检索点,利用检索工具获得信息资源的方法。使用此方法首先要明确检索目的和检索范围,熟悉主要的检索工具的编排体例和作用。根据检索方式,常规检索法又可分为直接检索和间接检索;根据检索要求,常规检索法又分为顺查、倒查和抽查。回溯检索法又称追溯法、引文法、引证法,是一种跟踪查找的方法。即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。回溯检索法获得文献针对性强,数量较多,在没有检索工具或检索工具不齐备的情况下,利用此法能够获得一些所需要的文献资料。综合检索法又称循环法、分段法。即交替使用回溯法和工具法来进行文献检索的综合检索方法。检索时,先利用检索

21、工具从分类、主题、作者、题名等入手,查找出一批文献信息,然后通过精选,选择出与检索课题针对性较强的文献,再按其后所附的参考文献回溯查找,不断扩大检索线索,分期分段地交替进行,循环下去,直到满足检索要求为止。2在实际检索中,究竟采用哪种方法检索最合适,应根据检索条件、检索要求和检索背景等因素确定。其中,检索条件是指是否有充分的检索工具可利用,在没有检索工具的情况下,可采用以回溯法为主的检索方法。检索要求是指查准、查全和查新,若要求以“查全”为主,则应采用顺查法或循环法;若要求以“查准”为主,则应采用倒查法。检索背景是指待查课题所属学科发展情况,即该学科从何开始研究,何时研究达到高峰或处于低谷,若

22、能准确知道此背景情况,可采用抽查法为主的检索方法。第三节检索途径检索途径就是在检索信息或文献时所通过的渠道。信息检索工具是把众多的各类信息资源进行分析加工,按照一定的特征标识排检组织而形成的信息集合体。而信息检索就是分析一些既定标识从信息集合中选取信息。因此,检索途径是与文献信息的特征和检索标识相关的。根据文献的外部特征和内容特征,信息检索的途径可分为以下两大类型:以文献外部特征为检索途径。文献的外部特征,是从文献检索载体的外表上标记的可见的特征,如题名、作者、序号。其中,题名途径是以书刊或论文篇名编成的索引作为文献信息检索的一种途径;责任者途径是根据已知文献责任者(作者、编者、译者、专利权人

23、、出版机构等)的名称来检索文献的途径;序号途径是根据文献信息出版进所编的号码(标准号、专利号、报告名、索取号等)顺序来检索文献信息的途径。以文献内容特征为检索途径。文献的内容特征是从文献所载的知识信息中隐含的、潜在的特征,如分类、主题等。其中,分类途径是一种按照文献资料所属专业学科的属性或类别进行检索的途径,主题途径是一种按照文献的内容主题进行检索的途径;分类主题途径则是分类途径和主题途径的结合。以文献的外部特征作为检索途径适宜用来查找已知文献题名、作者姓名或序号的文献,而以文献内容特征作为检索途径更适宜于用来检索未知线索的文献。第四章 信息检索策略与技巧第一节信息检索的基本步骤检索策略是为实

24、现检索目标而制定的计划或方案,是对整个检索过程的安排。在计算机检索的条件下,检索策略的制定通常应是在明确需求和分析主题的基础上进行的,包括选择检索系统和数据库、确定检索词、构造检索表达式、实施检索策略、优化检索策略等步骤。(1)分析研究课题是指在着手查找文献前对课题进行分析,弄清检索的真正意图及实质。分析研究的内容包括:课题检索的目的和意义、内涵和外延概念范围,有关课题的国内外行情或背景知识,有关课题的“人”和“机构”线索,有关课题和科学技术知识和一定的专业知识,有关课题的“文献特征”情况等。(2)选择检索系统要考虑所选择的计算机检索系统是否包含与信息需求结合紧密、学科专业对口、覆盖信息面广、

25、报道及时、提示信息内容准确、有一定深度的数据库以及系统的检索功能是否完善等问题。选择检索系统关键是数据库的选择。因数据库的类型和学科范围不同,决定了它适用于不同的检索对象和满足于不同的检索需求。(3)检索词是表达信息需求和检索课题内容的基本单元,也是系统中有关数据库进行匹配运算的基本单元。检索词应根据检索课题所涉及的学科专业和技术内容来选择,并进行一定处理。检索词选择得恰当与否,会直接影响着检索效果。检索词可分为表示主题的检索词(如标题词、单元词、叙词、关键词等)、表示作者的检索词(如作者姓名、机构名等)、表示分类的检索词(如分类号)和表示特殊意义的检索词(如ISBN号、ISSN号、引文标引词

26、等)。(4)构造检索表达式。在计算机检索过程中,检索提问和存储标识之间的对比匹配是由机器进行的,构造表达式的核心是构造一个既能表达检索课题需求,又能为计算机识别的检索表达式。构造检索表达式主要使用布尔逻辑算符、位置算符、截词算符、限制符等,将检索词进行组配,确定检索词之间的概念关系或位置关系,准确地表达课题需求的内容,以保证和提高检索的查全率和查准率。(5)实施检索策略。计算机检索策略的实施,主要是将构造好的检索提问表达式输入计算机检索系统,使用检索系统认可的检索指令进行匹配运算,并对输出或显示的检索结果进行阅览和筛选,找出满足信息需求的检索线索。获取检索结果后,还需要对其归类整理,并按相关度

27、进行排序,从而获取相关度最高、最有价值的原始信息。此外,在检索过程中,如果检索结果过多、过少或准确性不高,则需要进行缩检、扩检,甚至更改检索策略。(6)优化检索策略。由于检索课题千差万别,检索系统的情况各不相同,加上检索人员的水平不一,所以,提出的检索词往往具有较大的局限性、随机性和盲目性,有可能导致检索的失误。这就要求在检索时不断了解反馈信息,及时修改检索策略。第二节信息检索的基本策略信息检索系统一般提供简单检索、二次检索、高级检索和专家检索等检索手段。其中,简单检索是一种单项检索,一般只需输入一个检索词,辅以相应的途径即可进行检索;二次检索是在原有简单检索的结果基础上,再进行检索,可反复使

28、用,不断缩小检索范围;高级检索是一种多项组合检索,一般输入多个检索词进行组配,有的检索系统也称为复杂检索或扩展检索;专家检索是用多个检索词与各种运算符组成检索式,功能与高级检索相似。网络的发展加速了信息的急速增长,也引起了网络信息的生产和利用之间的尖锐矛盾。由于用户信息需求的多样性,决定了其检索目的、检索策略、检索方法和检索步骤的差异性;而又信息量的巨大和信息描述的不规范,利用检索工具(如搜索引擎)检索信息的过程往往是多次检索、不断完善、不断优化的过程。检索策略的优化,就是在检索过程中,为了完整描述所检课题的内涵和外延,往往要进行几个概念的组合和同一概念的多个同义词的组合,而且在检索过程中也需

29、要根据检索结果随时调整检索策略。调整检索策略最为常用的手段是扩检与缩检,扩检与缩检是信息检索的基本策略,也是检索过程中经常面临的问题。其中,扩检是指初始设定的检索范围太小,命中文献不多,需要扩大检索范围的方法。扩检的方法主要可以有以下几种:概念的扩大、范围的扩大、增加同义词和年代的扩大等。缩检则是指开始的检索范围太大,命中文献太多,或查准率太低,需要增加查准率的一个方法。缩检与扩检相反,即概念的缩小、范围的限定、年代的减少等。此外,还可以通过核心概念的限定、语种的限定、特定期刊的限定等方法进行限定。第三节信息检索的基本技巧信息检索的基本技巧包括布尔检索、截词检索、限制检索、位置检索、强制检索和

30、加权检索等。(1)布尔检索。布尔逻辑检索是检索系统中应用最为广泛的检索技术,是最简单、最基本的匹配模式,几乎所有的信息检索系统都支持布尔逻辑检索。布尔逻辑运算符包括逻辑与、逻辑或和逻辑非,分别表示检索词之间的并列、交叉和排除关系,不同的检索系统对逻辑运算符的表示方法各不相同。(2)截词检索。又称词干检索、模糊检索。检索时,只需用词干加截词符号,凡是含有与该词干相同的文献均能被检出。该方法能很好避免漏检现象的出现。检索系统不同,截词符也不同,常用的有:#、?、*等。根据截词符出现的位置不同,可分为:后截词、前截词和中间截词。(3)限制检索。是缩小或约束检索结果的方法,主要是指限定字段检索,即是指

31、定检索词在记录中出现的字段。常用的字段代码有:TI(题名)、AU(作者)、AB(文摘)、JN(刊名)、PY(年代)和LA(语种)等。使用方法如:information/TI、LA=english、文摘=网络信息资源等。(4)位置检索。位置检索通过限定词与词之间的位置关系以提高检准率。位置运算符包括W(With)和N(Near),运用W或nW来限定两个词之间的顺序和间隔,但多数检索系统都采用NEAR运算符限定检索结果中词与词之间的距离和词间的修饰关系。制定A WITH B检索式,表示检出的信息资源中词A在词B之间,且允许间隔一个字符。(5)强制检索。使用双引号可以将引号中的词作为一个整体,在文本

32、中查找。例如用“digital library”这一表达式将digital library作为一个整体进行检索,而不是分别检索digital和library;强制检索的另一种情况是针对一些存在忽略字符的检索系统进行的强制搜索,如Google对一些网络上出现频率极高的词作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“+”。(6)加权检索。用专门符号规定某个检索词在检索结果中的权值。例:+environment表示关键词environment必须出现在结果中;-truck表示关键词truck一定不能出现在结果中。部分检索系统中的加权检索还支持对检索词在特定位置出现次数的限定。第

33、五章 搜索引擎信息检索第一节Google与搜索引擎因特网为用户提供了一个海量和无所不有的免费数字图书馆。通过网络获取信息已成为大多数人生活的重要组成部分,而搜索引擎则正是使之成为现实的利器。从上世纪90年代以Yahoo、Alta Vista为代表的第一代搜索引擎开始,搜索引擎发展至今,已进入了Google、Baidu为代表的第二代搜索一统天下的阶段,并逐步向专业化和智能化方向发展。以Google为例,目前的Google已不再是推出之初单纯的网页搜索,而是一个可以搜索网页、视频、图片、音乐和身边分类生活信息的综合性搜索引擎,成为一个集导航、地图、翻译、邮件、即时语音通信等功能于一体的内容服务商。

34、不论Google是搜索引擎、免费电子邮件、社会化网络,还是GooOS 新型的网络“操作系统”,无论它是什么,人们知道在它那里可以查到资料,它是一个巨大、实时更新、快速而免费的资料库。Google的出现,颠覆了以往前台以门户网站示人和后台以人工干预分类为特点的第一代搜索引擎的模式,其简洁的搜集入口和简单的搜索操作改变了人们获取信息的习惯。事实上,Google搜索的简单是以其后台技术的复杂为依托的;并且,Google本身也提供了人们一整套高级的查询语法和功能,以便于用户更准确、全面和便捷地获取所需信息。此外,从用户的角度,要想高效地用好搜索引擎,也需要用户适当了解一点关于搜索引擎的使用技巧。而在搜

35、索之前的起步阶段,做好需求的分析并提炼正确的关键词,则是任何信息检索取得效果的基础。(1) 搜索之前先分析搜索引擎本事再大,也搜索不到网上没有的内容,而且,有些内容虽然存在网上,却因为各种原因,而成为漏网之鱼。所以在你使用搜索引擎搜索之前,应该先花几秒种想一下,我要找的东西网上可能有吗?如果有,可能在哪里,是什么样子的?网页上会含有哪些关键字?(2) 提炼正确的关键词选择正确的关键词是一切的开始。学会从复杂搜索意图中提练出最具代表性和指示性的关键词对提高信息查询效率至关重要,这方面的技巧(或者说经验)是所有搜索技巧之母。在提炼关键词时,还要适当了解Google处理关键词的一些做法,如:Goog

36、le自动过滤掉检索词中常用的副词、代词等;Google对检索词的位置和顺序敏感;Google对英文检索词是不分大小写的。这些均是正确使用关键词的基本技巧。(3) 合理使用逻辑表达式和参数除了简洁的搜索入口和简单的搜索规则之外,Google还提供了较为完整的高级查询语法和功能,如支持 “与”、“或”、“非”逻辑检索,支持词组、通配符、同义词检索词;此外,Google还支持filetype、site、link、inurl/allinurl、title/allintitle等参数限定。上述高级查询语法的使用,方便了用户更准确、全面和便捷地获取所需信息。(4) 合理使用搜索提示在用户向搜索框键入查询或

37、只键入字词的一部分时,Google 会推测用户键入的内容,并实时提供建议。搜索提示与 Google 的相关搜索功能类似,该功能会在搜索开始后提供替代查询建议,只不过搜索提示是实时提供的。对中国用户,Google还设计了拼音提示的功能,即只要用户输入拼音的一部分,系统也会提示相对应的中文搜索关键字。例如,如果用户键入音乐,Google 可能会提供一个优化查询建议列表,包括音乐下载或音乐试听。用户可以使用箭头键或鼠标,向上或向下滚动列表在其中选择一个建议进行查询。第二节Google 基本检索(1)逻辑检索Google无需用明文的附号来表示逻辑“与”操作,只要空格就可以用于搜索包含两个及两个以上关键

38、字的网页。此外,Google用大写的“OR”表示逻辑“或”操作,搜索结果至少包含多个关键字中的任意一个;用减号“-”表示逻辑“非”操作,如“AB”表示搜索包含A但没有B的网页,用于搜索不包含某些特定信息的网页。(2)截词检索很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用引起来。比如,“以*治国”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。(3)强制搜索Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号

39、如“*”、“.”等,作忽略处理。如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。Google另一种强制搜索的方法则是把上述关键字用英文双引号引起来。在上例“world war I”中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。第三节Google 高级检索(1) 网站限定“site”参数表示搜索结果局限于某个具体网站或者网站频道,如“”、“”,或者是某个域名,如“”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。例如:“搜索引擎 技巧 site:”搜索国内教育科研网站或高校网站上关于搜索引擎技巧的网页

40、。(2)文件类型限定“filetype”参数是Google开发的又一具非常强大实用的搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能搜索Office文档、PDF文档、Flash动画等。其中最实用的文档搜索是PDF搜索,PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准,通常是一些图文并茂的综合性文档,提供的信息一般比较集中全面。例如:用“资产负债表 filetype:pdf”可用于搜索资产负债表的PDF文档。(3)URL链接限定“inurl”语法返回的网页链接字符串中包含第一个关键字。有很多网站把某一类具

41、有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。“allinurl”语法返回的网页的链接中包含所有作用关键字。(4)网页标题限定“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言中和之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题

42、中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。第四节Google的其它搜索(1) Google网页目录搜寻引擎是用户搜索网页的最佳工具,但当搜索范围涵括太广时,Google提供了网页目录工具“http:/”,可以将用户搜索缩小在指定的范围内。Google 结合先进的网络搜索技术,并依据“Open Directory” 明细分类,经由全球各地的义务编辑人员精心挑选,再由 Google 著名的“网页级别” 技术分析,对目录中的网站进行排序,从而让用户在目录内找到更确切的网页分类资料。 此外,Google 的网页目录能帮助您了解各分类主题的相关程度,并提供您相关的搜索线索;使用网络目录检索,能将搜索范围局限于特定的分类内,略去类似但无关的其它网页,并让用户只察看已经过编辑群审核过的优良网站。(2) Google学术搜索Google学术搜索的网址为http:/ 目录型搜索引擎目录型检索工具的主要优点是所收录的网络资源经过专业人员的选择和组织,可以保证质量,减少了检索中的“噪声”,从而提高了检索的准确性。但是由于人工搜集整理信息耗时费力,收录的信息的范围有限,其数据库的规模也相对较小。目录型检索工具比较适合于查找综合性、概括性的主题概念,或是对检索准确度要求较高的课题。除了Goo

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1