搜索引擎PPT课件.ppt

上传人:rrsccc 文档编号:9605194 上传时间:2021-03-10 格式:PPT 页数:48 大小:2.82MB
返回 下载 相关 举报
搜索引擎PPT课件.ppt_第1页
第1页 / 共48页
搜索引擎PPT课件.ppt_第2页
第2页 / 共48页
搜索引擎PPT课件.ppt_第3页
第3页 / 共48页
搜索引擎PPT课件.ppt_第4页
第4页 / 共48页
搜索引擎PPT课件.ppt_第5页
第5页 / 共48页
点击查看更多>>
资源描述

《搜索引擎PPT课件.ppt》由会员分享,可在线阅读,更多相关《搜索引擎PPT课件.ppt(48页珍藏版)》请在三一文库上搜索。

1、1,第八章 搜索引擎,2,GOOGLE使用技巧 常用学术搜索引擎介绍,搜索引擎简介,常用学术搜索引擎介绍,GOOGLE使用技巧,3,搜索引擎简介,搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。,4,搜索引擎简介分类,全文搜索引擎 全文搜索引擎是名副其实的搜索引擎,国外代表Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。 根据搜索结果来源的不同,全

2、文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。,5,搜索引擎简介分类,目录搜索引擎 虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo、新浪分类目录搜索。,6,搜索引擎简介

3、分类,元搜索引擎 元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。,7,搜索引擎简介分类,垂直搜索引擎 垂直搜索引擎为2006年后逐步兴起的一类搜索引擎。不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索、旅游搜索、生活搜索、小说搜索、视频搜索等等),在其特定的

4、搜索领域有更好的用户体验。相比通用搜索动辄数千台检索服务器,垂直搜索需要的硬件成本低、用户需求特定、查询的方式多样。,8,搜索引擎简介分类,其他非主流搜索引擎形式 1、集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。 2、门户搜索引擎:AOLSearch、MSNSearch等虽然提供搜索服务,但自身既没有分类目录也没有网页数据库,其搜索结果完全来自其他搜索引擎。 3、免费链接列表(Free For All Links简称FFA):一般只简单地滚动链接条目,少部分有简单的分类目

5、录,不过规模要比Yahoo!等目录索引小很多。,9,GOOGLE使用技巧简介,Google是一家美国上市公司(公有股份公司),于1998年9月7日以私有股份公司的形式创立,以设计并管理一个互联网搜索引擎。Google公司的总部称作“Googleplex”,它位于加利福尼亚山景城。 Google 创始人 Larry Page 和 Sergey Brin 在斯坦福大学的学生宿舍内共同开发了全新的在线搜索引擎,然后迅速传播给全球的信息搜索者。 Google 目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务。不作恶(Dont be evil)是谷歌公司的一项非正式的公司口号,最早是由G

6、mail服务创始人在一次会议中提出。,10,GOOGLE使用技巧产品大全,11,GOOGLE使用技巧基本搜索,12,GOOGLE使用技巧基本搜索,搜索基本要点 每一个字词都很重要。通常,搜索引擎会使用您在查询中输入的所有字词。 搜索始终不区分大小写。搜索 new york times 与搜索 New York Times 获得的结果相同。 通常,标点符号(包括 #$%&*()=+)以及其他特殊字符)都会被忽略。,13,GOOGLE使用技巧高级搜索,14,GOOGLE使用技巧高级搜索,利用高级搜索,可以只搜索符合以下要求的网页: 包含您键入的所有搜索字词 包含您键入的完整词组 至少包含您所键入的

7、其中一个字词 不包含您所键入的任何字词 以特定语言编写 以特定文件格式创建 在特定时间段内更新过 位于特定域或网站内,15,GOOGLE使用技巧高级搜索,常用GOOGLE高级搜索符: 1、词组搜索 () 给搜索词组添加双引号,等于告诉 Google 严格按照该词组的形式查找结果,而不对搜索词组进行任何变动。Google 搜索本身就将字词顺序和字词组合视为非常明显的整体搜索标志,除非有必要,否则不会拆分搜索字词,因此通常没必要加引号。如果您坚持用词组搜索,可能会意外错过若干有用的搜索结果。例如,搜索 李云 (加引号)会错过包含李小云的网页。 2、搜索单个字词的完全匹配结果 () Google 搜

8、索自动采用同义词,因此会返回包含同义词的搜索结果,例如查询 儿童 看护 (包含空格)会同时查找“儿童看护”,查询 加州历史 会同时查找“加利福尼亚州历史”。不过,Google 的这种帮助有时似乎是多余的,反而传回您并不想要的同义词搜索结果。给单个字词添加双引号,等于告诉 Google 严格按您键入的字词来搜索结果。,16,GOOGLE使用技巧高级搜索,常用GOOGLE高级搜索符 3、在特定网站内搜索 (site:) Google 可让您指定搜索结果必须来自特定网站。例如,查询 伊拉克 site: 会仅传回 网站上关于伊拉克的网页。使用比较简单的查询 伊拉克 或 伊拉克 纽约时报 通常就可以了,

9、尽管这可能会从其他提及“纽约时报”的网站传回搜索结果。您还可以指定一类网站,例如 伊拉克 site:.gov 会仅传回 .gov 域的搜索结果,而 伊拉克 site:.iq 会仅传回伊拉克网站的搜索结果。 4、要排除的字词 (-) 在字词前紧靠该字词加一个减号,表示您不希望搜索结果中出现包含该字词的网页。减号应该紧靠相应字词,并且减号的前面应该加一个空格。例如,在查询 anti-virus software 中,减号用作连字符,因此不会被解释为排除符号;而查询 anti-virus -software 会搜索单词“anti-virus”,但是排除包含“software”的网页。您可以根据需要排

10、除任意多个字词,只需在它们前面都加上减号 - 即可,例如 美洲虎 -汽车 -足球 -操作系统 。减号 - 不仅仅用于排除字词。例如,在“site:”操作符之前加一个减号(中间无空格),可以从搜索结果中排除特定的网站。,17,GOOGLE使用技巧高级搜索,常用GOOGLE高级搜索符 5、补全搜索字词 (*) 通配符 * 是一个鲜为人知的功能,但是它的功能非常强大。如果您在查询中使用 *,则 Google 会尝试将该星号视为任意未知字词,然后查找最佳匹配结果。例如,搜索 Google * 会获得关于若干 Google 产品的搜索结果(搜索结果页非常多,因为我们有许多产品)。查询 Obama vot

11、ed * on the * bill 会传回关于奥巴马针对不同提案投不同票的报道。请注意,* 操作符只能代表整个单词,不能代表单词的一部分。 6、OR 操作符 Google 的默认行为是搜索所有字词。如果您希望专门搜索若干字词中的任意一个字词,可以使用 OR 操作符(请注意,“OR”必须全部是大写形式)。例如, 旧金山巨人队 2004 OR 2005 会传回包含其中任意一个年份的搜索结果,而 旧金山巨人队 2004 2005 (没有 OR)会显示同时包含两个年份的网页。符号 | 可以代替 OR。(注:默认情况下,Google 会应用 AND 操作符,因此不需要再加该操作符。),18,学术搜索引

12、擎简介,以学术资源为索引对象,一般涵盖免费学术资源和以深层网页形式存在的学术资源,通过对这类资源的爬行、抓取、索引,以统一的接口向用户提供服务。学术搜索引擎按照覆盖范围,有综合性和专业性两类。,19,学术搜索引擎分类,综合性学术搜索引擎 Google Scholar SCIRUS 读秀 专业学术搜索引擎(略) Medical Matrix (医学) Medhunt(医学) ,20,Google Scholar简介,Google Scholar ( ) 2004年11月推出,是建立在Google搜索引擎基础之上,直接面向科研需要的学术资源的网络检索工具。 2006年推出中文版Beta版,21,G

13、oogle Scholar简介,Google Scholar 的优势 虚拟的、真实高速运行的、提供统一检索入口的、全球性的学术搜索引擎 检索操作便捷 学术性,唯一的选题标准和价值取向 引用索引 结果排序的科学化 运行高速,22,Google Scholar简介,学术性,唯一的选题标准和价值取向 与ACM、Nature等专业文献数据库出版商的协作,与世界顶级图书馆合作,建立学术信息服务的新体系。 进入中文版Google Scholar的,主要是论文、著述、文摘、技术报告等学术科研文献,它们最终源头是各学术出版物、专业学会、预印本库、大学及专业学术网站。,23,Google Scholar简介,引

14、用索引 Google的核心技术之一PageRank算法,其原理类似于科技论文中的引用机制。 Google Scholar能够专门提供文献引用检索和索引。通过“被引用次数”和“相关文章”链接,揭示文献的内在联系,有利于新知识的有效发现和对学术成果的科学评价。 结果排序的科学化 默认为“全部文章”排序,坚持被引因素优先,其次是时间因素。点击“最新文章”可以按时间排序。 每篇文献显示为题录形式,符合图书馆规范的编目信息。“get via library”链接,获取全文。,24,Google Scholar主页,25,Google Scholar高级搜索,26,Google Scholar高级搜索,最

15、常见的 Google 学术搜索操作符 作者搜索 出版物限制 日期限制 其他操作符,27,Google Scholar高级搜索,作者搜索 作者搜索是找到某篇特定文章最有效的方式之一。如果知道要查找的文章作者,您只需将其姓氏添加到搜索字词中。 例如: 搜索 friedman regression (弗里德曼 回归) 会返回以“regression”为主题的,由名为“Friedman”的人撰写的文章。如果您想搜索某位作者的全名或姓氏及首字母,则输入加引号的姓名:“jh friedman”。 如果某个词既是人名也是普通名词,您最好使用“作者:”操作符。该操作符只影响到紧挨其后的搜索字词,因此“作者:”

16、和搜索字词之间不能有空格。 例如: 作者:flowers (人名弗劳尔,也是花的意思) 会返回由名为“Flowers”的人撰写的文章,而 flowers - 作者:flowers 会返回关于花的文章,而忽略由名为“Flowers”的人撰写的文章(搜索字词之前的减号 (-) 会排除包含这一搜索字词的搜索结果)。 您可以使用将作者全名加引号的操作符,来进一步缩小搜索范围。尽量使用首字母而不要使用全名,因为 Google 学术搜索编入索引的某些来源仅提供首字母。 例如: 要查找 Donald E. Knuth(唐纳德E. 克努特),您可以尝试 作者:“d knuth”、作者:“de knuth”或作

17、者:“donald e knuth”。,28,Google Scholar高级搜索,出版物限制搜索 只返回来自特定出版物、针对特定字词的搜索结果。 但是,请记住,出版物限制搜索可能并不完整。Google 学术搜索从许多来源收集书目数据,包括从文字和引言中自动提取。信息可能不完整甚至不准确;例如,许多预印本没有介绍文章是在哪里(甚至是否)最终出版。 通常情况下,如果确定自己在找什么,出版物限制的搜索是有效的,但搜索范围比期望值要窄。 例如: 比较两种搜索方法,一种是在所有出版物上搜索 “共同基金”,另一种是只在金融研究上搜索 基金,您可能会发现前者会为您提供更多有用的搜索结果。 最后,要记住:一

18、本杂志名称可能会用多种方式进行拼写(例如:Journal of Biological Chemistry(生化杂志)经常被简写为 J Biol Chem),因此为了得到完整的搜索结果,您需要对同一出版物多尝试几种拼写方法。,29,Google Scholar高级搜索,日期限制 在寻找某一特定领域的最新刊物时,日期限制搜索可能会比较实用。 但要记住:有些网站资源没有标注出版日期,而日期限制搜索是无法搜索 Google 学术搜索不能辨别出版日期的文章的。所以,如果您肯定一篇关于超导薄膜的论文是在今年出版的,但通过日期限制搜索没能找到,请重新尝试不加日期限制的搜索。,30,Google Schola

19、r高级搜索,其他操作符 Google 学术搜索也支持多数 Google Web 搜索中的高级操作符。,31,Google Scholar搜索设置,32,Google Scholar搜索设置,学术搜索设置除了可以对常用的界面语言,搜索语言、结果数量等进行设置外,尤其重要的是还可以对特定图书馆的馆藏、导出的文献管理软件进行设置,方便了用户对文献全文的获取和导出。,33,Google Scholar搜索设置,34,Google Scholar搜索设置,35,Google Scholar搜索设置设置后检索结果显示,36,Google Scholar搜索设置设置后检索结果显示,37,SCIRUS简介,S

20、cirus ( )是专门用于科技信息检索的世界上最全面的科技搜索引擎。 Scirus 与其它搜索引擎最大的区别在于,其既可以搜索网站(Web),也可以搜索期刊资源,而且专注于科技方面的内容。,38,SCIRUS简介,涵盖资源: 1280万条MEDLINE文摘; 160万篇ScienceDirect全文; 90万项USPTO的专利; 近66万篇Beilstein文摘; 近25万篇IDEAL全文; 10310篇NASA技术报告; 将近20万篇来源于E-Print ArXiv的电子文献; 1410篇来源于CogPrints的电子文献; 565种来自Mathematics Preprint Serve

21、r的预印本; 820篇来源于BioMed Central的全文; 565条来源于Neuroscion的新闻; 465种来自Chemistry Preprint Server的预印,39,SCIRUS简介,文献类型:论文、专利、技术报告、新闻等(文摘、全文) 学科领域:农业与生物学,天文学,生物科学,化学与化工,计算机科学,地球与行星科学,经济、金融与管理科学,工程、能源与技术,环境科学,语言学,法学,生命科学,材料科学,数学,医学,神经系统科学,药理学,物理学,心理学,社会与行为科学,社会学等 获取途径:免费浏览所有检索到的互联网主页的信息。Scirus提供的期刊资源可以免费查看题录和文摘。但

22、是,获取非免费期刊全文需要预先注册并支付费用。,40,SCIRUS主页,41,SCIRUS高级搜索,42,SCIRUS检索结果,43,读秀简介,读秀学术搜索是由海量中文学术资源组成的庞大知识库系统,其以260万种中文图书信息,170万种图书全文,6亿页中文资料为基础,为读者提供深入图书内容的章节和全文检索、部分文献试读、参考咨询等多种功能。 武汉大学师生可以直接从图书馆主页访问,44,读秀简介,使用步骤: 1.选择检索频道,如全文检索或图书,输入关键词,直接检索相关信息。 2.根据需求点击图书名称或全文章节知识点进行浏览。 3.获取图书方式:(左侧本馆借阅) 1)点击本馆馆藏纸本,直接进入图书馆OPAC系统浏览 2)点击本馆电子全文,直接阅读电子书或下载 3)图书馆文献传递,直接传递所需文献部分内容到邮箱,45,读秀主页,46,读秀检索结果,47,读秀搜索类型注:读秀各搜索类型中都提供高级搜索和专业搜索,48,只要我们还在使用网络,就肯定离不开搜索引擎!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1