网络信息资源的检索.ppt

上传人:本田雅阁 文档编号:3221674 上传时间:2019-08-02 格式:PPT 页数:82 大小:8.33MB
返回 下载 相关 举报
网络信息资源的检索.ppt_第1页
第1页 / 共82页
网络信息资源的检索.ppt_第2页
第2页 / 共82页
网络信息资源的检索.ppt_第3页
第3页 / 共82页
网络信息资源的检索.ppt_第4页
第4页 / 共82页
网络信息资源的检索.ppt_第5页
第5页 / 共82页
点击查看更多>>
资源描述

《网络信息资源的检索.ppt》由会员分享,可在线阅读,更多相关《网络信息资源的检索.ppt(82页珍藏版)》请在三一文库上搜索。

1、网络信息资源的检索,定义,是指通过网络存储的数字化图、文、声、像等多媒体信息的集合。 与传统信息资源相比较,其主要特征是数字化和网络存取。,网络信息资源的特点,信息量大,传播广泛 信息层次多,品种多样 自由发布,交流直接 信息传播速度快,变化频繁 分散无序,缺乏管理 检索方便 内容质量不一,网络信息检索方法,直接 如: 网络资源指南 搜索引擎,网络信息检索工具,定义:是指在因特网上提供信息检索服务的计算机系统。 原理:,网络资源,搜集资源,提供资源,搜索引擎,定义: 搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务的系统。,搜索引

2、擎,原理 搜索程序,处理程序(索引),检索程序,蜘蛛 或机器人,搜索引擎分类,按工作方式划分: 全文搜索引擎 目录索引类搜索引擎 元搜索引擎,搜索引擎分类,全文搜索引擎 通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,是名副其实的搜索引擎。 在国外具有代表性的搜索引擎有Google等,国内著名的有百度等。,内容全,更新快,功能强,命中率低,结构不清晰,搜索引擎分类,目录索引类搜索引擎 虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(

3、Keywords)查询,仅靠分类目录也可找到需要的信息。 在国外代表DMOZ - the Open Directory Project等,结构清晰,内容少,更新慢,,搜索引擎分类,元搜索引擎 在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。 著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有360搜索。,搜索引擎分类,元搜索引擎,搜索引擎一般查询规则,连接符 逻辑“与” 一般用“and”表示,提高查准率 逻辑“或” 一般用“or”表示,提高查全率 逻辑“非” 一般用“not”表示,缩小范围,搜索引擎一般查询规则,截词符

4、 一般按截断的位置可以分为前方截词,中间截词,后方截词。 一般用“?”和“*”等表示截词符。 前方截词(后方一致):“? ology”可检出:methodology, biology, radiology 中间截词:“wom? n”,woman和women 后方截词(前方一致):“comput?”可检索出compute、 computer、 computing等,搜索引擎一般查询规则,空格、逗号、括号和引号 空格的作用与逻辑“与”和“and”是相同的 如 计算机 维护 逗号相当于逻辑“或”和“or” 括号用于改变复杂检索式中逻辑运算符的优先顺序,在括号中的优先执行。 如:多媒体 and (计算

5、机 or 网络) 引号括中其中的多个词被当作一个短语。 如:“ electronic magazine” electronic magazine,搜索引擎一般查询规则,限定字段检索 限定在标题,正文,网址等。,中国搜索分布情况,数据来源: http:/ http:/ http:/ 百度() 百度,全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。 以网络搜索为主的功能性搜索,以贴吧为主的社区搜索,针对各区域、行业所需的垂直搜索,Mp3搜索,以及门户频道、IM等,全面覆盖了中文网络世界所有的搜索需求,根据第三方权威数据,百度在中国的搜索份额超过80%。,国内外著名搜索引擎,

6、主要国内搜索引擎 百度() 高级搜索: 把搜索范围限定在网页标题中intitle 例如,找云南省风景相关信息,就可以这样查询:风景 intitle:云南 注意,intitle:和后面的关键词之间,不要有空格。,国内外著名搜索引擎,主要国内搜索引擎 百度() 高级搜索: 把搜索范围限定在特定站点中site 例如,天空网下载软件不错,就可以这样查询:msn site: 注意,“site:”后面跟的站点域名,不要带“http:/”;另外,site:和站点名之间,不要带空格。,国内外著名搜索引擎,主要国内搜索引擎 百度() 高级搜索: 把搜索范围限定在url链接中inurl 例如,找关于photosh

7、op的使用技巧,可以这样查询:photoshop inurl:jiqiao。 上面这个查询串中的“photoshop”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。 注意,inurl:语法和后面所跟的关键词,不要有空格。,国内外著名搜索引擎,主要国内搜索引擎 百度() 高级搜索: 精确匹配双引号和书名号 如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。 例如,搜索 上海科技大学 ,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,“

8、上海科技大学”,获得的结果就全是符合要求的了。,国内外著名搜索引擎,主要国内搜索引擎 百度() 高级搜索: 精确匹配双引号和书名号 书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。 书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说。比如,查电影“手机”。,国内外著名搜索引擎,主要国内搜索引擎 百度() 高级搜索: 要求搜索结果中不含特定查询词 例如,搜 神雕侠侣,希望是关于武侠小说方面的内容,却发现很多关于电视剧方面的网页。那么就可以这样查询:神雕侠侣 -电视剧 。 注意,前一个

9、关键词,和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。,国内外著名搜索引擎,主要国内搜索引擎 百度() 高级搜索: 特定文件搜索(filetype) 其搜索语法为:查询词+空格+Filetype:格式,格式可以是DOC、PDF、PPT、XLS、RTF、ALL(全部文档)。 例如:市场分析 filetype:doc,其中的冒号是中英文符号皆可,并且不区分大小写。,国内外著名搜索引擎,主要国内搜索引擎 百度() 高级搜索: 记不住? http:/ 百度() 更多技巧 http:/ Google (http:/ Google 被公认为全

10、球最大的搜索引擎,也是互联网上5大最受欢迎的网站之一,在全球范围内拥有无数的用户。Google允许以多种语言进行搜索,在操作界面中提供多达30余种语言选择。 访问不顺畅,国内外著名搜索引擎,主要国内搜索引擎 Google 翻译 将文本、网页和文件在 50 多种语言之间进行即时互译。 学术搜索 搜索学术论文,国内外著名搜索引擎,主要国内搜索引擎 360搜索(http:/ 2012年8月16日,360安全搜索上线,启用独立so二级域名。 360浏览器的收藏夹功能,国内外著名搜索引擎,主要国内搜索引擎 新浪搜索(http:/ 新浪公司是一家服务于中国及全球华人社群的网络媒体公司。 新浪搜索针对其网站

11、内容进行搜索。,国内外著名搜索引擎,主要国内搜索引擎 中国雅虎 (http:/ 是全球第一门户资讯网站,业务遍及24个国家和地区,为全球超过5亿的独立用户提供多元化的网络服务。,目录索引搜索引擎,国内外著名搜索引擎,主要国内搜索引擎 搜搜(http:/ 搜搜作为腾讯旗下的搜索引擎网站于2006年3月正式发布并开始运营,搜搜目前已成为中国网民首选的三大搜索引擎之一,主要为网民提供实用便捷的搜索服务,同时承担腾讯全部搜索业务,是腾讯整体在线生活战略中重要的组成部分之一。,国内外著名搜索引擎,主要国内搜索引擎 有道(http:/ 作为网易自主研发的全新中文搜索引擎,有道搜索致力于为互联网用户提供更快

12、更好的中文搜索服务。2006年底有道推出测试版,并于2007年12月11日推出正式版。目前有道搜索已推出的产品包括网页搜索、图片搜索、视频搜索、购物搜索、网易返现、有道购物助手、有道词典、有道手机词典、有道翻译、饭饭、有道云笔记、工具栏、网址导航、有道阅读、有道热闻等。,国内外著名搜索引擎,主要国内搜索引擎 有道(http:/ 搜索类似网页 使用带“related:“前缀的页面url地址搜索某个页面的类似页面。如输入【related:】,可以查看到和网易新闻频道类似的其他网页。,国内外著名搜索引擎,主要国内搜索引擎 搜狗(http:/ 搜狗搜索是搜狐公司于2004年8月3日推出的全球首个第三代

13、互动式中文搜索引擎。早在2007年就成为全球首个中文网页收录量达到100亿的搜索引擎。目前已成为新近崛起的拥有核心技术的搜索引擎,其在音乐搜索、地图搜索等诸多方面一直引领着搜索引擎产品和服务的发展趋势。,国内外著名搜索引擎,主要国内搜索引擎 必应(http:/ 必应,是微软的中文搜索品牌,2009年5月29日正式推出。“必应”是微软全球搜索品牌Bing的中文搜索品牌,是微软全球搜索服务品牌的一个重要组成部分。,国内外著名搜索引擎,主要国内搜索引擎 Jopee (http:/ ) Jopee是集合国内外多家大型搜索引擎结果为一体的元搜索引擎系统! 360搜索,元搜索引擎,国内外著名搜索引擎,主要

14、国内搜索引擎,国内外著名搜索引擎,国内外著名搜索引擎,主要国内搜索引擎 重庆就业- 前程无忧- 中华英才- 职友集- 职业大百科-,职业方面垂直搜索引擎,国内外著名搜索引擎,主要国内搜索引擎 中搜论坛,论坛方面垂直搜索引擎,国内外著名搜索引擎,主要国内搜索引擎 http:/ 电子书搜索引擎,中国最大的电子图书搜索引擎。,电子书方面垂直搜索引擎,国内外著名搜索引擎,主要国内搜索引擎 搜索软件吧,中国首家专业软件搜索引擎。,软件方面垂直搜索引擎,国内外著名搜索引擎,主要国内搜索引擎 淘宝 天猫 京东 苏宁易购 中关村在线 太平洋电脑网等等,购物垂直搜索引擎,国内外著名搜索引擎,主要国外搜索引擎

15、Google (http:/ ) Google 被公认为全球最大的搜索引擎,也是互联网上5大最受欢迎的网站之一,在全球范围内拥有无数的用户。Google允许以多种语言进行搜索,在操作界面中提供多达30余种语言选择。,国内外著名搜索引擎,主要国外搜索引擎 雅虎 (http:/ ) 是全球第一门户资讯网站,业务遍及24个国家和地区,为全球超过5亿的独立用户提供多元化的网络服务。,目录索引搜索引擎,国内外著名搜索引擎,主要国外搜索引擎 雅虎 (http:/ ) 是全球第一门户资讯网站,业务遍及24个国家和地区,为全球超过5亿的独立用户提供多元化的网络服务。,国内外著名搜索引擎,主要国外搜索引擎 必应

16、(http:/ ) 必应,是微软的中文搜索品牌,2009年5月29日正式推出。“必应”是微软全球搜索品牌Bing的中文搜索品牌,是微软全球搜索服务品牌的一个重要组成部分。,国内外著名搜索引擎,主要国外搜索引擎 EXCITE (http:/ 其数据库界面非常友好,用户可以利用关键词、词组和自然语言进行检索。由于它已经开发出多种全球区域版本,因此它也是使用最为广泛的搜索引擎之一。 其使用google、雅虎和Yandex的索引数据库,但检索结果排序使用自己以前的算法。,国内外著名搜索引擎,主要国外搜索引擎 Ask Jeeves (http:/ /) 虽然Ask Jeeves的知名度并没有google

17、和微软搜索引擎bing大。在诞生10周年(2010年)之际,Ask Jeeves依据过去10年时间里网民提出的逾10亿条问题,来选出过去10年10大无法回答问题。,垂直搜索引擎,国内外著名搜索引擎,主要国外搜索引擎 HotBot (http:/ HotBot 是美国一个非常优秀的搜索引擎,它获得了许多杂志及媒体的奖项。HotBot 最大的特点在于它的界面组织和丰富的检索功能。 该引擎已被Lycos收购,国内外著名搜索引擎,主要国外搜索引擎 Lycos (http:/ ) Lycos是搜索引擎中的元老,是最早提供信息搜索服务的网站之一。数据来自looksmart, yahoo。,国内外著名搜索引

18、擎,主要国外搜索引擎 Dogiple (http:/ ) 是一个著名的元搜索引擎,诞生于1996年,现属于InfoSpace公司,是目前性能较好的统一检索入口式元搜索引擎之一。,元搜索引擎,国内外著名搜索引擎,主要国外搜索引擎 Dogiple (http:/ ),国内外著名搜索引擎,主要国外搜索引擎 Dogiple (http:/ ),各搜索引擎相关知识,网络信息资源检索技巧,分析检索的主题,明确检索目的和要求 信息类型,查询方式,查询范围,查询时间 选择合适的检索工具 中文选百度,英文选择谷歌等 析取检索词 先选用主题词,用常用专业术语,用同义词与相关词,避免用高频词和低频词,网络信息资源检

19、索技巧,正确构造检索式 使用前面的逻辑运算符,位置算符和截词算符等。其直接关系检索结果,网络信息资源检索技巧,及时调整检索策略 检索结果过少 放宽检索范围:学科领域、时间、文章类型,关键词出现的字段等; 将描述检索主题的词想全,包括同义词、近义词、缩写形式; 减少用“AND”或“NOT”算符联结,增加用“OR”联结检索词; 采用截词检索法,网络信息资源检索技巧,及时调整检索策略 检索结果过多 严格限定检索范围:学科领域、时间、文章类型,关键词出现的字段等; 选择与检索主题密切相关的词和专业术语 避免使用过于宽泛的词汇; 使用词组检索或位置检索 在检索结果的基础上进行二次检索 增加用“AND”或“NOT”算符联,网络信息资源检索技巧,加快检索速度,节约时间和费用 建立收藏夹 只用文本方式传输 使用镜像资源(本地资源) 选择合适时间,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1