网络信息检索技术8上课ppt课件.ppt

上传人:本田雅阁 文档编号:3221620 上传时间:2019-08-02 格式:PPT 页数:28 大小:2.18MB
返回 下载 相关 举报
网络信息检索技术8上课ppt课件.ppt_第1页
第1页 / 共28页
网络信息检索技术8上课ppt课件.ppt_第2页
第2页 / 共28页
网络信息检索技术8上课ppt课件.ppt_第3页
第3页 / 共28页
网络信息检索技术8上课ppt课件.ppt_第4页
第4页 / 共28页
网络信息检索技术8上课ppt课件.ppt_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《网络信息检索技术8上课ppt课件.ppt》由会员分享,可在线阅读,更多相关《网络信息检索技术8上课ppt课件.ppt(28页珍藏版)》请在三一文库上搜索。

1、网络资源获取途径: 途径之一:搜索引擎,工作原理:由网络搜索软件(Robot、Spider、Worm等)自动定期遍历各类网站,自动搜集网页信息进行索引建库并提供全文检索。不仅可以快速地搜集全球各网站的信息,还及时发现新的网站内容并剔除已废弃的网站网页,及时更新完善自身数据库。数据库规模可以做得相当庞大,数据的时效性也可以得到有力保障,大大提高了网络信息的查全率、及时性及有效性。 。 优点 :信息量大;信息更新速度快;方便普通用户使用。 缺陷:信息噪音较大。,途径之一:搜索引擎,第一代:以网络、网页的数量 多少为标准,结果不按相关性排序,代表为Lycos,Lycos是搜索引擎中的元老,是最早提供

2、信息搜索服务的网站之一。 第二代:以检索结果的质量为目标,检索思想、方法发生转变,检索结果排序并进行超链分析,代表为Google、Baidu 。 第三代:未来趋势智能化搜索工具,进行概念分析。根据检索提问,进行智能化分析与搜索,并对检索结果进行分析、筛选、排序、链接和提示等。,Google 主页,网络资源获取途径之二:网络地址,一个城市如果没有街道、门牌号,要找到一个地方很难,网络也如此。 在国际互联网上有成千百万台主机,为了区分它们,给每台主机都分配了一个专门的“地址”作为标识,称为IP地址。每个IP地址的长度为32位(bit),每段数字范围为1254Bit,段与段之间用小数点分隔。如202

3、.197.191.1 由于IP地址是数字型的,使用起来不方便,于是人们又发明了另一套字符型的地址方案,即域名地址。入网的每台主机都具有类似于下列结构的域名:如, 。在掌握网络地址的情况下,可以利用地址栏进行检索,直接、简便。,商都 信息港 域名,网络资源获取途径之三:主题指南(Subject Directory,网络目录),(如搜弧 雅虎Yahoo! ) 工作原理:将网络信息利用人工分类的方法组织成一个树状目录结构,用户根据主题类目和子类目逐层深入查找所需信息。 优点: 搜集的信息经过人工筛选,质量较高,结果更具有参考价值。 缺陷:信息量小;类目不易确定;信息更新速度慢。 例如:搜狐于199

4、8年推出中国首家大型分类形式的主题指南。18个部类、近10万条链接构成的树型网页结构 。每日页面浏览量超过800万,可以查找网站、网页、新闻、网址、软件、黄页等信息。,主题指南,主题指南,网络资源获取途径之四:网络导航,网络导航就是通过一定的技术手段,为网站的访问者提供一定的途径,使其可以方便地访问到所需的内容。 相当于传统图书馆信息部门的目录索引。 网络导航有许多类,重点学科导航是其中一类。如各高校重点学科导航,北大、清华。,学科 导航,网络资源获取途径之五:网络资源链接、超链接,检索到某一信息资源,往往有许多相关链接、推荐连接、热点连接等,顺链而下,可以查找到许多相关有价值信息。,相关链接

5、,网络资源获取途径之六:网络数据库,网络数据库(免费、购买使用) 免费资源:参考下面网站推荐的免费资源 http:/ 购买的如:CNKI 、万方学位论文数据库、EI 、SCI 等中外文数据库。,网络资源获取途径之七:其他方法与途径,网络会议、专业博客网站。 免费纯网络期刊网站,如神州学人 (http:/ 网络地址的获得:网络指南、因特网适用网址速查 国外电力常用网址名录中国工商网址黄页中国医学网址、“中国精彩网址”、“企业网址大全”等或运用网页地址历史记录、收藏夹直接进入相关站点,可以省去输入网址的时间。,神州学人月刊简介(纯电子期刊),神州学人杂志历经14年的发展,围绕着“加强对广大在外留学

6、人员进行爱国主义教育,鼓励他们回国工作或以适当方式为国服务,为我国改革开放和社会主义现代化建设事业做贡献”的办刊宗旨,经过多年的探索,其主要内容框架已基本形成,即:走近中国了解祖国的窗口; 留学视野联络感情的纽带;学人园地表达情思的园地;留学服务提供服务的媒体。,网络信息检索中的一些常用基本概念初级检索,初级检索是面向一般读者提供的检索方式。利用初级检索系统能进行快速方便查询,适用于不熟悉多条件组合查询的普通用户。它为用户提供了详细的导航内容,最大范围的选择空间。对于一些简单查询,建议使用该检索系统。 该查询的特点是方便快速,执行效率较高,但查询结果有很大的冗余,会检索出一大批检索者所不期望的

7、结果。如果能在检索结果中进行二次检索或配合高级检索命中率会大大提高。,简单检索界面,网络信息检索中的一些常用基本概念高级检索,高级检索包括布尔逻辑检索、位置检索、截词检索、限制检索等。利用高级检索系统能进行快速有效的组合查询,优点是查询结果冗余少,命中率高。缺点是必须掌握一定的检索技术。对于命中率要求较高的查询,建议使用该检索系统。,高级检索界面,检索入口,网络信息检索中的一些常用基本概念检索入口,检索入口,又称检索途径(或可检字段),是用户作为检索依据的文献特征,包括文献的内容特征和外部特征。这些特征在数据库中以字段的形式表现, 所以检索入口也称检索字段。全文数据库中常用的检索途径有:关键词

8、、刊名、作者、题名、分类号、文摘、分类号、任意字段。读者可根据所掌握的文献特征情况及检索目的选择适当的检索入口。,网络信息检索中的一些常用基本概念检索范围,为了提高检索效率和满足特定需求,用户检索时可以先设定检索范围。 用户常设的检索范围有:学科范围、期刊范围、时间范围、语言范围、地域或国家范围等,在下一节的数据库检索中我们将具体介绍如何选择检索范围。,网络信息检索中的一些常用基本概念二次检索,所谓二次检索就是在前次检索的基础上进行的再次检索,一般的二次检索的结果与第一次检索存在一定的关联性;通过二次检索可以缩小检索范围,优化检索结果。,网络信息检索中的一些常用基本概念全文阅读器/浏览器,全文阅读器是一种用于打开具有某些特定格式的全文的一种浏览软件。由于有些数据库的全文使用的是特定格式的文件,必须由相应的阅读器进行阅读,所以,在使用相应的数据库时,必须先下载相应的阅读器,才能阅读全文。如Acrobat Reader (阅读PDF格式文件)、CAJ、维普浏览器等。,实验,查询互联网上有哪些有声图书网站。 查阅有关“基于小波神经网络的智能复合材料损伤定位的仿真研究 ”方面的中文文章。 检索2009年税务与经济上发表的农村经济方面的文献,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1