网络信息利用原理.ppt

上传人:rrsccc 文档编号:9198215 上传时间:2021-02-07 格式:PPT 页数:21 大小:411KB
返回 下载 相关 举报
网络信息利用原理.ppt_第1页
第1页 / 共21页
网络信息利用原理.ppt_第2页
第2页 / 共21页
网络信息利用原理.ppt_第3页
第3页 / 共21页
网络信息利用原理.ppt_第4页
第4页 / 共21页
网络信息利用原理.ppt_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《网络信息利用原理.ppt》由会员分享,可在线阅读,更多相关《网络信息利用原理.ppt(21页珍藏版)》请在三一文库上搜索。

1、网络信息利用原理,1.网络信息资源 2.网络信息检索工具和检索方法 3.学术网站的评价方法,1.1网络信息资源的定义,广义上说,网络信息资源是在网上一各种方式存在并传播的信息集合。 具体表现为网上计算机中的无数信息、网上的各种信息工具以及网络通信渠道。 网上信息包括:计算机中的数据库、电子出版物、王业、软件以及各种格式文件所包含的信息;信息工具包括FTP,Telnet, e-mail, www浏览器和搜索引擎等;网络通信渠道是指网络提供的信息交流渠道。,1.1网络信息资源的定义,狭义上说,网络信息资源通常指指公网上的信息资源,即访问不受任何限制的信息资源,它不包含使用权受IP、用户名及其密码限

2、制的资源。商业性数据库因可以通过网络加以使用,将它们归入网络信息资源是可以的,但由于这些数据库的使用或者受IP限制,或者要求用户名和密码,是不能归入公网信息资源范畴的。,1.2网络信息资源的特点,1.数量庞大,增长迅速(200年网上每天增加200万张网页) 2.整体武训,局部有序(五统一管理机构,但是各引擎和站点收集信息,并有序分类。) 3.更新频繁,变化无常(2001年地网页平局寿命仅仅44天,更新很快。) 4.多为现实,交互方便(多种载体,包括图像声音,视频等) 5.良莠混杂,参差不一(有的是精髓信息,有的却是无根据的错误信息甚至是不健康信息。),1.3网络学术信息资源的类型,按照内容区分

3、,网络学术信息主要有四类: 网上传播的学术机构信息,包括学会,协会,研究所等有关信息; 学术人物信息,包括学科专家、学术间就倒头人的有关信息; 研究信息,包括科研课题、科研项目的立项,申报,课题(项目)的进展、结题报告等信息; 可以称信息,包括发表的论文、出版的著作、课题报告等信息。,1.3网络学术信息资源的类型,按照出版类型区分,网上学术信息资源有着和纸质性出版物类似的对应关系。 按照是否具有原创性,网上学术信息资源又一次资源和二次资源的区分。一次资源是指首次发表的原创性信息,二次资源是专在已有的信息后者是从原创信息中提取的部分信息。,1.3网络学术信息资源的类型,按照是否经过审核,网上学术

4、信息资源可分为正式出版物和非正式出版物两种。 按照是否属于搜索引擎检索范围,可分为不可见资源和可见资源。网上的不可见资源数量远远超过可见资源数量。有人估计,网上的不课件资源和可见资源之比超过400:1。,网络学术信息资源,网上商用数据库,网上公开资源,一次资源,二次资源,一次资源,二次资源,全 文 期 刊 数 据 库,全 文 图 书 数 据 库,其 他 全 文 数 据 库,期 刊 文 摘 数 据 库,会 议 文 摘 数 据 库,其 他 文 摘 数 据 库,学 术 机 构 网 站,个 人 学 术 网 站,其 他 学 术 网 站,i P A C 数 据 库,搜 索 引 擎 数 据 库,虚 拟 图

5、书 馆 网 络 导 航,其 他 网 络 二 次 资 源,网上商用数据库,1.4人文社会科学学术网络,1.网页、网站和竹叶的概念 网页的学名是Html文件,是一种可以在互联网上传输,并被浏览器认识、翻译成页面显示出来的文件。 2.人文社会科学学术网站的类型 按照信息内容特征区分。可分为综合性(如华东师大史学理论与史学史教研室创办的“知识学术网”),专科性社会科学学术网站(社会学人类学中国网)。 按照网站的主办机构区分。可分为:个人网站(如张军经济学网站)、杂志社网站(如民族研究在线网)和科研机构网站(如中国社会科学网)。 按照网站功能区分。可分为:学科门户(如中国经济学教育科研网),学科资源(如

6、法律帝国网)和论坛博客(如传播学论坛)。,1.4人文社会科学学术网络,3.学术网站的判断方法 网站和网页的区别,主要依据显示网页的结构和内容。 学术和非学术网站的区别主要依据网站本身的主旨介绍。 4.人文社会科学常用的网上资源 参见书上P114的网站一览表,2.1网络信息检索的相关概念,1.IP地址和域名 因特网协议地址,通称IP地址。它有四段数字足协横,中间用圆点隔开。 域名一般由代表通信协议、主机名、机构性质域名和国家地区域名四段字母构成。域名并非每台上网计算机所必需,只有作为服务器的计算机才需要。 所以,就服务器而言,域名和IP地址之间有着对应的互换关系。 2.网址 它又称统一资源定位器

7、,代表网上一切资源,包括上网计算机及其 各种文件的地址。 3.网上常见文件的格式和后缀名 如TXT表示纯文本,bmp表示windows位图等。,2.2搜索引擎的基本概念,1.搜索引擎的定义 搜索引擎是网上信息搜索工具的通称。它可以使一个独立的门户网站,如谷歌,雅虎,也可以是辅助其他类型网站或主页上的一个搜索工具。 2.搜索引擎的类型 按照工作方式区分,可分为主题引擎、目录引擎和多元引擎。 主题引擎一般由搜索软件(spider、robot、crawler),索引软件(它的任务是建立索引)和检索软件三部分组成。它的优点是信息量大、更新及时、无需人工干预,缺点是返回信息中常有很多无关信息,身子有一定

8、比例的死链接,用户必须从结果中进行筛选。,2.2搜索引擎的基本概念,目录引擎又称目录指南性搜索引擎。这种引擎的信息收集和处理有人工干预过程,信息处理的层席位网站,检索所得结果的网页中不一定含有检索词。 目录引擎的用户界面基本上都为分级结构。 它与主题引擎的主要区别是由于目录引擎旨在数据库保存的编辑人员对站点的描述中进行搜索,因此站点本身的动态变化不会反映到搜索结果中来。 多元引擎又称圆搜索引擎。它本身没有存放网页信息的数据库,当用户查询一个关键词是,它把请求转换成其他数个搜索引擎能够接受的命令格式,并行地活着有选择性的访问这些搜索引擎并查询这个关键词,处理这些搜索引擎返回的结果,然后再返回给用

9、户。多元引擎的服务方式为面向网页的检索。但是严格来说,它只算是一个用户代理。,2.2搜索引擎的基本概念,按照工作语种区分,可分为中文搜索引擎和外文搜索引擎。 按照搜索内容区分,可分为门户索索引擎和垂直搜索引擎。提供综合性信息服务的搜索引擎称之为门户搜索引擎(如搜狐),而垂直引擎目前最普遍的是博客引擎。 它们的主要区别是一是门户引擎内容信息范围要比处置引擎的来得广;二是门户网站信息内容的实效性相对新一些;三是垂直引擎在信息的深度上往往比门户引擎优越一些。,2.3几个重要的引擎的使用方法,1.百度 输入的检索词可以使研究的主题、网站、新闻等任何内容,形式可以使中文英文,数字或者中英数字的混合体;并

10、且它不区分字母大小写;它没有模糊检索和截词检索功能。 它可以使用两个以上检索词的检索逻辑。 字段检索。 标题检索。 在url中搜索。 特色功能:百度快照,相关检索,专门内容检索。,2.3几个重要的引擎的使用方法,2.谷歌(Google) 它是优点是网址数量大,检索语种多,响应速度快,它页提供“网页快照”功能,但是这只限国外站点,点击Cached链接即可。 谷歌检索文本框中可以任意输入中英文检索词,故宫不支持借此福,但有默认的截词功能。 检索与反方面,检索多个检索词时。 3.Dogpile 它是个多元引擎,而且是目前性能比较好的一个并行式元搜索引擎。它可同时调用25个网页引擎、新闻组引擎和ftp

11、引擎等。 它的输入框下方可选查Web,Usenet,ftp等。 特色: A.采用独特的并行和串行相结合的查询方式。 B.可使用布尔算符合模糊查询。,2.4使用搜索引擎学院注意的问题和搜索引擎检索策略实例,1.选择适合的检索词 切分检索提问。 检索提问具体化。 使用搜索引擎要注意不能写错别字,还应该尽量使用比较常用的词语。 避免使用禁用词作为检索词。 2.小时网页和网站信息的获取方法 有时由于网站整理、文件被重新命名引起的,有时是由于更换服务器引起的“404-Not Found”的错误信息。此时,我们可以用网址回溯法,还可以用字段检索法,或者服务器缓存法。 3.检索策略的调整,即增减检索同义词、

12、近义词等,或者使用逻辑与或者字段限制等策略。,2.5虚拟图书馆和网络资源导航,虚拟图书馆的出现时为了减少信息选择的难度。 较早提出该概念的人是美国人卡耶(Gapen D Kaye)。 何时使用虚拟图书馆: 当时间短促,不允许浏览有搜索引擎查得的巨量的信息时; 当希望看到比较可靠的网络信息; 当希望对某个领域有个整体的、较全面的了解时、,3.1客观评价方法,1.网站排名法 网站排名法是以客观方法评价一个常用方法。某些排名网站通过定期自动统计网站的访问量,分析网站的状态和地位。 Alexa是当前拥有排名网址数量较大、信息发布较详细的一个排名网站。 2.链接分析法 它是利用某些搜索引擎提供的Link命令,检查评价对象网站的被他人连接的情况也是评价网站的一个常用的客观方法。 3.专家分析法 它是指利用网站组织的专家或者资源人员对网站做出的人工评价结果来评价网站。,3.2主观评价方法,1.内容评价法 从内容角度对网站提供的信息进行的判断,主要考虑的标准有可靠性、权威性、唯一性、完整性和全面性。 2.网址评价法 主要有网址回溯法和网址成分分析法。 3.形势评价法 主要从网站的界面和结构方面,包括对网站可访问性、帮助信息的质量和使用技术的恰当性三方面。 4.稳定性评价法 它包括系统稳定性,网站稳定性和信息稳定性。,Thank you!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1