信息资源检索.doc

上传人:scccc 文档编号:13506423 上传时间:2022-01-12 格式:DOC 页数:8 大小:52KB
返回 下载 相关 举报
信息资源检索.doc_第1页
第1页 / 共8页
信息资源检索.doc_第2页
第2页 / 共8页
信息资源检索.doc_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《信息资源检索.doc》由会员分享,可在线阅读,更多相关《信息资源检索.doc(8页珍藏版)》请在三一文库上搜索。

1、信息资源检索1、因特网的信息资源与服务存在许多误解 :( 1)认为因特网无所不包、无所不 能。所有信息均可在网上找到; (2)认为因特网上找到的、下载下来的信息都是正确 的; (3)认为因特网可以完全取代其他媒体或信息渠道;(4)认为因特网上的信息无太 多利用价值 , 仅限于聊天、菜谱、各种发烧友俱乐部等非正式、娱乐性信息, 缺乏严肃类信息。2、网上有什么样的信息 : 政府信息(来源过最大的是美国)、科研信息、教育信息、文化信息、休闲娱乐信息(被称为是网上最成功的领域)3、因特网信息资源的特点 : 无限性和广泛性、多样性、廉价性、共享性、新 颖 性、无序性4、因特网上信息资源的种类:Web信息

2、资源、Tel nt、FTP信息资源、用户组 信息资源(用户通信、服务组是因特网上最受欢迎的信息交流形式)、RSS言息资源5、超文本传输协议HTTP超文本标记语言 HTML通用资源定位程序URL (URL 乂称信息资源的统一定位或统一资源定位器)URL包括3部分:所使用的传输协议、服务器名称、该服务器上定位文档的全路径名;6、 浏览器是一种应用于 WWW网络软件,它是运行在用户计算机上的客户程序。 浏览器分为 3 类: 行式浏览器、文本浏览器、使用图形界面的浏览器。7、评价的标准:忖的、范围、内容8、围绕网站内容的方面 : 准确性、权威性、新颖性、独特性、可靠性、链 接、 图形和多媒体设讣、信息

3、的展示与设讣、可操作性9、评价方法 : 定性评价(即按照一定的评价标准对被评站点的各方面特征、质 量作出主观评判。)定量评价(即利用数量分析方法,对调查统讣数据进行分析,进而 做出较系统、客观的评判。)10、因特网信息资源检索的特点 : 检索范围大、检索效率高、检索工具强大、 信 息冗余大11、使用关键词检索网络资源的优点是 :( 1)检索简单易行、利于上手 (2)检 索 到的信息较新,时效性好可以达到较高的检全率符合检索语言的文献保障原则和用户保障原则12、基于关键词检索的缺点 :关键词语言难以反映词间的相关关系 ; 分散主题, 影响查准率;自动标引无法完全解决标引不一致的问题。13、检索工

4、具的功能通常包括 : 布尔检索、截词检索、位置检索、加权检索、 字 符串检索、限制检索、概念检索、模糊检索、深入检索因特网信息检索匸具的工作原理:网络资源U录的工作原理相对简单,一般是山人工发现、抓取、辨别网上信息,依靠编LI 、标引人员的知识,按照图书分类、学科分类或其他分类依据,建立主题树分层LI 录,将采集、筛选后的信息分门别类地放入各大类或子类下面。一个完整的搜索引擎应具备如下 5 部分: 搜索器、搜索引擎数据库、索引器、 检 索引擎和用户接口14、汁算机检索模型包括 : 布尔模型、向量空间模型、概率模型、扩展布尔模 型15、因特网检索匸具的性能评价 : 收录范兩、检索功能、检索效率、

5、检索结果 的 处理和展示、用户界面设计16、检索功能直接影响信息检索的检全率、检准率、检索的灵活性、方便性 及检索速度 ,是评价与选择因特网信息检索工具的核心指标。17、检全率: 对于一项检索,实际检出的真正相关的文件数目(小与所有应该被 检出的文件数 LI (R) 的比率 ,r/R 即为检全率。18、 检准率:对于一项检索,如果检出的文件数是n,其中与本次检索真正相关的 文件是 r, 那么检准率就是 r/no19、搜索引擎 (search engine) 是指根据一定的策略、运用特定的计 ?算机程序 从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的 信息展示

6、给用户的系统。20、通用搜索引擎:Google谷歌(Google会自动以AND逻辑连接;Google也支 持 0R逻辑操作:Google不支持截词符的使用)百度、天网、搜狗、网易等21、LI 录型网络检索工具概念:因特网上的 LI 录型检索匸具一般称为网络口录 (Web Directory), 乂称分类站点 LJ 录、专题目录或主题指南、站点导航系统等。它 是由网络开发者将网络资源收集后,以某种分类法进行组织整理,并和检索法集成在 一起的信息查询方式。网络口录一般是通过引导网络用户的查询概念 (而不是确切 的词 条 ) 来帮助用户找到所需的网络信息。22、网 络资源 LI 录一般采用人工或半自

7、动方式采集和存储网络信息。23、 一个网络资源H录到底有儿层,取决于多种因素:其一与使用的目录有关; 其二取决于所选的类目;其三与主题有关。24、网络资源目录使用的分类法 : (1) 主题分类法 (2) 学科分类法 (3) 图书分类 法 (4) 分面组配法25、 主题分类法一般设置12-18个一级主题类目,层次一般是 4级。Yahoo!就 是应用了主题分类法,它将网络资源按内容分为 14 个大类。26、“网络指南针”采用的分类法之一便是学科分类法,其一级类目共分 58 个 学科。27、分面分类法的原理是首先确定儿个分类标准,即分面,再确定每个分类标 准 中的若干特征值,即类日。28、网络资源

8、LI 录介绍 : Yahoo! Galaxy 、 The WWW Virtual Library 、 Google 网页目录、 Dmoz29、网络资源 LI 录主要适用于 :(1) 用户进行较宽泛的主题浏览和检索。 (2) 当 用户尚未形成很精确的检索概念时,采用主题指南作为检索起点非常有效。30、元搜索引擎是一种基于搜索引擎的网络检索工具。31、元搜索引擎的分类 : 桌面元搜索引擎、 All-in-One 式元搜索引擎、并行 检索 式元搜索引擎32、并行检索式元搜索引擎是将多个搜索引擎集成在一起,提供一个统一的检 索界面,用户发出检索请求后,提问式被同时分别提交、发送给多个独立搜索引擎,同时

9、检索多个数据库,最终输出的检索结果是经过聚合、去重之后反馈的多个独立搜索引擎查询结果的综合。 33、在选择、使用各元搜索引擎时应注意其在以下儿方面的特点:(1) 所集成搜索引擎的数量和名称 (2) 检索提问的输入及处理 (3) 其他检索 选项(4) 检 索结果的处理34、常用的桌面元搜索引擎 : 飓风搜索通、网际狂搜35、 Dogpile,是老资格的元搜索引擎之一,LT前可检索多达26个搜索引擎和 类信息资源,具体对应如下:WWW源: Alta V istaBay9Direct Hit.Usenet 资源 : Deja. comFTP 资源 : Fast FTP Search拍卖信息: Go

10、To. com音频资源 :Astraweb, AudioGalaxy, MP3Board36、TBIR:基于文本的图像检索技术;CBIR:基于内容的图像检索技术37、 用来帮助图像分析、标引的 Web文档内容包括:(1)图像的文件名及其网 址(2) 图像的替代文字 (3) 图像周圉的文字 (4) 图像所在页面的标题 (5) 图像的超链接 (6) 图像所在网页彼此间的链接38、图像的内容特征 , 主要采用的是图像的颜色、纹理、及其形状特征。39、OCLC FirstSearch :是由美国OCLC创建的,是一个非营利、成员制的联机 计算机图书馆服务和研究机构,也是世界上最大的文献信息服务机构之一

11、。40、 OCLC自建的数据库有以下 7个:(l)WorldCat 世界上最大的、每日更新的书 目数据库。(2)ArticleFirst 提供 15000多种学术期刊中论文的书 LI 信息(3) ContentsFirst提供 15000多种学术期刊的 LI 次页和馆藏信息 (4)FastDoc 是一个全文数据库,包括来自 1000 种期刊、杂志的 90 万篇文章 (o)NetFirst 是一个权 威、可靠的Internet信息资源指南、LI录(6)PaperFirst提供世界范围内各种学科学术会议议论文的索引 (7)ProceedingFirst提供在世界各地举行的各类学术会 议的会议目次表

12、41、SOSIG(社会科学信息网关)是一个有关社会科学信息资源的搜索引擎。检索功能:Search SOSIG (信息检索)、Browse SOSIG (信息浏览)、Whats New (更 新信 息)、Add New Resource (添加新资源)、help (帮助信息)。可用 title ”、description ”和 keyword ” 这 3 个参数来限制检索范围。42、 ERIC数字图书馆,由美国教育部教育科学研究所主办,是教育文献。43、APA:美国心理学协会,是世界上最大的心理学家联盟。44、法律信息检索工具 : Lexisexis; 工程技术信息检索工具 : Ei Villa

13、ge2; 医 学信息检索工具 : Medline Plus45、图书馆书目检索的途径主要有 :(1)题名检索 ,它包括书名、丛书名、并列书名、刊名等。( 2)责任者检索 , 它包括著者、编者、译者、团体著者。( 3)分类检索,从图书所属学科、领域分类的角度 , 按分类号进行检索。(4)主题检索,以表征图书内容主题的主题词或关键词进行检索。(5)号码检索,包括国际标准书号 ISBX. 国际标准刊号ISSN.分类号、索书号、订购号等。(6)出版社名称检索。46、亚马逊网上书丿占,是因特网上最大、最著名的图书及音像制品销售公司。47、 中国期刊网(简称CNKD ,它的数据库主要有:中国期刊全文库(C

14、JD、中国重要报纸全文库 (CCND 中国优秀博硕士论文全文库(CDMD、中国基础教育知识 库(CFED、中国医院知识库 (CHKD、中国期刊题录数据库(免费)、中国专利 数据库 (免费)等。48、 UnCover是1988年美国CARL公司建立的世界上规模最大、更新速度最快 的期刊检索系统。Un Cover的服务内容有:Ope ning search,免费检索题录或文摘;Un Cover Reveal,最新文献报到服务;DOcume nt Delivery,原文递送服务。49、JSTOR全名为Journal Storage, 是一个对西文过刊进行数字化的非营利机构。50、国际标准化组织ISO

15、是世界上最大的非政府性标准化专门机构。51、参考信息即指人名、地名、机构、事件、统计数据等一类数据、事实信 息, 是人们在工作研究和日常生活中经常要查考、引用的信息。52、网上参考信息源的主要类型 :(1) ti 科知识检索网站 (2) 任务信息检索网站(3) 地理信息检索网站 (4) 时事、新闻信息检索服务 (5) 机构信息检索网站 (6) 语词信 息 检索网站 (7) 统计信息检索网站53、百科全书是“工具书之王”。54、白页信息服务:网上白页是专用于查找因特网用户个人信息的特殊工具。55、IAF是LI前世界上最好的黃白页信息查询工具之一。56、年鉴是指“每年出版的统汁数据和事实的汇编,兼

16、有现期性和回溯性内 容。其包含的地区和学科领域可能较为宽广,也可能限于某一特定国家或特定的主题”。57、词典是汇集词语 ( 或词语的某些成分 ) ,根据一定的编撰 LI 的加以描述、处 理,通常按字顺排列,供人们查找词语信息的工具书。58、上位词,指概念上外延更广的关键词 , 或者可以说每一个关键词所覆盖的 信息范围都是它的上位词所覆盖信息范围的子集。下为词,则是指概念上内涵更窄的关键词。59、检索策略: (1) 确定自己的问题是否适合 Internet 检索(2) 了解 Internet 信息检索的特殊性 (3) 了解可用的检索工具 (4) 仔细分析自己的信息需求并选择合适的 工具(5) 根据检索结果调整检索策略 (6) 检索必须找对地方 (7) 选择合适的提问方式60、搜索引擎的“瓶颈”:搜索引擎索引更新慢、检索结果的排序仍然不能令人满意、搜索引擎不能查找动态生成的网页61、网络信息检索的法律问题 : 侵犯隐私的风险、搜索技术本身的争议和”安 全 港“规定、网页缓存功能的争议、搜索引擎营销中的法律纠纷62、网络信息检索技术方面(发展方向/热点):智能检索、语义检索、P2P检 索

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1