第四信息获取.ppt

上传人:本田雅阁 文档编号:3132602 上传时间:2019-07-15 格式:PPT 页数:47 大小:717.53KB
返回 下载 相关 举报
第四信息获取.ppt_第1页
第1页 / 共47页
第四信息获取.ppt_第2页
第2页 / 共47页
第四信息获取.ppt_第3页
第3页 / 共47页
第四信息获取.ppt_第4页
第4页 / 共47页
第四信息获取.ppt_第5页
第5页 / 共47页
点击查看更多>>
资源描述

《第四信息获取.ppt》由会员分享,可在线阅读,更多相关《第四信息获取.ppt(47页珍藏版)》请在三一文库上搜索。

1、第四章 信息获取,4.1信息源及其特点,4.1.1记录型信息源 记录型信息源包括由传统介质(纸张、竹、帛等)和各种现代介质(如磁盘、光盘、缩微胶卷、胶片等)记录和存贮的知识信息。 记录型信息源的特点是传播信息系统,便于保存,便于积累,便于利用。,记录型信息源分类, (1)印刷型。包括铅印、油印、胶印、木版印刷等等。其缺点是体积大,分量重,收藏要占很大空间,管理较为困难。 (2)缩微型。一般指以感光材料为载体,利用光学记录技术,使印刷型文献按比例缩小的文献资料,包括缩微胶卷、缩微胶片(平片)和缩微卡片等缩微品。 (3)计算机阅读型。它是将文字和图像转换成二进制数字代码,记录在磁带、磁盘或光盘等载

2、体上。阅读时,再由计算机将它输出,转换成文字或图像。它能存贮大量信息,并以极快的速度从中取出所需信息。, (4)网络型。它直接在网上产生、发布、存贮和传播,如各类网络书刊、网络新闻、网站信息等等,可以下载存贮在其他载体上。 (5)视听资料。又称声像资料或直感资料,它是运用录音、录像和摄影技术直接记录声音与图像的文献形式,包括唱片、录音带、录像带、电影、幻灯片等。这类文献不同于一般文字形式的资料,它能直接记录声音与图像,给人以直观感觉,对于传播信息有独特作用。,记录型信息源的其他分类, 一次信息。凡是在科研、生产、经营、文化及其他各类活动中生产的原始信息,称为一次信息。如期刊论文、研究报告、市场

3、调查报告、专利说明书及各种网络信息。 二次信息。是对一次信息进行加工整理后产生的一类信息,如书目、题录、简介、文摘等形式的检索工具。二次信息的重要作用,不仅在于报道,更重要的是为查找一次信息提供线索。 三次信息。是在一、二次信息的基础上,经过分析、综合而产生的信息。人们常把这类信息称为信息分析研究的成果,如综述、述评、学科年度总结、文献指南、书目之书目等。,4.1.2实物信息源,实物信息源是由实物携带和存贮的知识信息,如某种生物的样品、产品样机、工艺品等。 实物信息源直观生动,含有丰富的信息,易于理解和吸收。 这类信息源不能直接进入信息系统,要对其进行管理,必须先将它转换成记录型信息。,4.1

4、.3智力型信息源,智力型信息源主要指由人脑存贮的知识信息,包括人们掌握的各类知识、诀窍、技能和经验,有的可以用语言和文字明确表达和记录,有的则难以明确表达和记录,故又被称为隐性知识(tacit knowledge)。,4.1.4零次信息源,零次信息源是指各种渠道中由人的口头传播的信息。零次信息是人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉(包括听、视、嗅、味、触觉)的结果。 零次信息具有直接性、及时性、新颖性、随机性、非存贮性等典型特征。,4.2信息的评价与选择,4.2.1信息评价的一般指标 能够及时地以适当的方式提供解决问题所需要的依据; 信息符合用户需求的内容; 信息的可

5、信赖程度高; 信息具有综合性; 信息容易获取(不是用特殊的手段或极少数人才能获取) 信息的费用与目标吻合。,4.2.2信息源的评价与选择,1.直接评价法 直接评价法就是按照前述有价值的信息应当具备的一般条件或标准,信息工作者根据对信息源的一般要求对信息源进行评分评价,从不同角度和侧面对信息源的价值给予评分评价。 现采用五项指标、十分制,我们对常见的信息源进行评价。各种信息源的该五项指标得分相加,便是该信息源所得的总分。按总分多少可对信息源进行排序。,信息源直接评分评定表,2.间接评价表,间接评价法是通过信息用户来评价信息源。以调查表的方式调查用户对信息源的需求和利用情况,然后由信息工作者对调查

6、所得到的数据进行统计分析和对比,对信息源的价值做出评定。这种方法的特点是需要信息用户密切配合,工作量较大,但评价结果较为客观。 设信息工作者将有n个项目的m张调查表收回后汇总成下表的形式。表中aij是被调查者i对第j个信息源的评分,信息价值较高的信息源其评分相应较高 。,信息源间接评分评价表,四种相对重要性指标的计算(1),(1)评分平均值。 用被调查者(指有效的被调查人)的人数去除这些被调查者给某一信息源的评分之和 。 Rj=aij/m(4-1) 式中: Rj信息源j的平均评分; m被调查人数; aij被调查人i给信息源j的评分。 (2)评分比重。 某一信息源所得全体被调查者的评分和,在全体

7、被调查者给所有信息源的评分总和中所占的比重 。 pj= aij / aij(4-2) 式中: pj信息源j的评分比重;n信息源数; aij,m与(4-1)式中的相同。,四种相对重要性指标的计算(2),(3)最高评分频度。 全体被调查者给某一信息源的全部评分中评最高分数的人数所占的比例,称为最高评分频度。 Pmax=m/m(4-3) 式中: Pmax 最高评分频度;m给最高评分的被调查者数;m同前。 (4)平均名次指标。 将全部信息源分别就各个被调查者的评分排队,列出名次,然后用被调查者总数去除名次的数值和,便是相应项目的平均名次。 Mj=Cij/m(4-4)式中: Mj j信息源j的平均名次;

8、 Cij被调查i给信息源j的评分排队名次;m同前。,4.2.3信息准确度的比较评价,角度一: (1)从不同的信息源获得同一性质的信息进行比较; (2)定期地、系统地搜集信息,调查过去同种信息是否出现并和新获取的信息进行比较评价; (3)从多种信息源搜集、分析同种信息和相关信息,与切题的信息进行比较评价。 一般把从各个方面获得同一信息,并进行比较评价的方法叫作“交叉检验”。,角度二: “5W1H” 评价信息的准确度,即内容(What),原因(Why),时间(When),地点(Where),人(Who),方法、途径、状况(How) 。步骤大致如下: 把信息分成六个要素,按要素分成不同的组; 分析各

9、组中有无共同点,把具有共同点的信息抽出来; 只用被抽出来的、具有共同点的信息要素构成信息形态; 把组成信息形态的要素分别同原信息进行比较; 根据比较结果,对于被认为最有共同点的原信息作进一步调查检验,分析它与其他信息的相关程度、相关的交接点等。,4.2.4信息的经济性评价,(1)所需信息存在率的评价。 (2)所需信息适合率的评价。 (3)所需信息可靠性的评价。,信息的再现率与适合率,信息错误及其原因,信息的提供、评价和利用等环节都是由人来进行的,所以不可避免地会产生人为的或无意识的错误。,4.3信息获取的途径,4.3.1信息获取的效率指标 1.采全率 采全率用来衡量切题信息搜集的完整程度,指某

10、一信息系统(信息库)所含的全部切题性信息(对该系统全体用户而言)在当时系统内外所有切题信息中所占的比例。如果用P表示采全率,r表示该信息系统中切题的信息,R表示当时系统内外全部切题的信息,信息采全率可表示为: P=r/R(4-5),信息获取的效率指标(2),2.采准率 采准率用来衡量信息搜集的针对性,指某一信息系统(信息库)所含的全部切题信息(对该系统全体用户而言)在当时该系统所有信息中所占的比例。如果用E表示采准率,r表示该系统中切题的信息,Q表示系统内所有的信息,信息采准率可表示为: E=r/Q(4-6) 3.及时率 及时率用来衡量信息搜集的速度,即在最短的时间内完成信息搜集过程的能力。它

11、由搜集过程的每一环节(从信息的产生到其被输入到信息库)所花费的总时间来计算,表示为: T=t(4-7) 式中,i=1,2,n,表示搜集过程的环节数。 ,信息获取的效率指标(3),4.费用率 费用率用来衡量信息搜集的资金效率,指用于信息库中单位信息的费用的最低能力。如果C表示单位信息的费用率,F表示年度搜集信息的总花费,G表示年搜集到的信息量(总件数),费用率可表示为: C=F/G(4-8) 5.劳动耗费率 信息搜集的劳动耗费率指信息系统搜集到的单位信息所耗费的最低劳动量,可用搜集过程所有环节的劳动消耗总数来计算。如果L表示搜集信息的工作量,li(i=1,2,,n)表示单位(件)信息在每一环节中

12、的劳动耗费(可用人、时等单位表示),劳动耗费率可表示为: L=li(4-9),效率指标关系的图形描述,4.3.2信息搜集的原则,1.针对性 任何信息服务机构必须根据本机构的性质、任务和服务对象有针对性地确定信息搜集的范围和重点。 2.系统性 了解和掌握信息源的动态变化,系统地、连续地搜集和积累有关的信息。 3.预见性 信息搜集中要预见可能产生的新的信息源和信息渠道。 4.科学性 采用科学方法研究信息源的分布规律,选择和确定信息密度大,信息含量多的信息源。 5.计划性 事先制定比较周密详尽的信息搜集计划,以便按计划有目的、有步骤地搜集信息。,4.3.3信息搜集的方法与途径,1.采购 采购是一种经

13、常性的、稳定的、系统的搜集和获取信息的有效方式 。 2.调查 现场调查 、访问调查 和问卷调查 。 3.交换 交换的信息源多属于内部资料、非卖品,不能通过采购或其他方式获得 。 4.索取 还不够详细、完备和全面的信息源,根据需要与可能,可以通过通讯联系或直接派人联系取得。 5.检索 手工检索、脱机检索、联机检索 和网络检索。,网络信息资源服务流程,网络信息是指通过计算机网络发布、传递和存储的各种信息。收集网络信息的最终目标是给广大用户提供网络信息资源服务,整个过程经过网络信息搜索、整合、保存和服务四个步骤,其流程如下:,网络信息收集,网络信息收集系统是一个汇集了各种网络信息收集技术的计算机程序

14、集成系统,其中主要采用了网页收集、网络信息挖掘和网络信息过滤等技术 网络信息的收集通常是借助各种搜索引擎来完成的,一个普通商用搜索引擎由搜索器、索引器、检索器和用户接口等四部分构成。 综合运用人工智能、模式识别、神经网络等领域的各种技术,通过用户个性化的信息需求,根据目标特征信息在网络上或者信息库中进行有目的的信息搜寻,并在大量训练样本的基础上,得到数据对象间的内在特征,以此为依据进行有目的的信息提取。根据挖掘的对象不同,网络信息挖掘可以分为网络内容挖掘、网络结构挖掘和网络访问模式挖掘。 使用自动获得的领域模型和用户模型等知识进行信息搜集、索引及过滤等处理,其中包括用户兴趣过滤和不良信息过滤等,并自动地将用户感兴趣的、对用户有用的信息提供给用户。,信息收集的一般步骤,(1)制定收集计划。只有制定出周密、切实可行的信息收集计划,才能指导整个信息收集工作正常地开展。 (2)设计收集提纲和表格。为了便于以后的加工、贮存和传递,在进行信息收集以前,就要按照信息收集的目的和要求设计出合理的收集提纲和表格。 (3)明确信息收集的方式和方法。 (4)提供信息收集的成果。要以调查报告、资料摘编、数据图表等形式把获得的信息整理出来,并要将这些信息资料与收集计划进行对比分析,如不符合要求,还要进行补充收集。,补充,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1