情报科学的基本原理.ppt

上传人:本田雅阁 文档编号:2591336 上传时间:2019-04-14 格式:PPT 页数:48 大小:383.01KB
返回 下载 相关 举报
情报科学的基本原理.ppt_第1页
第1页 / 共48页
情报科学的基本原理.ppt_第2页
第2页 / 共48页
情报科学的基本原理.ppt_第3页
第3页 / 共48页
亲,该文档总共48页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《情报科学的基本原理.ppt》由会员分享,可在线阅读,更多相关《情报科学的基本原理.ppt(48页珍藏版)》请在三一文库上搜索。

1、情报科学理论 第2章 情报科学的基本原理,21世纪信息管理丛书,2.1 离散分布原理 2.2 有序性原理 2.3 相关性原理 2.4 易用性原理 2.5 小世界原理 2.6 对数透视原理,第2章 情报科学的基本原理,2.1 离散分布原理,信息、知识和情报是以离散形式分布的,在离散分布基础上趋向集中。情报学需要研究如何用科学的方法获取情报密度最大的情报源,为用户情报需求提供最优服务由此离散分布原理实际上主导着整个情报活动,对其研究也将揭示情报学的奠基性的定律。,2.1 离散分布原理,2.1.1 原理的表现形式,内容单元以不同的方式从不同的角度分散于各种著作或不同形式的载体中。本质上是由知识体系自

2、身的分化和综合决定的,与情报的生产、利用,情报的累积性、再生性、老化性以及对创造者的独立性有密切的关系。,2.1 离散分布原理,2.1.2 原理的研究成果布拉德福定律,1频次等级排序法,按某一具体事项(如文章、作者,词等情报单元)在其主体来源(如期刊,作者集合或词的集合)中的出现频次按递减顺序排列起来,就会导出布拉德福分布。这种现象广泛存在与社会科学领域内,如城市人口分布,书籍按页分布等。,这实质上是情报离散分布基础上形成的核心趋势和集中取向,是“成功”累积的结果,也是“马太效应”的表现形式。,2.1 离散分布原理,2布拉德福定律定律的两个不足,(1)对情报离散分布的机理研究得还不够深入。,(

3、2)对情报离散分布规律的研究还停留在宏观水平上即 对期刊上发表的科学论文分散规律的研究,而在微 观层次上对情报离散分布的研究即在内容单元 (而不是文献)和内在逻辑联系层次上的研究仍不 多见。,案例:埃格希和鲁索出版了情报计量学引论,在论及情报的分散规律时,仍然是以宏观层次的文献为基础的根本上混淆了哲学。,2.1 离散分布原理,2.1.3 微观层次的研究工作,1. 以实证的方式研究科学情报(信息)的分布,2. 以实证的方式研究网络信息的分布,3. 分析信息离散分布形成的机理,通过这些工作,我们可以看到情报科学发展模式及其基本定律的一致性与稳定性。,2.1 离散分布原理,当一系列同类对象被人选择时

4、,就会出现有的经常被选择,有的不常被选择。这种频度会反过来作为再次被选择的依据。普顿斯用累积优越性函数来描述这一过程。这便是情报分布中出现马太效应的根本原因。,布拉德福定律:著者都希望把他们的文章发表在本专业领域的、过去已经发表了大量高质量论文的这类期刊上。投稿数量增加,因而对文章的质量要求提高,期刊的威信也随之日益提高,便产生了一些带“核心”性质的期刊,这就是文献情报分布中的“集中”趋势。与此同时,有关这一学科的文章也在其他相关期刊上发表,便又产生了文献的分散现象。,2.1.4 信息离散分布或核心趋势的形成过程,2.1 离散分布原理,1. 布拉德福定律揭示的不仅仅是情报的离散分布,同时 又揭

5、示了离散分布基础上的集中取向和核心趋势。,2. 所创造的频次等级排序方法和对马太效应的深刻解释都具有普遍意义。,(1)频次等级排序有两个明显的特点:,依照对象的重要程度为序直接表示出分析的数据,提供丰富的信息,有助于认识事物的特征。,频次等级排序无需任何统计理论或概率假设为基础,就能对事件直接进行分析和解释,应用方便,不受理论约束。,2.1.5 布拉德福定律的意义,2.1 离散分布原理,(2)通过这种排序揭示的情报对象离散分布的反向趋 势集中取向(马太效应)更使人们看到,相互矛 盾、对立的情报现象和情报过程实际上是高度统一 的。,2.2 有序性原理,序是事物发展和进步趋向有序的基本结构形式,是

6、事物组成要素之间的相互联系以及这种联系在空间时间结构中的表现。,2.2.1 情报结构的有序性,情报结构无论是以自然系统存在还是以人工系统存在都具有某种“序性”。研究和揭示这种“序性”,是设计最优情报系统、提供最优情报服务的基础。,情报结构的有序不仅是情报科学的基本原理,也是情报工作和信息服务追求的基本目标,因此,情报科学的基本任务就是要研究这种“序”的规律,揭示这种“序”的表现按照这种“序”来标引和组织知识信息,建立高效的情报结构。,2.2 有序性原理,2.2.2 情报结构的有序性来源,1情报创造过程的有序性:主观知识结构的有序过程,情报在知识体系中的有序性结构并不意味着它能自动生成有序的情报

7、检索系统,只是表明我们可以通过情报的有序结构研究情报的规律和组织,建设更有效率的情报系统。,科学体系的有序性和人的创造过程的有序性。,2.2 有序性原理,2知识体系自身的自组织功能导致有序性:客观知识 系统的有序结构。,3情报作用的基本方程式,20世纪70年代中期,布鲁克斯曾提出描述情报作用的基本方程式: 式中,KS表示原有的知识结构;KS+S表示吸收情报以后的知识结构;I表示知识结构吸收的或增加的情报。该方程的意义是,原有的知识结构KS,由于吸收了情报I,变为KS+S。新的知识结构形成是由于吸收情报的结果。,KS+I=KS+S,2.2 有序性原理,布鲁克斯的基本方程不仅适用于主观知识结构(即

8、波普理论中的“世界2”),同时也适合于客观知识结构(即波普意义上的“世界3”)。,4耗散结构理论,(1)普里高津的“耗散结构”,远离平衡态的非线性区形成的新的稳定的有序结构,称之为耗散结构。这种自行产生的组织性和相关性被称作自组织现象。所以这一理论又叫作非平衡系统的自组织理论。,(2)开放知识系统熵变化方程,ds=des十dis,2.2 有序性原理,式中des为系统与外界交换的熵流,dis为系统内部的熵产 生。dis来源于知识系统(结构)中知识单元数目的增多, 知识体系的复杂、冗余无序,知识的老化和陈旧等等,为了维护和提高知识系统的功能,要求ds0,即必须des0,且 |des|dis|,也就

9、是说,需要由外界向系统输入足够的负熵流。,情报对知识系统来说,是一种负熵流理论一个知识系统、知识增长过程实质上是输入情报使知识结构由无序走向有序或从一种有序结构演变为另一种有序结构的过程。,2.2 有序性原理,耗散结构理论中,当负熵流输入时,系统只有远离平衡态 才可能形成新的有序结构,在近平衡态时,新的有序结构 不可能出现。,情报结构的有序性充分体现了情报生产过程中的自组织机 理,如知识生产中的引文系统、网络链接系统,RSS中的 知识信息聚类,都说明情报的有序化自组织功能的存在。,(3)耗散结构的条件,2.2 有序性原理,有序性原理表明无论是主观知识结构还是客观知识结构,也无论是通过自组织产生

10、的情报结构还是人工建造的情报结构,情报单元一定是以开放系统形式存在的,而且唯有如此,情报才能得到有效积累和利用。,布鲁克斯的“知识地图”。,迄今还不能按知识结构自身的有序规则来建立情报系统。,如果输入的情报与原有知识结构处于近平衡态,增加原有知识系统的知识量;当其与原有的知识结构处于远平衡态,就有可能形成新的有序知识结构,导致重大的科学发现。,2.2.3 自组织机理,2.3 相关性原理,任何一种情报结构都是按一定规则相互关联的。研究和揭示情报相互关联(即相关性)的规律和规则,是有效组织和检索信息、知识、情报的基础。,Saracevic认为情报学自诞生到20世纪90年代末有三个重要的思想:信息检

11、索、相关性、交互性。信息检索为信息处理过程提供了逻辑基础;相关性直接面向人类信息需求与评价过程;交互促成了人机之间的交流与反馈。,2.3.1 对情报学相关性的理解,1作为客体的信息(或情报)之间有着极强的相关性, 这使得对信息和情报的组织成为必要和可能。,2.3 相关性原理,2信息检索过程是基于用户检索提问与所查询信息之间的 相关度匹配而进行,3情报的吸收和利用密切地依赖于背景知识,即相关程度 的衡量,情报科学中的相关性实际上存在于两个方面:一是用户的情报检索,另一则是客观知识体系的自组织建立起来的相关性。迄今为止,相关性研究仅仅注意到了前者却忽视了后者。,2.3 相关性原理,1. 系统相关性

12、,系统相关性主要研究用户情报需求的描述和表达与系统文档描述之间的相互匹配关系 ,描述了情报检索系统内部的情报组织机制和方式在多大程度上适合或匹配用户检索的要求。,用户相关性指用户以及用户检索代理者与检索系统之间的关系,这类相关性是主观的,在信息检索过程中,既涉及到用户(或检索代理)的认知或知识储备,又涉及到用户所处的情报问题情景。,2. 用户相关性,2.3.2 情报检索中的相关性,2.3 相关性原理,无论是哪一类相关性,实质上都是指情报用户(主体)与情报(客体)之间的关系,情报主体与情报客体之间普遍存在的相关性便成为情报科学的一种基本现象,揭示这种基本现象的原则和思想显然是情报科学最基本的原理

13、。,2.3 相关性原理,2.3.3 知识系统中的情报相关性,1情报学相关性理论,根据信息链的结构,情报必定是进入科学系统的某种知识。由于知识体系的整体性、综合性、继承性、累积性和国际性,使得情报在纵向和横向都有极强的相关性。,(1)纵向。情报的不同的级别之间存在着内在的逻辑联系。,(2)横向。各知识领域之间是一个不可分割的整体,其情报单元也自然相关联。,2.3 相关性原理,2情报学相关性的表现,(1)传统系统中的表现,传统的各种情报标引和检索语言正是基于文献情报的相关性采用概念逻辑划分来组织和存贮情报的。由于情报标引和检索语言 的产生,情报的相关性便可以反映为概念之间的关系,对概念的内涵进行限

14、制,外延实施划分便可组织起相互关联而有序的现代情报检索系统。,(2)情报的相关性在不同的学科领域是不同的,(3)情报的相关性还可实现更深层次的知识组织,布鲁克斯的“知识地图”,知识表示和知识挖掘,专家系统,2.4 易用性原理,人类交流、获取和利用信息、知识、情报总是趋向简捷、方便、易用,省力。研究和揭示人类情报行为追求易用与省力的特征、规律可以使情报获取和情报服务的成本最小,效益最大。,2.4.1 齐夫定律最小努力原则,(1)“单一化的力”和“多样化的力”相互作用,取得平 衡,使自然语言的词汇出现频次呈双曲线(缩略 语词)。,1齐夫定律的内容,2.4 易用性原理,(2)对较长文章中的词进行统计

15、,也同样得到了fr=c(f 表示词在文章中出现的频数,r表示词的等级序号) 的著名分布。,2齐夫定律的应用,齐夫定律不仅适用于自然语言,而且适用于人工语言,因而又被应用于情报的组织、存贮和检索领域。,(1)在情报组织中,对于倒排文档的词语控制在对信息 组织和用户来说都是“最省力”的规模,(2)不同领域中最短路线的选择和确定问题都与省力 法则有关,2.4 易用性原理,齐夫定律帮助合理地选择公共图书馆和情报中心的地 点位置,使得各类用户能方便到达。,3穆尔斯定律,一个情报检索系统,如果用户从它取得情报比不取 得情报更伤脑筋和麻烦的话,这个系统就不会得到利用。这就是为什么本国文字出版的文献是用得最多

16、的情报源的原因。,用户搜寻情报的过程表明:由于各种情报源或渠道的易用性不同,却使得不同的用户几乎趋向同样的行为。,2.4 易用性原理,1效果,指用户为特定目标在使用某一信息系统时,完成任务的全面性和准确性。,2效率,指在保证服务准确性的前提下,用户获取所需信息的速度。,3愉悦度,愉悦度是指用户在使用某信息系统时愉快及满意程度。,2.4.2 易用性指标,2.4 易用性原理,5容错,系统的容错性是指系统不仅可以有效的预防由用户不当的操作引起的错误,还可以在错误发生的时候快速的恢复系统。,各种指令和操作程序设置简单方便,用户在较短的时间里就能掌握。,上述5个指标之间并不是完全独立,互不影响的,它们之

17、间存在着一定的联系。,4易学,2.5 小世界原理,无论世界如何大,人口如何多,联系多么困难,人际情报交流与传递总是能实现的。研究和揭示人类信息联系和交流得以实现的途径及其特征、规律是建立最佳信息、知识和情报网络的基础。,2.5.1 小世界原理内容,1小世界现象,(1)小世界现象研究实例,1929年,Frigyes Karinthy,认为任何两个人可以通 过一条由5位联系人组成的链条来达到相识或联系,1967年,哈佛大学“六度分离”实验结论,2.5 小世界原理,小世界现象是指人与人之间的联系可以通过有限个个体连通,也称为“六度分离”理论,即你和任何一个陌生人之间所间隔的人不会超过6个。,2小世界

18、网络,小世界网络简单地说就是存在小世界现象的网络。人际关系等中都存在小世界现象,而人际关系本来就存在一个网络,可以用小世界理论研究人际关系网络。,(2)小世界现象结论,小世界模型则是数学家和物理学家对小世界的抽象描述,逐步发展成为图论的一个新兴分支学科和复杂网络理论中的一个领域。,3小世界模型,2.5 小世界原理,2.5.2 小世界原理研究成果,1小世界网络形成的最根本的原因:网络中两点的平 均距离L与网络中节点数N呈对数关系,说明网络 中节点数量增长很快时L变化相对较慢。,2网络不同,L也各异。实验获得的人际网络平均传 递大约是6次。尽管因特网的网络节点的平均距离 有差异(如6,19,10)

19、,但差异就显得微不足道 了,表现出特有的“小世界现象” 。,2.5 小世界原理,3小世界网络模型,瓦茨(Watts) 和斯特洛格茨(Strogatz)对小世界网络模型(W-S模型)的研究,更进一步证实了这种信息相关性存在的普遍性,并找到了实现联系的一般方式。,W-S模型实质上是具有一定随机性的规则点阵。构建方法是:在环状规则点阵中用“断链重连”的方法,即顺序浏览每条边,以较小的概率p(p0.1)将边的一端移到另一个随机选取的位置上,即形成了所谓的小世界网络。,2.5 小世界原理,(1)虽然少数边伸展到较远的地方(捷径),但由于p 很小,模型仍大致维持规则结构,具有较高的聚类 系数。另一方面,加

20、入捷径使特征路径长度下降很 很快,这使得小世界网络的特征路径长度与随机网 络的特征路径长度相当。,2.5 小世界原理,(2)许多领域的合作网络都存在小世界现象,于是断定小 世界现象是大型现实网络的内在属性。,(3)许多学者对W-S模型加以改进,提出以较小的概率p 在网络中将少量边“断链重连”或直接加入少量捷 径,保持网络基本不变,而节点之间的特征路径长 度则下降很快。这种网络就同时具有短特征路径长 度和高聚类系数,实现了由大世界向小世界的转换。,2.5 小世界原理,2.5.3 小世界原理应用空间,1形成网络思维方式,2促进信息传播和交流,3提高信息搜索的精确度,4优化网络信息服务,小世界原理体

21、现了情报相关性,在情报科学和整个信息管理系统领域发挥重要作用,作为情报科学的基本原理具有普遍意义和广泛应用。,2.6 对数透视原理,人类获取和接收信息、知识和情报的认知过程遵循对数转换机制。可以揭示物理空间的信息与进入认识空间中的信息、知识和情报之间,信息载体和信息内容之间在数量和特征上的差异,为情报、情报学的定量化提供理论、方法和途径。,2.6.1 对数律简介,1对数律的提出,19世纪,韦伯和费希纳通过实验验证后提出对数律,表示为:S=ktogR,其中,S是由外部物理刺激引起的人的感觉量质,R是物理刺激量。,2.6 对数透视原理,2对数律的本质,这一原理实际上是普遍存在的人类感官系统对外界物

22、理刺激的反应机制,它描述物理空间的对象特征在人的感觉系统中的影像之间的差异符合对数转换律。,当我们进行观察时,物理空间的一切实体总是以其对 数尺度反映在我们的感觉系统中,当人类不能在所处 的物理空间中自由移动或借助其他手段观测时,难以 纠正这种对数透视对物理对象带来的歪曲。,2.6.2 对数透视原理简介,20世纪70年代末, B. C.布鲁克斯发现“对数透视原理”。,2.6 对数透视原理,1对数透视原理应用的前提条件,不能自由移动的空间,由于人类永远不可能在认识空间或情报空间中自由移动,因而在信息获取和接收时对数透视效应的作用就不可避免,而且在大多数情况下是不可能校正的。,2物理空间的对数透视

23、原理,布鲁克思设想了一个抽象的信息空间,该空间属于物理空间,其中潜在信息(potential information)均匀分布,其密度为,然后将对数透视原理应用于该空间,推导出在一维、二维、三维空间中距观察者a到a+n处的感知信息量分别为:,2.6 对数透视原理,I1=ln(a+n)/a (1) I2=2ln(a+n)/a (2) I3=4ln(a+n)/a (3),如果我们将式(1)用于时间轴上的信息接收,设信息 产生的时间区间为1000年,那么最近的10年虽然潜在 信息量在总量中仅占1/100(均匀分布),而感知信息 量却占到33.3%(lg10/lg1000)。,如果将(2)式用于2维空

24、间中的信息获取和接收,设信 息分布在10000米范围内,那么离接收者最近的100米 虽然其潜在信息量仅占总量的0.01%(1002/100002), 而感知信息量却占到50%(lg100/lg10000)。,同样可利用(3)式计算出3维空间中信息的透视结果。,2.6 对数透视原理,虽然潜在信息是均匀分布的,但经过对数透视变换后,那些距接收者时间和距离较近的信息优先获得接收,而且其感知信息量占有相当大的比例。,一般来说,人们对距自己时间和距离较远的信息接收 较少,对较新的较近的信息接收较多,这又一次印证 了省力法则。,2.6 对数透视原理,3认知空间的对数透视原理,(1)布鲁克斯情报科学定量的基

25、本思想,物理空间与认识空间存在着一定的关系,后者是前者在一定条件下的变形,如果把两者区别开来,就容易按一定的规则转换,如果不进行转化,我们所得到的仅仅是情报问题的物理解,而这个转化的规则就是对数定律。,根据上述分析,我们不能简单地把物理空间的测量数据搬到认识空间(或情报空间),应当考虑到对数透视效应的作用而进行转换。,2.6 对数透视原理,(2)对数透视原理应用,以评价情报检索系统的检全率为例,如果一个数据库中与某一课题相关的文献为N为100篇,检索实际获得n为60篇,文献检全率为60%,这显然是一个物理量。根据对数透视原理,应用(3)式,从1篇文献到60篇文献,其情报检全率应是:,2.6 对

26、数透视原理,如果这100篇相关文献事先由情报中心按照相关性依递减次序排列,相应的情报检全率可再次应用对数透视原理:,可见,用文献为单位来评价情报检全率,无疑是夸大了情报的损失。这种方式忽视了人的情报过程的认知相关性。,2.6 对数透视原理,4 对数透视原理与频次等级排序,频次等级排序利用获得的经验数据揭示信息对象的分布和人类情报行为的特征,对数透视原理则揭示信息对象在物理空间与情报空间的差异,以便于转换。,相同点:相同的数学表达式 ,都反映着某种由大到小 由多到少、从高到低的同类信息对象排列起 来的分布规律。,不同点:频次等级排序将信息对象的数据按递减顺序 排在对数尺上,而对数透视效应则用对数

27、尺去 量度由近及远、均匀分布的信息对象,它们在 分析情报现象和问题时,具有不同的适应性。,2.6 对数透视原理,5对数透视原理假设前提,(1)宏观上信息空间密度均匀,微观上每篇文献包含的 知识、信息量相等,(2)知识、信息获取者的接受能力相同,(3)知识、信息的获取没有其他辅助工具或技术的支持,(4)知识的继承性好,对数透视原理的经典理论很好地解释了传统信息环境下人们的情报行为的现象和规律。,第2章 总结,六个基本理论就是为了研究知识信息分布的规律,找出它们自身及其与用户的关联,帮助用户以最省力和最有效的方式获取最有价值的情报。相互之间关系密切,成为支撑情报科学大厦的基石。,目前研究得最多、成

28、果也最多的是离散分布原理和相 关性原理,但是二者都还停留在经验水平上: 离散分布原理 在内容层次上,我们没有找到情报单元的确切表示方 式和计量方式,只得通过关键词、主题词加以间接统计。,第2章 总结,将对情报学的定量化产生重大影响,但将对数变换直接用来测度信息接收时在情报空间中的认知量还需进一步的实验验证。,主要集中在检索系统和检索过程,而忽略了知识体系自身和用户行为与系统和知识体系之间的相关性。,相关性原理,有序性原理、省力原理,研究成果显得很零星,目前还没有非常具有影响力的研究成果。,对数透视效应,第2章 总结,六个基本原理内涵丰富,意义深刻,引人入胜。本章的工作是将情报空间中的六个基本原理作为情报科学学科理论体系的基本原则、思想、规律明确地提出来,并进行初步的讨论,尤其注意到它们之间的内在联系。希望通过这种方式为情报科学基础理论体系的构建提供一条思路,而这种持续探索和研究的成果将是情报科学取得突破的基石。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1