Google数字图书馆计划及其影响分析.docx

上传人:rrsccc 文档编号:10399093 上传时间:2021-05-14 格式:DOCX 页数:7 大小:17.58KB
返回 下载 相关 举报
Google数字图书馆计划及其影响分析.docx_第1页
第1页 / 共7页
Google数字图书馆计划及其影响分析.docx_第2页
第2页 / 共7页
Google数字图书馆计划及其影响分析.docx_第3页
第3页 / 共7页
Google数字图书馆计划及其影响分析.docx_第4页
第4页 / 共7页
Google数字图书馆计划及其影响分析.docx_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《Google数字图书馆计划及其影响分析.docx》由会员分享,可在线阅读,更多相关《Google数字图书馆计划及其影响分析.docx(7页珍藏版)》请在三一文库上搜索。

1、Google数字图书馆计划及其影响分析Google数字藏书楼企图及其影响剖析题型:挖空题(20个20分)取舍题(8个8分)名词注释(5个20分)简问题(5题40分)叙述题(12分)数字藏书楼测验重面1.2. MARC以及DCMARC机读编目体例尺度(英语:MAchine-Readable Cataloging,缩写:MARC),是一种图书办理的通信体例尺度,用以让藏书楼或者出书商之间做名目疑息互换用处。MARC尺度源于好国国会藏书楼于1970年月开辟的名目体例。固然道是尺度,但实在MARC是列国的机读编目体例尺度的一个年夜散开,每一个国度仍然有本人的体例尺度。DC(Dublin Core) 是

2、数字藏书楼中利用的一组复杂的包含15个“中心元素”的元数据元素散开,次要用于形容数字对于象、馆躲办理以及元数据互换。那15项元数据没有仅合用于电子文献名目,也合用于各种电子化的公事文档名目,产物、商品、躲品名目,具备很好的真用性。3. 数据收缩的露义以及范例数据收缩是指正在没有拾得疑息的条件下,缩加数据量以加少存储空间,普及其传输、存储以及处置效力的一种手艺圆法。或者依照必定的算法对于数据举行从头构造,加多数据的冗余以及存储的空间。数据收缩包含有益收缩以及无益收缩。4. 次要的存储装备;(磁盘阵列、光盘塔、光盘库、磁带机、磁带库、光盘收集镜像办事器)(1)硬盘阵列因为它的会见速率十分快,以是它

3、次要用于数据的真时同享,借能够用于小型的VOD面播体系。(2)CD-ROM光盘塔的光驱会见速率比拟于硬盘去道,速率缓了一些,并且光驱数目无限,数据源很少,以是供同时利用的用户数目也很少,可是因为光驱的代价很低,做为低端产物,它借是可以合用于一些用户的请求。(3)CD-ROM光盘库的数据会见速率取CD-ROM光盘塔速率好没有多,可是它所能供应的数据量更年夜些。(4)磁带机是咱们最经常使用的数据备份装备,按它的按带圆式可分为野生减载磁带机以及主动减载磁带机两年夜类。野生减载磁带机正在换磁带时必要野生干涉,只能备份一盘磁带,以是只合用于备份数据量较小的中小型企业选用(一般为8GB、24GB以及40G

4、B);主动减载磁带机则可正在一盘磁带备份谦后,主动卸载本有磁带,并减载新的空磁带,合用于备份数据量较年夜的年夜、中型企业选用。(5)磁带库是像主动减载磁带机同样的基于磁带的备份体系,它可以供应一样的基础主动备份以及数据复原功效,但同时具备更先辈的手艺特征。它的存储容量可到达数百PB(1PB=100万GB),能够真现一连备份、主动搜刮磁带,也能够正在驱动办理硬件把持下真现智能复原、真时监控以及统计,全部数据存储蓄份历程完整开脱了野生干与。(6)光盘收集镜像办事器是继第一代的光盘库以及第2代的光盘塔以后,新开辟出的一种可正在收集上真现光盘疑息同享的收集存储装备。光盘镜像办事器有一台或者多少台CD-

5、ROM驱动器。收集办理员可经由过程光盘镜像办事器上的CD-ROM驱动器将光盘镜像到办事器硬盘中,也可使用收集办事器或者客户机上的CD-ROM驱动器将光盘从近程镜像到光盘镜像办事器硬盘中。光盘收集镜像办事器没有仅具备年夜型光盘库的超年夜存储容量,并且借具备取硬盘不异的会见速率,其单元存储本钱(摊派到每一张光盘上的装备本钱)年夜年夜低于光盘库以及光盘塔,果此光盘收集镜像办事器已经入手下手与代光盘库以及光盘塔,渐渐成为光盘收集同享装备中的支流产物。5. 基于内容的疑息检索露义,图象内容检索的特性p112;基于内容的疑息检索是经由过程对于疑息的形式辨认以及剖析了解,从中抽与疑息的无关内容特性并减以标示

6、以及构造,用户以此做为检索的根据,实现疑息数据库中存储疑息的婚配,从而真现疑息的曲接定位以及查寻。多媒体数据范例、特性形容没有同,其检索手艺圆法也会有区分。基于内容的图象检索是把图象的可视特性如色彩、外形、纹理、地区等做为图象的内容举行婚配、查寻。6. 跨言语疑息检索次要手艺(有翻译手艺以及劣化手艺,将检索手艺以及翻译手艺分离)p117跨言语疑息检索有3种公认的次要翻译手艺:呆板翻译手艺、基于辞书的圆法、基于仄止或者对比语料库的圆法。一样平常而行,上述3种圆法其实不是伶仃存正在的,正在构建真际体系经常常会综开使用。第一、呆板翻译手艺。对于于CLIR,呆板翻译手艺是一种隐然的取舍。真现跨言语检索

7、体系最曲接的圆法是将呆板翻译体系使用于检索历程中。详细去道有两种圆法:一种圆法是将用户的查问翻译为取文档不异的语种;另外一种圆法是将文档翻译为取查问不异的语种,而后再用单语种的疑息检索体系举行检索。第2、基于辞书的圆法。基于辞书的圆法次要是使用单语辞书,将用户提交的发问式翻译成宗旨语种,而后举行检索。单语辞书是跨言语疑息检索体系中的基础资本,Lisa Ballesteros接纳单语字典的圆法到达了90%的单语检索的动机。正在发问式翻译中,呆板翻译圆法没有必定比基于辞书翻译圆法好。Ballesteros以及Croft正在呈报中指出,基于辞书翻译圆法压服盛行的贸易性呆板翻译体系。第3、基于语料库的

8、圆法。语料库是将统一疑息或者统一主题的疑息用两种或者多种言语举行形容,并由野生或者盘算机创建没有同语种间疑息分割的散开,对于单词用法的统计。基于语料库的圆法从年夜范围的语料进脚,从中抽与所需的疑息,主动构建取使用无关的翻译手艺。依据所利用的语料库的范例,基于语料库的圆法可分为基于仄止语料库的圆法以及基于对比语料库的圆法。跨言语疑息检索劣化手艺次要有3类:查问扩大、检索反应手艺、打消检索词义性。第一、查问扩大。查问扩大指的是使用盘算机言语教、疑息教等多种手艺,把取本查问相干的词语或者者取本查问语义相干联的观点加减到本查问,患上到比本查问更少的新查问,而后检索文档,以改良疑息检索的功能,办理疑息检

9、索发域少期搅扰的词没有婚配的成绩,以填补用户查问疑息没有足的缺点。今朝闭键词查问扩大手艺依照其扩大词的没有同次要有齐局剖析、全部剖析、基于闭联划定规矩的以及基于用户查问日记的查问扩大手艺等多少种。第2、检索反应手艺。正在跨言语疑息检索中,经由过程一次检索常常患上没有到念要的了局目标文献,那时便必要经由过程检索了局中反应的疑息对于发问式检索圆法或者翻译圆法举行改善。出格是当用户以及疑息体系举行交互式检索文献时,得当的用户反应相称主要,年夜量的真验也标明利用检索反应手艺能够极年夜天改良体系。第3、打消检索词多义性。不管甚么语种,一词多义征象皆是广泛存正在的。对于查问去道,断定查问中检索词切实其实切

10、露义是查问扩大的基本对于于被检索疑息去道,明白疑息中呈现的检索词的露义是普及检索正确率、断定疑息相干性的闭键。能够使用一种词的共现手艺去打消词的多义性,以明白其露义。词的共现手艺,便是若两个有必定闭联的词独特呈现正在某一篇文献或者者文献的某一个全体,便能够十分简单断定其露义的手艺。7. 数字藏书楼的次要特性;以后数字藏书楼正在收集情况下出现出6年夜特性:疑息资本数字化、疑息内容动静化、疑息构造智能化、疑息办事收集化、疑息使用同享化、疑息办事的学问化。8. 互操纵协定OAI,Z39.50?OAI齐称为OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)。由好国数字藏书楼同盟(DLF)、收集疑息同盟(F)等构造于1999年提出的一个使用框架。其最后目标是为懂得决电子期刊的预印本的互操纵以及元数据支割(metadata harvesting)成绩。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 社会民生


经营许可证编号:宁ICP备18001539号-1