语言后设资料OLAC及DC标准与应用.ppt

上传人:本田雅阁 文档编号:3306585 上传时间:2019-08-10 格式:PPT 页数:98 大小:2.21MB
返回 下载 相关 举报
语言后设资料OLAC及DC标准与应用.ppt_第1页
第1页 / 共98页
语言后设资料OLAC及DC标准与应用.ppt_第2页
第2页 / 共98页
语言后设资料OLAC及DC标准与应用.ppt_第3页
第3页 / 共98页
语言后设资料OLAC及DC标准与应用.ppt_第4页
第4页 / 共98页
语言后设资料OLAC及DC标准与应用.ppt_第5页
第5页 / 共98页
点击查看更多>>
资源描述

《语言后设资料OLAC及DC标准与应用.ppt》由会员分享,可在线阅读,更多相关《语言后设资料OLAC及DC标准与应用.ppt(98页珍藏版)》请在三一文库上搜索。

1、1,語言後設資料:OLAC及DC標準與應用,張如瑩 ruynggate.sinica.edu.tw 中研院語言所籌備處 2003年9月10日,語言座標研習營,2,Outline,Background DCMS: Dublin Core Metadata Element Set OLAC: Open Language Archives Community Language Archive,3,Background #1,全球資訊網(World Wide Web)的興起 知識時代的來臨 面對語意網(Semantic Web)挑戰,4,Background #2,文字與圖片資料機器無法真正理解其義

2、非語意或語意的註解皆有助於電腦理解 將Web page呈現和內容以XML或其他物件導向的語言(ex: XOL, SHOE, RDF, RDF Schema, DAIL+OIL)加以呈現,5,Metadata 定義和功能,譯名: 後設資料、詮釋資料、超資料、元資料或是元數據 定義 Metadata通常稱為“data about data” 描述資料的資料。 Metadata是資料結合物件,用來描述資料屬性的資料,以協助其潛在使用者擁有完整的進一步知識。 功能包括: 定位(location) 探索(discovery) 文件紀錄(documentation) 評估(evaluation) 選擇(s

3、election),6,Dublin Core Metadata Initiative,源起1995挖掘web資源的OCLC/NCSA Metadata workshop, http:/dublincore.org/ Dublin Core後設資料元素一個普遍跨學科的核心元素,有效廣泛支援資源挖掘,適用於任何以數位化或傳統型態存在的資源描述. 目標: 更容易挖掘出資源以及資料互通 包含十五個可任選與重複的元素(elements),7,Dublin Core Metadata Element Set v1.1,Title 資源標題 Creator 創造者 Subject 主題 Descripti

4、on 資源描述 Publisher 出版者 Contributor貢獻者/單位 Date日期 Type資源型態,Format 資源格式 Identifier 資源識別碼 Source 來源 Language 語言 Relation 關聯性 Coverage 涵蓋範圍 Rights權利管理,8,DCMS -修飾語(qualifiers),Element refinement 更詳細敘述元素的意義. 範圍限制更嚴格. Ex:element:Title refinement:Alternative Encoding Schema qualifier定義schemes是可幫助element進行直譯.

5、schemes的值包括(1).控制詞彙(controlled vocabularies),(2).規格化的註解(formal notations)(3).剖析規則(parsing rule). Ex:element:Subject Encoding Scheme:LCSH、MeSH、DDC、LCC、UDC,9,語言典藏及其後設資料標準,10,Open Language Archives Community,http:/www.language-archives.org,11,OLAC的目標,於2000年12月的一個語言資源工作營中,由來自北美、南美、歐洲、非洲、中東、亞洲、澳洲的語言學家與軟體

6、發展者所創,希望藉由下列步驟進行創造世界性語言資源的虛擬圖書館: 針對語言資源數位典藏發展一致性的實踐指引。 發展一網路上具有互通性且提供存取相關語言資源的儲存器和服務中心,12,OLAC的組織,Coordinators: Steven Bird & Gary Simons Advisory Board: Helen Aristar Dry, Susan Hockey, Chu-Ren Huang, Mark Liberman, Brian MacWhinney, Michael Nelson, Nicholas Ostler, Henry Thompson, Hans Uszkoreit,

7、Antonio Zampolli Participating Archives & Services: LDC, ELRA, DFKI, CBOLD, ANLC, LACITO, Perseus, SIL, APS, Utrecht Prospective Participants: ASEDA, Academia Sinica, AISRI, INALF, LCAAJ, Linguist, MPI, NAA, OTA, Rosetta, Tibetan Digital Library (UVA) Individual Members: 120,13,OLAC的緣起,許多協會需要語言資源,如:

8、語言學家、工程師、教師、演說家許多機構提供片段性的架構,如:檔案管理員、軟體發展者和出版者。 前所未有的契機: 延伸性標誌語言(Extensible Markup Language,XML)和 Unicode提供以結構化方式彈性呈現以及長期儲存資料。 線上或非線上的數位化出版品有效且實際上達到分享語言資源涵義 Dublin Core 後設資料集(資源分類標準模組)連同Open Archives Initiative所提供的交換方法,可建立一個跨越多個儲存器與檔案櫃的架構。,14,OLAC的願景 # 1,使用者透過單一OLAC的服務提供中心網站,搜尋與呈現OLAC的metadata欄位。,15,

9、OLAC的願景 # 2,理論上使用者可取得任何需要的資源 DATA 任何描述語言的相關資訊。 問卷結果:25%數位化,但並未採用相同的後設資料欄位。 TOOLS 有助於創造、瀏覽、查詢或使用語言資料的計算機資源。 ADVICE 什麼資源是可靠的?什麼工具適用於此情境?創造新資料時該如何作?,16,OLAC的願景 # 3,實際上 無法得到想要的資源 在不同網站擁有不同名字(Name)造成召回率低 (low recall) 。 在其他領域有相同意義,造成正確率低(precision). 是否運用適當軟體以及判斷ADVICE的價值? 許多語言資源並非以文字為基礎。 語言資源散佈在不同的網站。,17,

10、OLAC的願景 # 4,OAI,CONTENT,METADATA,OLAC REPOSITORIES,OLAC SERVICES,USER SERVICES,18,OLAC的願景 # 5,銜接縫隙的基礎架構 Gateway 使用者可獲得data,tool,advice的單一入口網站。 Metadata data,tool,advice的統一描述,包含所有項目的連結以及解釋如何存取。 Review 瀏覽 data,tool,advice的評價。 Standards 上述各項過程與協定的基礎,例如:metadata schema,harvesting protocol.,19,OLAC三個主要標準

11、,OLAC Metadata (Qualified DC) OLAC MHP: Refinements to the OAI protocol OLAC Process: a procedure for identifying Best Common Practice Recommendations.,20,OLAC Metadata,2001 年10月推出0.4版本 以Dublin Core的15個元素為基礎 以OAI(Open Archives Initiative)為典藏架構的基礎 可經由XML的DTD或Schema編碼加以驗證 中譯本,請見語言典藏網站 http:/LanguageAr

12、chives.sinica.edu.tw/,21,OLAC Metadata 0.4版,貢獻者/單位(Contributor) 涵蓋範圍(Coverage) 創造者(Creator) 日期(Date) 資源描述(Description) 資源格式(Format) 資源cpu格式(Format.cpu) 資源編碼格式(Format.encoding) 標誌語言(Format.markup) 作業系統需求(Format.os) 程式語言(Format.sourcecode) 資源識別碼(Identifier),語言(Language) 出版者(Publisher) 關聯性(Relation) 權利

13、管理(Rights) 來源(Source) 主題(Subject) 主題使用語言(Subject.language) 資源標題(Title) 資源型態(Type) 軟體資源的功能(Type.functionality) 語言學上的資源型態(Type.linguistic),22,IRCS Workshop,IRCS Workshop on Open Language Archives 10-12 December 2002 University of Pennsylvania, Philadelphia, USA http:/www.language-archives.org/events/o

14、lac02/ 2002-12-11誕生1.0版本 proposal 2002-05-31 1.0版本Candidate Standard,23,OLAC Metadata 1.0版之變革,OLAC Metadata 格式 延伸機制(Extensions) OLAC的延伸 (OLAC extensions) OLAC建議的延伸(建議的控制詞彙) 第三團體的延伸 (a third-party extension) 延伸進行文件化,24,OLAC Metadata格式 #1,OLAC Metadata 格式遵從Guidelines for implementing DC in XML OLAC 綱要

15、(OLAC schema)為了限制DC所發展的兩個後設資料綱要經混合後的應用輪廓(Application profile) DC副本儲存處: 基本的DC:http:/www.language-archives.org/OLAC/1.0/dc.xsd 修飾語:http:/www.language-archives.org/OLAC/1.0/dcterms.xsd 最新版本的OLAC 後設資料綱要(附上簡單的記錄)請見: 綱要(Schema): http:/www.language-archives.org/OLAC/1.0/olac.xsd 例子: http:/www.language-arch

16、ives.org/OLAC/1.0/olac.xml,25,OLAC Metadata格式 #2,元素 來源:http:/www.language-archives.org/OLAC/1.0/ metadata容器(container): 元素名稱空間(Namespace) OLAC元素:olac DC元素:為預設值,所以不需要名稱空間 一筆有效的OLAC紀錄 Bloomfield, Leonard 1933 Language New York: Holt ,26,OLAC Metadata格式 #3,OLAC後設資料,也包括DC修飾語並遵從Guidelines for implementin

17、g DC in XML 使用refinement或encoding scheme在後設資料都必須要宣告dcterms名稱空間 xmlns:dcterms=“http:/purl.org/dc/terms/ 例如: 以W3C日期格式呈現創造日期: 2002-11-28,27,OLAC Metadata格式 #4,元素內容所使用的語言-xml:lang的屬性值 語言識別代表碼RFC1766 保留前置字元“x-“ OLAC採用該機制定義了語言代碼,其中包含超過7,000種現存及絕種的語言 若缺少xml:lang屬性預設值為英語。 多個後設資料元素去標記不同的語言,則資料提供器(Data provid

18、ers)將提供多語的後設資料記錄,28,使用OLAC的延伸 (Extensions) #1,xsi:type機制具有抓取XML Schema完整權限,被用在除了縮小元素意義、限制元素內容(如同DC修飾語)等其他意圖而進行的改變。又或者藉由額外的屬性的樣式(pattern)或列舉值(enumerations)依次限制,這兩者可同時使用。 延伸機制著錄原則: 有限制的元素內容以code屬性去著錄 其他沒有限制的附註以元素內容加以著錄。 code屬性和元素內容同時被使用時,則以元素內容陳述更精準資源描述,勝過於單獨以code的限制詞彙加以表達。 code屬性是任選的,他可用來增加精準率,標示屬於其他

19、所遺留但非原始限制過的資料。,29,例子:描述喀麥隆(Cameroon,西非國名)Dschang 語言資源的變遷三步驟: Dschang 利用元素內容 Dschang 利用參考名稱空間以及元素內容 利用code屬性的控制詞彙,使用OLAC的延伸 (Extensions) #2,30,使用OLAC的延伸 (Extensions) #3,皆會被視為最佳實踐指引(recommended best practice) 被定義在名稱空間為olac的schema中 不受OLAC控制的額外詞彙,且不隸屬於OLAC過程(OLAC Process) 例如:Ethnologue 語言代碼 文件需描述OLAC延伸,

20、並對於未定義新增的這個詞彙,必須標注簡單的資料,以及參考到額外的詳細定義。 OLAC延伸的變更,當編碼值詮釋的範圍更狹窄,則以新的碼代替之前已存在的編碼值。,31,OLAC建議的延伸 (Extensions) #1,為了符合語言資源社群的特殊需求,OLAC使用延伸使語言描述更精準。 使用xsi:type這屬性終止基本DC後設資料元素的定義,而在語意上更精準的定義。 例如: 主題(Subject)的描述:Dschang language(表示該資源主要描述的是和Dschang語言資源相關的。) 將標準語言識別碼帶入OLAC延伸:,32,OLAC建議的延伸 (Extensions) #2,言談型態

21、代碼(Code for Discourse Types) 名稱(Name):olac:discourse-type 應用於(Applies to):資源型態(type)、主題(subject) 語言識別代碼(Code for Language Identification) 名稱(Name):olac:language 應用於(Applies to):資源型態(type)、主題(subject) 語言學領域代碼(Code for Linguistic Field) 名稱(Name):olac:linguistic-field 應用於(Applies to):主題 (subject) 語言學的資

22、料型態代碼(Code for Linguistic Data Types) 名稱(Name):olac:linguistic-type 應用於(Applies to): 資源型態(type) 參與者角色代碼(Code for Participant Roles) 名稱(Name):olac:role 應用於(Applies to):創造者 (creator) , 貢獻者/單位 (contributor),33,定義第三團體的延伸(Defining a third-party extension) #1,允許子社群針對一個共有特殊關注的部分加以發展和分享後設資料的延伸 藉由其他名稱空間 透過xs

23、i:type的使用,不需要變更OLAC綱要(OLAC schema),便可以延伸OLAC的應用輪廓(application profile),34,定義第三團體的延伸(Defining a third-party extension) #2,例子:貢獻者/單位(Contributors)的角色,在OLAC-Role中增加注釋者(Commentator) Sampson, Geoffrey Sampson, Geoffrey 則XML Schema和說明 更多例子請見http:/www.language-archives.org/OLAC/1.0/third-party/ 第三團體所定義之延伸,

24、是由專業的子協會定義其他屬性,而這些屬性將被標準的OLAC服務所忽略。,35,文件化延伸(Documenting an extension),每一個延伸都應該提供那些詞彙在語義上相關的且人們可讀的使用說明。 每個延伸機制都應該提供一份摘要說明 摘要說明(summary documentation)包含六個委任元素:簡稱(shortName)、全名(longName)、版本日期(versionDate)、描述(description)、應用於(appliesTo)、延伸機制說明(extensionDoc) 摘要說明擷出的資訊是為了呈現在OLAC網頁中的第三團體之延伸機制文件,36,後設資料和內容

25、標記,後設資料 以資源實體為標記單位 內容標記 以字、詞為標記單位 維習安 (2000) 提到所謂內容標記是指透過有系統的標記,以呈現文本的結構、以及任何文本使用者有興趣的內容訊息。,37,內容標記類別,Metadata,類似文件的書目描述 結構 卷、章、節、句、詞彙. 排版 項目符號的標記 語言學的注解etc. 詞類、音韻,38,語音標誌 phonetic,語言的聲音部分. 音素(phoneme): 語音的最小單位. 音節(音綴)(syllable): 漢語裡,一個字就是一個音節. 音高(pitch):聲音的高低. 漢語裡音高變化可區分詞義的作用, 如媽、麻、馬、罵四個字的聲調不同即音高的不

26、同. 聲調(tone):有些語言,特別是和藏語系各語言裡面不同的音高升降曲折變化具有區分詞義的作用.語言學上稱具有這種音高升降曲折狀態叫做聲調(tone). 吐氣群(breath group) 音調(語調)(intonation): 整個句子的音高曲折變化.,39,語法標誌 syntax,也叫文法.即語言的組織規律.從最廣的意義上說,語法是只對語言中存在的規則性和不規則性所作的概括描述. 詞類(Parts of Speech):詞的最基本語法分類,例:名詞、動詞 詞組/短語(phrase, word group): (1).由兩個或兩個以上的實詞組合而成的句法單位.例:兄弟姊妹,高樓,好得很,

27、愛人民. (2).在系統語法中,指英語具有五個語法單位之一.詞組包含一個或幾個詞,句包含一個或幾個詞組. 句子(sentence):用來表達一個完整思想的言語單位.一般是由主語和賓語兩個部分所組成. 語法功能 句結構,40,語用標誌 pragmatic,語境(亦即實際使用句子時)對於語意解釋的影響,而語言行為也是語用研究的一部分. 輪(turn):會話中被提出的單位.有時是由一位對話者所提出,或者由一些對話者所提出的內容. 停頓(pause): 話語中短暫的間歇,常常出現在信息內容或低概率詞組之前. 語調單位(Intonation unit, IU),41,語意標誌 semantic,語言裡的

28、語詞、句子等的意義. 詞義(word meaning):詞彙的意義 詞義場(semantic field): 也叫語意場圈.任何一組詞彙如果含有相同的語意成分,便構成語意場.例:親屬關係的用語 指涉(reference),42,其他相關計畫,國外 E-MELD(Electronic Metastructure for Endangered Language Data) Domain Ontology of Linguistic Concepts, http:/emeld.org/tools/ontology.cfm EAGLES/ISLE Meta Data Initiative, http:

29、/www.mpi.nl/world/ISLE/ Alaska Native Language Center, http:/www.uaf.edu/anlc TEI:Text Encoding Initiative, http:/etext.virginia.edu/TEI.html Corpus Encoding Standard, http:/www.cs.vassar.edu/CES/ 國內 中華佛學研究所CBETA, http:/ccbs.ntu.edu.tw/cbeta/,43,和其他計畫的關係,Where 空間,When 時間,數位典藏,How and What,44,應用範圍,增加

30、檢索結果的正確率、召回率 (領域)詞彙庫的建立 (含語意的)內部資料處理與各界資料交換 教學 其他內容的加值應用 計算機對自然語言的處理 資訊檢索 機器翻譯 知識管理.etc. 語言學上質和量的研究 質:computational lexicons, grammars, and multi-lingual lexicon and tree bank. 量: frequent or characteristic uses of language, translation equivalents. morphological taggers, POS taggers, sense taggerse

31、tc.,45,實例,以XML可延伸式標注語言建立文章標誌系統研究以蘇軾詩為範圍http:/cls.hs.yzu.edu.tw/cm/,46,語言座標以及OLAC最新動態,語言典藏:研究趨勢與計畫簡介,台灣語言學會學會通訊,台灣語言學會學會(Lingustic Society of Taiwan),第五卷第二期,2003年 6月。 2003年7月11-13日,文本與田野資料數位化工作營(EMELD workshop on Digitizing & Annotating Texts and Field Recording) 美國密西根州立大學,東蘭辛(East Lansing) . SCIENTI

32、FIC AMERICAN August 2002. p.79-85. Saving Dying Language. 搜尋語言相關資源, http:/www.linguistlist.org/olac 參與 OLAC 社群, http:/www.language-archives.org/,47,Dublin Core Metadata Element-Title,Name: Title Identifier: Title Definition:資源的命名. Comment: 一般來講是指資源其正式被知道的名稱 EX: Element: Title Refinement: Alternative

33、,48,Dublin Core Metadata Element-Creator,Name: Creator Identifier: Creator Definition: 資源內容的創造者. Comment: 創造者(Creator)的舉例包括:一個個體或組織或一個服務中心.一般說來創造者是一個實體的名稱,49,Dublin Core Metadata Element Set-Subject,Name: Subject and Keywords Identifier: Subject Definition: 資源內容的主題(Topic). Comment:一般是以關鍵字或關鍵段落或分類點加以

34、描述.最佳做法(best practice)是用已存在的控制詞彙或正式分類綱要(Schema). Encoding scheme: LCSH, MeSH, DDC, LCC,UDC,50,Dublin Core Metadata Element Set-Description,Name: Description Identifier: Description Definition:資源內容的記載. Comment:描述可以概括:摘要,內容表格,圖示內容,或以任何形式去呈現的內容,呈現方式並無任何限制.,51,Dublin Core Metadata Element Set-Publisher,

35、Name: Publisher Identifier: Publisher Definition: 負責使資源流通的個體(推廣資源的實體) Comment: 例如:一個人,組織,或服務中心.也就是一個實體.一般說來推廣者(Publisher)是一個實體的名稱.,52,Dublin Core Metadata Element Set-Contributor,Name: Contributor Identifier: Contributor Definition: 任何與資源內容有貢獻的個人組織或服務中心. Comment:例如:一個人,組織,或服務中心.也就是一個實體.一般說來貢獻者(Contr

36、ibutor)是一個實體的名稱,53,Dublin Core Metadata Element Set-Date,Name: Date Identifier: Date Definition: 資源中一事件的生命週期. Comment:一般會將日期與資源的創造以及可獲得日加以配合.日期的編碼方式最好以ISO 8601 W3CDTF 為基礎,遵從YYYY-MM-DD格式. Refinement: Created, Valid, Available, Issued, Modified,54,Dublin Core Metadata Element Set-Type,Name: Resource T

37、ype Identifier: Type Definition: 資源內容的本質. Comment: Types包括項目描述內容的一般目錄,功能,式樣,或者集合層次. 最佳做法是選用控制詞彙例如DCT1.若描述數位化顯示方式或是實體的樣子請用Format. Encoding scheme: DCMI Type vocabulary,55,Dublin Core Metadata Element Set-Format,Name: Format Identifier: Format Definition: 顯示資源的實體或數位化格式. Comment: 一般format包括媒體形態(media-t

38、ype)資源大小(dimensions of the resource),其它還包括展示或操作該資源所須的軟硬體等設備.資源大小(dimensions)包括:尺寸(size)以及持續時間(duration.).最佳做法是使用控制詞彙例如MIME定義電腦媒體的型態. Refinement: Extent,Medium,56,Dublin Core Metadata Element Set-Identifier,Name: Resource Identifier Identifier: Identifier Definition: 內容資源的獨特明確識別碼. Comment: 最好由正式的全球性識

39、別系統認證的文字或數字所組成. 正式的全球性識別系統包括Uniform Resource Identifier (URI)(包括Uniform Resource Locator, URL, Digital Object Identifier, 或DOI, International Standard Book Number, ISBN).,57,Dublin Core Metadata Element Set- Source,Name: Source Identifier: Source Definition: 目前作品是參考該作品所衍生的. Comment: 目前作品是由該作品的部份或全部所

40、衍生的. 最好由正式的全球性識別系統認證的文字或數字所組成.,58,Dublin Core Metadata Element Set- Language,Name: Language Identifier: Language Definition: 資源內容所使用的語言 Comment:最好控制詞彙的方法是以網際網路FRC1766定義語言規格,前兩個字母碼的基礎為ISO 639接下來的兩個字母最好由國家碼(country code )組成,這是以ISO 3166.為基礎.例如: en =English, fr= French, 或者en-uk =在英國使用的英文。,59,Dublin Core

41、 Metadata Element Set- Relation,Name: Relation Identifier: Relation Definition: 參考到相關資源. Comment: 最好由正式的全球性識別系統認證的文字或數字所組成.,60,Dublin Core Metadata Element Set- Coverage,Name: Coverage Identifier: Coverage Definition: 資源內容中的程度或範圍. Comment:一般包括地理位置 (一地方的名字或地理上的情況) ,暫時的時段(一段時期的標籤,日期,一段時間)或者管轄區(被命名的行政區

42、域).最佳做法是用控制詞彙(例如:地理名辭典Thesaurus of Geographic Names TGN) 或者其他適當的已被命名的地點或格式化的時間區域集合。 Refinement: Spatial, Temporal,61,Dublin Core Metadata Element Set-Rights,Name: Rights Management Identifier: Rights Definition: 資源的所有權限制. Comment:一般包含資源的權限狀態或參考一個提供此資訊的服務.版權資訊通常包括:智慧財產權,版權,其它財產權.若是所有權沒選定哪一個狀態其他的所有權將表

43、達有關這資源的所有權的資訊.,以上資料僅擷取詳細資料可見語言典藏的網站 http:/LanguageArchives.sinica.edu.tw/,62,Guidelines for implementing DC in XML-General implementation guidelines,XML Schemas較 XML DTD更具有彈性且適合 更多彈性,且在其他XML應用上的再使用更容易 使用XML Namespace 作為 DC 元素,元素refinement 和元素schemes的唯一識別碼. 候選的容器(container)元素名稱包括: , , , 和,63,Guidelin

44、es for implementing DC in XML-Simple Dublin Core #1,Abstract model 簡單的DC記錄(record)由一或多個特性(properties)以及其值(values)所組成 每個特性(property)是指資源被描述的屬性(attribute) 每個特性(property)必須是15 DCMES元素之一 每個值(value)是一字串 每個字串值(value)也許和一語言結合(例如:en-GB),64,Guidelines for implementing DC in XML-Simple Dublin Core #2,Implemen

45、tation guidelines 執行者應該將特性(properties)視為XML元素,值(values)視為那些元素的內容 Dublin Core in XML rather than 15個元素也就是特性(properties)名稱應該小寫 多個特性值應該針對特性以重複的元素編碼 First title Second title,65,Guidelines for implementing DC in XML-Simple Dublin Core #3,Example a simple DC record UKOLN UKOLN is a national focus of exper

46、tise in digital information management. It provides policy, research and awareness services to the UK library, information and cultural heritage communities. UKOLN is based at the University of Bath. UKOLN, University of Bath http:/www.ukoln.ac.uk/ 請見附件simple_DC.xml,66,Guidelines for implementing DC

47、 in XML-Qualified Dublin Core #1,Abstract model Qualified DC紀錄是由單一或多個特性(properties)和其值(values)所構成 每一個特性(property)是資源被描述的屬性(attribute) 每一個特性(property)必須可能是: 15DC元素、其他由DCMI建議的元素、列在DC修飾語的元素refinement. 特性(property)可重複 每一個值(value)是一文字字串 每個值(value)也許結合encoding scheme 每個字串值(value)也許和一語言結合(例如:en-GB),67,Guid

48、elines for implementing DC in XML-Qualified Dublin Core #2,Implementation guidelines 元素refinement被視為另一個特性(property)(=refinement視為元素) 2002-06 rather than 2002-06 encoding schemes應以XML 元素(也就是特性property)的xsi:type值去表達 http:/www.ukoln.ac.uk/,68,Guidelines for implementing DC in XML-Qualified Dublin Core

49、#3,Implementation guidelines 元素refinement 和 encoding scheme應使用列在DC修飾語中的名稱(Name) refinement第一字母須小寫;scheme第一字母必須大寫,但通常是全部字母都大寫 http:/www.bbc.co.uk/ name=The Great Depression; start=1929; end=1939;,69,Guidelines for implementing DC in XML-Qualified Dublin Core #4,Implementation guidelines 值(values)所使用的語言應以xml:lang屬性(attribute)表達 seafood fruits de mer,70,Guidelines for implementing DC in XML-Qualified Dublin Core #5,Example- a qualified DC reco

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1