都柏林核心集修飾詞的演變

本文解說和比較都柏林核心集修飾詞部份的兩個模型--DC/HTML與DC/RDF。DC/HTML的修飾詞實作機制是「集合--元素」,其中集合可以Scheme或Subelement來替換,元素則由相關的內容值(例如URL)來取代。DC/RDF的修飾詞實作機制是「集合--次集合--元素」,其中集合可以Value Qualifier或Element Qualifier來替換,次集合為identifierScheme或identifierType等,元素則由相關的內容值(例如ISBN)來取代。 吳政叡

為了豐富都柏林核心集的內涵和擴大其應用範圍,在都柏林核心集的第四次研討會中,確立了「坎培拉修飾詞」,正式收納了三種修飾詞 -- 語言修飾詞(Lang)、架構修飾詞(Scheme)、次項目修飾詞(Subelement) [作者註:原稱為類別修飾詞(Type)]。這三種修飾詞中,除了語言修飾詞是一直遵循RFC 1766的規定,使用 ISO 639的二個字母的語言代碼外。其餘的二種修飾詞,雖然在功能或作用上並無太大變化,但在名稱和實作機制上,卻有非常大的演變。

名稱和實作機制目前分為兩支,已經發展成熟的是DC/HTML,使用的名稱為架構修飾詞(Scheme)和次項目修飾詞(Subelement),使用的格式為HTML 4.0,其呈現的形式如下:

<Meta Name="DC.Creator.Homepage" Scheme="URL" Lang="zh-tw" Content=http://dimes.lins.fju.edu.tw/>

由上例可明顯看出DC/HTML的實作機制,若以數學中集合(Set)的術語來闡釋,是以架構修飾詞(Scheme)為集合的名稱,而URL等為集合中的元素(Element)。所以DC/HTML的修飾詞實作機制是「集合--元素」,其中集合可以Scheme或Subelement來替換,元素則由相關的內容值(例如URL)來取代。

由於近來「資源描述架構」(Resource Description Framework,簡稱RDF)[註1] 和XML(eXtensible Markup Language) [註2] 的興起和發展成熟,對都柏林核心集也產生一些重要的影響。基本上RDF是一個與任何特定語法無關的抽象的資料(表達)模式,用來呈現資源(Resource)的特性(Property)與其值(Value)三者的關係。[註3] 例如圖1中的資源(Resource)為網頁http://dimes.lins.fju.edu.tw,Creator乃是此資源的其中一個「特性」(Property),而此特性的值(Value)為Cheng-Juei Wu。由圖1可知,在RDF的圖形表示方式上,以橢圓形代表資源,箭頭代表特性,矩形代表值。

圖1. RDF的基本架構。

以XML的語法來表示為 [註4]

<rdf:RDF>

<rdf:Description about="http://dimes.lins.fju.edu.tw">

<s:Creator>Cheng-Juei Wu</s:Creator>

</rdf:Description>

</rdf:RDF>

在了解RDF的基本架構後,再來看資料模型工作小組提出的DC/RDF基本模型(圖2)。[註5]

圖2. DC/RDF的基本模型。

在圖2中的Resource(資源),其意義參見上面的解釋,主要是以URI的格式來表達。Element(項目)主要是指都柏林核心集的15個基本欄位(或項目),很明顯的,它們是資源的特性(Property)。由於每個欄位的內容,可再被多種修飾詞(Qualifier)來修飾,形成一個複雜的結構體(Entity),在RDF的基本模型中是被視為Resource,因此在圖2中也以橢圓形來表示。

內容值修飾詞(Value Qualifier)與DC/HTML之架構修飾詞約略對映,用來指示內容值的編碼方式或是架構,例如LCSH和ISBN等;項目修飾詞(Element Qualifier)則與DC/HTML之次項目修飾詞約略對映,用來進一步釐清欄位(或項目)與資源的關係,例如以欄位題名(Title)而言,包含有並列題名和副題名等。

就DC/RDF的修飾詞實作機制而言,是採用「集合--次集合--元素」的方式,以下是一個實例:[註 6]

圖3. 一個含內容值修飾詞的RDF圖示。

<?xml version='1.0'?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:dc = "http://purl.org/dc/elements/1.0/"

xmlns:dcq="http://purl.org/dc/qualifiers/1.0/">

<rdf:Description rdf:about = "機讀編目格式在都柏林核心集的應用探討">

<dc:identifier>

<rdf:Description>

<rdf:value> 957-15-0930-2</rdf:value>

<dcq:identifierScheme>ISBN</dcq:identifierScheme>

</rdf:Description>

</dc: identifier>

</rdf:Description>

</rdf:RDF>

上例若以數學中集合(Set)的術語來闡釋,是以內容值修飾詞(Value Qualifier)為集合的名稱,以資源識別代號架構(identifierScheme)為次集合名稱,而ISBN為次集合中的元素(Element)。所以DC/RDF的修飾詞實作機制是「集合--次集合--元素」,其中集合可以Value Qualifier或Element Qualifier來替換,次集合為identifierScheme或identifierType等,元素則由相關的內容值(例如ISBN)來取代。

此外為了使每個名稱的意義明確,也引入了Namespace(名稱空間)的概念,簡言之,是由一群名稱(或控制詞彙)所組成的集合。由上例中可知,資料模型工作小組提出的草案中,引入了三個與都柏林核心集相關的名稱空間,其代稱分別為dc、dcq、dct。[註 7]

dc為Dublin Core Namespace的代稱,是由都柏林核心集的15個基本欄位名稱所組成,例如Title等,上例中<dc:identifier>即是使用名稱空間dc。dcq為Dublin Core Qualifier Namespace的代稱,是由內容值修飾詞(Value Qualifier)和項目修飾詞(Element Qualifier)的名稱所組成,例如IdentifierScheme與TitleType等,上例中<dcq:identifierScheme>即是使用名稱空間dcq。dct為Dublin Core Terms Namespace的代稱,是由內容值修飾詞彙(Value Qualifier Term)和項目修飾詞彙(Element Qualifier Term)的名稱所組成,例如ISBN和並列題名等,寫法如<dct:ISBN />。

此外DC/RDF也引進內容值成份(Value Component)的概念,主要是與個別資源無關的資料,例如作者的e-mail、網頁網址、電話、住址等,其呈現的形式如下:[註 8]

圖4. 一個含內容值成份(Value Component)的RDF圖示。

<rdf:Description rdf:about = "機讀編目格式在都柏林核心集的應用探討">

<dc:creator>

<rdf:Description>

<vcard:fn>Cheng-Juei Wu</vcard:fn>

<vcard:email>lins1022@mails.fju.edu.tw</vcard:email>

<vcard:org>Fu-Jen University</vcard:org>

</rdf:Description>

</dc:creator>

</rdf:Description>

註釋

註 1:O. Lassila and R. R. Swick, Resource Description Framework (RDF) Model and Syntax Specification, 22 Feb. 1999, <http://www.w3.org/TR/1999/REC-rdf-syntax-19990222>.

註 2:T. Bray, J. Paoli, and C. M. Sperberg-McQueen, Extensible Markup Language (XML) 1.0," 10 Feb. 1998, <http://www.w3.org/TR/REC-xml>.

註 3:吳政叡,都柏林核心集與元資料系統,(台北市:漢美,民國 87 年5 月),頁166。

註 4:同註1,頁8。

註 5:E. Miller, P. Miller and D. Brickley, Guidance on expressing the Dublin Core within the Resource Description Framework (RDF), 1 July 1999, <http://www.ukoln.ac.uk/metadata/resources/dc/datamodel/WD-dc-rdf/WD-dc-rdf-19990701.html>, p. 11.

註 6:同註5,頁21。

註 7:同註5,頁16。

註 8:同註5,頁23。