中國機讀編目格式(第三版)到都柏林核心集對照表

 

吳政叡 (Cheng-Juei Wu)

輔仁大學圖書資訊系專任副教授

E-mail: lins1022@fujens.fju.edu.tw

中文摘要

為了推廣都柏林核心集在國內的應用,使圖書館界在機讀編目格式中所累積的龐大資源,也能被都柏林核心集的系統所利用。本文介紹國內圖書館目前使用最廣泛的機讀編目格式版本─中國機讀編目格式(Chinese MARC)第三版到都柏林核心集的轉換,此外本文也簡略的統計了第三版和第四版在欄位上的差異。

關鍵字:元資料,中國機讀編目格式,都柏林核心集,MetadataChinese MARCDublin Core

一、前言

中國機讀編目格式的發展歷程,根據王振鵠教授在「中國機讀編目格式」第三版中的序言描述,首先是在民國 69 年 5 月成立「中文機讀編目格式工作小組」進行研定,主要是依據「國際機讀編目格式」(UNIMARC-1980)、「美國國會圖書館書目機讀編目格式」(MARC Formats for Bibliographic Data-1980)、ISO 2709 格式來制定,於民國 70 年 1 月正式刊行中國圖書機讀編目格式第一版,同年 7 月第二版修訂出版。隨後又修訂加入連續性出版品、地圖、音樂、視聽資料等,在民國 71 年發行新版,並且更名為「中國機讀編目格式」(Chinese MARC),民國 73 年又根據國際圖書館協會聯盟 1983 年編訂的 UNIMARC Handbook ,修訂出版第二版,第三版則於民國 77 年出版,第四版甫於民國86 年 6 月修訂出版。

都柏林核心集為元資料的一種,是1995年3月由國際圖書館電腦中心(OCLC)和National Center for Supercomputing Applications(NCSA)所聯合贊助的研討會,在邀請五十二位來自圖書館、電腦、網路方面的學者和專家,共同研討下的產物,目的是希望建立一套描述網路上電子文件特色的方法,來協助資訊檢索。研討會的中心問題是--如何用一個簡單的元資料記錄來描述種類繁多的電子物件?[註 1] 主要的目標是發展一個簡單有彈性,且非圖書館專業人員也可輕易了解和使用的資料描述格式,來描述網路上的電子文件。在其欄位方面,則祇有15個基本欄位(或項目),有關欄位的名稱、詳細闡釋、例子、與著錄要點,請參閱作者《都柏林核心集在UNIMARC和機讀權威紀錄格式的應用探討》一書中的第一章第四節「基本欄位」。[註2] 至於都柏林核心集修飾詞的內涵與演變,請參閱上述專著的第一章第五節「修飾詞」和第五章第一節「DC/RDF模型」中的介紹。[註3]

為了推廣都柏林核心集在國內的應用,使圖書館界在機讀編目格式中所累積的龐大資源,也能被都柏林核心集的系統所利用,有必要製作適當的對照表,來將以機讀編目格式(MARC)為儲存格式的資料,轉換到以都柏林核心集為格式的系統。

二、中國機讀編目格式第三版與第四版差異統計

雖然「中國機讀編目格式」第四版已於民國86 年 6 月出版,但是國內大部份自動化系統,(在本文寫作期間)還是使用第三版為主,因此就機讀編目格式的應用而言,目前可以說是處於第三版與第四版的過渡銜接時期。蔡燕青在「談線上編目」一文中,雖然有扼要敘述第四版和第三版的差異 [註4],但仍不足以來清楚明瞭兩版本間的差異情況。

根據作者就「中國機讀編目格式」第三版與第四版,以欄號為比較單位,所做的分析和統計,發現至少110項的欄號差異:

1)第三版,而第四版的欄號,總計有71項。

2)第三版,而第四版的欄號,總計有34項。

3)第三版與第四版欄號相同,但是內容性質完全不同者,分別為欄號530、531、540、541、780,總計有5項。

如果以段的層次來分析,則在3__附註段、4__連接款目段、5__相關題名段等三個段上有極大的變動:

1)3__附註段:第三版有29項欄號,而第四版縮減成4項。

2)4__連接款目段:第三版有26項欄號,但第四版則取消此段,將絕大多數欄號併入5__相關題名段。

3)5__相關題名段:第四版中由於併入4__連接款目段的欄號而項目數量大增,總計有36項欄號;而第三版的相關題名段則祇有16項欄號。除此之外,第四版中為了容納新增加的欄號,被迫遷移原先第三版中屬於其他相關題名的欄號--520、530、531、532、540、541等6項欄號,在第四版中遷移到欄號550-555,直接造成530、531、540、541等4項欄號,在第三版與第四版中產生欄號相同,但是內容性質完全不同的情形。

雖然上面的比較和分析非常簡略,但仍足以顯示第三版和第四版間有不小的變動,因此若是直接參照《機讀編目格式在都柏林核心集的應用探討》一書中第三章的第四版對照表,來嘗試轉換依據第三版機讀編目格式製作的書目資料,不但是非常麻煩,且非常容易出錯。基於以上的考量,作者以為有另外製作第三版的對照表的必要,而不能以第四版對照表來代替。

三、轉換對照表的基本原則和方法解說

為節省篇幅,本書中將祇列出表格,而省略表格後的說明與解釋。另一方面,與第四版完全無差異,而可直接使用第四版對照表的欄號也不再贅述,祇於對照表前列出欄號,請讀者自行參閱機讀編目格式在都柏林核心集的應用探討》一書中的第四版對照表。[5]同時以下的中國機讀編目格式第三版到都柏林核心集轉換對照表,其製作方法和符號使用的簡要說明,也與第四版大致相同 [註6],祇有在修飾詞的使用上有所差異,請參見下面的說明。

由於都柏林核心集的修飾詞目前正處於轉變中,有DC5時確立的DC/HTML模型,和正在發展中的DC/RDF模型。因為DC7(第七次研討會)已開始採取DC/RDF模型中的名稱,因此以下的表格,遵循DC7的用法。此外根據都柏林核心集之資料模型工作小組199971日所發表的草案Guidance on expressing the Dublin Core within the Resource Description Framework (RDF) [7],有內容值修飾詞(Value Qualifier)和內容值修飾詞彙(Value Qualifier Term)的區分;同樣的,也有項目修飾詞(Element Qualifier)與項目修飾詞彙(Element Qualifier Term)的區分。但是真正修飾詞的資訊是蘊涵在內容值修飾詞彙(Value Qualifier Term)和項目修飾詞彙(Element Qualifier Term),而所謂的詞彙內容正是DC5中修飾詞的內容,因此嚴格說來,DC5中架構修飾詞(Scheme Qualifier)的內容相當於資料模型工作小組草案中的內容值修飾詞彙(Value Qualifier Term),而DC5中次項目修飾詞(Subelement Qualifier)的內容相當於草案中的項目修飾詞彙(Element Qualifier Term)。[8]

四、0__識別段1__代碼資料段

0__識別段省略的欄號計有:001、005、009、020、042、050等6個欄號。另一方面,與第四版完全無差異,而可直接使用第四版對照表的欄號有:010、011、021、022、040等5個欄號。

1. 中國機讀編目格式(第三版)0__識別段欄號的對照表。

中國機讀編目格式

都柏林核心集

欄位

位址

指標

欄位

修飾詞

Value Qualifier Term

Element Qualifier Term

025 $a

 

 

資源識別代號

{$b}

銷售號

025 $z

 

 

資源識別代號

{$b}

銷售號錯誤碼

071 $a

 

 

資源識別代號

{$b}

出版者資料編號

 

1__代碼資料段省略的欄號有:100 $a(位址0-7、9-16、21-34)、102 $b和$c、110 $a(位址8)。另一方面,與第四版完全無差異,而可直接使用第四版對照表的欄號有:100、101、105、106、110、115、116、120、121、122、123、124、125、126、127、128、129、130、131等19個欄號。

2. 中國機讀編目格式(第三版)1__代碼資料段欄號的對照表。

中國機讀編目格式

都柏林核心集

欄位

位址

指標

欄位

修飾詞

Value Qualifier Term

Element Qualifier Term

102 $a

 

 

出版者

 

出版地

135 $a

0

 

資源類型

 

 

五、2__著錄段

此段與第四版完全無差異,而可直接使用第四版對照表的欄號有:200、204、205、206、207、208、209等7個欄號。

3. 中國機讀編目格式(第三版)2__著錄段欄號的對照表。

中國機讀編目格式

都柏林核心集

欄位

位址

指標

欄位

修飾詞

Value Qualifier Term

Element Qualifier Term

210 $a+$b

 

 

出版者

 

出版地

210 $c

 

 

出版者

 

 

210 $d

 

 

出版日期

 

 

210 $e+$f

 

 

簡述

 

印製地

210 $g

 

 

簡述

 

印製者

210 $h

 

 

出版日期

 

印製日期

211 $a

 

 

出版日期

 

預定出版日期

215 $a

 

 

資料格式

 

稽核資料(數量)

215 $c

 

 

資料格式

 

 

215 $d

 

 

資料格式

 

尺寸

215 $e

 

 

簡述

 

附件

225 $a+$e

 

 

題名

 

集叢正題名

225 $d

 

 

題名

{$z}

集叢並列題名

225 $f

 

 

著者

 

集叢著者

225 $h

 

 

簡述

 

集叢編次

225 $i

 

 

簡述

 

集叢編次名稱

225 $v

 

 

簡述

 

集叢號

225 $x

 

 

資源識別代號

國際標準叢刊號(ISSN

 

225 $r

 

 

題名

羅馬拼音

集叢正題名

六、3__附註段

由於3__附註段中各欄號的分欄 $u,其內容與分欄 $a相同,用途主要是以英文來敘述,以便利國際書目交換之用。為了避免資料重複,因此將分欄 $u省略。

4. 中國機讀編目格式(第三版)3__附註段欄號的對照表。

中國機讀編目格式

都柏林核心集

欄位

位址

指標

欄位

修飾詞

Value Qualifier Term

Element Qualifier Term

300 $a

 

 

簡述

 

 

301 $a

 

 

資源識別代號

 

 

302 $a

 

 

資源類型或語言

 

 

303 $a

 

 

簡述

 

著錄依據

304 $a

 

 

簡述

 

題名與著者附註

305 $a

 

 

簡述

 

版本

306 $a

 

 

簡述

 

出版附註

307 $a

 

 

簡述

 

稽核項附註

308 $a

 

 

簡述

 

集叢附註

310 $a

 

 

簡述

 

 

311 $a

 

 

關連