吳政叡 (Cheng-Juei Wu)
輔仁大學圖書資訊系專任副教授
E-mail: lins1022@fujens.fju.edu.tw
中文摘要
為了推廣都柏林核心集在國內的應用,使圖書館界在機讀編目格式中所累積的龐大資源,也能被都柏林核心集的系統所利用。本文介紹國內圖書館目前使用最廣泛的機讀編目格式版本─中國機讀編目格式(Chinese MARC)第三版到都柏林核心集的轉換,此外本文也簡略的統計了第三版和第四版在欄位上的差異。
關鍵字:元資料,中國機讀編目格式,都柏林核心集,Metadata,Chinese MARC,Dublin Core。
一、前言
中國機讀編目格式的發展歷程,根據王振鵠教授在「中國機讀編目格式」第三版中的序言描述,首先是在民國 69 年 5 月成立「中文機讀編目格式工作小組」進行研定,主要是依據「國際機讀編目格式」(UNIMARC-1980)、「美國國會圖書館書目機讀編目格式」(MARC Formats for Bibliographic Data-1980)、ISO 2709 格式來制定,於民國 70 年 1 月正式刊行中國圖書機讀編目格式第一版,同年 7 月第二版修訂出版。隨後又修訂加入連續性出版品、地圖、音樂、視聽資料等,在民國 71 年發行新版,並且更名為「中國機讀編目格式」(Chinese MARC),民國 73 年又根據國際圖書館協會聯盟 1983 年編訂的 UNIMARC Handbook ,修訂出版第二版,第三版則於民國 77 年出版,第四版甫於民國86 年 6 月修訂出版。
都柏林核心集為元資料的一種,是1995年3月由國際圖書館電腦中心(OCLC)和National Center for Supercomputing Applications(NCSA)所聯合贊助的研討會,在邀請五十二位來自圖書館、電腦、網路方面的學者和專家,共同研討下的產物,目的是希望建立一套描述網路上電子文件特色的方法,來協助資訊檢索。研討會的中心問題是--如何用一個簡單的元資料記錄來描述種類繁多的電子物件?[註 1] 主要的目標是發展一個簡單有彈性,且非圖書館專業人員也可輕易了解和使用的資料描述格式,來描述網路上的電子文件。在其欄位方面,則祇有15個基本欄位(或項目),有關欄位的名稱、詳細闡釋、例子、與著錄要點,請參閱作者《都柏林核心集在UNIMARC和機讀權威紀錄格式的應用探討》一書中的第一章第四節「基本欄位」。[註2] 至於都柏林核心集修飾詞的內涵與演變,請參閱上述專著的第一章第五節「修飾詞」和第五章第一節「DC/RDF模型」中的介紹。[註3]
為了推廣都柏林核心集在國內的應用,使圖書館界在機讀編目格式中所累積的龐大資源,也能被都柏林核心集的系統所利用,有必要製作適當的對照表,來將以機讀編目格式(MARC)為儲存格式的資料,轉換到以都柏林核心集為格式的系統。
雖然「中國機讀編目格式」第四版已於民國86 年 6 月出版,但是國內大部份自動化系統,(在本文寫作期間)還是使用第三版為主,因此就機讀編目格式的應用而言,目前可以說是處於第三版與第四版的過渡銜接時期。蔡燕青在「談線上編目」一文中,雖然有扼要敘述第四版和第三版的差異 [註4],但仍不足以來清楚明瞭兩版本間的差異情況。
根據作者就「中國機讀編目格式」第三版與第四版,以欄號為比較單位,所做的分析和統計,發現至少有110項的欄號差異:
(1)第三版有,而第四版無的欄號,總計有71項。
(2)第三版無,而第四版有的欄號,總計有34項。
(3)第三版與第四版欄號相同,但是內容性質完全不同者,分別為欄號530、531、540、541、780,總計有5項。
如果以段的層次來分析,則在3__附註段、4__連接款目段、5__相關題名段等三個段上有極大的變動:
(1)3__附註段:第三版有29項欄號,而第四版縮減成4項。
(2)4__連接款目段:第三版有26項欄號,但第四版則取消此段,將絕大多數欄號併入5__相關題名段。
(3)5__相關題名段:第四版中由於併入4__連接款目段的欄號而項目數量大增,總計有36項欄號;而第三版的相關題名段則祇有16項欄號。除此之外,第四版中為了容納新增加的欄號,被迫遷移原先第三版中屬於其他相關題名的欄號--520、530、531、532、540、541等6項欄號,在第四版中遷移到欄號550-555,直接造成530、531、540、541等4項欄號,在第三版與第四版中產生欄號相同,但是內容性質完全不同的情形。
雖然上面的比較和分析非常簡略,但仍足以顯示第三版和第四版間有不小的變動,因此若是直接參照《機讀編目格式在都柏林核心集的應用探討》一書中第三章的第四版對照表,來嘗試轉換依據第三版機讀編目格式製作的書目資料,不但是非常麻煩,且非常容易出錯。基於以上的考量,作者以為有另外製作第三版的對照表的必要,而不能以第四版對照表來代替。
三、轉換對照表的基本原則和方法解說
為節省篇幅,本書中將祇列出表格,而省略表格後的說明與解釋。另一方面,與第四版完全無差異,而可直接使用第四版對照表的欄號也不再贅述,祇於對照表前列出欄號,請讀者自行參閱《機讀編目格式在都柏林核心集的應用探討》一書中的第四版對照表。[註5]同時以下的中國機讀編目格式第三版到都柏林核心集轉換對照表,其製作方法和符號使用的簡要說明,也與第四版大致相同 [註6],祇有在修飾詞的使用上有所差異,請參見下面的說明。
由於都柏林核心集的修飾詞目前正處於轉變中,有DC5時確立的DC/HTML模型,和正在發展中的DC/RDF模型。因為DC7(第七次研討會)已開始採取DC/RDF模型中的名稱,因此以下的表格,遵循DC7的用法。此外根據都柏林核心集之資料模型工作小組1999年7月1日所發表的草案Guidance on expressing the Dublin Core within the Resource Description Framework (RDF) [註7],有內容值修飾詞(Value Qualifier)和內容值修飾詞彙(Value Qualifier Term)的區分;同樣的,也有項目修飾詞(Element Qualifier)與項目修飾詞彙(Element Qualifier Term)的區分。但是真正修飾詞的資訊是蘊涵在內容值修飾詞彙(Value Qualifier Term)和項目修飾詞彙(Element Qualifier Term),而所謂的詞彙內容正是DC5中修飾詞的內容,因此嚴格說來,DC5中架構修飾詞(Scheme Qualifier)的內容相當於資料模型工作小組草案中的內容值修飾詞彙(Value Qualifier Term),而DC5中次項目修飾詞(Subelement Qualifier)的內容相當於草案中的項目修飾詞彙(Element Qualifier Term)。[註8]
四、0__識別段和1__代碼資料段
0__識別段省略的欄號計有:001、005、009、020、042、050等6個欄號。另一方面,與第四版完全無差異,而可直接使用第四版對照表的欄號有:010、011、021、022、040等5個欄號。
表1. 中國機讀編目格式(第三版)0__識別段欄號的對照表。
|
中國機讀編目格式 |
都柏林核心集 |
||||
|
欄位 |
位址 |
指標 |
欄位 |
修飾詞 |
|
|
Value Qualifier Term |
Element Qualifier Term |
||||
|
025 $a |
|
|
資源識別代號 |
{$b} |
銷售號 |
|
025 $z |
|
|
資源識別代號 |
{$b} |
銷售號錯誤碼 |
|
071 $a |
|
|
資源識別代號 |
{$b} |
出版者資料編號 |
1__代碼資料段省略的欄號有:100 $a(位址0-7、9-16、21-34)、102 $b和$c、110 $a(位址8)。另一方面,與第四版完全無差異,而可直接使用第四版對照表的欄號有:100、101、105、106、110、115、116、120、121、122、123、124、125、126、127、128、129、130、131等19個欄號。
表2. 中國機讀編目格式(第三版)1__代碼資料段欄號的對照表。
|
中國機讀編目格式 |
都柏林核心集 |
||||
|
欄位 |
位址 |
指標 |
欄位 |
修飾詞 |
|
|
Value Qualifier Term |
Element Qualifier Term |
||||
|
102 $a |
|
|
出版者 |
|
出版地 |
|
135 $a |
0 |
|
資源類型 |
|
|
五、2__著錄段
此段與第四版完全無差異,而可直接使用第四版對照表的欄號有:200、204、205、206、207、208、209等7個欄號。
表3. 中國機讀編目格式(第三版)2__著錄段欄號的對照表。
|
中國機讀編目格式 |
都柏林核心集 |
||||
|
欄位 |
位址 |
指標 |
欄位 |
修飾詞 |
|
|
Value Qualifier Term |
Element Qualifier Term |
||||
|
210 $a+$b |
|
|
出版者 |
|
出版地 |
|
210 $c |
|
|
出版者 |
|
|
|
210 $d |
|
|
出版日期 |
|
|
|
210 $e+$f |
|
|
簡述 |
|
印製地 |
|
210 $g |
|
|
簡述 |
|
印製者 |
|
210 $h |
|
|
出版日期 |
|
印製日期 |
|
211 $a |
|
|
出版日期 |
|
預定出版日期 |
|
215 $a |
|
|
資料格式 |
|
稽核資料(數量) |
|
215 $c |
|
|
資料格式 |
|
|
|
215 $d |
|
|
資料格式 |
|
尺寸 |
|
215 $e |
|
|
簡述 |
|
附件 |
|
225 $a+$e |
|
|
題名 |
|
集叢正題名 |
|
225 $d |
|
|
題名 |
{$z} |
集叢並列題名 |
|
225 $f |
|
|
著者 |
|
集叢著者 |
|
225 $h |
|
|
簡述 |
|
集叢編次 |
|
225 $i |
|
|
簡述 |
|
集叢編次名稱 |
|
225 $v |
|
|
簡述 |
|
集叢號 |
|
225 $x |
|
|
資源識別代號 |
國際標準叢刊號(ISSN) |
|
|
225 $r |
|
|
題名 |
羅馬拼音 |
集叢正題名 |
六、3__附註段
由於3__附註段中各欄號的分欄 $u,其內容與分欄 $a相同,用途主要是以英文來敘述,以便利國際書目交換之用。為了避免資料重複,因此將分欄 $u省略。
表4. 中國機讀編目格式(第三版)3__附註段欄號的對照表。
|
中國機讀編目格式 |
都柏林核心集 |
||||
|
欄位 |
位址 |
指標 |
欄位 |
修飾詞 |
|
|
Value Qualifier Term |
Element Qualifier Term |
||||
|
300 $a |
|
|
簡述 |
|
|
|
301 $a |
|
|
資源識別代號 |
|
|
|
302 $a |
|
|
資源類型或語言 |
|
|
|
303 $a |
|
|
簡述 |
|
著錄依據 |
|
304 $a |
|
|
簡述 |
|
題名與著者附註 |
|
305 $a |
|
|
簡述 |
|
版本 |
|
306 $a |
|
|
簡述 |
|
出版附註 |
|
307 $a |
|
|
簡述 |
|
稽核項附註 |
|
308 $a |
|
|
簡述 |
|
集叢附註 |
|
310 $a |
|
|
簡述 |
|
|
|
311 $a |
|
|
關連 |
||