自序

本書《都柏林核心集探討:機讀編目格式與檢索失誤率》是作者所寫作有關都柏林核心集的第二本專書,相較於第一本書《都柏林核心集與元資料系統》的偏重基本和全面性介紹,本書則是深入的探討都柏林核心集在圖書館、資料處理與檢索等方面的理論與實務課題。

都柏林核心集是資源描述型元資料(Metadata)的一種,元資料主要是描述資料屬性的資訊,用來支持如指示儲存位置、資源尋找、文件紀錄、評價、過濾等的功能。以圖書館的角度來看,就其本義和功能而言,元資料可說是電子式目錄,因為編製目錄的目的,即在描述收藏資料的內容或特色,進而達成協助資料檢索的目的。因此元資料是用來揭示各類型電子文件或檔案的內容和其他特性,其典型的作業環境是電腦網路作業環境。換言之,元資料是因應現代資料處理上的二大挑戰而興起的:一是電子檔案成為資料的主流,另外一個是網路上大量文件的管理和檢索需求。

值得注意的,雖然從圖書館界的角度來看,元資料的功用和角色跟目錄相似,資源描述型元資料也是當今元資料的主流,但是元資料不等於書目描述資料,因為那祇是元資料中的一類,尚有其他種類的元資料扮演不同的角色,例如元資料中可放入與資料安全相關的資訊,像是數位簽名等。

附帶一提的,有很多人曾問作者為何要將Metadata翻譯成「元資料」,主要是因為字首meta表示「結構」的意思,而且已在很多理工的領域中被廣泛使用,作者在參閱大部分的理工辭典對Meta-language等的翻譯後,也將meta字首翻成「元」,是取其「結構」之義,而非「最初」之義。既然將其引進到圖書館學和資訊科學領域時,其使用方式和本義並無不同,為尊重學術慣例,理應加以沿用,以避免無謂的困擾,因此將Metadata翻譯成「元資料」。

由於都柏林核心集(Dublin Core)自作者的第一本書《都柏林核心集與元資料系統》出版後,又有不小的變化,因此本書中很多都柏林核心集的相關部份,已重新改寫或者修訂過。現在將本書的章節介紹如下:第一章是元資料的興起背景與簡介,使讀者對元資料興起的背景能有充分的了解,進而對未來資料處理與檢索方面的發展趨勢,能有更清晰的認知。第二章都柏林核心集,是有關於都柏林核心集的詳細介紹。

第三章機讀編目格式轉換是本書兩個主要探討的課題之一,作者創造了幾個轉換的原則,不但順利的將較複雜的機讀編目格式轉換成較簡單的都柏林核心集,還同時達成了兩個主要的目標:一是不損傷都柏林核心集原有的架構和格式;一是資訊的損失非常低,幾乎是沒什麼資訊的流失。因此這幾個轉換的原則,不但充分發揮了都柏林核心集的彈性,也提示了將來傳統印刷媒體資料和電子印刷媒體資料合併處理的可能性。第四章是介紹都柏林核心集到機讀編目格式的格式轉換,主要是都柏林核心集轉換到國際機讀編目格式(UNIMARC)、美國機讀編目格式(USMARC)、中國機讀編目格式(Chinese MARC)的分析。

第五章分散式元資料系統(DIMES),由於作者所寫的一個都柏林核心集實驗系統,已經過大幅度的改寫和換名,所以特別加以詳盡介紹,也使讀者對第六章所提的實驗,其實作環境能有充分的認識。第六章是都柏林核心集與檢索失誤率,雖然祇進行了一個簡單的先導式實驗,但是透過作者親自設計的實驗方法,其實驗結果清楚的證明了都柏林核心集在資訊檢索上所能扮演的角色,和可達到的功效。更重要的,為了能明白闡釋實驗的數據與結果,作者創造了一個新的檢索系統衡量標準--「檢索失誤率」,不但可以有效克服傳統衡量標準-回收率和精確率的種種缺失,更可以用來作為各種檢索系統(如圖書館自動化系統中的線上公用目錄查詢系統、光碟資料庫、WWW的搜尋引擎)的共通衡量標準,對未來檢索系統的評估與設計,有深遠和重大的影響。

作者撰寫本書時雖然力求完善,然而一己的能力畢竟有限,疏漏在所難免,尚祈各界先進和同業不吝指正。最後本書的完成,要感謝家人和同儕的協助,也是本書完成不可或缺的助力,在此表達最深的謝意。

 

                                        吳政叡 謹識

民國87年11月

於輔仁大學圖書資訊系