關鍵字:國家檔案、權威控制、都柏林核心集、機讀權威記錄格式、美麗島事件檔案、名稱權威記錄格式、主題權威記錄格式、地名權威記錄格式、ISAAR (CPF)

 

一、       研究緣起

 

編目規則、機讀格式、和權威記錄一直以來是圖書館技術服務的三個主要工具(或支柱),而這也適用於檔案資料的整理。在編目規則部份,薛理桂教授有「我國檔案編目現況與中文檔案編目規則擬訂之研究」(民國89年)的國科會研究報告;在機讀格式或Metadata部份,有陳昭珍教授「我國國家檔案描述標準化之研究」的檔案管理局委託研究報告,與薛理桂教授「中文檔案機讀編目格式之研究」(民國88年)的國科會研究報告。檔案管理局為求其業務的順利推動,對於檔案資料的權威控制課題,有必要做進一步深入的探討。

檔案目錄係組織檔案資訊及提供檢索檔案之工具,為讓檔案涉及之主題、人名、團體名稱及地名等之著錄具一致性,以及建立相關名稱參照關係,俾提高目錄查檢之正確性及效能,為檔案資料整理的重要課題之一。

再者,國家檔案(例如二二八事件、美麗島事件及國民大會等檔案),其類別多元,且涵蓋之時間範圍及內容不同,因此如何配合檔案類別來規劃適合的權威控制架構,亦為檔案資料整理的重要課題之一。

權威控制係針對檔案著錄內容,如涉及之主題、人名、團體名稱及地名等進行詞彙控制,亦即透過檔案著錄規範及系統功能,促使相關概念或主題聚集,提高檢索精確率;是以,建立權威檔及確立其線上運作方式,以利檔案目錄之著錄及查檢作業極為重要。


二、       研究目的

 

本研究計畫之目的,在確立適用我國國家檔案描述權威控制之架構與方式,並以美麗島事件檔案為對象,實作國家檔案個人及團體名稱權威紀錄之著錄。研究重點,乃是一方面透過廣泛蒐集國內外檔案館其檔案描述權威控制項目、描述方式、系統運作及權威檔建置等現況;另一方面配合國家檔案之內容及類別,就目錄使用與管理需求,研議可行之國家檔案權威檔描述格式和權威控制作業方式,以提高國家檔案目錄之正確性,俾發揮目錄之效能。

本研究計畫預期達成目標主要有下列項目:

1.        了解檔案資料著錄人員的權威控制需求。

2.        制定適合國家檔案多樣性之檔案權威檔描述格式。

3.        完成人名權威檔的著錄項目設計。

4.        完成團體名稱權威檔的著錄項目設計。

5.        完成主題權威檔的著錄項目設計。

6.        建議適當的權威控制作業模式。

7.        建議適當的權威控制作業方式和程序,以提高國家檔案目錄之正確性。

8.        依據研究結果,以美麗島事件檔案為對象,實作國家檔案個人名稱權威紀錄之著錄。

 

三、       研究方法與步驟

 

本計畫的研究方法主要有:

1.          文獻分析法:蒐集國內外相關文獻來了解(a)檔案權威控制的需求和功能;(b)國內外檔案館其檔案描述權威控制項目、描述方式、系統運作及權威檔建置等現況;(c)國內外圖書館的權威記錄、作業方式、與權威檔建置等現況,以資借鏡。

2.          資料著錄人員訪談與問卷調查:針對檔案資料著錄人員來進行訪談或問卷調查,以了解其作業方式與權威控制的需求。調查對象包括(a)檔案管理局資料著錄人員;(b)國內其他著名檔案機關之資料著錄人員。

3.          使用者訪談與問卷調查:針對檔案資料使用者來進行訪談或問卷調查,以了解其需求。

4.          實作:設計適合國家檔案多樣性之檔案權威檔描述格式與各種權威檔(如人名權威檔和主題權威檔等)的著錄項目,並建置一個簡易的(電腦)實驗系統,以供檔案資料著錄人員來進行測試。

5.          個案研究:以檔案管理局的美麗島事件檔案為對象,進行個案研究,以了解所設計的檔案權威檔描述格式和人名權威檔著錄項目是否恰當。

 

四、       研究範圍與限制

 

本研究由於人力與時間的不足,研究範圍有以下的限制:

1.          在收集的資料文獻上以中英文為主。

2.          在國外檔案館的資料收集上,以國家級的檔案機構為原則,包括美國和澳洲。

3.          以目前國家檔案為主要研究對象。

 

五、       主要研究結果與建議

 

(一)國內外主要檔案相關機構之權威控制作業

 

針對美國國家檔案暨文件署(NARA)、澳洲國家檔案局(NAA)、國史館、中研院近史所檔案館等4個國內外主要檔案機構之權威控制作業方式,做綜合整理比較,比較的重點分別為權威檔格式與種類、權威記錄新增與審核方式、編目作業與權威記錄查核配合方式等三方面。

 

檔案機構

權威檔格式與種類

權威記錄新增與審核方式

編目作業與權威記錄查核配合方式

美國國家檔案暨文件署(NARA

權威檔有人名、機構、地名、主題等種類。

權威檔主要使用機讀權威記錄格式,少數使用LCDRG

主題權威檔使用LCSH標題表。

*新增與審核皆採集中專人處理方式。

*權威記錄查核由編目人員負責,且為編目作業的一環。

澳洲國家檔案局(NAA

*權威檔有組織、機構、個人等種類。

*權威檔使用自訂的CRS格式。

*由其權威記錄累積速度非常緩慢推測,應採集中專人處理方式。。

*由其權威記錄有專屬查詢網頁推測,權威記錄查核應由編目人員負責,且為編目作業的一環。。

國史館

*目前有人名權威檔。

*權威檔使用以機讀權威記錄格式為藍本的自訂格式。

*新增與審核皆採集中專人處理方式。

*目前編目作業與權威記錄分開進行,但是編目人員會使用特殊符號來標示須做權威控制的詞彙。

中研院近史所檔案館

*目前有外交人名權威檔(外交人員資料庫)和外交人名及職銜詞彙權威控制檔。

*權威檔使用自訂格式。

*新增與審核皆採集中專人處理方式。

*由於編目記錄已完成在先,故目前祇是補做權威控制部分。

 

由上述表格可以歸納出以下的結論

1.          權威檔格式方面:除了澳洲國家檔案局完全自訂外,其餘檔案機構目前是直接採用圖書館使用的機讀權威記錄格式,或者參考其格式來訂定。

2.          權威記錄新增與審核方式:基本上都是採取集中專人處理方式。

3.          編目作業與權威記錄查核配合方式由於各檔案機構的發展過程不同,因此目前呈現較分岐情況,但權威記錄查核成為編目作業的一環是未來共通的趨勢。

 

(二)美麗島事件資訊網LOG檔分析摘要

透過資訊系統自動記錄的檢索相關資料(即LOG檔)之統計分析,可以來了解使用者檢索的習慣。根據來自民國九十三年四月十五日訪問檔案管理局徵集組時所取得的LOG檔,可以歸納出以下的結論

1.            所有欄位的關鍵詞查詢方面:人名查詢有769次,佔總查詢次數1250次的61.52%,由此可知,檔案方面的查詢,以人名查詢佔絕大多數,也因此可見名稱權威檔的重要性。

2.            指定「主題」欄位的查詢方面,總計有101次查詢,但是其中人名查詢有60次,佔總查詢次數的59.41%,仍然是人名查詢佔絕大多數,因此可知在檔案資料上,名稱權威檔與一般主題權威檔的相對重要性。

3.            指定欄位的查詢上,機關名稱之查詢總計有950次,對比上述的指定欄位之主題查詢,機關名稱的查詢頻率是相當高。

 

 

(三)使用者問卷調查的重要發現

為了調查使用者於實際使用網路檔案檢索系統時,所遭遇的困難與需求,乃設計了如附錄一所示的問卷。施測地點有三處:國史館、中央研究院近史所檔案館、和檔案管理局。由於一般檔案機構的使用者較少,且來館時間不定,因此在施測方式上是委請檔案機構的同仁代發問卷給來館的使用者。施測時間是民國935月中旬至民國938月底止的二個多月期間。

總計回收16份問卷,其中國史館有10份,中央研究院近史所檔案館有4份,檔案管理局有2份。推測問卷回收份數較少的原因,一方面可能是目前國內檔案使用的人數較少;一方面可能是施測時間主要在暑假,所以走訪檔案館的使用者較少。由於回收份數較少,因此以下歸納出的發現,僅供初步參考

1.            在受訪者的背景資料方面:其中有10人具有歷史系所背景,有1人就讀法研所,有1人讀言語社會系所,有4人未知。可見目前大多數檔案資料的使用者仍為具歷史系所背景者,因此使用者來源可說是非常狹窄,宜想辦法多吸引其他背景者來使用檔案資料,方能使檔案事業的發展步入坦途。

2.            曾使用過檔案管理局之網路檔案檢索系統查詢資料者有11人(佔全體68.8%)。

3.            欄位檢索方式:有93.3%的人使用「輸入關鍵字詞,不分欄位」的方式進行檢索。有40%的人會使用「指定欄位」。有45.5%的人會使用「指定多欄位」的方式檢索。

4.            習慣檢索的指定欄位:以排名第1習慣和排名第2習慣使用的指定欄位兩者綜合來看,「案名」、「人名」、「主題或標題」這三個欄位的使用頻率最高。

5.            在進行檔案人名檢索時曾遭遇的困難方面:有9人曾遭遇一個人有其他不同稱呼的情況(佔填答總人數15人的60%);有8人曾遭遇同名同姓卻非同一人的情況(佔填答總人數15人的53.3%)。在發生頻率上,「一個人有其他不同稱呼」的平均發生頻率為40%;「同名同姓卻非同一人」的平均發生頻率為44%

6.            在進行檔案地名檢索時曾遭遇的困難方面:有9人曾遭遇一個地名有其他不同稱呼的情況(佔填答總人數14人的64.3%);有8人曾遭遇地名相同卻屬不同地點的情況(佔填答總人數14人的57.1%)。在發生頻率上,「一個地名有其他不同稱呼」的平均發生頻率為31%;「地名相同卻屬不同地點」的平均發生頻率為53%

7.            在進行檔案機關名稱檢索時曾遭遇的困難方面:有7人曾遭遇一個機關有其他不同名稱的情況(佔填答總人數12人的58.3%);有7人曾遭遇名稱相同卻屬不同機關的情況(佔填答總人數12人的58.3%)。在發生頻率上,「一個機關有其他不同名稱」的平均發生頻率為38%;「名稱相同卻屬不同機關」的平均發生頻率為40%

8.            扣除人名、地名和機關名稱,輸入其餘關鍵字詞進行檢索曾遭遇的困難方面:有14人曾遭遇所顯示的資料筆數中出現許多非相關資料的情況(佔填答總人數15人的93.3%);有9人曾出現螢幕記錄顯示查無相關資料,但透過另一關鍵字搜尋,卻可以獲得相關資料的情況(佔填答總人數15人的60%)。在發生頻率上,「所顯示的資料筆數中出現許多非相關資料」的平均發生頻率為60%;「螢幕記錄顯示查無相關資料,但透過另一關鍵字搜尋,卻可以獲得相關資料」的平均發生頻率為23%

 

上述567點的檔案人名、地名、和機關名稱檢索時曾遭遇的困難,可以說是直接針對檔案權威控制需求所設計的問題,由問卷調查所得到的數據,充分顯示檔案權威控制工作有其必要性。

在此要特別聲明,在問卷上有特別註明『以下所稱之「網路檔案檢索系統」,除特別註明者外,皆不限於國家檔案局之網路檔案檢索系統,填卷者可根據自身實際使用相關檔案機構之網路檢索系統的經驗(例如:國史館、中研院近史所檔案館…等),來回答問題。』的語句,因此上述歸納的發現,並非單獨針對檔案管理局的網路檔案檢索系統。

 

(四)建議

在透過親自訪談、電子郵件詢問、網路等方式,來蒐集國內外相關機構之權威控制系統資料後,再加上國內外重要相關的權威控制記錄格式,經過整理和綜合分析後,在此對未來檔案管理局權威控制系統的運作模式與架構提出建議,做為將來檔案管理局建置權威控制系統的參考。

在進行的方法上,採取從宏觀到細部的方式進行,因此下面是先就系統架構和運作模式的整體,提出若干設計原則;確立整體的設計原則後,接著再依據這些原則,就權威控制的實際運作方式與流程提出建議;最後,就權威檔(或權威記錄)的格式或欄位做出建議。

系統架構和權威檔方面,歸納出下列六項設計原則

1.            權威記錄與檔案記錄的格式分離

2.            權威記錄應與檔案記錄緊密結合

3.            控制語彙檢索與非控制語彙檢索(關鍵詞檢索)併行。

4.            各種權威檔(或權威記錄)的Metadata格式盡可能統一和保持彈性:建議採取都柏林核心集(Dublin Core),或者仿其修飾詞的柔性形式,做為檔案管理局未來各種權威檔的元資料格式,以收統一和彈性之利

5.            名稱權威檔採二部(分離)式以保持彈性,即建置二個功能不同的權威檔:一個類似圖書館使用的「名稱權威檔」,主要側重在權威控制功能。一個類似ISAAR(CPF)的「名稱權威參考資料檔」,但是不指定權威標目,或是see的標目,換言之,這是一個機構、個人、家族名稱的參考資料檔。

6.            權威檔資料建置應盡可能整合各界力量。

 

在權威控制的實際運作方式與流程建議方面,歸納出下列六項建議:

1.            權威記錄的新增和審核採集中專人作業方式

2.            權威資料的查核採分散式並與編目作業流程相結合

3.            應制定權威資料的編目手冊來規範權威控制作業

4.            名稱權威檔的建置應單獨優先進行。

5.            權威記錄應開放給使用者查詢。

6.            檔案記錄實施權威控制的欄位應使用權威記錄識別碼。

 

至於實際的名稱權威檔、主題權威檔、和地名權威檔之格式和欄位,由於篇幅過長,請直接參考第六章中的說明和表格;另外,名稱權威檔、主題權威檔、和地名權威檔之DC格式對照表,也請直接參考第七章。

總結而言,雖然權威控制做起來費時費力,但以本研究報告的主題「國家檔案」來說,基於下述的二個原因,國家檔案的權威控制,並非「做與不做」的問題,而是「何時開始做」和「如何做」的問題。

1.          國家檔案永久典藏的特性。

2.          在可預見的將來,電腦自動化的相關處理技術,尚無法有效來取代權威控制技術以達成下列三個主要功能:一是將同一人事物的不同名稱透過相互參照連結起來;一是將同一名稱的不同人事物區分開來;一是將相關的人事物透過相互參照連結起來。

在「如何做」部份,建議先從人名與機構名稱開始做起(例如EAD權威控制中的個人名稱欄位,這是檔案記錄與權威記錄兩者接合處),並且先採用較簡易的權威記錄格式(如本報告表6-1建議的名稱權威檔),一方面可以達成權威控制的基本功能,一方面可以節省大量的時間、人力、與成本。

在人力配置方面,建議檔案管理局在組織內配置一人專門負責權威控制的相關事務,包括權威記錄工作的外包作業、權威記錄品質的管核與監督、新增權威記錄的審核等。由於權威控制的工作相當繁重,最好能使其專責此事,以便長時間來培養其權威控制的能力與知識。

至於實際的權威記錄建置工作,最好是委外請國內相關圖書資訊系所教授編目課程的老師負責,帶領研究所或高年級學生來做,然後再依據檔案特性,請相關專門學科的老師與學生一起搭配進行。這樣一來,可以同時有快速、品質、省人力的好處。

在處理的檔案選擇上,建議先從範圍較固定和檔案文件數量較少者開始做起,一方面較易進行與完成,一方面可以累積經驗。

其他可以運用的策略,包括更深入的使用者調查,以更精確找出來造成檔案使用者困擾的問題來源,如在本研究報告第五章第二節「使用者問卷調查分析」所描述的種種發現。再者,充分運用其他已建置好的權威資料,如在本研究報告第五章第四節之「美麗島事件檔案之人名與國家圖書館中文名稱權威資料庫的比對分析」所做的工作。最後,正如有評審委員提到的,LOG檔也是很有價值的資料來源(一如在本研究報告第五章第一節「美麗島事件資訊網LOG檔分析」中所做的分析),可以協助標示出那些人名的權威記錄應該優先進行。