淺談電子圖書館的發展

圖書館學刊 25 , pp. 23-31, 85 6 , 輔仁大學圖書資訊系發行

吳政叡 April 2, 1996

自從美國柯林頓政府於1994年提出 National Information Superhighway 的口號後,digital library(DL) 逐漸受到重視,因為它是 NII(National Information Infrastructure) 的核心,NSF/APRA/NASA(the National Science foundation/the Department of Defense Advanced Research Projects Agency/ the National Aeronauticsand Space Administration) 也於 1993 [1] 年徵求 Initiatives,選中 Carnegie Mellon University 6所大學的提案(見下面的介紹),雖然此領域仍處於初期發展階段,但由於它的發展將深深影響到圖書館的教育與運作,故本文擬從對 DL 的簡介,和 NSF/APRA/NASA 所贊助幾個專案的介紹,來一窺此領域的全貌,並由對一些常見問題的討論,來看 DL 對圖書館的教育與運作所可能帶來的衝擊。

一、Digital Library(DL) 的簡介

首先到底 DL (電子圖書館或數位圖書館)所指為何,包含那些內容。從字面上看,digital library digital 暗示其主要處理對象為電子媒體,相對於我們所熟悉的紙張媒體,如書本等。更精確的說,資料是以數位形態儲存於電子或磁性物質上,藉由電腦與網路,資料可更容易加工處理和傳播。那為何與Library牽扯上關係呢?此處的 library 不是圖書館,而是取其功能而言,圖書館的主要功能有四:[3]

(1)收藏與保存

(2)組織和呈現

(3)存取與檢索

(4)分析、綜合與傳播

換言之,DL所應用的場合與組織,將擴及任何提供部份或全部上列功能的機構,包含圖書館及形形色色的資料中心與資料庫。

以下舉一些見於文獻的定義:

(1) "A digital library is a distributed technology environment which dramatically reduces barriers to the creation, dissemination, manipulation, storage, integration, and reuse of information by individuals and groups." [2]

(2) "Digital Libraries were viewed as system providing a community of users with coherent access to a large, organized repository of information and knowledge." [4]

(3) "A digital library service is an assemblage of digital computing, storage, and communications machinery together with the software needed to reproduce, emulate, and extend the services provided by conventional libraries based on paper and other material means of collecting, storing, cataloging, finding and disseminating information." [3]

Fox, et al [5],提及一個有趣的現象,DL似乎給不同專業的人,不同的印象和內容,如:

(1)圖書館專業的人--傳統圖書館的電子化;或是以不同方式來執行圖書館的功能 (舊瓶裝新酒?或新瓶裝舊酒?),如新的資料獲取方式,新的儲存和保存方式等。

(2)電腦專業的人--一個大型的分散式資訊系統。

(3)一般 WWW 的使用者--一個更好用和有效率的網路。

一般而言,相對於傳統圖書館,電子圖書館有以下的特色:[3]

(1)不受空間限制,可同時從多處來源收集資料。

(2)可查核使用者身份,並依使用者身份來限制使用或顯示部份館藏。

(3)可建立虛擬館藏。

(4)方件間可輕易互相連結起來 (如目前 WWW 上的方式)

總言之,相較於傳統圖書館,電子圖書館有以下的優點:透過網路,讀者可全天候 (即不受時間限制) 同時到全世界各地 (即無空間限制) 的資料中心或圖書館 (即多來源) 找尋所需資料;不像傳統圖書館須在開放的時間內 (即有時間限制),親自到館 (即有空間限制) 查尋館內所擁有的館藏 (即單一來源)。因此資訊的傳播和搜尋更加快速。在圖書館方面,可利用電腦來充份管制不正當的資料使用,也可依使用者身份來劃分館藏(在傳統圖書館中,此措施極難實施)。同時館員可依讀者的需求,來建立虛擬館藏(即所顯示的書目資料,不受限於自身館藏)。簡言之,雖然 DL 所包含的功能,部份已可以在現存的圖書館中或網路上 ( WWW) 達成,但 DL 將它們統一在一個完整的架構下,以一致和親善的介面,呈現給使用者(即將各系統間的差異隱藏起來),同時以更有效率的方式來運作和服務使用者。

二、NSF/APRA/NASA 所贊助的六個專案計劃簡介

以下的介紹大多摘錄自 1995 4 月份 Communications of the ACM digital libraries 專刊,和 NSF/APRA/NASA 所發布的贊助提案宣布聲明。

首先,如在宣布聲明中所指出,DL專案的重點,是研究如何在電子(數位)資訊的收集、儲存和組織方面,取得大幅度的進步,同時以使用者親善的介面,透過網路來檢索和加工處理這些資訊。

其次這六個專案各有其特色和焦點,分別介紹如下:

(1)Carnegie Mellon University:

目標是創造一個線上的互動式數位影像資料館,將以 1000 個小時的教育錄影帶為試驗對象。

(2)University of California--Santa Barbara

目標是創造一個以地理性資料為主的電子圖書館,所收集資料涵蓋任何與地理有關的資料,如地圖、衛星照片等。

(3)Stanford University:

目標是建造一個統合的虛擬圖書館,可統合現存的科技,和提供使用者一個一致和方便的使用介面,其資料以文字媒體為主。

(4)University of Michigan:

目標是創造一個大型的多媒體電子圖書館,其主要收集對象是地球和太空科學相關的資料。

(5)University of California--Berkeley:

目標是建立一個有關環境資訊的電子圖書館,收集範圍以跟環境評估和影響相關的資料為主。

(6)University of Illinois:

建立一個以現存的 WWW Mosaic 為基礎的電子圖書館,所收集資料以工程和科學的文獻為主要的收集對象。

此外,作者也觀察到以下一些現象:

(1)地理性資料似乎佔很重的比例,至少有三個專案計劃,是以地理性資料為主要的處理對象。這反映美國甚重視地理方面的研究,相較於國內,地理性資料似乎為被遺忘的一群。

(2)專案計劃都跟商業機構密切合作,正如 [3] 所指出,DL 發展的一大特色,是商業活動和學術研究一起開始展開的,兩者關係密切。所有六個專案都有一些知名的電腦公司和商業機構,做為合作夥伴,這意謂專案的成果,將很快商業化,使 DL 普及的速度加快。

(3)至少有二個專案計劃跟教學扯上關係,其中 University of Michigan 的專案計劃,將直接包含中學生,為測試使用者群的一部份,顯示美國的 DL 並不祇以支援舉術研究為主,也支援一般教學。

(4)四個專案計劃是以非文字媒體為主,尤其 Carnegie Mellon University Informedia 專案計劃,是直接針對錄影帶,其所牽涉的影像和聲音處理相關技術,甚多且艱難,值得密切注意。

三、一些常見問題的討論

問題一、紙張媒體會不會消失:

雖然有些人認為紙張媒體將會消失,如果不是立刻,也是在不久的將來。但大多數人仍不認為紙張會消失 [5],至少在可預見的將來,仍會在我們的生活中佔有一席之地。從歷史的角度來看,收音機和電視機之間的關係,提供我們一個思考的借鏡,雖然在電視機發明後,有人預測收音機會迅速消失,但事實證明,收音機不但沒有消失,還仍被廣泛的使用,而且也沒有人預期它們會在不久的將來消失。探究其原因,固然電視同時提供聲音和影像,給我們比收音機的純粹聲音,更多采多姿的感受。但電視台的經營不易,須龐大資本,不如廣播電台的靈活,更適合小群體。此外電視機同時佔用我們的視覺和聽覺,不像收音機祇利用聽覺,收聽者仍可用視覺進行其他工作。因此正如 [6] 所言,祇要紙張媒體有電子媒體所無法取代的優點(那怕是祇有一項優勢),紙張媒體與電子媒體共存的現象即不會消失,因此如何來有效的混合二者於同一組織(圖書館)中,即為一重要的研究課題。

以上所言,偏重在科技層面,事實上根據對一個工作團體,其工作場合的實際觀察 [6],和我們目前自身的工作方式,紙張所具有的彈性和便易性,仍是電腦所無法取代的。其實就算是在科技上,電子媒體已能完全取代紙張媒體,由於人類心理和社會方面的需求,紙張媒體也不會完全消失,正如即使我們將善本書和名畫數位化,並不會因此就將它們丟棄,因為它們有某些文化、心理和社會方面的功能。綜合以上所言,個人認為電子媒體的地位與日俱增,和佔總體資料量的比例逐漸加重,已為不可避免的趨勢,祇是其比例增長的速度大部份取決於相關科技的發展速度。因此除非社會發生大倒退,在可預見的將來,電子圖書館將衝擊所有跟資料處理相關的行業(包含圖書館)和人員(包含圖書館員)。另一方面,紙張媒體雖將從支配地位退下,但仍將存在很長一段時間,因此相關的技術如資料的保存與組織,仍須加以傳承和繼續發展。總言之,紙張媒體在可預見的將來不會完全消失,而祇要媒體本身存在一天,其相關的處理技術並不會真正終結。

問題二、智慧財產權:

雖然 Internet (1969 APRAnet 的創建算起)已存在二十幾年 [7],圖書館的 OPAC 系統也在其上運作很長的一段時間,換言之,透過網路查尋圖書館的資料或館藏已存在多時,但有關智慧財產權的話題卻是在DL興起後,才一夕間被熱烈討論。這種現象是因為Internet的早期宗旨之一,即是方便學術界和研究者自由傳播知識,因此免費的資料是其一大特色。而圖書館透過OPAC和網路,公開其館藏和書目資料,也並不侵犯到作者和出版商的版權,反而是免費的宣傳,因此也受到出版界的歡迎,那為何如今DL使圖書館界捲入智慧財產權的漩渦呢?這是因為DL的基本作法是將整部作品(而非祇有書目資料)數位化,以便透過電子網路快速傳播。所以在傳統圖書館中,雖然也有存在不正當利用影印機複印資料的現象,但受限於物理空間的限制,對出版商所造成的侵害規模仍在可忍受的範圍內。諷刺的是,拜網路之賜,此種空間和時間上的限制已打破,網路大量和快速的傳播與再複製資料的能力,一方面使圖書館更能有效率的服務使用者,加強其某方面的功能;但另一方面,卻也由於網路有能力使出版商的版權侵害規模,擴大到威脅它們生存的地步,使得圖書館捲入智慧財產權的紛爭中,也使圖書館一向秉持的自由免費傳播知識的信念和作法,受到嚴苛的考驗。如何在保護出版商的版權,和維持知識的自由流通間取得平衡,已成了重要的研究課題,很多相關的技術也在陸續發展中。[?]可預期的是,DL將包含各式各樣的資料處理和保存機構,使用者將可更方便的收集到更多的資料,祇是荷包可能會稍微消瘦一些。

問題三、MARC會不會消失:

MARC (Machine Readable Catalogue) 是起源於電腦興起後,為了有效利用電腦來處理館藏而創設的,其基本設計宗旨是針對書目資料。很明顯的,在DL的時代,祇利用書目資料來組織和檢索作品已是不夠的。但因為電腦的龐大資料容量,檢索系統極易成為系統運作的瓶頸,故一個高效率的檢索系統實為電子圖書館計劃的成敗關鍵。檢索系統的基礎為其資料庫,資料庫中所含的資料項目和檢索點的設計,決定了檢索系統的功能。在檢索系統的研究文獻中,最常見的資料呈現方式為概念集--{(概念1)(比重1) (概念2)(比重2) ..., (概念n)(比重n)}[9-10],例如圖書館的分類號系統,可詮釋為{(分類號)(1)}

因此從 資訊檢索系統 (Information Retrieval System) 的角度來看,圖書館所使用的分類號和全文檢索,實代表檢索的兩個極端,前者以單一概念來呈現文獻的資料,相反的,全文檢索則以文獻全體來代表文獻。此二者各有利弊,也各有其適用場所,舉例而言,雖然全文檢索可提供最多的功能,但是低檢索效率為其主要的缺點。試想一個含有千百萬種文獻(書籍,文件等)的資料庫系統,如透過網路給成千上萬使用者同時檢索,若是全部使用者皆使用全文檢索,外加多重布林邏輯操作,將可能導至系統的癱瘓。然而,在分類號和全文檢索間還有很多其他的檢索系統(或文獻呈現方法),如索引,引用文獻分析 [11] 等,各個檢索系統也各有其適用場所。那如何來決定資料呈現方式,進而設計出高效率的檢索系統?這有賴於對使用者檢索需求和方式的了解,如 Fox [12],即從對使用者的需求調查,來做為系統設計的基礎。因為不同的使用者有不同的需求,惟有透過對使用者需求的徹底了解,才能找出最佳的平衡點和設計出較佳檢索效率的系統。

簡言之,一個更有效率的資訊檢索系統是必須的,而未來的資訊檢索系統,也將充分利用 DL 以整部作品為資料來源的優勢。因此未來 MARC 的何去何從,將考驗圖書館界和 DL 的研究者,綜觀目前的 DL 計劃和系統( NSF/APRA/NASA 的六個初始計劃),雖然也包含若干圖書館界的人員,但多由電腦或資訊科學的人在主導,因此在很多作法和設計上,也與圖書館界的作法有很大的差異,將來如何整合是一大課題。同時 DL 對圖書館的衝擊將是全面性的,例如目前的圖書館自動化系統,大多以書目資料為設計基點,以紙張媒體為處理對象。但將來DL的系統成熟後,人們不可能在同一機構中維持二套不同的系統,一套以紙張媒體為處理對象,另一套以電子媒體為處理對象,因此如何在未來的DL系統中,能同時有效支持此二種差異極大的媒體資料,也成為一重要的研究課題。例如流通系統,如紙張媒體不消失,將來勢必要有一個整合的DL流通系統,能同時處理網路上的流通(如查核使用者的權限和身份,收取費用,傳送資料等),和目前自動化系統流通系統的功能 (如借還書、逾期通知、預約、查尋等) [13]

四、結論:

拜電腦科技的進步與普及,如個人電腦功能的不斷提昇和網路的普及,資訊處理的技術也不斷的推陳出新,來充分利用新科技的功能。圖書館做為知識儲存與傳播環節中的一環,自不能置身事外,而不受到這一波波新科技的衝擊。然而由於新科技進步的速度太快,不但使人有喘不過氣的壓迫感,也加大各個與資訊處理相關領域的隔闔。

由於 NII 的興起,使為其核心組成子的電子圖書館 (DL),成為熱門的研究課題。DL 將藉由光纖網路和新一代的網路技術 ( ATM),將網際網路 (Internet)進一步伸展成L遠弗屆的資訊高速公路。DL 的主要目標是以一致連貫的介面,來幫助使用者檢索各式各樣的資料儲存所 (包括圖書館) [4]。以一個統一的架構,來整合各式的資料型態:有各種參考資料、書籍、期刊、報紙、電話簿、聲背圖片、影像、各式的商業和私人資料等 [3]

因此電子圖書館可說是最新一波的衝擊,這波衝擊的特色,是其廣泛性與全面性,由前面文章中的介紹,我們知道 DL 計劃的主要宗旨,即是提供一個整合的系統給使用者,因此在作法上, DL 不但嘗試將現存的相關技術,如網路、資料庫、檢索等,納入同一架構中;也將資料處理流程中的每一環節,從收集、儲存、加工處理、到再傳播,全部整合和緊密連結起來。正因為此種整合的特色,使 DL 對圖書館運作的衝擊是全面性的,幾乎涵蓋圖書館的所有功能與層面。

換言之,將來仍會有類似圖書館的組織存在 (即外表風貌變化不大),但組織的運作方式和內部人員將有很大的變化。圖書館在面臨此劇變的十字路口,惟一的因應之道,似乎祇有趁早介入各種 DL 的發展計劃,一方面吸收其他領域的新知,一方面將我們的菁華提供出來,以打破領域間的隔闔。由於電子圖書館牽涉的領域太廣,相關的技術細節和研究課題,無法在此一一詳述,將於日後另以專文介紹。

五、參考書目

[1]. Digital Library Initiative, FY 1994, A joint initiative of the National Science Foundation, the Department of Defense Advanced Research Projects Agency, the National Aeronauticsand Space Administration, U.S. Government document NSF 93-141, 1993.

[2]. E. Fox (ed.), Source book on Digital Libraries, TR 93-95, Dept. of Computer Science, Virginia Tech, 1993.

[3]. H. M. Gladney, et al, "Digital Library: Gross Structure and Requirements: Report from a March 1994 Workshop," IBM Research Report RJ9840, IBM Almaden Research Center, May, 1994. Also available by anonymous FTP from directory pub/DigitalLibrary on info.cs.vt.edu as RJ9840.ps

[4]. C. Lynch and H. Garcia-Molina, "Interoperability, Scaling, and the Digital Libraries Research Agenda," IITA Digital Libraries Workshop, May 1995.

[5]. E. A. Fox, et al, "Digital Libraries," Comm. of the ACM, vol. 38, no. 4, pp. 23-28, 1995.

[6]. D. M. Levy and C. C. Marshall, "Washington's White Horse? A Look at Assumptions Underlying Digital Libraries," in Proceedings of the 1st Annual Conference on the Theory and Practice of Digital Libraries: Digital Libraries '94, (Texas A&M Univ., College Station, TX, June 1994).

[7]. D. P. Dern, The Internet Guide for New Users, McGraw-Hill: N.Y., N.Y., 1994.

[9]. D. Lucarella and K. Morara, "FIRST: Fuzzy Information Retrieval SysTem," J. Information Sci., vol. 17, pp. 81-91, 1991.

[10]. S.-M. Chen and J.-Y. Wang, "Document Retrieval Using Knowledge-Based Fuzzy Information Retrieval Techniques," IEEE SMC-25, no. 5, pp. 793-803, 1995.

[11]. 何光國著,<<文獻計量學導論>>,臺北市:三民書局,1994.

[12]. E.A. Fox, etc., "Users, User Interfaces, and Objects: Envision, a Digital Library," JASIS, vol. 44, no. 8, pp. 480-491, 1993.

[13]. 張慧銖編,<<圖書館學問題研討():圖書館自動化>>,臺北市:文華,民83年。