論版本研究對古籍數字化的學術支撐
古籍數字化就是基于保護和利用古籍的目的,運用計算機技術將古籍文獻的語言文字或圖形符號轉化為能被計算機識別的數字符號,從而制成古籍文獻書目數據庫和古籍全文數據庫,用以揭示古籍文獻信息資源的一項系統工作。古籍數字化是對古籍或古籍內容的再現及加工,是當前古籍整理與研究的一項重大工作,它不僅可以方便學者檢索、使用古籍,而且對于古籍的保存、流傳也極為重要。當前,對古籍數字化起學術支撐作用的因素很多,譬如電腦技術的發展、古籍分類學的研究,其中版本學的研究是一個尤為重要的環節。本文僅是從一個使用者的角度對當前的古籍數據庫提出進一步完善的建議,芻蕘之獻,敬祈斧正。
當前影印古籍價格過于昂貴,普通讀者難以購求,因此古籍數字化實在是當前解決這一日益增長的文化需求的最好方法。通常我們會利用古籍數據庫進行一些相關的文獻取證工作,譬如一些學術概念的演變、人物的生平里貫、引文的核查甚或??钡?。在使用過程中,我們逐步發現,版本學的研究尤其古書版本源流的研究,在古籍數字化的進程中顯得尤為重要。
在古籍庫建設的諸多環節中,擇求善本是其中重要的一環。首先可以為使用者提供更為精確全面的錄文。在構建古籍庫時,我們需要選擇當前最為完善的版本,尤其是經今人精心??闭磉^的本子作為校錄文字的依據。當然,前提建立在今人的整理本對古書的篇卷次第并沒有大的改動,這樣也便于我們對多個版本進行比勘。而當前的古籍庫大多未能很好地滿足這一要求。以《中國基本古籍庫》為例,其每種典籍均提供一個通行版本的全文信息和一到兩個重要版本的原文圖像。但其全文信息所依據的通行版本,并非都是經過精心校勘的版本,亦罕見今人整理??边^的善本。因此,倘若所依據通行本不善,則可能出現衍文、脫文、殘闕等現象。
其次,擇求典型版本,與校錄的文字版本相互對照,不僅可以供檢索、查勘,而且可以為進一步的研究提供多個重要的版本。學術研究,尤重善本。不過,在浩如煙海的古代典籍中,僅有為數不多的典籍經過前人及今人的精心校訂。因此,在古籍數據庫中,如能為使用者提供盡可能多的不同版本的原文圖像,庶幾可彌補古籍善本難求的缺失。即使不能夠網羅所有版本,也應盡最大努力提供典型版本的原文圖像。我們這里所謂的典型版本,主要指兩類:一是隸屬不同版本系統的各祖本,一是稀見的稿抄本、批校本等。
那么,如何才能夠做到擇求善本呢?又如何對典型版本進行確認呢?我想應當具備最起碼的古籍版本學的知識。古籍版本學,包括兩方面的內容:一是講如何鑒別古籍的版本;一是講每種古籍有過哪些版本,其淵源遞嬗關系如何,其中哪些是善本,哪些不善?黃永年先生將后者成為版本目錄學,即講各種古籍的版本的目錄學。(黃永年《古籍整理概論》,上海書店出版社,2001年,8頁)我們進行古籍整理(包括古籍數據庫的建設),如果不懂得這門學問,就根本無從選擇底本、對校本,一切整理工作也就無法進行。我認為可從以下幾個方面著手:
一、通過前人的版本研究
清人對版本的研究頗為重視,自錢曾《讀書敏求記》詳列版本之后,諸家藏書志、題跋多著錄版本信息。如黃丕烈《蕘圃藏書題詩識》(繆荃孫編集)、張金吾《愛日精廬藏書志》、瞿鏞《鐵琴銅劍樓藏書目錄》、陸心源《皕宋樓藏書志》、丁丙《善本書室藏書志》、繆荃孫《藝風藏書記》、葉德輝《郋園讀書志》等,民國以降,學者繼其軌轍,撰寫藏書志之風更熾,傅增湘《藏園群書經眼錄》、張鈞衡《嘉業堂藏書志》、繆荃孫等《適園讀書志》、王重民《中國善本書提要》及《續編》等,均值得珍視。此外,還有一類綜合的版本目錄,即前人在每種古籍下詳細記載傳世的各種版本。如莫友芝《郘亭知見傳本書目》、邵懿辰、邵章《增訂四庫簡明目錄標注》、朱學勤批注《四庫簡明目錄》、范希曾《書目答問補正》、孫殿起《販書偶記》及《續編》。其中孫氏二書專門記載清人、民國初年人著述版本。
以上所列藏書題跋、藏書志等,多涉及古籍版本的諸多信息,我們如果能將其綜合起來考察,基本可以獲知一部典籍的典型版本信息。羅偉國、胡平先生所編《古籍版本題記索引》對我們考察古籍版本非常有幫助,這部索引為有關古籍版本的書目、題跋記、讀書志、書影等102種圖書編纂索引,“按圖索驥”,使用起來非常方便。
二、通過今人的版本研究
前人的版本研究多有疏失,因此今人在進行具體的古籍整理或版本考察時,遂在前人基礎上得出更為明晰的結論,其中頗多后出專精的研究。如周祖謨先生對《洛陽伽藍記》版本的研究、吳金華先生對《三國志》版本的研究、張玉春對《史記》版本的研究、傅剛對《文選》版本的研究等,其他散見于各大期刊的版本研究文章更數不勝數。這些成果也亟待我們搜集整理,加以利用。
三、通過各種文獻自行考察
還有一些古籍,前人涉及較少,故而需要我們利用各種文獻資料,對其版本源流進行考察。這個過程或許還要依靠選擇性的??辈拍芙鉀Q,因為如果想把一部典籍的版本源流系統說清楚,僅靠一點版本知識或前人粗略的研究是遠遠不夠的。必須通過認真的???,可以擇取其中的數卷,從文字、內容的異同之處,理出源流,分清系統。
經過以上的考察研究,我們基本上可以為每一部古籍列一個版本源流表,進而選擇出典型的版本,然后將其掃描,列入數據庫。掃描過程中,一定不可刪去序跋等相關資料,甚至諸本中的簽條最好也能掃描。這些資料不僅可以為我們提供作者交游及書籍刊刻的相關信息,還能夠幫助讀者進一步核實此前版本研究的準確性。
至于能夠利用檢索的手段獲得某一信息在具體刻本、鈔本中的頁碼,則是更為深入的技術問題了。當前的許多古籍庫雖然可根據需要調閱數個版本,實現全文版與圖像版以及圖像版與圖像版的對照,但圖像版只能夠按照頁碼翻上翻下,不能通過檢索直接跳轉至所選文字,這不能不說是很大的遺憾。因此,如果我們在建立數據庫時,能夠為篇帙浩繁的典籍提供典型版本卷次的定位,方便使用者在檢索到相關資料后能夠迅速追溯到“史源”,則是莫大的貢獻。
此外,目前的古籍庫多貴遠賤近,明清兩代典籍很少,近代以來的更少。因此我們欲檢索明清兩代的資料時卻沒有大型數據庫可供利用,這非常不利于學術的進展。如果能將《續修四庫全書》、《四庫全書存目叢書》、《四庫禁毀書叢刊》、《中國方志叢書》、《中國地方志集成》、《叢書集成初編》及《續編》《新編》、《近代中國史料叢刊》等先行制作成數字版,可以彌補當前明清資料檢索的困難,而這一工作也是切實可行的。
(作者單位:西北大學文學院)