賈文龍 肖愛民
(河北大學)
史料是歷史研究的基礎,而古籍的全文檢索是文史研究電子化應用最為直接和最為有效的手段。河北大學宋史研究中心的創(chuàng)立者漆俠先生十分重視古籍整理中的新技術應用,自1989年開始,與河北大學電子信息工程學院的漢字信息處理研究室聯(lián)合開發(fā)了《續(xù)資治通鑒長編》(520卷,720萬字),并由1995年在河北省第六屆發(fā)明展覽會上獲金獎。該成果受到國內外同行專家的重視,曾有多位宋史界學者前來參觀試用。
新世紀以來,中國古籍數(shù)字化的研究和實踐已經(jīng)遠離了手工作坊式的簡單錄入形態(tài),河北大學宋史研究中心逐步提出建設斷代宋史數(shù)據(jù)庫的計劃。因為中國古籍數(shù)字化規(guī)模之宏,數(shù)量之多,范圍之廣,對財力、人力等方面都提出了高要求,大而全的數(shù)據(jù)庫開發(fā)進程緩慢,校對不容易精準,影響了其檢索的可靠性。宋代以前,古代文獻因為存世數(shù)量不大,其數(shù)字化工作已經(jīng)接近完善。而遼宋夏金元(916-1367)約五百年的歷史中,因為宋朝的文化昌盛,雖經(jīng)兵火戰(zhàn)亂、其存世文獻仍頗具規(guī)模,漆俠先生講:對宋代文獻,一個用功的學者,一輩子可以讀完。而明清文獻的全部數(shù)字化,可能還要持續(xù)上百年。因此建立《宋遼夏金元史數(shù)據(jù)庫》既有相當?shù)碾y度,又有相當?shù)膬r值。2006年10月,我中心為早日啟動在“宋遼夏金元史數(shù)據(jù)庫”建設工作,當年在北京召開了有宋遼夏金元史專家、文獻學專家和文獻數(shù)字化專家參加的咨詢會議,明確了建設該專業(yè)數(shù)據(jù)庫的初步構想和功能要求。2007年我中心成立了數(shù)據(jù)庫建設工作工作領導小組,向學校申請了“宋遼夏金元史數(shù)據(jù)庫”的專項建設經(jīng)費。2007年底在原有工作的基礎上召開了第三次數(shù)據(jù)庫工作會議,討論了賈文龍、肖愛民起草的《<宋遼夏金元數(shù)據(jù)庫>建設的幾個重要問題》的報告。2008年7月,河北大學宋史研究中心與北京國學時代公司簽署協(xié)議,決定共同投資100萬元研制《宋遼夏金元史數(shù)據(jù)庫》。
關于《宋遼夏金元史數(shù)據(jù)庫》的建設,我們提出一些思路,希望數(shù)據(jù)庫既有資料性,又有學術性;不僅可以用于科研,還要利于教學工作;含有動態(tài)建設過程,而在相當時段內保持一定的先進性。下面提出這些思路,借這次大會的機會,以求教于方家。
一、以時人詩文為數(shù)據(jù)庫主體
新技術革命的浪潮深刻地消解了歷史、文學、哲學等學科間的材料隔膜,古籍數(shù)字化更是突破了傳統(tǒng)的經(jīng)、史、子、集的古籍分類方式。而歷史學研究對象涉及面廣的特性決定了歷史學者必須從其他學科查尋資料。歷史學者在檢索文獻時使用綜合性數(shù)據(jù)庫,利用計算機所具有模糊查詢識別能力,可以通過簡單的檢索便在自己不熟悉的斷代和領域找到相關的資料。因此斷代史古籍數(shù)字化可以以散漫的古籍分類方式構建數(shù)據(jù)庫,可以以檢索詞的方式回到以古人個體中心構建文獻的模式。而古人的個體創(chuàng)作,基本上只有詩與文兩種。因些《宋遼夏金元史數(shù)據(jù)庫》以《全宋詩文數(shù)據(jù)庫》、《全遼詩文數(shù)據(jù)庫》、《全金詩文數(shù)據(jù)庫》、《全元詩文數(shù)據(jù)庫》為主體。
二、以篇目章節(jié)檢索為圖文對照間的聯(lián)系
古籍數(shù)字化的最理想的成果形式是能直接引用,圖文對照是能達到直接引用的最有效途徑。《宋遼夏金元史數(shù)據(jù)庫》計劃建立《古籍書影數(shù)據(jù)庫》,首先實現(xiàn)書名章目的檢索,并以對照原文制作資料專題的方式,基本達到直接引用的要求。
三、以工具書庫作為檢索詞的延伸
史料是歷史研究的基礎。學術上的突破,往往依賴于新材料的發(fā)現(xiàn)。古代典籍浩如煙海,傳統(tǒng)的史學研究在某種程度上,就是發(fā)掘史料功夫的較量。而數(shù)據(jù)庫能夠把原來枯燥的史料翻檢工作變?yōu)榧夹g性操作,就某種意義而言,數(shù)據(jù)庫建設將引發(fā)傳統(tǒng)史學研究的革命。為方便史料查詢,就要豐富檢索詞,所以第一屆古籍數(shù)字化國際會議外,多位專家提出建立同位語數(shù)據(jù)庫的倡議。《宋遼夏金元史數(shù)據(jù)庫》似建立《宋人存世著述書目》、《全宋人名資料庫》(姓名、字號、籍貫、事跡、生卒、著述)、《宋遼夏金元史地名資料庫》、《宋遼夏金元史官名資料庫》,以為使用者豐富檢索詞,并提供查詢幫助工具。
四、以影像資料為文本古籍的補充
《宋遼夏金元史數(shù)據(jù)庫》還計劃建立《宋遼夏金元史文物考古圖片庫》和《宋遼夏金元史文物教學資料庫》,主要包括這一時期的書法、繪畫、書影、兵器、建筑、雕塑、印章、壁畫、瓷器、金銀器、服飾、車舟等各方面文物考古圖片,以達到以影像證史的目的。
五、以論著索引為學術前沿的反映
《宋遼夏金元史數(shù)據(jù)庫》計劃集資料性與信息性為一體,包含20世紀至今宋遼金史百年論著索引,反映了海內外宋遼夏金元史的最新研究成果,希望成為最全、最新的宋元時期的古籍及研究前沿的數(shù)字化成果。目前我們與方建新先生、劉浦江先生已合作完成《二十世紀宋史研究百年論文索引》、《二十世紀遼金史研究百年論文索引》,并每年補充;宋遼夏金元史博士、碩士學位論文索引已有一定成績。
河北大學宋史研究中心與北京國學時代文化傳播有限公司雙方優(yōu)勢互補、強強合作,《宋遼夏金元史數(shù)據(jù)庫》可以完成對宋遼夏金元時期基本的重要的古籍、碑刻及文物考古圖片的數(shù)字化使命。《宋遼夏金元史數(shù)據(jù)庫》既注重資料性,也注重工具性和信息性,我們相信《宋遼夏金元史數(shù)據(jù)庫》可以最終建設成具有良好的應用性與專業(yè)性、達到國際先進水準的宋遼夏金元史學術研究平臺。
發(fā)布日期:2009-08-18