大型古籍數據庫《國學寶典》網絡版開通
日前,大型中華古籍全文數據庫《國學寶典》成功地推出了網絡版。這項由首都師范大學電子文獻研究所開發的中文古籍數據庫工程目前共收入古籍3800多部,總字數逾8億字,收入書籍種類和字數都超過了《四庫全書》。
近年來,電子技術在古籍研究中的應用,已成為人們關心的話題,電子技術對傳統學術研究陣地開始有所觸動?!秶鴮W寶典》的主要開發者尹小林先生介紹說,此前,單機版 《國學寶典》、《四部叢刊》電子版、《四庫全書》電子版等古籍檢索軟件已經普遍為學術界所應用,并受到學者的青睞和好評。博聞強記,皓首窮經曾是古人做學問的基本路徑。而現在,電子檢索軟件大大縮短了咬文嚼字的時間,使研究者從繁瑣的資料翻檢中解脫出來,有更多的時間思考,創作。
同時,隨著中國經濟近年來的高速發展,中國文化也正在世界范圍迅速傳播并產生越來越大的影響。讓浩如煙海的中國古籍文獻乘上現代技術的快車,通過互聯網走向世界,也是這套系統研制者們的期望。據悉,北京國學時代文化傳播有限公司投資一千多萬元,依托首都師范大學組織國內一批文史專家,經過長達6年的資料搜集、電子化???,并借助清華大學的網絡技術,在今年1月取得古籍網絡數據庫檢索的重大突破,完成了《國學寶典》網上檢索系統,即《國學寶典》網絡版(www.gxbd.com)。
該系統采用國際通用的unicode漢字編碼,字庫容量大,擴展性強,可在全球所有網絡瀏覽器上正確顯示漢字。據悉,這套檢索系統還開通了手機WAP網站,可以在普通手機上實現其全部檢索功能。
湯一介、樂黛云、龐樸、曹先擢、傅璇琮、劉夢溪、張燕瑾等專家學者出席了《國學寶典》網絡版的新聞發布會。
北京大學教授樂黛云、湯一介先生都是該數據庫單機版的用戶。在新聞發布會上,樂黛云教授提出了新推出的網絡版與自己正在使用的單機版有什么不同的問題。尹小林表示,網絡數據庫的特點一是規模大。收入古籍總字數超過了《四庫全書》,并且收入了一批《四庫全書》未收的通俗小說、戲曲。數據庫目前以每年二至三億字的速度繼續擴充。網絡版不但極大地方便了用戶的使用,而且可以做到數據的及時更新。二是《國學寶典》網絡版使用了清華大學研發的極先進的搜索引擎技術,檢索速度奇快,從8億字近10萬卷的古籍數據庫中任意范圍查找任何一個字(詞),可以在一秒鐘左右得到結果,并可滿足數千人同時在線檢索。即使以后繼續增加數據,其檢索速度也不會下降。
國家語言文字工作委員會副主任、中國辭書學會會長曹先擢說,在工作中他每天都在使用《國學寶典》,數據庫在資料搜集上有很強的實用價值。
首都師大的一位教授在發言中提出,電子化古籍一定要注重版本問題,目前專家學者在使用網絡古籍檢索時必須要重新核對紙版本的原文;再就是古籍中的繁簡轉換問題,也有待計算機技術的進一步解決。