楊琳
作者簡(jiǎn)介:楊琳,南開(kāi)大學(xué)文學(xué)院教授,博士生導(dǎo)師,從事古代漢語(yǔ)、古典文獻(xiàn)、古代民俗等方面的教學(xué)與研究。
數(shù)字化的浪潮正在強(qiáng)烈地沖擊著傳統(tǒng)圖書(shū)出版業(yè)的堡壘。英國(guó)經(jīng)濟(jì)學(xué)家查爾斯·漢迪(Charles Handy)在《大象與跳蚤》(The Elephant and the Flea: Looking Backwards to the Future,Hutchinson,Random House, London 2001)一書(shū)中指出:網(wǎng)絡(luò)幅度及速度的改變將顛覆現(xiàn)在的出版產(chǎn)業(yè)模式,帶來(lái)信息行業(yè)的“去物質(zhì)化”(dematerialization)和“去中介化”(disintermediation)。所謂“去物質(zhì)化”就是不需要紙張,也就是數(shù)字化。“去中介化”則是作者直接出版圖書(shū),不需要出版社作中介。微軟公司的創(chuàng)始人比爾·蓋茨(Bill Gates)甚至預(yù)言到2050年,紙質(zhì)圖書(shū)將可能消亡。他們二位的話絕不是危言聳聽(tīng),下面的事例很能說(shuō)明這一問(wèn)題。
事例1:俄羅斯數(shù)學(xué)家格里高利·佩雷爾曼(Grigori Perelman)因?qū)嫾尤R猜想(Poincare Conjecture)證明做出了奠基性的貢獻(xiàn)而獲得了2006年度國(guó)際數(shù)學(xué)界的最高獎(jiǎng)菲爾茲獎(jiǎng)(Fields),然而格里高利的獲獎(jiǎng)?wù)撐牟](méi)有發(fā)表在正規(guī)雜志上,作者只是將論文手稿粘貼到一家專門刊登數(shù)學(xué)和物理論文的網(wǎng)站上,并用電郵通知了幾位數(shù)學(xué)家。格里高利的獲獎(jiǎng)意味著“網(wǎng)絡(luò)發(fā)表”已得到學(xué)術(shù)界的認(rèn)可,它預(yù)示著報(bào)刊的制作形式將逐步向網(wǎng)絡(luò)化過(guò)渡。2008年10月28日,美國(guó)很有影響的日?qǐng)?bào)《基督教科學(xué)箴言報(bào)》(Christian Science Monitor)在其官方網(wǎng)站上宣布,從2009年4月起停止出版紙質(zhì)日?qǐng)?bào),改為網(wǎng)絡(luò)版的電子日?qǐng)?bào),從而成為美國(guó)首家以網(wǎng)絡(luò)版替代紙質(zhì)版日?qǐng)?bào)的全國(guó)發(fā)行報(bào)紙。幾乎與此同時(shí),美國(guó)著名的IT雜志《PC Magazine》2008年11月19日宣布,將于2009年2月停止發(fā)行印刷版,而完全以數(shù)字化方式發(fā)行。而作為美國(guó)新聞界最高榮譽(yù)獎(jiǎng)的普利策新聞獎(jiǎng)(Pulitzer Prize),也從2006年起允許網(wǎng)絡(luò)內(nèi)容參加各獎(jiǎng)項(xiàng)的評(píng)選,表明評(píng)獎(jiǎng)委員會(huì)已經(jīng)承認(rèn)了網(wǎng)絡(luò)媒體的重要影響及合法地位。
事例2:每年一度的德國(guó)法蘭克福書(shū)展(Frankfurt Book Fair)是世界上規(guī)模最大的國(guó)際性圖書(shū)博覽會(huì),它是世界圖書(shū)發(fā)展趨勢(shì)的風(fēng)向標(biāo)。2008年10月15日至19日舉行的第60屆法蘭克福書(shū)展上,以“數(shù)字化出版”為主題的參展商多達(dá)361家,參展的產(chǎn)品中數(shù)字化產(chǎn)品超過(guò)30%,而為出版界專業(yè)人士舉辦的400多場(chǎng)活動(dòng)中,50%以上的活動(dòng)與迎接圖書(shū)數(shù)字化有關(guān)。展會(huì)期間發(fā)布的調(diào)研報(bào)告顯示,在未來(lái)60年里,數(shù)字化圖書(shū)將成為最重要的出版形式。據(jù)保守估計(jì),到2018年,全球電子圖書(shū)的市場(chǎng)份額將超過(guò)傳統(tǒng)圖書(shū)。
事例3:中國(guó)出版科學(xué)研究所受國(guó)家新聞出版總署的委托,自1999年起每?jī)赡旮阋淮稳珖?guó)性的國(guó)民閱讀調(diào)查活動(dòng),至今已經(jīng)搞了五次,下面是五次調(diào)查獲得的數(shù)據(jù):
縱觀這五次調(diào)查的結(jié)果,可以清楚地看到我國(guó)國(guó)民紙質(zhì)圖書(shū)閱讀率(指每年至少讀一本書(shū)的讀者在識(shí)字者中的比例)呈持續(xù)走低態(tài)勢(shì),2007年比2005年下降了14個(gè)百分點(diǎn),下降幅度是很大的。與紙質(zhì)圖書(shū)閱讀率下降形成鮮明對(duì)比的是,互聯(lián)網(wǎng)閱讀率持續(xù)迅速上升,2007年的網(wǎng)絡(luò)閱讀率已經(jīng)超過(guò)了紙質(zhì)圖書(shū)閱讀率。據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)2009年1月13日發(fā)布的《第23次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》,截至2008年底,我國(guó)網(wǎng)民數(shù)量達(dá)到了2.98億,比2007年增長(zhǎng)了41.9%,居世界第一位;互聯(lián)網(wǎng)普及率為22.6%,首次超過(guò)21.9%的全球平均水平。盡管如此,由于中國(guó)的人口基數(shù)大,互聯(lián)網(wǎng)普及率在全球各個(gè)國(guó)家和地區(qū)中只排在第87位,而發(fā)達(dá)國(guó)家的平均普及率更是高達(dá)51% ,我們?nèi)杂泻艽蟮牟罹唷2浑y預(yù)見(jiàn),在未來(lái)的若干年里,我國(guó)互聯(lián)網(wǎng)的用戶將會(huì)持續(xù)高速增長(zhǎng)。隨著互聯(lián)網(wǎng)的不斷普及,網(wǎng)絡(luò)閱讀率必將不斷提高,而紙質(zhì)書(shū)刊的閱讀率必將不斷下滑。這使紙質(zhì)圖書(shū)面臨的生存危機(jī)越來(lái)越嚴(yán)重。
2000-2008年中國(guó)網(wǎng)民規(guī)模與增長(zhǎng)率統(tǒng)計(jì)圖(據(jù)CNNIC報(bào)告)
這些事實(shí)有力地表明,我們已進(jìn)入了一個(gè)數(shù)字化閱讀的新時(shí)代。
那么,紙質(zhì)圖書(shū)的閱讀率為什么越來(lái)越低呢?這是因?yàn)榕c電子圖書(shū)相比,紙質(zhì)圖書(shū)缺點(diǎn)很多,如生產(chǎn)時(shí)間長(zhǎng),生產(chǎn)成本高,價(jià)格昂貴,攜帶不方便,存放起來(lái)占用空間大,不能檢索復(fù)制,等等。所以圖書(shū)的數(shù)字化制作是不可阻擋的發(fā)展趨勢(shì)。數(shù)字技術(shù)的興起使我們的圖書(shū)制作方式及閱讀習(xí)慣正在發(fā)生著歷史性的變革。想當(dāng)初,紙書(shū)的出現(xiàn)把笨重的簡(jiǎn)冊(cè)趕下了歷史舞臺(tái)。今天,電子圖書(shū)的問(wèn)世則意味著紙質(zhì)圖書(shū)的掘墓人已經(jīng)誕生,它將使紙質(zhì)圖書(shū)日趨萎縮,并在不遠(yuǎn)的將來(lái)取代紙質(zhì)圖書(shū)的主流地位。對(duì)此發(fā)展大勢(shì),圖書(shū)出版機(jī)構(gòu)、圖書(shū)管理機(jī)構(gòu)及各級(jí)圖書(shū)館應(yīng)該有清醒的認(rèn)識(shí)。
目前,電子圖書(shū)還沒(méi)有統(tǒng)一的質(zhì)量標(biāo)準(zhǔn),制作機(jī)構(gòu)各行其是。電子圖書(shū)的質(zhì)量標(biāo)準(zhǔn)當(dāng)然不能搞一刀切,也不可能是一成不變的。不同的圖書(shū)類型,不同的讀者對(duì)象,應(yīng)該有不同的質(zhì)量標(biāo)準(zhǔn)。這里我想從學(xué)術(shù)需要的角度來(lái)談一下理想的電子古籍應(yīng)符合哪些標(biāo)準(zhǔn)。
我們認(rèn)為學(xué)術(shù)需要的理想電子古籍應(yīng)符合五項(xiàng)標(biāo)準(zhǔn)。
其一,文本要可靠
這是對(duì)電子古籍最起碼的要求。判定文本可靠的標(biāo)準(zhǔn)有兩條。
一是文字跟紙質(zhì)古籍一樣,沒(méi)有差錯(cuò),即沒(méi)有脫字、增字、別字、錯(cuò)字等現(xiàn)象。要真正做到這一點(diǎn)很不容易,目前恐怕還沒(méi)有哪個(gè)電子古籍?dāng)?shù)據(jù)庫(kù)敢說(shuō)沒(méi)有差錯(cuò),我們?cè)谑褂弥袝r(shí)有發(fā)現(xiàn)。如“中國(guó)基本古籍庫(kù)”:王念孫《讀書(shū)雜志·漢書(shū)弟十四·見(jiàn)哀》:“《呂氏春秋·報(bào)更篇》:‘人主胡可以不務(wù)哀土?’”“哀土”為“哀士”之誤;明洪楩輯《清平山堂話本·簡(jiǎn)貼和尚》:“大國(guó)長(zhǎng)安一座縣,喚做鹹陽(yáng)縣,離長(zhǎng)安四十五裏。”“鹹”“裏”都是制作軟件將簡(jiǎn)體轉(zhuǎn)換為繁體時(shí)造成的錯(cuò)誤;宋戴侗《六書(shū)故》卷前附有《六書(shū)通釋》一卷,“中國(guó)基本古籍庫(kù)”整卷脫漏;南開(kāi)大學(xué)組合數(shù)學(xué)研究中心、天津永川軟件技術(shù)有限公司、中國(guó)社會(huì)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)中心聯(lián)合研制的“二十五史全文閱讀檢索系統(tǒng)”:《晉書(shū)·甘卓傳》的“察孝謙”,“謙”為“廉”之誤。《史記·陸賈列傳》的“以好田畤地善”,“田畤”為“畤田”誤倒。下面是龍語(yǔ)瀚堂典籍?dāng)?shù)據(jù)庫(kù)中的一頁(yè):
這里的“”是個(gè)錯(cuò)字,《龍龕手鑒》原文作“
”。又龍語(yǔ)瀚堂收元熊忠《古今韻會(huì)舉要》卷二十八《去聲·隻》“炙”字下:“炙,膾炙也,之夜切,字從夕,兩點(diǎn)。炙,之亦切,近火也,字從夕,一點(diǎn)。”“字從夕,兩點(diǎn)”之“夕”當(dāng)作
,“炙,之亦切”之“炙”當(dāng)作
。可見(jiàn)電子古籍的差錯(cuò)率是比較高的。
造成這種狀況的主要原因在于:一方面,古籍的用字情況比較復(fù)雜,而漢字識(shí)別技術(shù)還很不成熟,產(chǎn)生不少識(shí)別錯(cuò)誤;另一方面,制作公司大都缺乏熟悉古代漢語(yǔ)的校對(duì)人員,而普通校對(duì)人員難以勝任古籍校對(duì)工作,這就造成了較高的差錯(cuò)率。
二是盡可能地保存底本文字的原樣。這就是說(shuō),底本寫什么樣的字,電子古籍應(yīng)顯示什么樣的字。按照這一標(biāo)準(zhǔn),脫離底本的繁體字系統(tǒng)并不符合要求。例如底本中“于”“於”二字并用,繁體字系統(tǒng)中有可能統(tǒng)一用“於”;底本中既有“并”字,又有“並”字,繁體字系統(tǒng)中有可能統(tǒng)一用“並”;目前不少繁體字電子古籍就是這樣處理的。這種做法使古籍走了樣,丟失了一些有價(jià)值的古籍文本信息,不利于學(xué)術(shù)研究。有些情況下甚至?xí)斐衫斫馍系幕靵y。例如《禮記·月令》:“﹝孟秋之月﹞修宮室,壞墻垣,補(bǔ)城郭。”這里的“壞”讀péi,是“用泥土封塞空隙”的意思,如果轉(zhuǎn)換為“壞”,文意就大相徑庭了。清陳康祺《郎潛紀(jì)聞初筆》卷八載:“林文忠性卞急,撫蘇日嘗手書(shū)匾額于聽(tīng)事之堂,曰‘制一怒字’。昔宋賢呂本中教屬吏當(dāng)先以暴怒為戒,公以之自律,其克己功夫尤切實(shí)已。”意思是說(shuō)林則徐為了克制急躁易怒的毛病,在官衙大廳內(nèi)懸掛上“制一怒字”的匾額來(lái)警誡自己。如果轉(zhuǎn)換成“製一怒字”,意思就成制造憤怒了。一本初中歷史課本中的林則徐畫(huà)像中就是這樣寫的。所以脫離底本的繁體字系統(tǒng)不是理想的電子古籍。至于把古籍轉(zhuǎn)換為簡(jiǎn)體字系統(tǒng)的,那就距理想的古籍就更遠(yuǎn)了。
那么我們?yōu)槭裁凑f(shuō)“盡可能地保存”底本文字的原樣而不要求全部保存呢?這是因?yàn)楣偶杏写罅康氖謱戵w和俗體,手寫體和俗體變化多端,一個(gè)字有可能有十多種寫法,如果全都原封不動(dòng)地再現(xiàn)于電子古籍,在目前的技術(shù)條件下存在很多困難。即使能夠做到,也將大大增加電子古籍的制作成本,從而制約電子古籍的生產(chǎn)和銷售。所以我們?cè)跇?biāo)準(zhǔn)中提“盡可能地保存”,言下之意是文字原樣保存得越多越好,關(guān)鍵在于制作者能夠找準(zhǔn)經(jīng)濟(jì)效益和理想標(biāo)準(zhǔn)的平衡點(diǎn)。
其二,僻字能正常顯示
漢字的字種數(shù)約有十萬(wàn)種左右,其中常用字不過(guò)三四千字,絕大多數(shù)字屬于僻字。目前幾乎所有的電子古籍都未能解決僻字的錄入顯示問(wèn)題。遇到無(wú)法錄入顯示的僻字,或者用方框、黑塊等符號(hào)表示空缺,或者用數(shù)字代替,鏈接到字形圖片,或者說(shuō)明偏旁的上下左右內(nèi)外等,給閱讀利用造成障礙。下圖是國(guó)學(xué)網(wǎng)“國(guó)學(xué)寶典”《爾雅·釋魚(yú)》中的一條:
僻字用編號(hào)代替,開(kāi)頭部分還是亂碼。最新的全功版也是如此。
下圖是書(shū)同文制作的電子版《四庫(kù)全書(shū)》中《龍龕手鑒》卷一的一頁(yè),□表示不能錄入顯示的字,一頁(yè)上就有35個(gè)字無(wú)法顯示。
這方面做得最好的是龍語(yǔ)瀚堂典籍?dāng)?shù)據(jù)庫(kù),大部分僻字都能正常顯示。如上面《爾雅·釋魚(yú)》的那一條,龍語(yǔ)瀚堂典籍?dāng)?shù)據(jù)庫(kù)中顯示為:
盡管如此,不能顯示的字也仍然不少。如下圖中的黑塊就是無(wú)法顯示的字:
看來(lái)解決僻字的錄入顯示問(wèn)題仍然是數(shù)碼技術(shù)急需攻克的難題。
其三,每一種書(shū)都有版本信息
同一古籍常有多種不同的版本,不同版本字句上時(shí)有差異,如果沒(méi)有版本信息,文本的可靠性無(wú)從核實(shí),這就降低了電子文本的使用價(jià)值。“國(guó)學(xué)寶典”沒(méi)有版本信息,學(xué)術(shù)研究上只能作為初步檢索,真正采用還得找可靠的版本去落實(shí)。“中國(guó)基本古籍庫(kù)”倒是注明了版本,但有張冠李戴的問(wèn)題。如所收元白珽《湛淵靜語(yǔ)》,注明是依據(jù)《知不足齋叢書(shū)》本,其實(shí)不然。如卷二:“邵康節(jié)生日不赴,蓋有見(jiàn)也。伊川生日亦不事飲宴。前修似此者多。”檢《知不足齋叢書(shū)》本,“生日不赴”作“生席不赴”,“前修”作“前脩”,并不相符。再檢文淵閣《四庫(kù)全書(shū)》本,完全一致,說(shuō)明所據(jù)底本為文淵閣《四庫(kù)全書(shū)》本,不知何以標(biāo)成了《知不足齋叢書(shū)》本。
另一方面,制作古籍軟件應(yīng)采用好的版本作為底本。如果采用了不好的版本,即使沒(méi)有差錯(cuò)(指與紙質(zhì)古籍一致),也不能算是理想的電子古籍。如“中國(guó)基本古籍庫(kù)”收錄的北宋樂(lè)史《太平寰宇記》采用《四庫(kù)全書(shū)》本,此書(shū)最好的版本是宋刻本,有中華書(shū)局2000年影印出版的《宋本太平寰宇記》,可惜“中國(guó)基本古籍庫(kù)”沒(méi)有采用,也作為沒(méi)有對(duì)照版本。
其四,檢索程序功能完善
電子古籍最大的優(yōu)勢(shì)在于能夠進(jìn)行檢索,所以有一個(gè)功能完善的檢索程序是理想電子古籍最重要的標(biāo)準(zhǔn)。那么,怎樣才算功能完善呢?
(1)檢索速度要快。一般應(yīng)在幾秒鐘之內(nèi)列出關(guān)鍵詞所在頁(yè)面的所有條目,并按一定順序排列。
(2)能夠滿足多種條件的檢索需求。比如按朝代(當(dāng)然更精確的是年代)檢索、按作者檢索、按文體檢索、排除式檢索、“A+任意字符+B”字組檢索,等等,這些功能在學(xué)術(shù)研究上非常有用,可惜目前古籍軟件的檢索程序提供的功能比較少,難以做到精確檢索。提供了某種功能的,還存在不少問(wèn)題。比如電子版《四庫(kù)全書(shū)》有“與”、“或”、“非”三種組合選項(xiàng),但軟件把“與”、“或”、“非”的出現(xiàn)條件限定在“一卷”的范圍,而不是“一個(gè)頁(yè)面”的范圍,這使“與”、“或”、“非”的檢索基本上沒(méi)有什么用處。“中國(guó)基本古籍庫(kù)”提供按朝代檢索的功能,但一次只能選一個(gè)朝代,不能同時(shí)多選,使用不很方便。至于具體文獻(xiàn)的朝代歸屬,問(wèn)題更多。如把明代牛衷編的《增修埤雅廣要》放在宋代,大約是由于此書(shū)是宋代陸佃《埤雅》的增補(bǔ)本的緣故,但《增修埤雅廣要》與《埤雅》分明是兩部書(shū)。其他如把清代畢沅的《釋名疏證》、清代王先謙的《釋名疏證補(bǔ)》放在漢代,把清代仇兆鰲的《杜詩(shī)詳注》、清代馮浩的《樊南文集詳注》放在唐代,都是不合適的。注本一般應(yīng)歸于注者的時(shí)代,正如北魏酈道元的《水經(jīng)注》雖然是注釋漢代《水經(jīng)》的,但我們不能把它當(dāng)漢代典籍一樣。如果是單純編輯的文本,應(yīng)放在文本產(chǎn)生的時(shí)代。如清代編的《全唐詩(shī)》、《全唐文》,文本都是唐代的,自然應(yīng)歸于唐代。別以為文獻(xiàn)的朝代歸屬無(wú)關(guān)緊要,放錯(cuò)了時(shí)代,會(huì)對(duì)學(xué)術(shù)研究產(chǎn)生不利影響。
(3)關(guān)聯(lián)檢索要準(zhǔn)確。由于古籍中存在異體字問(wèn)題,對(duì)大陸來(lái)說(shuō)還存在繁簡(jiǎn)字問(wèn)題,所以檢索關(guān)鍵詞時(shí)一般應(yīng)有相應(yīng)的關(guān)聯(lián),這樣才能把想檢索的內(nèi)容一次都檢索出來(lái)。異體關(guān)聯(lián)如當(dāng)我們以“涼風(fēng)”為關(guān)鍵詞時(shí),程序同時(shí)也能檢索出“涼風(fēng)”的條目。繁簡(jiǎn)關(guān)聯(lián)如當(dāng)我們以“關(guān)于”為關(guān)鍵詞時(shí),同時(shí)能檢出“關(guān)于”和“關(guān)於”的條目。目前的古籍軟件大都不具備異體關(guān)聯(lián)功能,有此功能的軟件則非常低能。如《四庫(kù)全書(shū)》設(shè)計(jì)了異體關(guān)聯(lián)功能,但設(shè)計(jì)者把“異體”的范圍放得很寬,包括“形似字”和“通假字”在內(nèi),其結(jié)果常常關(guān)聯(lián)出一大堆無(wú)效信息,反而給檢索造成障礙。比如當(dāng)你檢索含有“籑”字的資料時(shí),大量含有“撰”“饌”的資料也一并檢索出來(lái),檢索“尺子”時(shí),“尺予”、“尺于”、“斥予”、“斥于”、“斥子”等條目混雜其中,而這些無(wú)關(guān)的條目還無(wú)法排除。另一方面,一些應(yīng)該同時(shí)檢出的異體字,程序卻視為不同的字而不能檢出,出現(xiàn)漏檢的情況。如“狼跋”俗體也寫作“狼”,當(dāng)以“狼跋”為檢索詞時(shí),“狼
”的資料檢不出來(lái)。這種關(guān)聯(lián)還不如沒(méi)有這種功能方便。異體關(guān)聯(lián)應(yīng)嚴(yán)格限定在“任何情況下都能互換的字”的范圍之內(nèi),否則只會(huì)降低準(zhǔn)確率。一些繁體字系統(tǒng)的古籍軟件只能輸入繁體關(guān)鍵詞,不能用簡(jiǎn)體關(guān)鍵詞,這對(duì)大陸的使用者造成麻煩。有些軟件雖然有繁簡(jiǎn)關(guān)聯(lián)功能,但往往漏洞百出。如在“中國(guó)基本古籍庫(kù)”所收明朱國(guó)禎《涌幢小品》卷二十四中明明有“百壽”一詞,但輸入“百壽”一詞進(jìn)行檢索時(shí),結(jié)果為零,改用繁體字檢索則能檢索得到。又如檢索“夫子巖”時(shí)檢不到寫作“夫子巖”的資料,反之亦然。檢索書(shū)名時(shí),輸入“集韻”檢索不到,輸入“集韻”才能檢到。這說(shuō)明該關(guān)聯(lián)的沒(méi)有關(guān)聯(lián)上。還有一種更糟的情況是,無(wú)論用繁體還是簡(jiǎn)體,都檢索不到。如“中國(guó)基本古籍庫(kù)”中收有清馮桂芬《(同治)蘇州府志》,其中有“惟蘇州者極巧,為天下第一”的話(見(jiàn)卷二十),但如果以“為天下第一”為關(guān)鍵詞,則檢索不到。“馬留”一詞在庫(kù)中所收的不少書(shū)中都有,如宋李昌齡輯《樂(lè)善錄》卷五、宋謝維新編《事類備要》卷四十一等,但檢索結(jié)果卻是沒(méi)有。以“見(jiàn)哀于石君”為檢索詞時(shí),只檢索到明彭大翼《山堂肆考》中的1條。實(shí)際上,庫(kù)中所收的《漢書(shū)》、王念孫《讀書(shū)雜志》及王先謙《漢書(shū)補(bǔ)注》中都有這句話,卻檢不出來(lái)。許多學(xué)者靠古籍?dāng)?shù)據(jù)庫(kù)的檢索來(lái)判斷某個(gè)詞語(yǔ)在某一時(shí)代或某部書(shū)中的有無(wú),上面的例子表明目前的古籍軟件不完全靠得住。
(4)檢索出的資料應(yīng)有詳細(xì)的出處顯示,并能便捷地復(fù)制。一條完整的出處應(yīng)包括作者、作者朝代、書(shū)名、卷數(shù)、篇名五項(xiàng)信息,這樣的出處才符合學(xué)術(shù)需要,然而目前還沒(méi)有達(dá)到這一標(biāo)準(zhǔn)的電子文獻(xiàn)。《四庫(kù)全書(shū)》有出處復(fù)制的功能,可惜出處只有書(shū)名和卷數(shù),過(guò)于簡(jiǎn)單,不能滿足需要。“中國(guó)基本古籍庫(kù)”5.0以前的版本沒(méi)有出處復(fù)制功能,最新的6.0版能在檢索到的條目頁(yè)面下顯示出處,并在復(fù)制文本時(shí)提供出處復(fù)制,但也只有書(shū)名和卷數(shù),使用者還得通過(guò)翻檢補(bǔ)充朝代、作者、篇名等信息,比較費(fèi)事。
(5)檢索結(jié)果要有統(tǒng)計(jì)數(shù)據(jù),并能快捷地打開(kāi)查看和復(fù)制。目前的一些軟件點(diǎn)開(kāi)原文后顯示的是關(guān)鍵詞所在的整篇文章的開(kāi)頭,而不是關(guān)鍵詞所在的段落,關(guān)鍵詞也不能高亮顯示,要找到關(guān)鍵詞所在的段落很費(fèi)事。有些數(shù)據(jù)庫(kù)對(duì)復(fù)制原文防范過(guò)嚴(yán),如“中國(guó)基本古籍庫(kù)”不能直接復(fù)制,須另外打開(kāi)“下載編輯”窗口才能復(fù)制,而且每次最多只能復(fù)制200字,很不方便。軟件制作者保護(hù)知識(shí)產(chǎn)權(quán)的用意是可以理解的,但只能復(fù)制一小部分的限制損害的是正當(dāng)使用者的權(quán)益,建議修改為能直接復(fù)制全部當(dāng)前頁(yè)。
其五,能很好地兼容常用字處理軟件
大多數(shù)大型古籍?dāng)?shù)據(jù)庫(kù)需要安裝專用的瀏覽軟件,這給使用者造成不便。書(shū)同文的每一種數(shù)據(jù)庫(kù)甚至都要安裝單獨(dú)的客戶端程序,很不合理。理想的狀態(tài)應(yīng)該是用常用瀏覽器(如IE)就可瀏覽,事實(shí)上龍語(yǔ)瀚堂典籍?dāng)?shù)據(jù)庫(kù)也已經(jīng)做到了這一點(diǎn),建議其他數(shù)據(jù)庫(kù)的研制者借鑒龍語(yǔ)瀚堂的成功經(jīng)驗(yàn)。當(dāng)然,如果能研制出一個(gè)更切合古籍瀏覽的通用軟件也未嘗不可,但目前各自為政的做法不但造成資源的浪費(fèi),而且給使用者造成很多麻煩,實(shí)不可取。
檢索出來(lái)的資料人們一般是要復(fù)制到WORD等字處理軟件中使用的,然而有些數(shù)據(jù)庫(kù)的資料復(fù)制粘貼后會(huì)發(fā)生錯(cuò)亂。例如不少古籍帶有注文,注文一般是隨文用小字表示。當(dāng)你把《四庫(kù)全書(shū)》中復(fù)制的帶注文的資料粘貼WORD中時(shí),所有的注文全都跑到正文的末尾之后,而不在原句之下,使你分不清楚哪是正文哪是注文。即便知道是注文,也不清楚是哪句正文的注文。不得已,還得跟數(shù)據(jù)庫(kù)中的原頁(yè)面仔細(xì)核對(duì)。大陸的使用者一般要把復(fù)制的繁體字資料轉(zhuǎn)換為簡(jiǎn)體字,但這種轉(zhuǎn)換會(huì)發(fā)生錯(cuò)誤。如用WORD的繁簡(jiǎn)轉(zhuǎn)換工具把《四庫(kù)全書(shū)》中復(fù)制的“譙國(guó)華佗字元化”整體轉(zhuǎn)為簡(jiǎn)體時(shí),“元”被轉(zhuǎn)換成了“符”,令人莫名其妙。龍語(yǔ)瀚堂典籍?dāng)?shù)據(jù)庫(kù)中的有些僻字復(fù)制粘貼到WORD后會(huì)走樣,如上例《爾雅》中的字復(fù)制到WORD后變成了鰴。這都是兼容性存在問(wèn)題。
總而言之,古籍的數(shù)字化是保存?zhèn)鞑ゲ⒊浞掷霉糯浼母锩允侄危哂兄匾默F(xiàn)實(shí)價(jià)值和深遠(yuǎn)的歷史意義,各有關(guān)方面應(yīng)該攜起手來(lái),與時(shí)俱進(jìn),共同迎接數(shù)字化時(shí)代的挑戰(zhàn)。
發(fā)布日期:2009-08-18