古籍資源的金字塔知識(shí)結(jié)構(gòu)數(shù)據(jù)組織
(發(fā)言提綱)
一、非常幸運(yùn)的是,古籍資源的數(shù)字化工作相比于民國(guó)書報(bào)刊和建國(guó)以來書報(bào)刊資源的數(shù)字化而言,一點(diǎn)也不顯得落后,從上世紀(jì)80年代以來,有全面開花、蓬勃發(fā)展之勢(shì),其中的原因,主要是古籍中存在著若干個(gè)集合性界限分明的板塊、原始古籍沒有版權(quán)問題以及當(dāng)代出版人的后知后覺;
二、但目前古籍?dāng)?shù)字化的重點(diǎn),在于板塊的選擇(如《四庫(kù)全書》《地方志》《家譜族譜》《中國(guó)基本古籍》等等)、文字的處理、全文檢索和輔助工具的設(shè)置等等,在數(shù)據(jù)的組織、信息的相關(guān)相似度計(jì)算處理以及隱含知識(shí)的挖掘等方面,還相對(duì)較弱,也就是說,數(shù)據(jù)處理尚有深入的余地;
三、就數(shù)據(jù)組織而言,我在這里提出金字塔知識(shí)結(jié)構(gòu)的概念,并準(zhǔn)備在古籍資源數(shù)字化的實(shí)踐中試加運(yùn)用;
四、金字塔知識(shí)結(jié)構(gòu)或曰金字塔知識(shí)層次,是基于知識(shí)創(chuàng)造的次第而提出的。就大的框架來說,我將文本資源分為原始資料、研究成果和工具書三個(gè)層次,原始資料當(dāng)然應(yīng)該是最先有的,其次是研究成果,最后才是工具書,工具書一定是在原始資料和研究成果的基礎(chǔ)之上提煉概括出來的。如果將工具書置于頂部,其中間部分是研究成果,底部則是原始資料,這樣就形成了我所說的金字塔結(jié)構(gòu);
五、原始資料、研究成果和工具書又各可以分為若干個(gè)小層次,工具書可以分為綜合性大型辭典、字典詞典、??妻o典、大事記年表等層次,研究成果可以分為綜合性比較強(qiáng)而又主要循橫截面結(jié)構(gòu)邏輯展開的、具有梳理性和一定程度的學(xué)術(shù)原創(chuàng)性的著作的“志”類圖書(《中華文化通志》、各種專志方志、教材類著作亦可入此)、大體以時(shí)間為序主要循縱向邏輯展開的、具有梳理性和一定程度的學(xué)術(shù)原創(chuàng)性的著作“史”類著作(如《中國(guó)通史》《中國(guó)斷代史》《中國(guó)文學(xué)史》及諸多專史等)、循作者各自選擇的論證邏輯展開的表述研究結(jié)果的富有學(xué)術(shù)原創(chuàng)性的學(xué)術(shù)文化專著(包括學(xué)術(shù)文)等層次,原始資料則可以分為經(jīng)過標(biāo)校整理的古籍(如《古典文學(xué)叢書》《全宋文》等等,這是加工程度較高的古籍資料,對(duì)于進(jìn)一步的專題研究功用最大,可惜數(shù)字化程度卻最低)、經(jīng)過整合而未經(jīng)標(biāo)校整理的古籍(如《四庫(kù)全書》《續(xù)修四庫(kù)全書》《古本小說集成》等等)、以圖片為主的圖書和圖片;
六、如就純古籍而言之,則亦大體可以分為工具書、研究整理著作和原創(chuàng)作品三大層次,其中工具書可以分為類書和訓(xùn)詁書、字書和韻書、大事記和年表等等,研究整理著作可以分為原典的注疏釋箋著作、史志類著作和研究專著、筆記等等,原創(chuàng)作品可以分為經(jīng)史子原典、詩(shī)文作品等等;
七、前面已經(jīng)說過,金字塔知識(shí)結(jié)構(gòu)的構(gòu)筑,大體以知識(shí)創(chuàng)造的次第為序,由下而上,將提煉程度最高的工具書放在金字塔的塔頂上,由經(jīng)過梳理和概括的成熟知識(shí)深入到學(xué)術(shù)成果乃至原始資料,知識(shí)點(diǎn)之間由淺入深地有機(jī)鏈接,成為一個(gè)有內(nèi)在聯(lián)系的知識(shí)整體,這樣的數(shù)據(jù)庫(kù)組織和鏈接方式是根據(jù)使用者的層次和需求決定的;
八、如《中國(guó)大百科全書》《辭海》這樣的百科全書和百科辭典,是經(jīng)過高度提煉的高質(zhì)量工具書,在知識(shí)體系的嚴(yán)密性、平衡性,知識(shí)點(diǎn)表述的準(zhǔn)確性和簡(jiǎn)明性方面,是其他文本數(shù)據(jù)所無法比擬的。而且它們用眾多的條目展開全部知識(shí),一個(gè)條目就是一個(gè)知識(shí)細(xì)胞,使查檢靶的明確而集中,故可以其條目為金字塔的核心知識(shí)群,其他文本數(shù)據(jù),均可與之依緊密程度呈漣漪狀地與之相鏈接。
九、對(duì)于一般的求知者來說,可以借助工具書條目直接、迅速地找到所需知識(shí)的簡(jiǎn)明而準(zhǔn)確的表述,成為他們不可或缺的知識(shí)之友;對(duì)于大學(xué)以上的深造者和專業(yè)人士來說,又可通過塔型知識(shí)庫(kù)從有關(guān)問題的一般表述開始,進(jìn)而找到相關(guān)研究成果和所需的研究資料,使研究的起點(diǎn)更高,從這一點(diǎn)上來說,它又將成為專業(yè)研究和論文撰寫的最好的工具,這也是一種研究支持功能;
十、基于上述目的,應(yīng)從對(duì)擬收資源各層級(jí)文本之表述方式的分析出發(fā),運(yùn)用先進(jìn)的數(shù)據(jù)庫(kù)技術(shù),逐步對(duì)塔中的全部知識(shí)作科學(xué)而細(xì)致的類分和標(biāo)引,使其知識(shí)之存儲(chǔ)方式發(fā)生質(zhì)變,從而其搭配取用方式也發(fā)生質(zhì)變,類聚相關(guān)相似知識(shí),挖掘隱性相關(guān)知識(shí),而且產(chǎn)生無窮的新知識(shí)。它將獨(dú)立于紙介質(zhì)出版物而存在,既利于查檢,也利于研究,其功能在原出版物的基礎(chǔ)上得到增強(qiáng)。