“日本所藏中文古籍數(shù)據(jù)庫”簡介
該數(shù)據(jù)庫由京都大學人文科學研究所附屬的“漢字情報研究中心”(2008年4月后改稱“東亞人文情報學研究中心”)在2001年發(fā)動,參加者有東京大學東洋文化研究所附屬的東洋學情報研究中心。至2008年5月,加入數(shù)據(jù)庫的主要是全日本的大學圖書館,國立圖書館和地方政府的公立圖書館次之,財團法人的私立圖書館較少,計55個,目前錄入的數(shù)據(jù)總數(shù)達748585條,現(xiàn)仍在進行之中。
“日本所藏中文古籍數(shù)據(jù)庫”的古籍目錄的分類,以《京都大學人文科學研究所漢籍目錄》為基礎,參酌《內(nèi)閣文庫漢籍分類目錄》。漢字編碼用的是國際通用的UTF-8編碼。據(jù)主編者的意圖是“不僅限于日本國使用,而是以提供給世界各國使用為目標”。編者為了讓日本、中國大陸、臺灣、韓國等任何一種編碼系統(tǒng)都能檢索,編者還將各國的漢字對照表加進檢索軟件中。
該數(shù)據(jù)庫基本上是個目錄數(shù)據(jù)庫,沒有收錄文本內(nèi)容。但為了辨別不同版本,盡可能附上卷頭的影印件,目前已影印一萬多件。還有一部分圖書,已連接到人文科學研究所的全文畫像數(shù)據(jù)庫,可以閱讀全文。
資料來源:高田時雄《“日本所藏中文古籍數(shù)據(jù)庫”介紹》,見《漢學研究通訊》2010年2月,總113期)
陳友冰摘編