English

数据库与古代文学研究

2004-09-29 来源:光明日报 作者:吴夏平 我有话说

数字化革命带给现代社会的不只是物质财富上的丰富,在精神文化方面同样以惊人的成就展示出现代社会特有的风采。在古典文学研究方面,《四库全书》、《四部丛刊》之光盘版以及包括《二十四史》、《全唐文》、《全唐诗》、《全宋词》在内的《国学宝典》光盘检索系统,为二十一世纪的古典文学研究开辟了新的道路。检索

系统极大地提高了我们的工作效率,我们不必为了寻找诸如一个名词之类的小问题而去逐册翻阅大量的文献,只需轻轻一击便可以轻松解决。利用检索系统,我们还可以作出在前人看来是难以想象的各种数字统计以及各种量化分析,比如作家古籍、词汇的使用频率、文学研究现状等之类的分析统计。此外,光盘版文献还有一个好处就是可以拷贝,自动生成文件式的卡片摘录,节省了我们许多不必要的用来书写或打字的时间。

但是,光盘检索能替代阅读吗?答案毫无疑问是否定的。就其本身而言,数据库检索系统尚有许多未能尽如人意之处,甚至可以说有二个“硬伤”。一、系统有时会出现“链接脱落”的现象,也就是说输入一定的词条,但检索结果并不一定能够显示全部含有此词条的相关内容。这一缺陷毫无疑问会影响到统计结果的可信度。二、《国学宝典》很多地方标点错乱,并且没有注明所用的版本。此外,就检索范围来说,《四库全书》、《四部丛刊》以及《国学宝典》所容纳的文献量虽然浩大,但新近的各种发现和地下出土资料,比如敦煌文献以及各种墓志等并不是这几张光盘所能囊括的。

与“硬伤”相对,更重要的是由于个人知识的局限以及一味依赖检索所造成的“软伤”。其一、要尽可能地检索较为完备的结果,不仅要熟悉同一内涵的不同概念指称,还应熟悉所检索的对象的发展衍变。否则很难检索到较为完备的结果。其二、过于依赖检索系统会逐渐滋长我们的隋性。数字检索在方便之余也逐渐吞噬我们的思维。好的学术在于敏锐的学术眼光和问题意识,而学术眼光与问题意识都只能在阅读大量的原始文献中逐渐培养。我们说,为人须“求同存异”,为文则要“求异存同”。问题意识就是从“求异”中培养出来的,而阅读大量的原始文献则是“求异”的基础。

我们说文学研究,其本身是很个性化、私人化的,每个人所从事的研究也并非其他任何人都能替代,因而建造具有个性化和私人化的数据库尤其重要。

我们先来看看古人是怎样建构“数据库”的:我们知道,类书的编纂很大程度上就是为上至皇帝下至士子进行创作而创建的“数据库”。创建这种“数据库”,首先要做的事情就是分类。不同时代的类书自然在分类上有所区别,这正体现了对事物认识的时代性和类书使用的功利性。

同类相归的方法在类书编纂的过程中大致有两种。一是“分条平列”,如《太平御览》,详则详矣,但对于使用者来说很是不便,不易找寻。二是“标题隶事”,最有名的是虞世南的《北堂书钞》。两种方法孰优孰劣,得依据使用者的情况而定。不过,后者对所摘抄的材料进行了简单的加工处理,似乎更接近今天我们所采用的收集材料的方法。

我们举一个直接的例子来说明这种先分类再填充的创建“数据库”的方法。《四库全书总目提要・子部・类书类・白孔六帖提要》引北宋杨亿《谈苑》:“白居易作《六帖》,以陶家瓶数十,各题门目,作七层架列斋中,命诸生采集其事类投瓶中,倒取抄录成书。”由于人多手杂,标准不统一,所以杨亿批评《六帖》“故所记时代,多无次序。”白居易的《六帖》之法值得借鉴,但如杨亿所批评的,这种方法较为杂乱,很难有个性化的创见。

如今,计算机的应用确实给古代文学研究创造了新的机遇。我们可以在电脑中依据个人的需要创建各种文件夹,这相当于《北堂书钞》所分的“部”,也相当于白居易的七层架子。在文件夹之中又可以根据需要创建许多文档,这些文档相当于《书钞》的“类”和白居易的“陶家瓶”。在每类之下我们可以精括摘录内容标出小标题,所摘录之内容注明出处。除此之外,要创建私人化和个性化的数据库,应十年如一日,像陶宗仪著《辍耕录》那样,“作劳之暇,每以笔墨自随……遇事肯綮,摘叶书之。”(孙大雅《辍耕录序》)这样的数据库,同样可以检索,比起古人来方便得多。要之,借助光盘版文献创建独具个性的数据库,比只依靠光盘检索系统更为重要。(作者单位:华南师范大学)

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有