English

古籍数字化的负面影响需要警惕

2010-07-17 来源:光明日报 作者:陈得媛 我有话说
古籍数字化工作从最初摸索尝试、零星制作到当前规模开发,己经取得令人瞩目的成就,一批基础性的古籍文献被开发为真正意义上的数字化产品,并成功走向市场。但我们应该看到,古籍的数字化是一把“双刃剑”,它在给读者带来便利和效率的同时,也给读者带来一些负面影响。如果对这些负面影响缺乏客观和全面的认识和评估,
不采取一些切实有效的措施加以纠正,将进一步助推浮躁不实的学风,从长远看,也会影响到古籍数字化工作的可持续发展。

其一,古籍数字化养育出许多读者不读原典的风气。古籍数字化虽然给读者带来了便利和效率,但也在悄无声息地弱化读者、尤其是青年读者的古籍阅读能力,甚至养育出许多不读原典,只会检索的学术“懒人”。在急功近利世风的影响下,越来越多的读者不去认真阅读原著,只是根据预设的想法,在数字化古籍中检索、复制、下载能证明或支持自己预设想法的文献材料。断章取义,曲解材料,不考虑句意、语篇,不了解古籍中相关事项的其他论述,只是根据检索结果,任意剪裁文献,对问题的理解不恰当或是得出的结论似是而非的现象很突出。古籍数字化使读者学习和研究的效率提高了,但学习和研究的质量却降低了,长此下去,读者,尤其是青年读者古籍阅读和理解能力会不断弱化,这种状况不能不令人忧虑。

其二,古籍数字化使读者勤于检索,少于思考。系统地阅读一本书与从一本书中检索出特定的资料,是两种不同性质的学习或研究过程。前者是与典籍作者对话,在阅读中思考,在阅读中提升自己的知识水平和思想境界,而后者只是一些特定信息的获取。在古籍数字化以前,边读书边作卡片,几乎是所有先生对学生的基本要求。除卡片式笔记之外,另一种重要的阅读方式是边读边作批注,手中执卷并圈点批注已是人们长期以来养成的一种阅读习惯。传统阅读的卡片记录和批注,暗含着读者对事物的认识态度和分类意识,而数字化古籍以信息检索为基本内容的阅读方式带给人们的是囫囵吞枣式的阅读。读者通过他们的指尖获取大量信息是重要的,但从教育以及学术意义上来说,他们仅仅通过检索到的关键词来阅读一些简单的信息,而忽略了原文的具体内容,从而把阅读做成了信息获取的快餐,抹去了读书过程中必不可少的思考和体悟。从某种意义上说,数字化的古籍对于一些读者来说,已经不是一本书了,而只是没有情感、冷冰冰的信息资料库而已。

其三,古籍数字化易使读者用电脑代替人脑,不重视隐性资料。数字化具备异常快捷的检索、统计功能,字、语词、事项最早或原始出处的查找,都可以在瞬间完成。但这种检索功能也带来了另一个问题――误引、误用成为常事。现在一些读者不是逐书翻检,只输入关键字词,点击鼠标。殊不知,这样检索的结果,并不都是可靠的。目前数字化古籍全文检索的功能还相对单一,还不能满足读者的多元需求。因为这些全文检索,只能是关键词的检索,不论是单词检索,还是组合检索,检索一次,都只能检索到与输入的词语严格匹配的资料,而不能检索到不含输入的词汇而实际相关的资料。也就是说,数字化古籍目前只能固定检索海量数据,而不能智能化地检索和生成新的数据。因为不能智能化检索,所以,我们无法穷尽古籍文献里的资料。如果说,用关键词检索人物资料,通过组合检索或多次检索的方式还能比较全面地查到所需资料的话,那么,查找相关主题的资料,就更加困难了。比如有读者查《四库全书》中有关文学传播的资料,但是古人并不常用“传播”这个概念,如果用“传播”作为关键词,就无法查到《四库全书》中蕴藏的大量的文学传播资料。检索不到《四库全书》中以“传播”为主题词的资料,并不等于说中国古代没有相关的文学传播方面的人和事。正如吴夏平先生所指出的那样,中国古代文献由于汉语的模糊性和不确定性,容易产生歧义,字面所反映的并不一定就是事物的真实意义,如果要了解事物的全部内容,则必须从字里行间去寻找“言外之意”或者“微言大义”。这就需要我们去仔细阅读原典,细心体会文献中的隐意,再强大的检索也无法代替。

其四,质量低劣的数字化古籍产品误导读者。一是错字错句多。在网络上传播的一些数字化古籍因为输入错误或者文字识别技术上的不足,篇章搞乱者有之,错字错句者有之,如果从网络上直接下载复制这些文献资料而不核对原文,一定会出现许多硬伤。二是正文和注混在一起。我国古籍一般都是把正文和诸家注解刻印在一起,并用字体大小或低两格的方式把正文和注解分开。由于一些古籍数字化工作者粗心大意或者古籍素养不足,往往把正文和注混在一起了。如网络上传播的一些数字化的《二十五史》,没有区分正文和注解,误导了许多缺乏传统文化素养的读者。三是疏于校勘。一些商业机构在进行古籍数字化产品开发时,嗜利忘义,忽视了古籍数字化工作的社会责任,导致古籍数字化数据库错误严重。另外,由于古籍出现于不同的时代,从手抄本到各种技术的刻印本字体极不规范,除了繁简字的问题,还有大量的异体字以及专用名词。一字多形、多义,一字多音,通假字,古今字,错讹字,异体字等现象在古籍中相当普遍。在古籍数字化过程中,一些数字化古籍产品开发者忽视版本的选择,内容的校勘和特殊字词的处理,致使这样一些特殊汉语字词被乱用和错用。四是古籍中一些特殊字词古今混用。在文字识别和繁简体转化过程中,由于技术问题,一些古籍中的字词不能识别或识别有误,一些繁体字虽然有相对应的简体字,但有些繁体字在特殊的语境中不能简化,如作为姓氏的“岳”就不能与繁体“?”互转,刘知?的“?”作为人名就不能简化为“己”,繁体的“?”、“?”本身代表不同的内涵,但都简化成“发”。这些都是在古籍数字化工作中应该严格按照古籍中字词应有之义进行技术处理的,但许多数字化古籍没有做这方面的工作,而读者在运用数字化古籍时不能区分。

总之,古籍数字化工作是当代科学技术发展的重要成果,是不可逆的发展趋势,任何反对、阻止这种潮流的想法和做法都是不可取的。但是,我们对古籍数字化给读者带来的一些负面影响也应该有清醒的认识和正确的评估,并通过一些行政的、学术的手段和技术革新把这些负面影响降到最低程度,保证学术文化事业的不断进步,保证古籍数字化工作的可持续发展。

(作者单位:华中科技大学图书馆)

 

(资料图片)

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有