English

突破十大技术瓶颈

2000-03-08 来源:光明日报 高文 我有话说

目前,中国数字图书馆工程建设正面临如下挑战:

1.信息资源建设:数字图书馆要把文本、声频、视频等各种信息资源整理入库,最大的问题是这些资源由谁来调动,由谁来做。这项工作如果协调不好,很可能同一件事要重复若干遍,给社会造成极大的浪费。

2.多媒体信息标准:在开始建设中国数字图书馆时,面临着一个严峻的事实是没有相应的电子图书标准,也没有多媒体信息标准。而现阶段,技术标准在一定程度上已成为国家主权的延伸。因此,在建设中国数字图书馆工程时,相关技术标准工作的研究尤为重要。技术标准的草拟应该由信息产业界、图书情报界以及与标准相关的国内软件开发商共同参与,在标准讨论的同时开发一批建立在这些标准基础上的软件系统。

3.存储与压缩:数字图书馆面临的数据是多种类型的、海量的。目前的数据库能否应付海量数据的存储?即使现在的数据库在管理上能满足要求,其系统的成本能否被接受?因此,如何保存和管理海量数据是系统设计的核心任务之一。在数字图书馆中,大部分是多媒体数据。因此,对多媒体数据必须进行压缩,然后保存在数据库中,以降低库的成本,使库的规模保持在可管理的范围内。

4.分类、索引、检索:目前在计算机中还没有像图书馆那样使用统一的分类、检索方法。如果索引方法和分类标准不统一,将来开发计算机的搜索工具就会非常困难,势必出现针对不同的分类方法制作不同的搜索工具的混乱局面。另外,对不同的内容,不同的数据类型需要不同的分类体系和索引机制。检索工具应保证提供给用户的信息恰恰是用户最需要的。因此,海量数据的搜索效率与速度是系统面临的最大挑战,其中包括中文搜索、图像搜索、语音搜索、智能搜索。

5.传输与保护:目前,访问国内外的站点和国外的站点都很慢。前者慢的原因是处理速度太慢,后者慢的原因是出口的带宽太窄。怎样从服务器端调度协调好,当用户提出一个服务请求时,用最短的时间对用户的请求进行回答,这是系统能否成功的关键。

6.交互界面:这不仅是数字图书馆所面临的挑战,任何系统都有这个问题,即怎样充分利用图形、语音,将其融为一体,设计一个用户界面,让用户使用时得心应手。

7.输出与信息表现:信息的输出和表现是数字图书馆为未来社会带来很大好处的一个方面。通过对数字图书馆的研究,使得人类对信息的发现、信息的利用更上一个档次。

8.多语言问题:这个问题也是“863”计划一直在支持研究的项目,包括机器翻译问题、多语言浏览器问题。

9.工具与平台:这是一个最大的挑战。基中包括总体结构标准、软构件技术、信息录入工具、搜索工具、知识挖掘工具等问题。

10.高层信息服务协议:应遵循以下原则:第一、统一性:不论哪种类型图书馆都必须服从整体协议;第二、分布式:不可能有一个中心,这是现今网络系统的基本点;第三、开放式:内容必须具有开放性;第四、可扩展性;第五、要简单易行;第六、能比较充分地用现有信息的服务设施。(作者为国家863计划智能计算机主题首席科学家、国家863计划中国数字图书馆发展战略组第一副组长)

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有