每一部古籍善本,都有一段精彩历史,映射着多姿多彩的中国传统文化。浏览“江苏省珍贵古籍数字资源集成平台”,《投笔集一卷》《憺园文集三十六卷》等文集有序排列在书架上,这些古朴厚重的线装书经过数字化技术处理后,重新图文并茂地呈现在大众眼前,曾经书写在宣纸之上的方块字,也仿佛重获了新生。
近日,南京图书馆“清人文集数据库”上线,作为“江苏省珍贵古籍全文影像数据库”项目第一期成果,该平台目前收录南京图书馆藏清人文集400种,以全本彩色扫描的方式,制作成13万多幅数字影像,对社会公开发布,读者只需要登录这个系统,就可检索、阅览所有的数字化资源。
南京图书馆历史文献部主管叶健告诉记者,清人文集是研究清代文献的重要基础,是反映清代社会经济、政治、文化等方面的重要依据,以图像数据库的形式集中展示清人文集,可为清代文史方面的学术研究提供帮助。另外,此番收录的“清人文集数据库”,囊括稿抄、批校、题跋等多形式版本,作者年代涵盖了整个清朝时期,还将视角延展到很多没有全网公开的古籍上,“例如嘉庆时期刻本吴俊《荣性堂诗集》、潘奕隽《三松堂集》等等,都是较为罕见的文献”。
为了方便读者检索,上线的“清人文集数据库”不仅对每种文献作至少深入序、跋等第二层级的标引,还提供了细颗粒度化检索字段与古籍信息,提供如“四部分类”“版本类别”“朝代分布”“馆藏分布”等类型化检阅项,满足读者个性化的检索需求。
“南京图书馆所藏古籍达到160万件(册),且善本较多,我们古籍数字化的项目从2008年启动,到2014年已实现了珍贵善本的数字化,目前,我们共实现了1万多部古籍数字化。”叶健介绍说,缺字的处理是古籍数字化过程中的瓶颈,电子文本需要字库支撑,古籍中有很多繁体字、异体字、通假字和避讳字,“目前,业界多采用Unicode作为文字处理的标准,但这并不能囊括现有古籍的全部汉字”。
不同地区的古籍数据库因为建设标准不同,很难统一,“江苏省珍贵古籍数字资源集成平台”从省级层面建设,对古籍数字化的技术标准,比如,对扫描图书信息的完整性、图像文件大小、水印大小、分辨率、图像格式、颜色、位深等方面进行规范,“在条件允许的情况下,江苏各市县级的图书馆可以将馆藏古籍的高清扫描影像汇集进来,通过这个平台实现资源共享,这样也能避免同一部古籍被重复扫描上传的情况。”叶健说。
新华日报·交汇点记者 周娴