编辑在审校书稿时,核对引文是一个重要的环节,可以让作者提供原文。但经常囿于各种条件限制,需要自行寻找一些权威的版本进行核对,以保证书稿质量。以往审校的书稿,经典古籍库就很够用了,绝大部分史料都可以在其中找到。
最近在审校一本关于海交史史料的书稿时,对古籍数据库的使用有了切身体会,也偶然发现了一些此前没使用过的数据库,在这里分享给大家,也希望同行编辑老师进一步讨论补充。
《明实录》可以从以下几个平台进行内容核对,在核对《明实录》时,还发现了这些数据库的其他资源。笔者根据使用体验将平台罗列如下:
(北京大学—字节跳动数字人文开放实验室合作共建的开放平台)
图1
图1将这个数据库的特点表现了出来,包括整理团队和版本情况。内容简体横排,AI的现代文翻译的内容基本准确,检索内容特别方便,但因为是粗校本,还是有疏漏的地方,可以看原文,而且还是开放资源,很容易获取。
同时这里有丰富的古籍资源可以获取,很多是AI文字识别,但是有原文可以看。
版本是国立北平图书馆红格钞本微卷,微卷系美国国会图书馆增摄,红格本缺卷缺页据别本补。这个数据库是经过“中研院”史语所校勘的,检索方便,内容准确,资源获取方便。
图4
图4是内文显示,也可以图像和文字对照,只有繁体字版,文本经过校对,放心使用。
图5
图5是书同文的其他一些可用的资源。其中一史馆的清实录、清会典也可以在一史馆的官网上直接利用,如图6。
微信读书中的《明实录》收录不全,大部分没有句读,基本上都对,但也有个别不准的地方。使用很方便,能检索,有客户端和网页版。
值得一提的是,微信读书里有很多其他数据库没有收录的新版古籍,如江苏人民出版社2024版的《高丽史校注》,宁波出版社2019年版《敬止录》等。而且我经常拿它当便携的语料库和数据库用,很方便。
中国哲学书电子化计划,很久以前查古籍的时候经常会使用到,近几年古籍数据库的开发使用越来越权威方便之后,使用就比较少了。内容是由文字识别功能建立,未经校对,没有标点。有时会检索不到,应该是未经校对的缘故。
国学大师《明实录》检索比较方便,简体横排无句读,版本情况以及是否经过校对不确定。国学大师有丰富的古籍数字资源可以使用。
图7
尚古汇典有全文,又权威又能检索。
日藏的汉文古籍种类丰富,有些可以全文查阅检索。
1. 日本国立国会图书馆可以检索内容,还能根据原文图像核对,十分方便,资源也十分丰富。
图9
如图9,一些史料比如镰仓遗文等可以全文检索。
1.《李朝实录》可以在上文提到的“中研院”的网站里查找,使用起来很方便。
2.朝鲜王朝实录:这个网站据说是由韩国国史编纂委员会主办的,能提供全文,可以用汉语检索,人名等一些专有名词是用不同颜色标出来的,很方便。
图10
3. 国学大师上的图像版,不能检索;有文字检索版,但是收录不全。
4. 上文提到的日本国立国会图书馆也是有部分《李朝实录》可以检索查询。
读秀上的资源确实比前几年要少了一些了,但有些资源隐藏得比较深,要多方检索才能发现。审校书稿的时候有几段引文出自《甓余杂集》,最终是在读秀里找到的资源。
图11
经典古籍库、学衡数据、爱如生(典海)等常用的古籍数据库就不在这里分享了,这几个古籍库涵盖了绝大部分的古籍资源。
总之,检索起来方便与否,版本权威与否,还需要使用者在实践中摸索出适合自己阅读习惯的路径。我目前用到的就这些,但仍有很多十分专业的数据库,比如关于甲骨文、金文、简牍等内容的专门数据库,这些需要大家在工作实践中遇到相应的问题时积极探索。
Deepseek回答“古籍数据库资源有哪些?”
在写这篇心得的时候,正值DeepSeek蹿红,笔者问它“古籍数据库资源有哪些?”给出的答案(深度思考+联网搜索)还挺靠谱的。联网状态下的回答有各个网站的链接。
以下是目前国内主要古籍数据库资源的整理,涵盖综合性平台、专题库及特色资源库,结合了最新发布的资源信息(截至2025年2月):
简介:由国家图书馆主导建设,整合全国古籍资源,包含29个专题库,覆盖善本、碑帖、地方志、家谱等类型,总资源量超10.6万部(件)。新增扬州市图书馆、澳门大学图书馆等机构资源。
特色资源:
宋元善本:如苏东坡相关宋元本9部、清乾隆活字印刷技术文献等。
民族文字古籍:藏文、满文等文献,如《四部医经》清代手抄本。
简介:全球最大中文古籍数据库之一,收录先秦至民国的1万部典籍,含18万卷全文及26万卷版本影像,支持图文对照阅读和全文检索,覆盖历史、文学、哲学等领域。
特色功能:原版式还原、朱墨套色显示、多条件检索。
访问地址:典海数字平台(需注册)
简介:覆盖经史子集丛全部分类,收录85万卷古籍,含四库类、方志、家谱等,支持一站式检索,数据量达8TB。
访问地址:古籍馆数据库
民族文字特藏库:藏文《四部医经》、满汉合璧文献等,体现多民族文化交融。
陕西文献集成数据库:整合陕西地方志、金石碑刻及学术研究成果,覆盖6000万字资源。
边疆历史地理数据库:收录1.5亿字边疆史地文献,含《水经注》《太平寰宇记》等经典。
首都图书馆《牡丹亭》专题库:提供明万历刻本全文、场景复原视频及公开课,推动古籍创新利用。
上海图书馆国家谱知识服务平台:关联数据技术整合1.5万种家谱,支持家族迁徙、人物关系分析。
繙云古籍文献分库:独家收录完整四库系列(四库全书、续修四库、禁毁书等),含3.8万种古籍及80亿字资源。
敦煌史料库:整合英、法、俄等国馆藏敦煌文献数字化资源。
中华文史学术论著库:收录《燕京学报》《文史》等期刊及学者文集,支持引用文本自动生成。
西南联大专题数据库:含口述视频、手记等1500分钟珍贵史料,还原抗战时期学术生态。
书格(开放共享平台)
提供305种古籍书目检索,侧重公共版权领域古籍的开放式分享,如《中国历代典籍总目》。
中华书局籍合网
包含《中华文史学术论著库》《边疆历史地理数据库》等,需通过合作机构访问。
1. 部分数据库需通过机构IP或VPN访问(如中国基本古籍库)。
2. 最新动态可关注国家图书馆“中华古籍保护网”及地方图书馆官网。
3. 免费资源优先推荐“中华古籍资源库”和“书格”,深度研究可结合专业库(如繙云四库系列)。
如需具体数据库链接或更多资源类型,可进一步参考上述来源。
笔者也问了它能否核实古籍引文,它回答常见的古籍可以。但是它有时会编,用AI核实引文也就是想想,现阶段不太靠谱。然而随着技术的发展和人对技术的深入实践,AI赋能编辑出版业务势在必行。
作者 | 田娜 吉林大学出版社
初审 | 夏国强
复审 | 邢自兴
终审 | 赵玉山