在编审、校读古代典籍书稿时,繁转简及处理异体字是相对复杂且枯燥的工作,不仅要求编辑能够熟练阅读繁体竖排文本,更要求编辑具有一定的文字学知识及古代汉语常识。简化字虽然早已推行,但在2013年以前,对于繁转简及处理异体字并没有一套完整的规范,致使简体字出版物中频繁出现如保留繁体字、过度简化、一刀切替换异体字等情况。出版物中频繁出现如保留繁体字、过度简化、一刀切替换异体字等情况。
2013年6月,经国务院同意,教育部、国家语言文字工作委员会组织制定的《通用规范汉字表》公布。可以说,《通用规范汉字表》的公布为繁转简及处理异体字提供了成熟且全面的规范,有利于简体字出版物尤其是中国古代典籍简体本的出版,也降低了书籍的阅读门槛。
然而,由于《通用规范汉字表》收录字符较多且不能直接检索,导致编辑往往在实际工作中不能方便地使用,再加上对书稿进度的需求,为了“省事”,有些编辑会选择直接“照搬”他社简体字出版物的处理方法,但如果所参考版本出版过早,甚至这个参考版本也是由“照搬他本”而来,那其参考意义就颇值商榷。
得益于OCR识别简化技术,今天编辑工作中对繁转简及异体字的处理,重点往往已不在于对原字的“如何修改”,而在于“缘何保留”,对这一问题,笔者曾做过一点关于保留稿件中繁体字和异体字的总结,作为自己工作时的办法。这份总结包含两个部分:
第一部分是保留稿件中繁体字和异体字的基本原则,之下列举了需要保留的数种情况,并举例说明;
第二部分是面对繁转简及异体字处理有疑惑时的一个简单实操方法。时间和专业知识允许的情况下,进行入里的考据当然为最佳,但在实际工作上往往难以做到每一个问题都细致考究,我们可以利用一些相对便捷易得的资源如网页、字典等,再与《通用规范汉字表》相配合,形成符合今天规范的、相对中立的处理办法,至少可以做到对此类问题的过滤。
一味否定简体字是不可取的,简化是汉字发展的总体趋势。诚然,在汉字简化的过程中,存在着大量不科学、不合理的缺陷,有着长时间的广泛讨论乃至争议,可以看到简体字今天还处在不断优化和整理的过程中。但这个过程对于一部书稿的出版乃至编辑的职业生涯,注定是缓慢渐进的。这份总结对于取字用字规范原则的总结,基本符合简体字未来的演化方向,但所举例子和对实操办法的介绍,则难免有其时效性。不畏粗陋发出,只为抛砖引玉,恳请方家指点。
简化是汉字发展的总体趋势,但汉字不能无限制地简化,必须有足够的区别度,笔画过于简单有时就不能起到区别汉字的作用;同时,简化汉字要符合汉字形体自身发展的规律,不能由个人随意生造。
汉字简化最重要的方法就是简化偏旁。偏旁的简化是有规律的,掌握了这些规律,就可以从繁体字类推出相应的简化汉字来。《通用规范汉字表》将类推简化的范围严格限定在字表以内。允许字表以外的字有条件使用,但不类推简化。
有些简化字不能作为简化偏旁去随意类推简化其他繁体字。如“兒”简化为“儿”,但不能把“倪、霓”中的“兒”简化为“儿”;“幹”简化为“干”,但不能把“擀”字的右半边简化为“干”(“擀”字即为规范字,无需简化)。
有些字是单独简化的,不能用作简化偏旁的简化字来类推简化。如“貝”简化为“贝”,但不能把“償”中的“貝”简化,而是整字简化为“偿”;“盧”简化为“卢”,但不能把“蘆”中的“盧”简化为“卢”,而是整字简化为“芦”。
有些字的简化偏旁也不能类推简化。如“療”简化为“疗”,但不能把“僚、潦、缭”的右半边简化为“了”;“溝”简化为“沟”,但不能把“篝、媾、遘”中的对应部分简化为“勾”。
以上这些简繁错用范例摘自《出版专业基础(初级)》,除了“擀”字以外,目前的OCR识别简化技术都可以避免,但我们不可因此对类推简化的错用掉以轻心,在《通用规范汉字表》里查不到的类推简化,要用它在《古代汉语词典》里能查到的字形。实在查不到,用原字。
1977年12月,国家有关部门公布了《第二次汉字简化方案(草案)》,也就是所谓的“二简字”。限于当时的条件,“二简字”有些急于求成,许多字简化得极不合理,故于1986年6月“二简字”废止。“二简字”虽然废止,有些人还是会误将其当作规范的简化字使用,如“菜”的下半部分写成“才”,“停”的右半部分写作“丁”。还有一些民间自造的所谓“简化字”,如“鸡蛋”写作“鸡旦”。
有少数简化字,一般情况下用简体,但在一定的语言环境中可能有歧义,这时仍用繁体。如“藉”,用在“藉口”“凭藉”中简化为“借”(jie四声);用在“慰藉(jie四声)”“狼藉(ji二声)”中仍写作“藉”。“於”,用在“於心不忍”中写作“于”(yu二声);用在“於菟”“於乎”中仍写作“於”(wu一声)。
2000年10月,第九届全国人大常委会第十八次会议通过《中华人民共和国国家通用语言文字法》,其中第二章第十七条规定,有下列六种情形的,可以保留或使用繁体字或异体字:
(1) 文物古迹,
(2) 姓氏中的异体字(如甯、仝、锺等),
(3) 书法、篆刻等艺术作品,
(4) 题词和招牌的手书字,
(5) 出版、教学、研究中需要使用的(即根据出版书籍的专业程度来决定),
(6) 经国务院有关部门批准的特殊情况。
对于书稿的实际处理,这六种情况的表述其实是比较笼统的。有些具体情况可参考《通用规范汉字表》“规范字与繁体字、异体字对照表”后面的注释,但稿件的内容类型是多样的,重点在于理解这六种情况保留繁体字、异体字的原因所在,而不是作出“人名和古地名一定保留繁体、异体字”式的一刀切总结,在笔者的工作过程中,曾发现一些保留繁体字、异体字的原因,兹举例如下,以作各位由浅入深的引玉之砖。
(1) 当时时代可能并未出现今字,比如“霸水”“霸上”要谨慎改为“灞水”“灞上”,这涉及地名用字的演化问题。地名用字很多由后世进行形声造字而成。比如“霸上”的“霸”演化为“灞”,“睢水”的“睢”演化为“濉”等。这种地名中形声字的出现时间,不一定是为该地命名的时间,可能是很久以后,要考虑到当时时代的用字。比如《史记》中的“霸水”“霸上”,若是统查统改为“灞水”“灞上”,可能会抹掉汉字的演变理路,笔者认为是不够妥当的。
(2) 今字在当时时代可能并未有其意思,比如古文中的“钜鹿”要谨慎改为“巨鹿”。以笔者阅读所见,巨、矩古时同字,金文中作,象人手持曲尺之形,“巨”作“大”解似乎是汉代才出现,如《汉书》载《小尔雅》“巨,大也”,又如《公羊》“力士举巨囊”,而钜鹿一地在汉前就已经出现。笔者的观察未必全面甚至未必正确,但此假设本身似已足以说明问题,采“钜鹿”而不作简化似乎是比较稳妥的做法。其实,此类情况是否简化,以对应当时的相关记载进行确定确是个合理的方法。
(3) 取用之字本身包含信息。这一情况常见于人名,比如唐代王勃的兄长名王勮,明显可以看出是一族中同辈人的名要字形相似,如果改为“王剧”,就抹掉了这一信息;再比如正德皇帝朱厚燳,他们这一辈的名字中都有火字旁。同样的情况也见于避讳,也是用字本身包含信息。这类情况可根据书稿的专业程度酌情调整。
写到这里,笔者想到一个问题,就是编辑和学者之间的区别。在编辑的工作中,勘误求正是很重要的部分,但相较于学者,编辑的勘误只是手段而不是目的,编辑的目的是让一部稿件达到出版标准,过度求证也会对这个目的形成妨碍,有时只需要对稿件提出恰当的问题和疑惑,就可以形成编辑工作的有力指导。不管是勘误还是立问,都是针对稿件具体内容而言的,这就要求编辑具备具体问题具体分析的习惯。
总会有编辑希望得到或试图总结出一个某类稿件的审校标准,但事实上,编辑工作的"凡例"是比较少的,稿件的方向、内容、体例乃至文风是如此地多样,所总结的标准越是“放之四海而皆准”,这样的标准就越是空泛而缺少实操价值,机械执行也往往造成如将浙江“台州”改为“臺州”之类的错误。
本节虽然是介绍保留繁体字和异体字的情况,但为完善说明,笔者也列举三种需要对繁体字、异体字做出处理的典型情况。
首先,不用已淘汰的异体字,这种情况在一些用字艰涩的诗词歌赋中经常出现,如《文选·左思·吴都赋》:“里讌巷饮,飞觞举白。”此处的“讌”字是“宴”字的异体字,在简化时应改为“宴”,又如《晋书·卫瓘传》:“思字體之頫仰,舉大略而論旃。”此处的“頫”字是“俯”字的异体字,在简化时应改为“俯”。
其次,不用已淘汰的生僻字和复音字,这里所说的生僻字,主要是指经国务院批准淘汰的一些作为地名的生僻难认的字,如黑龙江的“铁骊”改为“铁力”。
再次,区别新旧字形,这种情况,校对软件一般可以识别出来,故不再作举例。
为了介绍这个方法,笔者以左思《蜀都赋》“火井沈荧于幽泉,高爓飞煽于天垂”一句中的“爓”字举例,以此字举例的原因,是“爓”字与前文举例“里讌巷饮”中的“讌”字不同,“爓”并未收录于《通用规范汉字表》,即表外字。步骤如下。
1.先在网页上查询该字的繁体字和异体字。这里笔者以汉典网(https://www.zdic.net/)为例。(如果打不出来,可以使用“汉字拆分”方法查询。)
2.进入该字的词条,查看它的繁体字和异体字,繁体字为红色字体,异体字为黑色字体。选取可能的简化字(汉典网的异体字不是国标,仅供节约时间之用)。我们看到,“爓”的异体字中,可能的简化字为“焰”。
3.打开《通用规范汉字表》,根据该简化字的笔画在“笔画检字表”中查询,得到该字左侧编号。(这一步比较费眼睛,可以根据偏旁排列规律先大致定位,再仔细辨别。)“焰”字编号为2748。
4.到《通用规范汉字表》的“规范字与繁体字、异体字对照表”中按编号查询该简化字对应的繁体字、异体字,如果有,就改为该简化字(正字)。可以看到“焰”字没有繁体字,异体字对应为“燄”,没有“爓”。
5.如果在第4步中没有查到对应的简化字,那么就分别根据该字和类推简化以后的笔画,到“笔画检字表”中检索。“爓”字字形无论是原字还是类推简化,均未在字表中查到,符合“有条件使用,但不类推简化”的情况。
6.综合《通用规范汉字表》《古代汉语词典》和稿件中的注释决定取舍。如“爓”字在《古汉语词典》里有单独词条,且未标明同某字,故我们选择在稿件中使用“爓”字。(此步一定不能省,有些异体字不止对应一个正字,不能简单地查到就用。比如“適”字,根据音义不同,分别对应了“适”“谪”“嫡”,如果对应的是“适”字,就可以直接简化,如果是后两个字,就要视稿件的专业程度进行保留或加注。)
当然,《通用规范汉字表》一定不是收录了全部的异体字形,在本例中,“燄”“爓”两字也有非常明显的字形关联,事实上也存在“燄”“爓”同为“焰”的异体字的说法。但值得注意的是,我们是在当代现有的规范下去处理稿件,在这样的大前提下,修改为“焰”似乎稍有冒进,选择不修改并非机械刻板的处理方式,也有记录简体字演变的意义在。
简繁字转换及异体字处理的最终目的,是让读者看得懂、查得到,所以在转换时一定要慎重,查不到简化字形的字宁可不改,也不要随意造字。不要以“读者是否认识该字”为原则进行类推简化,而是要以“该字是否有出处”为原则进行简繁转换及异体字处理。也就是所谓的“程序正义”。