我原是个学工程的人,一直在台湾工程界服务。上世纪八十年代,用计算机进行中文打字在台湾开始流行。当时台湾使用的输入法只有两种:一种是注音码;另一种是仓颉码。注音码是在键盘上加刻注音符号“ㄅㄆㄇㄈ……”;仓颉码是设定 “日月金木……” 等中文字母。二者都与键盘上原有的“abcd……”没有逻辑上的联系,也就是说字码与码元间缺少有机的映像关系,不易记忆。于是我开始摸索,自创字符输入法,强调字码与码元的关连。自己试用之后,觉得并不理想,于是认定这是汉字本身的结构问题,从此开始了我对汉字优化的研究。
我的汉字优化研究主要有这么几个方面:
一、研究理念
我认为汉字是约定俗成的传统产物,字量庞大,字型驳杂。要研究它,须从全面性的宏观着眼,微观性的计量着手,从统计的资料中分析、推演、归纳,从而得出若干结果。这样做较为踏实,并可理清汉字的全貌。
二、汉字部首的定位
通过对近2万个繁、简规范字的部首归属统计,发现部首其实可在单字的字头或字尾寻找,不必在字的中间摸索。为着检字方便,我以为部首须以 “据形优先、据义其次” 的原则来定位,而且部首的数量也可缩减至约175个。我把大陆7,000个通用字及台湾13,051字一一编部实验,证明“首尾检字法”为可行。初期论文曾在上世纪九十年代的《中文信息》上发表。
三、汉字形声功能的研究
我利用计量法,研究6千多个通用字的形声功能,并从而探讨汉字音变的原因。我逐字统计了音符与本字之间的韵转与声变。统计资料显示声变较韵变为大。不计声调及介音时,形声字的表音功能约为52-55%;若计及声调及介音的变化,则远低于此数。
探索形声字的音变,约有三个方向:第一可由发音部位及语音性质探讨;第二可比较方言及国语的差异;第三可由语音史上去追根寻底。
我认为欲恢复汉字的形声功能,必须使声符合理化。这可从三个方面着手:一是常用字声符的重组或改进;二是次常用字读音的通俗化;三是声符的定性与定量研究。但这并不是一件容易的事,也许我们要认定汉字形声功能的式微,是历史的必然,不必对它有所苛求。
四、两岸汉字字形的比较
在以上三项研究的基础上,我对7千多个两岸通用的规范字,作了字形异同的统计。把大陆规范的通用字与台湾规范的常用字,作一对一的比较与分析,从多种角度说明它们之间的差异,提出一些资料作为讨论繁简规范字统合的参考。我以为这是两岸走向汉字书同文过程中一项必要的前期工作。
由统计可证,繁、简体的差别,实不如人们所想的那么大。依我的静态统计,在7千多个通用字中,繁简体字形完全相同的占了64%;若再加上笔划略有差异的2%,与只部首不同的13%(繁简体部首的差异,只有几个,极易辨认),则繁、简体字形完全相同及相差不多的比例,高达 80 % 左右。
五、汉字字量问题
连异体字在内,汉字的总数已超过10万个,而日常使用只须几千。因此我们要在汉字整理与分级规范上,寻求“最适量”(optimized)的字数。
有人说汉字“生而不报,死而不葬”,因此留传下来的字量愈来愈多,其中大多是异体。另一种更适当的说法,如台湾文字学家趙友培氏所说:“字无生死,只有行废”,也就是说汉字一旦出生就不会死亡,汉字只有用(行)与不用(废)的区别。
汉字编码的范围究须多大,要依编码者所设立的目标而异,这应该是没有争论的。重要的是:规范字的分级,是否做得好?例如,所用样本资料的时代性、字频的统计、异体字的认定、分级的级数、每一级所含的字数等等,都是庞大的文字整理工程,而且可能每三十年须要更新统计一次。
有人估计,汉字从古到今,常用字都在5千左右。尤其今天汉字已成语素文字,而且汉字组词的能力很强,5千个字应是够用的。
至于欲阅读古书,可能须认识较多的汉字。但正如 “科普”的大众化一样,阅览由专家编写的“古普”(古籍精华简介,坊间已有一些著述),可能是有效的替代方式。
六、繁简体的统合问题
繁简体二者各有优劣。预计在相当时期内,繁、简体仍是并行不悖。我认为目前应先行解决繁简体的正确对译问题,避免发生“皇天後土”之类的笑话。其方法是除去异体字之外,大陆的规范,不妨增加一些必要的繁体字。长久之计是两岸相关学者共同协商,拟出一个统合繁简体的共享标准字,开创历史上新的汉字书同文局面。
七、汉字的优化
从汉字发展史看,书写工具常影响汉字的字形变化。如果没有毛笔的发明,可能不会有篆隶之变。今天计算机作为书写工具,对于结构过于复杂、无法拆分的汉字,势必要求优化。汉字字形必须进一步改善,几乎已是定论。我以为倘若一个汉字,它的形、音、义之间缺少关连,或是它的字形结构过于繁复,难学难记,这类汉字就得考虑加以改进。
我以为现阶段的文改,应在传统的基础上创新,那就是现行汉字的优化。这是最可行的一条路。而且汉字的改进,是以保持八成不变的方式进行。《说文段注》中说:“小篆之于古籀,或仍之,或省改之,仍者十之八九,省改者十之一二而已。” 这里所谓“仍之”,即保留之意。台湾一个文字学家说过类似的话,大意是:文改最好以“八分”的方式进行,亦即保留八成不变,二成省改的方式。
相对于拼音文字而言,我赞同潘德孚先生的理念,认为汉字是拼形文字。对汉字要注重字形研究。我的设想是,能否用350-400个左右的汉字基元,依统一的标准笔序,组成常用通用字,用于汉字教学和计算机编码输入。基元即部件,是汉字的基本结构单元,可看作是汉字字母。我经过统计发现,有些基元在繁简体常用字中,只出现一至二次。我以为这些低频低效的字母,最好能设法用他元取代,以减少基元的数量。
以上所叙我对两岸汉字字形的比较和繁简体的统合问题等的研究,可说是和汉字书同文的课题旨趣密切相关;但我原来并没有自觉意识到这一点,也不知道在中国大陆竟有个民间学术沙龙,她的成员们多年来均在潜心研究汉字书同文问题。
我曾把自己的研究心得,发表在自己的个人网站内,另外,又把其中的几篇主要论文链接到了《北大中文论坛》上。2005年1月间,我忽然接到一封署名陈明然的电邮,主题是“请赐大作”。大意是要我把链接在北大网站上的《繁简体规范字的比较》一文传送给他。我和陈先生素不相识,至今也还没有见过面。但出于礼貌,就把该文传给了他。后来才知道,原来明然兄是《汉字书同文研究》第6辑的主编之一。拙文经修正后,以《两岸汉字字形的比较和分析》为题,收入了由周胜鸿先生和明然兄共同主编的《汉字书同文研究》第6辑内。
明然兄在通信中告知我有关《汉字书同文研究》及网站专栏的情况,并把丛书的编委周胜鸿、沈克成、何华珍、冯寿忠、俞步凡、孙剑艺、戚桐欣,倪永宏、李禄兴、胡敬禹等先生向我作了简要的介绍。同时告诉我:“历次参加‘汉字书同文学术研讨会’的专家还有:上海华东师范大学詹鄞鑫教授(博导)、徐莉莉教授(博导);深圳大学副教授张林涛博士;台湾铭传大学副教授王敏東博士等。” 通过这些讯息和对书同文研究专题网站的浏览,我对汉字书同文研究这个民间学术沙龙的专业性,总算有了基本的了解。
其后明然兄详细校正我的文稿,真是巨细无遗。我们曾数次通过电邮,互相比对。他的细心核稿令我感动。后来我给他一封谢函,内云:“比较两岸文字字形困难之处,是目前两岸并无统一相同的内码,只靠微软的unicode传输比照。而且不少字不在对方的规范之内,必须有所添列,这也增加了二者对照的复杂性。文稿内繁简并列,若非你细心校阅,必是错误百出。特此向你表达谢意。”这是我与书同文学术沙龙结缘之始。从此,我常通过他继续和书同文研究学术沙龙保持联系,迄今未断。
2005年3月间,收到第八次汉字书同文学术研讨会的邀请。可惜因为个人原因未能成行。2006年2月间,周胜鸿先生给我寄来《汉字书同文研究》第6辑,并附书函。收到书时我的第一感觉是,封面设计清新可喜,篇目井然有序,可见编者的用心。周先生在来信中鼓励我多参与书同文的活动。我随即覆函致谢,并说我对他倾力主持此项民族大业的研究,深为钦佩。去年《汉字书同文研究》第7辑征稿时,我曾把我的《繁简体统合概论》一文,透过明然兄寄与主编参考。今年1月,收到明然兄的通知,说第7辑的出版因故推迟了,拙文将被收入这本《纪念文集》,并发来了编辑后的文稿让我校对。对于《汉字书同文研究》丛书编委会对拙作的关心和厚爱,我自然是十分感谢的。
然而我因故未能参加每年举办的讨论会,甚为遗憾,只好藉此园地,漫谈一番我对汉字书同文研究的片思断想,希望藉以与文友作远距离的交流,并期待大家的回响。我相信在讯息交流中,大家对于汉字功能的提升,全球书同文的实现,都有共同的期盼。
李牧先生,台湾退休工程师,现定居加拿大。e-mail: 。