1. 提要
1.1 定义:
本文所谓“繁体”,泛指台湾规范字;“简体”泛指大陆规范字。“非对称”的繁简对应也包括异体关系,笔者刻意不予区分,因为无论它们的关系如何,其解决的方式一样,须化“非对称”为“一对一”的对应。
1.2 样本:
各家得出的“非对称”字组数量有相当差异,其原因除是否包含异体关系之外,还有就是各人所依据的样本资料不同。笔者是以大陆规范《现代汉语通用字表》7000字,以及台湾规范cns11643常用5401字为主要样本,加上为求二者对应而采录的1700多个台湾次常用字,合计样本字数7376字,共得“非对称”270字组(一简对二繁240组,一简对三个以上繁体字30组)。字组数量曾依实际情况更新,并用繁简自动对译一一验证无误。
1.3 自动转译的实验: