发展“一语二文”是中国文字改革的捷径 ----兼谈我的“汉语表意拼音转写系统软件" 浙江大学 张飞鹏 摘要: 近百年来中国文化已经成功地进行了重大的改革,汉语的书写 系统也需要改革。汉语走拼音化的道路需要过渡阶段。最好“用两条 腿走路”发展一种准拼音文字与汉字并行使用;本汉语表意拼音转写 系统是这个方案的雏形。本法把汉语词汇按语法分为实词和虚词, 再 把实词按语义分类, 在汉语拼音的基础上,采用[实词加表意词尾,虚词 拼写定型化]的方法,编成一种同时适用于汉字键盘输入和成篇转写的 可读编码, 简单易学重码少,适用于打字写作通讯和对外汉语教学。 前言 中国人用自己创造的独特的汉字, 在六七千年的漫长岁月里, 创造 了一个灿烂辉煌的汉字文化体系,留下了大量的书简、碑刻、典籍, 并一直使用到现在, 这在世界上是无与伦比的。汉语是一个有 十多亿人口使用的古老文明的语言。汉语本身是一种语音语法 简洁明快、词汇丰富多彩的语言, 但是所用的方块汉字形体复杂、 字数多、难学难记, 致使汉字文化在"普及教育"和"汉语走向世界" 的过程中却遇到特有的困难。许多人特别珍惜汉字的历史悠久和 艺术价值,有人说它是“化石文字”,是一种古董。其实,从刻在 乌龟壳上的甲骨文,写在竹简上的隶书,抄写成卷的经典,到刻板 印刷、活字印刷、打字印刷、以至电脑排版印刷,汉字的书写形式 发生过多次重大的变化。今天能读通先秦小篆的人毕竟是很少的。 懂英文的华人阅读清末沈复翻译的《天演论》一定比读它的英文 原本更吃力。中国人一向用“十年寒窗”来描述学习读写的艰苦 历程。人生苦短,花这么多精力在读写上多可惜! I·汉字文化和汉字是否需要改革? 这是个争论由来已久的问题,在高层知识分子中尤甚,论者各执 己端,似乎莫衷一是。其实少加回顾,事理自明。当年我们祖父 年轻时读四书五经,书上连标点符号都没有,更没有注音符号和 汉语拼音,没有数学课,也不用阿拉伯数码。根据我的记忆,50 年前能够达到写封信文化水平的人,在广大的中国农村里还不到 10%。 1·一个多世纪以来汉字文化的改革成绩巨大 大约在上世纪的今天,鸦片战争打开了中国的闭关锁国状态半个世纪 之后,受西欧文字的影响,马建中出版了第一部有系统的汉语语法 《马氏文通》。在西方文化的冲击下,“废科举、兴学堂”成了 清末轰轰烈烈的文化改革运动。辛亥革命胜利后,迎来一个短暂的 真正“百花齐放,百家争鸣”的年代,五四运动前后的白话文运动, 确立了以白话文为当代文化的主流。1918年制定了中式的国语 注音符号,1928年制定了西式的国语罗马字。在此前后,受苏俄 东方文化运动的影响,一批过激的知识分子又酝酿推行北方拉丁化 新文字(北拉)。北拉的影响面不大,但它却为50年代末制订 “汉语拼音方案”提供了系统的实验资料。由此可见,一百年来 汉字文化的变迁比从东汉的《说文解字》到清末的《马氏文通》 1600年间的变化还要大。光从汉字文化的变迁来看,您能说这个 汉字文化的改革是微不足道的吗? 2·汉语书写系统也需要改革 汉语本身是一种语音语法简洁明快、词汇丰富多彩的语言, 但是所用的方块汉字形体复杂、字数多、难学难记, 致使汉字文化 在"普及教育"和"汉语走向世界"的过程中却遇到特有的困难,这是 众所周知的事实。汉字的发展史已经比较清楚了:汉字实际上 是古代广大地区里的汉民族所创造的这种文字的汇集, 历史上 虽经过多次改制、整理、增补和简化, 在书写形态上发生过重大 变革, 但是其造字原则, 从来没有系统地按统一的表义或表音 原则进行过改造。不走拼音化的道路,要解决汉字的繁难问题 是不可能的。 必须强调的是我们这里谈的只是汉字的改革,而不是要改革 汉语。其实汉语本身也在变化,但它是遵循着语言演变的规律自然 进行的。汉字的改革可使汉字和汉语的关系更加密切、更一致;而 汉字改革后使人们更有时间研究和欣赏古代的汉字文化,绝对不会 割裂古代汉字文化与现代文化的联系。 按照当今的语言学知识,为一个没有文字的民族设计一种拼音 文字可能不是一件很困难的工作。但是要为已经形成如此复杂庞大 的汉字文化体系设计一种汉语的拼音文字就很不容易了。汉字同 音字特别多向来是一个突出的问题:现代汉语普通话只有400个 音节,加上四声也只有1300个不同音调的音节; 汉字的数目多达 五六万个,没有一个准确的数目。从现有的汉字形态总结出任何 表音、表义或表形的简单规律来都是不可能的。形声汉字的表义 偏旁和表音偏旁都经常起误导作用,连汉字的笔顺和笔画数也是 篆书过渡到隶书楷书后人为附加的规定。因此,中国人识字的过程 还主要是靠从小死记硬背、反复使用、熟能生巧、日积月累而后 “习惯成自然”的。请已经通过汉字成为高层知识分子的人不要 忘记了自己从小认字习字的艰苦过程。汉字是否难学,只要比较 一个事实就知道了:中国门户开放以后,西洋人相竞进入中国 办学校传教,先后达一个多世纪,其中有几人曾经留下自己的 中文著述?而与此同时,也有不少中国人漂洋过海,到西方留学 定居,其中使用西欧文字发表论文和著述的人却比比皆是!在中国 长大的外国人多数都精通本国语文,而移居外国的中国人的第二代 就很少能阅读中文的书报了。不少人到国外数年之后便感到使用 中文时容易提笔忘字,不得不经常加用外文,简直已经无法用中文 写信了。 其实文字作为人类社会运载文化进行思想交流的工具,与车辆 作为人类社会运载货物进行物资交流的工具,具有类似的意义。 这里有一个随着社会生产力的发展不断改进的过程; 在新旧交替的 过渡阶段,也不妨实行新旧并存的双轨制。在慢腾腾的古代社会 里,复杂难学的汉字作为少数知识阶层记事议政的记录工具和从事 吟诗作赋、书法篆刻的艺术文字,还是挺雅致的。汉字的繁难 要求每个人多花5-6年的时间学习读写,使汉字文化的普及率 长期名列世界殿军之列,给号称古老文明的中国带来大量的文盲 群众;到了电报和打字机时代汉字便更显示出它的笨重了,如今 到了电脑信息时代,暴露出许多汉字难以应付的局面。没有现代化 的文字工具也就很难进出越来越快的国际信息互联网进行文化交流。 当前的电脑语言文字处理是检验汉字文化系统的试金石。文字是 记录储存语言的书面视觉符号,即便在技术上解决了汉语的电脑 语音识别系统,文字资料也还是需要识字的人去读取。在讨论汉字 是否需要拼音化改革的时候,比较是认知的好办法。在美国我们 可以比较发行“纽约时报”和“世界时报(较小)”两个报社的 雇员人数和工作效率,也可以比较美国在校的大学生和中国或 台湾在校的大学生使用电脑处理本国文字的水平。现在E-mail 系统已经家喻户晓,我们可以调查拥有电脑的华人使用中文互通 E-mail的比例有多少?看来是该改革汉字这种文化交流工具的 时候了!改革汉语书写体系当然需要一个准备、过度和习惯的 过程,这好比从使用马车到普及汽车的过程,需要技术条件和 物质条件的准备,需要人来适应这个交通工具改变的过程。 3·发展“一语二文”,用两条腿走路,是汉字改革的捷径 作者认为,汉字改革的捷径是:以当前研究汉字输入法为挈机, 发展一种以当前的汉语语体文为基础准拼音汉字,与方块汉字 并行使用、可分可合、相辅相成, 实行文字多轨制,给中国人一个 习惯于拼音汉字的过程,例如,发展一种重码率低的电脑汉语 拼音输入法作为汉字改革的雏形,是汉语拼音化的重要过渡方案, 因为只有可读的表音码才有助于汉语的普及统一和健康发展。 “一语二文”的方针既有利于发展普及文化和汉字文化的现代化 又保存了古代汉字文化的延续和发展,不是"一举两得"的良策吗? 这是笔者在此论述开发这种汉语表意拼音输入法的目的。 当前电脑的GB码简体字字库收汉字6763个, Big5码繁体字繁体字 字库里有13063个,而Unicode中日朝汉字集则收集了20902个 汉字,因此, 使用任何规范的拼音方案编制的“表音码”都无法 解决汉字拼音输入法重码率高的难题; 而按“表形码”输入,不论是 按部首边旁、还是笔画或笔顺, 都是建筑在熟练掌握汉字结构和 写法的基础上的,对于受汉字教育不够多的人,便谈不上容易。学习 汉字的笔画结构和笔顺写法本身就是个费时费力的艰苦过程,是 文字意义之外附加的额外负担。即使熟悉汉字的知识分子,使用 表形码输入法时,随时都要想着每个汉字的写法和笔画拆分方法, 也会严重干扰使用汉语写作的思维过程。 目前已有几十种电脑汉字输入法进入市场,令人目不暇接眼花缭乱。 当前汉字编码百花齐放的大好局面说明了大家都在动脑筋想办法 解决这个难题。总的情况是: 由于受汉语拼音方案拼写法的约束, 表音码方案最少,而表形码方案特别多;最近出现几种挺好的 音形码,惟独没有真正意义的音义码。 表音码容易学,但重码多, 速度慢, 而重码少的表形码就难学难记,速度也很难上去。目前流行 最广的笔型码输入法,实际上只适用于专业打字员誊写稿件或给 出版社排版使用, 而由于输入法的难学难记,使用文字写作最忙的人 还用不上电脑, 即使在中国大学里,真用上电脑写作的人也很少; 学生写论文还多半是先写好了稿子,再输入到电脑上去修编。 作者认为: 只有可读的表音码才有助于汉语的普及统一和健康 发展, 重码率低的汉语拼音输入法可能成为拼音汉字的雏形。拼音 汉字无疑地会在发展汉字文化,普及汉语普通话和对外汉语教学中 发挥重要的积极作用。 4·语义与语音一样是一项重要的汉字编码信息 遗憾的是汉字编码界至今忽视了一个重要的事实---语义与语音一样 是一项重要的汉字编码信息。其实,任何语言都是"以音传意"的, 因此语言有语音和语义两个方面; 作为记录语言符号的文字, 是"以形记音传意"的,也必得既表语音就有词义。汉字的关键在于 "形"上,但是不论如何, 语音和词义应当居于汉字编码必要信息的 首位,而汉字的笔画、笔顺、边旁只能算是次要的信息。我国自古 以来所谓的"汉字三要素: 形、音、义", 其实是任何成熟的文字的 共同条件。古人以"六书"的理论解释篆字的形体结构, 已是远在 汉字书写体系形成之后的事了。唐兰先生在"中国文字学"一书中 分析说: "象形、会意是上古时期的图画文字; 形声文字是近古时期 的声符文字。这三类可以包括尽一切中国文字。" 据东汉以来 各大辞书的统计,形声字在汉字比例中占绝对多数, 达80至90%, 因此要说汉字多数是表义又表音的,也不为过。那么为什么不能 把文字的语义学信息直接编入编码或写入拼音文字呢? 上古时期创造的象形、会意图画文字多是单体字,它本身既表音 也表义,是不可分的。只有形声文字才有表义边旁和表音边旁之分。 实际上,汉字之表音与表义还多半是人在文字符号解码过程中 联想附加的。但是,由于历史的变迁, 这些表义边旁和表音边旁 系统庞杂,指意的准确度很差, 常常对于汉字的表义和读音起误导 作用,"见字读半边"成为读错字的重要原因之一。 分析问题要抓住事物的本质和共性。从结构语义学的观点来看,在 "语义场"中, "树木花草菌苔"属于植物;"人马牛鸟鱼虫"属于动 物; "顶底手脚耳目肉,以至五脏六腑"都是整体物的部件;作者 根据这个推理办法,发展筛选出一套按照语义学分类作为汉语词 的表义体系。 事实上,这套语义学分类法比汉字的表义边旁更科 学、更有规律。因为它是一种国际性的语义学分类, 不受民族文 化背景的干扰, 而且也不需要知道这些汉字的写法, 与边旁、笔 顺、简体字、繁体字都没有关系。这便为提高学习汉语和汉字的 效率打开了方便之门。 笔者基于上面的分析, 根据《新华词典》附录<现代汉语语法简表> 所列的12 个词类, 先按汉语语法的特点, 把汉语词汇里主要起 语法作用的虚词分离出来。按<马氏文通>的定义:虚词主要具备语 法功能, 起支配实词间的语法关系的作用。现代汉语虚词数量有 限,一共不过七八百个,因此我们又把实词中独立意义较弱的 代词、名词中的方位词、动词中的能愿动词和量词(包括物量词、 动量词和度量衡单位)人为地划入"虚词", 与语法虚词里的介词、 连词、助词、叹词、副词、一起,都不加表意词尾,而分别给以 固定的拼写法, 称为"虚词定型化"。实际上,多数直接使用其汉语 拼音,只采用了一百多个非标准拼写法。剩下来的便是实词。 按<马氏文通>的定义:实词具有陈述事物的实际意义, 能够单独充 当句法成分。 实词包括: 名词、数词、形容词和动词,还有象声 词,按其自然属性综合划分为20类。这便形成了我们的"汉语表 意拼音输入法"的编码设计基础。 5·汉语表意拼音输入法及自动转写系统成果的现状 实践是检验真理的唯一标准。笔者现在已经根据自己的[中国发明 专利CN 1088323A]的“反映语法特征的汉语表意拼音文字输入法” 方案与简正三博士合作完成了一种以汉语拼音为基础,按[实词加意尾, 虚词定型化]编制的"汉语表意拼音输入法及自动转写系统视窗版软件", 软件设计成挂在中文Windows 上使用,以充分利用Windows提供的 软件文字处理功能; 软件储存基本汉语词条总数: 66,000条; 重码率: 5. 0%; 平均码长:每个汉字3.6字节; 使用Pentium100MHz的CPU, 屏幕后成篇转写速度为每分钟22Kbytes,自动转写速度达每分钟上千 字。本软件既可用于常规打字又能用于成篇转写,并带有码表检索增修 程序;可以增挂各种专业词库。本法只使用了"表音"和"表义"两个必要 信息就把汉语词汇的重码率降低到5% 的水平; 如果把规则弄得更 复杂精密一些,重码率还会进一步降低。这说明语义学分类信息对于 汉字编码比任何表形信息都更准确可靠,很少随意性的例外规定。表意 拼音编码为解决汉字同音词问题提供了有力的依据,为拼音汉字提供 了一种可行的雏形。 表意拼音编码的优势还在于编码思维分析与语言思维是互助互利 关系:一方面,编码本身是表音表义的,因而是可读的,即读者可以 从它的拼音部分读出词的语音,同时从它的表意词尾判断词的意义; 另一方面,用表意拼音码写成的文句客观地从形态上反映了文句中 各个词的现代汉语语法关系。应该说它是符合汉字文化客观规律的 一种编码系统,在特定的条件下可以作汉语拼音文字使用法。 II. 实词加语义学分类表意词尾的具体分析 汉语表意拼音输入法是根据汉语语法、词义和语音分析而设计的一种 以汉语词为基础的全拼音不等长字词混合编码。它把实词按词义分为 20 类,分别加上统一规定的不发音的表意词尾作为区分同音词的表意 符号, 从而把汉字的三要素"形、音、义"有机地联系了起来, 基本上 (95%)把汉字编码与汉字词汇本身结成了"一对一"的对应关系。词义学 分类法以整个词的意义为依据,多义词按意义分别列在不同的词义分类 中。 这20类实词的表意词尾分配如下: 1. [-b] 动物; 2.[-p] 植物; 3.[-h] 工具; 4.[-q] 部件; 5.[-j] 疾病; 6. [-l] 数词; 7.[-t] 自然物和自然现象; 8.[-f]人称和职务; 9.[-k] 文化和 思想意识的名称; 10.[-c] 名称不同于原料的加工产品(食品和布料类); 11. [-r] 只表示事物的集合状态或形状的名词;12.[-v]古代汉文化里的 干支序数和针灸学位名称;13.[-s] 动词; 14. [-x] 形容词。 这14 类汉语词汇表意分类界限明确,兼类的汉字分别按表意词尾 列入各自的词类。 为了进一步减少重码,我们又按其与人类活动的关系把事物细分为: 15. [-th] 建筑物:即构成自然景观的,不能移动的人造物体; 16.[-tt] 加工 原料物:凡不改变原有名称而经过挑选、加工以至精练而得的做原料用 的物质,都归入这一类; 17.[-qt] 分泌物:由动物器官或植物机体分泌或 提取而得的物质; 18.[-ft] 朝代及年号: 因为是以人名命名的时代名,所 以加表义词尾-ft; 19. [-sk] 动名词: 当把动词被当作名词使用时,称为 动名词; 20.[`]象声词和叹词在表音码之后加符号[`] 作分类标志, 这是 一种纯粹的表音文字。 为了维护编码成文书写方式的语言逻辑,还设计了如下的扩展分类: 21. 惯用动词词组: 凡在语言逻辑上不属于动宾格的,由一个动词加上 非动词构成的惯用词组,都归入这一类。 这些词组是一种独特的动名 词,一般既可以当动词也可以当名词, 可以分开写, 也经常分开来插入 别的词. 例如: 睡觉,洗澡,鞠躬,敬礼,救火,救灾,烤火,卖俏,吹牛皮,跑龙 套,拍马屁之类; 对于结构紧密的双音惯用动词词组,建议使用分类词 尾[-ks]。比方:词组“救灾”可以写作jius-zaik或jiuzaiks。 22. 成语容错码:由于汉语成语形成的历史跨度大,有的用字古奥,难以 用现代汉语的词义准确地进行分类, 因此我们用编码功能符号\......\把 成语分开编码。凡在成语符号里的汉字都要分开来写,而编码只提取每 个字的第一个字母, 这样即使表意词尾不确,编码也不发生变化,因此 称为 "成语容错码". 这样做的目的是为了保持行文的 "可读性"和 "表意性"。比方:成语“沆瀣一气”只有合起来才有意义。 23. 黏着词素在前面加符号[`]作分类标志,后面不加表意词尾。这是 一批在现代汉语中很少单独成词使用的单个汉字,我们笼统地称之为 黏着词素,在人名地名中经常使用,如: 宏,伟,辉,煌,芬,芳,秀,丽,珍,英,琼, 等。这是本分类法中定义最不严格的部分。 24. 简码在前面加符号[']作分类标志,供加速打字用,包括:机关单位的 简称,行政区划的简码, 惯用语和常用词组的简码等。本简码采用[一字 一码]方案,简单灵活,可以自由增删。 25. 汉语量词按语义大致可以分为五类: 1.专用量词; 2.度量衡单位; 物体的积聚状态; 4. 量具名称; 5. 形似量词: 如:一[叶]扁舟,一[轮]明月, 一[江]春水,一[带]远山,等。各用各的表意词尾。 此外, 以大写字母开头书写专有名词是一种有效的降低重码率的 语义分类方法。本法采用类似西文的书写规则: 除了每个句子的第一 个字以大写字母开头外, 凡天体名、地名、姓氏、地质年代名、朝代 名、古生物名、古器具名、古书名、商标名、用地名或人名命名的 产品名, 以及古代汉字文化特有的文化名词(包括:干支数序、针灸学 位、戏曲名称、词牌名称), 一律以大写字母开头,加相应的表意词尾。 因此本法不能随便使用大写字母。 III. 讨论:有关汉语表意拼音输入法几项重要问题 1. 表义学分类的依据 本法的语义学分类实际上首先是建筑在汉语语法分类的基础上的, 即所谓[实词加意尾,虚词定型化],而[实词加意尾]的语义学分类是按所 谓[词义从常识]来决定的。语义学分类应覆盖所有的词类,既不宜太多, 又要容易为常人的"常识"所接受, 因此不能像一般的同义词词典那样 使用学科分类法分得那么细,那么多, 所以我只按照宏观的意义分成20 个义类。分类的原则很重要,应该避免没有规律可循的规定。根据这 个原则,当然还能做进一步的改进, 比方说,"采踩睬"这三个动词,加了 表意词尾之后仍旧是重码, 如果把动词再分为:上肢动作[-ss],下肢动作 [-xs],观感动作[-qs] 等等,不又可以分开了吗? 语义学分类分到什么 程度,要看大家的接受能力而定,但是务必定义确切,不要随意性太多。 不过我以为,当前还是分得粗略一些为好,宁愿重码稍微多一些。当实践 检验证明这是一个好主意之后, 还可以再细分。 2. “标准拼写法”与定型拼写法。 历届中国政府颁布的国语注音符号、国语罗马字和汉语拼音方案 都是作为为汉字注音用的音标,相当于英文的韦氏音标、牛津音标和 国际音标。音标当然应该固定不便,而输入编码或拼音文字则不能 单纯使用音标。本汉语表意拼音文字输入法是以汉语拼音为基础设计 的,因为它是当前影响面最广、最适于设计拼音汉字的系统;但是 我们不拘泥于汉语拼音方案的所谓“标准拼写法”,而从国语罗马字 中吸取许多拼写法作为定型拼写法。汉字输入编码采用了非标准的 拼写法并不影响汉语拼音作为音标的功能。1956-57年中国文字改革 委员会当时讨论制订汉语拼音方案的目的之一确实是为汉语拼音化 改革做准备的,(笔者保存有当时出版的大量拼音实验读物)并且 在它的注释条文中,也体现了拼写时变通的余地。事在人为----既然 汉字表形码输入法可以采用各种笔画拆分方案,为什么表音码不能 使用不同的拼写方法呢?20个表意词尾和200个一对一的定型拼写法 对于汉字这样繁难的书写系统,其记忆负担简直是微不足道的。 3. 表意词尾的确定 本法设计的表意词尾是随意的,需要特殊记忆。通过如下的分析, 你会理解,标准键盘上的字母有限,实际上没有多少选择的余地;幸亏 数量不多, 用过几次便记住了。 在26个西文字母中, a, e, i, o, u, n, g 七个字母是不能用来作表意分类 字母的, 因为它们都是汉语拼音的主要韵母构成部分, 此外又把 d, r, z 三个字母保留作为最常见的汉语词尾"的,儿,子"的正常编码(不算简码) 和为了降低重码率把w, y 两个字母作为代替 u, i的特殊拼写法, 以及 把m保留作外来语的韵尾发音之用。我们重复使用了r, 也只有14个 字母可以被用来作表意分类字母。因此除了采用这14个字母之外,还 设计了像ft, qt, th, tt, sk, hs, ks, 还有象声词后面加[`]等办法 来做表意词尾。这种组合字母都表达了与单个表意词尾相关的词义, 而不 影响汉语拼音的拼写原则。大小写也起语法语义学分类的作用。我们的 表意分类字母比英文里的不规则拼写法要容易记忆, 倒有点法语词尾 中不发音的辅音字母。 4. 定型化拼写法的制定 汉字同音字特别多对于汉语拼音化改革向来是一个突出的难题; 如果不采用变通的拼写方法,无论使用什么拼音方案,都解决不了这个 难题。[虚词定型化]的目的是从书写形式上避免同音字的干扰而赋予 虚词更明朗的意义和语法功能; 同样的目的也部分地沿用到实词上 去了。为此在汉语拼音的基础上设计的200个定型化拼写法, 都是 参考我国文字改革历史上出现过的变通拼写原则确定的。这些定型化 拼写法多半与汉语的声调上声和去声有关联, 例如: n->nn, i->y, ai->ay, ao->aw, ou->ow 为去声; a->aa, e->ee, i->ii或iy, ai->ae, iu->eo, 在j,q,x,y之后(u)->eu为上声; 还采用了中原方音o代e作为 go/各, ko/可, ho/何,zho/着, lo/了的定型化拼写法等一些非规范的拼写法。 此外,我还采用eu代替带两点的“鱼)韵母 u(umlaut),并保留v作为声母w 的变体使用。特殊拼写法只适用于特定的常用词,不当作普遍规则,便使 这些变体词的标志功能特别强。例如:把“此”写成ciy,把“彼”写成 biy;这样做确实需要特殊记忆, 但其记忆量与汉字的笔画和笔顺相比 简直可以略而不计。 5. 标调问题 本输入法一般不标注四声,而是使用部分特殊拼写法来区分一些 常用的同音词,特别是虚词。首先因为中国广大的地区里,四声很不 一致,标调的增益与因此造成的记忆负担是并存的,不标调至少避开 了标调符号的困难。其次,汉字的读音、声调和词义向来都是在人们 阅读的过程中“解码”时联想附加上的。拼音加上表意词尾之后, 声调也就能自然地联想出来了。这样做留下的一些同类同音词则留作 重码来处理,比方说,"采踩睬"这三个动词的就通过[重码预选]功能 分开。这样当然增加了本法的重码率。输入法的重码相当于拼音汉字 的多义词。其实任何文字都有一些多义词,在一定的语言环境下很少 引起误解。比方英文的right在使用特殊拼写法与write, rite分开之后, 还是一个多义词。如果用caes来代表"采踩睬"这三个动词,产生误解 的情况也不多,除非故意编造一些孤立于语言环境之外的例句。汉字 的四声在唱歌时是完全被曲调打乱了的,举一句儿歌为例:“小松树, 快长大,吐绿叶,发新芽,----”,在曲调中“松树songshup”唱得 完全像“松鼠songshub”。这里汉字不会误解,表意拼音也没有问题, 唱歌多唱半句不也就明白了吗?笔者并不反对标调,特别在使用拼音 书写人名的时候,标调是十分重要的。但是在标调符号没有妥善解决 之前,本法作为一种输入法,宁愿使用重码选字的办法避开由于标调 所引起的麻烦。 6. 分词连写问题(About word division and syllable aggregation) 这似乎是一个更敏感的问题。本法尊重汉语的自然属性,凡是在 概念上和习惯上可分可合的词都既可以分开来写也可以合起来当复合 词输入,因为多数都是原来就有的词,只不过增加一点词库的容量就 解决了。你觉得怎样更合理便怎样输入,原来使用汉字不会误解的 现在也没有问题。我们可以先这样做了再说,不必为此先作莫衷一是 的争论。这是本人的观点和做法。汉语常用词的单音词特别多,而 这些常用词的构词能力又特强;因此认为汉语的复合词是由单音词 自由拼接而成,从而否认汉语需要分词是有问题的。实际上,汉语 古代的联绵字和近代的复合词是不可否认的多音词。即使最普通的 复合词:“白人、白菜、白果、白痴、青菜、青豆、青果、黄豆、 黄瓜、黄鹂、黄牛、水牛、天牛、黑人、黑板、黑锅、田鸡、八哥、 钢笔、电脑、快乐、漂亮、研究、讨论、锻炼、琢磨、推敲”之类, 尽管将其分开后也都是词,但合起来便形成了专门的概念,避免了 词义的混淆。你必须承认这些都是汉语的词。分词连写可以减少读 破句的不文明现象,对于阅读和理解都有明显的好处。 7. 汉语表意拼音编码自动转写系统的意义----拼音汉字的雏形 从电脑程序来说, 任何编码都可以编制自动转写系统, 但是只有 在客观上具有文字功能的编码,这样做才有意义。因为,一方面,编码 本身是表音表意的,因而是可读的,即读者可以从它的拼音部分读出 每个词的语音,同时从它的表意词尾判断每个词的意义; 另一方面, 用表意拼音编码写成的文句客观地从形态上反映了文句中各个词的 现代汉语语法关系。掌握了本输入法之后,你便可以像使用西文写作 一样,径直地用汉语表意拼音编码在电脑屏幕上写下去,你可以任意 在屏幕上进行增删修改; 当你感到满意之后,再进行一次性的成篇 转写。因为表意拼音编码的思维分析与语言思维是互助互利的,这样 写作,思维逻辑受到的干扰最少,键盘操作最为快捷,不但避免了一边 输入一边选字那样分散注意力, 还大约为每个词减少一次输入击键。 使用西文写作不正是这样进行的吗?习惯成自然。这便是汉语拼音 文字了。本法还提供了一个[拼写检查]和[重码预选]程序, 它可以 借用国际INTERNET上的西文通讯系统准确无误地发送使用汉语 表意拼音编码书写的汉字信息。 因此,我们认为汉语表意拼音编码有助于汉语的普及统一和健康 发展, 可以成为汉语拼音化的雏形,无疑会在发展汉字文化,普及汉语 普通话和对外汉语教学中发挥重要的积极作用。 结束语 笔者花了整整三年的精力,按照我推敲多年的编码方案,把 《现代汉语词典》的汉语词汇逐条进行了编码,聘请了浙江大学的 简正三博士编写电脑程序,几经修订终于完成了这套《汉语表意拼音 文字输入法及其自动转写系统》,经过几十篇各种类型的短文转写 实验,觉得效果还不错。使用这个系统可以非常舒服地进行现代汉语 的写作到转写《孟子》一类的古文。学习本法的难度低于任何表形码: 会讲普通话并且会拼音的人,弄明白汉语表意拼音输入法的编码原则 后,便能上机打字。它的重码率比任何拼音码都底得多,具有“形、 音、义、三结合,一词一意”的表意拼音功能。本法目前毕竟还是 一个汉字输入法,在有重码需要选字时,还需要应用一定的汉语知识; 可以在重码汉字后面加注英文帮助选词,但是也很难做到尽善尽美。 总之,笔者不敢妄谈完善,因为一个人的精力和中文水平都有限, 脑海里装着几十条编码规则,面对一本1700页的词典,疲倦了便会 有疏漏或对词义的曲解,每次修订都可能有顾此失彼的地方。特以此 请教海内外诸君,欢迎建议和评论。纸短情长,不胜枚举。现将三类 汉语表意义拼音文字样本附录于下,请诸位把意见集中在表意分类等 大的方面,至于哪一个字应当采用定型拼写法,怎样拼写更好,都是 可以从长计议的。尽管笔者为此课题申请了中国专利和美国版权, 笔者还是欢迎与有意合作者合作研究、开发、应用这种表意的汉语 拼音化课,并与合作者共享可能由此带来的权益。 赐教处: 张飞鹏,中国,杭州,310013,杭州市浙江大学求是村71幢203号 E-mail : 美国 [CITS1997@aol.com]; 中国 [fpzhang@public.hz.zj.cn]。 [附录]:汉语表意义拼音文字样本(转写前)--重码预选后,可以 整篇迅速转写成汉字,转写速度约为每分钟15页,极少错别字。 下面是我们专门为转写而设计的功能符号:从这些符号的数量和 比例可以看出使用CITS书写拼音汉字的合理性和问题所在。 1. 句首大写前加[`]等于小写字母; 2. 数码是预选重码的序号; 3. [----]以普通词构成专用名词; 4. < 由双音词取前字; 5. >由双音词取后字。 总的情况就是这样了,欢迎您评论并提出建议和批评。我主张 分词连写,还为此设计了适合于该方案的正词法。我以为,今后 有可能取各家之长处,糅合出一个更合理更简单的方案来。但是 不能要求简单到不需要学习就会。当今世界上还没有任何一种 不需要学习的文字。全拼输入法不也得学习吗? 一·黄河颂:(冼星海曲,光未然词)--起句未大写;重码预选, 数码是重码表里的序号。 Huanghet songsk [朗诵langsongsk] a`! Huanghet yiy toa yingxiongf d qypok, chuxianns zay Yazhout d yuanyet, 啊!黄河以它英雄的气魄, 出现在亚洲的原野,toa xiangzhengs zho women minzuf d jingshenk1, weidax erqiee chonggaox; zheliy, 它象征着我们民族伟大的精神,伟大而且崇高; wo xyang zho Huanghet changs2 zho womend zangek! 我向着黄河唱着我们的赞歌! [歌词] wo zhans8 zay gaox shant zh dianq, wangs2 Huanghet guns guns, 我站在高山之巅,望黄河滚滚, bens xyang dongnan2, jintt taot pengpaix, xians1 qiis vanl -zhang kuanglant; 奔向东南,金淘澎湃,掀起万丈狂澜; zhuox lius2 wanzhuanx, jies4 chengs3 jiul quk lianhuanx. 浊流万转,结成九曲连环。 cong Kunlunt shant xia bens xyang Huanghait zh bian, 从昆仑山下本相奔向黄海之边, baa Zhonghuat dadit pis3 chengs3 nan bei liangl mian. 把中华大地劈成南北两面。 a`! Huanghet! ni shy women minzuf d yaolanh, 啊! 黄河!你是我们民族的摇篮, wul qianl niant d gut guot wenhuak, cong ni zhe -r fas1 yuant2. 五千年的古国文化,从你这儿发源。 duoshaox yingxiongf d gushyk, zay nid zhouzaot banyans! 多少英雄的故事,在你的周遭扮演! a`! Huanghet! ni shy weidax jianqiangx! xyangs yige jurenf, 啊! 黄河!你是伟大坚强!像一个巨人, chuxianns zay Yazhout pingyuant zh shang. 出现在亚洲平原之上。 yongs ni na yingxiongf d tipoq, 用你那英雄的体魄, zoos chengs3 women minzuf d pingzhangt. 做成我们民族的屏障。 a`! Huanghet! ni yil xies3 vanl -liy, haohaodangdangx, 啊!黄河!你一泻万里,好好浩浩荡荡, xyang nan bei liangl annt shens2 chus qianl vanl tiaor tiett1 d beiq bangq2! 向南北两岸伸出千万条铁的背帮膀! women minzuf d weidax jingshenk1,jiang yaw zay nid baoyusk xia fayangs zizhangs! 我们民族的伟大精神,将要在你的保育下发扬滋长 women zuguot d yingxiongf erneuf, jiang yaw xuexis nid bangyangk. 我们祖国的英雄儿女,将要学习你的榜样。 xyangs ni yiyang d weidax jianqiangx! 像你一样的伟大坚强! xyangs ni yiyang d weidax jianqiangx! 像你一样的伟大坚强! 二· 散文 "荷塘月色":朱自清; 汉字略。起句大写;没有预选重码, 有多义词,读起来没有问题。 `Sanwenk: `Hep tangt yuet set (1927 niant Qiyuet, Beijingt) `Zhe jiil tiant xink liy puo bu ningjingx. `Jinwant zai yuanhz liy zuos zho chengliangks, huran xiiangs qiis rit rit zous guo d' hep tangt, zay zhe maanx yuet d guangt liy, zong gay ling yeo yil -fan yangzik ba. `Yueliangt jiannjiann dy shengs gaox lo, qiangq way maluth shang haifz -men d' huanxiaosk,yiijing tings bu jianns lo; qif zay wuth liy pais zho [`run r] , mimihuhux dy hengs zho miansk gek. `Wo qiaoqiao dy pis lo dax shanh , dais shang menh chuqus . `Yanzhe hep tangt, shy yil tiaor quzhex d xiaox meixiet luth. `Zhe shy yil tiaor youpix d luth; baitiant ye shaox renf zous, yewant gengjia jimox. `Hep tangt sil mian , zhangs zho xuduox shup , wengwengyuyux d. Luth d yil pang , shy xie yangliup, hoe yixie bu zhidaos mingzik d shup. `Meyyeo yueguangt d' wanshangt, zhe tiaor luth shang yinx-sensen d, yeoxie parenx. `Jinwant quo hen haox , sueiran yueguangt ye hay shy dannx dannx d. `Luth shang zhiy yeo wo yige renf , beis zho shouq dus zho. `Zhe yil pianr tiant dit haoxyangs shy wod; wo ye xyangs chaochus lo pingchangx d zyjif, daw lo ling yige shyjiet liy. `Wo ays renaox, ye ays lengjinngx; ays qunjus, ye ays duchus. `Xyangs jint wanshangt, yige renf zay zhe cangmangx d yuet xia, shenme dow koyiy xiiangs, shenme dow koyiy bu xiiangs , biann jues shy ge zyyiuk d renf. `Baitiant liy yiding yaw zoos d' shyk, yiding yaw shuos d' huak , xianzay dou koyiy bu liis. `Zhe shy duchus d miaox chut, wo qiee showyongs zhe vu bian d hep xiangx yuet set lo. `Ququzhezhex d hep tangt shangmian, miwangx d shy tiantianx d yep z. `Yep z chus shuit hen gaox , xyangs tingtingx d wuneuf d' qunh . `Congcongx d yep z zhongjian , lingxingx dy dianzhuis zho xie baix huap, yeo niaonuox dy kais zho d, yeo xiusex dy daas zho huaduop> r d; zheng ru yil lyr lyr d mingzhutt, yew ru lanx tiant liy d xingxingt. `Vifengt guos chut , songs lais leuleux qingxiangx, fangfu yoanx chut gaox louth shang miaomangx d gek shengt syd. `Zhe shihout yep z yeu huap ye yeo yil sir d zhandongsk, xyangs shaandiant ban, shashit chuans guos hep tangt d nabian qus lo. `Yep z ben shy jianq bing jianq mix mix dy ais zho, zhe biann wanran yeo lo yil -dao ningbix d bot henk . `Yep z dixia shy momody liushuit, zhes zhoo lo, buneng jianns yixie yanset ; er yep z quo geng jianns fengzhyk lo .`Yueguangt ru liushuit yiban , jinngx jinngx dy xies zay zhe yil pianr yep z hoe huap shang. `Box box d qiingx wut fus qiis zay hep tangt liy. `Yep z hoe huap fangfu zay niub ruqt zhong xiis guo yiyang ; yew xyangs longs zho qiingx shac d mengk. `Sueiran shy maanx yuet , tiant shang quo yeo yil cengr dannx dannx d yunt , suoyiy buneng minglangx> zhaos; dann wo yiywey zhe qia shy daw lo haox chut -- hanmiansk guran< bu ko shaox,xiao shuisk ye bie yeo fengveyk d. `Yueguangt shy ges lo shup zhaos guolais d, gaox chut congshengs d guanmup, luos xia cencix d banlanx d heix yingt ; wanwanx d yangliup d' xishux d qianyingt , quo yew xyangs shy huask zay hep yep shang. `Tangt zhong d yuet set bing bu junyunx; dann guangt hoe yint yeo zho hexiex d xuanleuk , ru violinh shang zous zho d 'mingquk. `Hep tangt d sil mian, yoanx yoanx jinnx jinnx , gaox gaox dix dix dou shy shup , er yangliup zuy duox. `Zhexie shup jiang yil pianr hep tangt chong chong weis zhoo; zhiy zay xiaox luth yil pang, lous zho jiil -duan kungxit, xyangs shy te wey yueguangt lious xia 'd. `Shup set yileu shy yinx yinx d, zha kanns xyangs yil tuanr yanwut; dann yangliup d fengzik, biann zay yanwut liy ye bianrens de chus. `Shup shaoq shang yinyinyueyuex d shy yil dait yoanx shant, zhiy yeo xie dayik bale. `Shup fengr liy ye lous zho yil liangl dianr ludengh guangt, \mo jingt das cait\ d, shy keshuis renf d' yanq. `Zhe shihout zuy renaox d, yaw shus shup shang d chanb shengt yeu shuit liy d wab shengt; dann renaox shy toamend, wo shenme ye meyyeo.`Huran xiiangs qiis cais lianp 'd shyqingk lais lo. `Cais lianp shy Jiangnant d jiux suk , syhu hen zaox jew yeo , er Liuchaoft shit wey shengx ; cong shigek liy koyiy yuelue zhidaos. `Yushy yew jys qiis [ xi zhout quk ] liy d jukz : `Cais lianp nan tangt qiut, `Lianp huap guos renf touq, `Dix touq nongs lianp zir, `Lianp zir qingx ru shuit. `Jinwant ruo yeo cais lianp renf, zhe r d lianp huap ye suans "guos renf touq" lo; zhiy bu jianns yixie liushuit de yingtz, shy bu xings d. `Zhe lings wo dawdi dianjys zho Jiangnant lo. `Zheyang xiiangs zho, meng yil tais touq,bu jues yiishy zyjif d menh qian; qiingx qiingx dy tuis menh jinns qus, shenme shengxit ye meyyeo, qif yii shushuis hao jeo lo. ( xuans zy gaojix zhongxuek kebenk, yuwenk, dy- 1 -cek, dy- 19-21 -ye ) 三·古诗词`Gut shik cik2 (字母前加[`]是专门为句首大写设计的。) 1. 《三国演义》序诗《 Sanguoft yanyik》 xuk2 shik `Guns guns Changjiangt dong shys3 shuit, 滚滚长江东逝水, `Langt huap taos3 jinn yingxiongf. 浪花淘尽英雄。 `Shy fy chengs3 bays1 zhoans touq kungx. 是非成败转头空。 `Qingx1 shant yijiu zay, 青山依旧在, `Jiil duk xiyangt hongx. 几度夕阳红。 `Baix faq yugangth< qiaofuf< jiangt [dut] shang,白发渔樵江堵上, `Guannx kanns qiut yuet chunt fengt. 惯看秋月春风。 `Yil huh hunzhuox> jiuc xiix xiang fengs2. 一壶浊酒喜相逢。 `Gut jint duoshaox shyk, 古今多少事, `Dou fus xiaos tans5 zhong. 都付笑谈中。 2·苏轼: 水调歌头Sushif: Shuidiaogetouk [ `Shuit diaok gek touq ] `Mingx yuet hoshit yeo? 明月何时有? `Baas jiuc wenns qingx1 tiant. 把酒问青天。 `Bu zhis1 tiant shang gongqueth, 不知天上宫阙, `Jinxit shy ho niant? 今夕是何年? `Wo yus5 chengs5 fengt guis qus, 我欲乘风归去, `Yew kongpas< `qiong1 louth yuyuth 又恐琼楼玉宇 gaox chut bu shengs4 hanx2. 高处不胜寒。 `Qiis wusk nongs qingx2 yingt, 起舞弄青影, `Ho sy zay renjiant? 何似在人间? `Zhoans zhuhongx< geth, 转朱阁, `Dix [`qi] huf, 低绮户, `Zhaos3 vu miansk. 照无眠。 `Bu ying yeo hensk, 不应有恨 `Hoshit chang xyang bie shit yuanx2? 何时常向别时圆? `Renf yeo beisk huanxiis< lis hes2, 人有悲欢离合, `Yuet yeo yinx qingx3 yuanx2 queshaos<, 月有阴晴圆缺, `Ciy shyk gut nanx quanx. 此事古难全。 `Dann yuann renf changjeo, 但愿人长久, `Qianl -liy gong Chanjuant. 千里共婵娟。 四·[天下为公]:可以想象,越古老的文章,使用汉语表意拼音 转写法问题就更多些。古文本身就难懂;不过从双音词选字的办法 倒有注释作用。所用双音词应该与所选的字在意义和词类上相当; 在印刷时可以像古书加注释一样,用字号区分要选的字。例如: `Dadaok zh xings2 ye, tianxiat wey gongx! xuanzes< shengxianf> yu nengrenf<; jiangs xinnk xius2 hemux>. Gu renf bu du qinf qi qinf, bu duzif qi zif; shiy laox yeo suo zhungq, zhuangx yeo suo yongs, youx yeo suo zhangf, guanfuf<, guafuf<, gu'erf<, du, feyx jij zhef, jiai yeo suo yangs3. `Nanf yeo fens, neuf yeo guis. `Huoc yanwus2 qi paoqis> yu dit ye, buby cangs yu jif1; lit yanwus2 qi bu chus yu shenq ye, buby wey jif1, shy Gu1 mouluek< bis3 er bu xings1, daozeif< qiezeif>luanx zeif er bu zuos1! Gu1 yet huf er bu bis3, shy wey datongk. 大道之行也,天下为公!选贤于能;讲信修睦。固人不独亲其亲, 不独子其子;使老有所终,壮有所用,幼有所长,鳏、寡、孤、 独、废疾者,皆有所养。男有分,女有归。货恶其弃于地也, 不必藏于己;力恶其不出于身也,不必为己,是故谋闭而不兴, 盗窃乱贼而不作,故夜户而不闭,是谓大同。 (完)