| 中国的码家军转自输入法论坛
本文节选自《中国换笔潮》(珠海出版社,1994年10月版) 1995年1月~3月《电脑报》连载
在体育的竞技场上,中国"马家军"教头马俊仁率领王军霞、曲云霞等人组成的精锐部队,争金夺银,一日数次刷新世界纪录,令全世界对中国人刮目相看。"马家军"的崛起,是鳖精滋补,是高原训练,还是有什么特异功能,个中奥妙,近乎于传奇。
然而,华夏大地上还有另一支阵容庞大的"码家军"部队,为了电脑的中文化进程,他们在汉字编码的攻坚战役里奋力拼搏,年复一年,日复一日,打破和刷新了多少项世界纪录,却无人做出准确的统计。
这支"码家军"中的佼佼者,随着新闻传媒的广为宣传,其非凡的业绩可以说已是家喻户晓。五笔字型和王永民、自然码和周志农、表形码和陈爱文……,就连声数码和唐懋宽,也因《电脑报》一篇短文让诸多读者们一睹其绚丽风姿。
这支"码家军"中更多的英雄豪杰,那些默默无闻的耕耘者们同样值得大书特书。据有关人士统计说,中国"码家军"前后已历时20年之久,总人数业已超过10万之众,比较完整地提出编码方案的总数是750余种,已经申请到专利的超过400余种,已经制成电脑软件上机运行的就有100余种之多。其波澜壮阔之势,在世界科学研究史上,恐怕连美国"阿波罗飞船"登月大型系统工程也相形见绌。
中国的"码家军",每一个编码的背后,都有一个曲折的故事。 中国的"码家军",每一项成功的喜悦,都满含着辛酸和苦涩。
---------------------------------------- 公元一千九百六十八年,中华文化史上令人不堪回首的特殊岁月,神州大地还笼罩在黑夜的阴霾之中。
这是一间当时被称为"牛棚"的斗室,肮脏而潮湿,墙角挂满了蜘蛛网。整个房间密不透风,连一扇窗户也没有,空气中充满了难闻的气味。透过墙壁,可以隐约听到远处传来的口号声和"文攻武卫"的阵阵枪响。没有床,没有桌子,也没有任何其他的用具,仅在粗糙的水泥地上铺着一张草席,使这6平方米的斗室显得格外凄凉。一盏白炽灯昼夜不灭,惨白的灯光照在墙上一幅刺目的标语上:"坦白从宽,抗拒从严",不仅增添了一种沉重的压抑感,也说明了这间住房主人特殊的"身份"。
室内关押着唯一的"犯人",看上去已经年愈花甲,饱经风霜的面容上还依稀保留着学者的风度。当他作为"反动学术权威"被押入"牛棚"后,这位著名的总工程师,曾在德国工作过11年专家失去了人身自由,被迫中断了自己毕生热爱的仪器仪表专业研究。
和当时许许多多身陷囹圄的老一辈科学家一样,时间对他已经所剩不多。 "我还能够做点什么呢?"他在室内踱来踱去:写检查?扪心自问,当年偕德籍夫人毅然返回故土,把自己的学识和才华献给了祖国的科学事业,实在没有什么值得忏悔的。继续研究?既无仪器,又无仪表,不能够实验和分析,能继续进行什么课题呢?他最终停在了那张标语前,无意识地盯着用毛笔书写的大号字体,看着看着,头脑里突然闪现出一个念头,
这是他设想过但一直无暇了却的夙愿, 也许现在正是一次机会,一种"天赐良缘"。 "是的,没有仪器仪表,但我懂得它们的原理;没有实验手段,但我还有能思索的大脑,还有通晓几国语言的优势,还有一颗报效祖国的拳拳赤子之心!"
从此,在极其艰难困苦的环境里,他开始了一项极其艰巨宏大的工程--建造一种神秘的符号体系。他不敢用纸,因为每一张纸片都被人做了编号,只允许用来写检查,唯一可以用来记录思维的只有茶杯盖。日复一日,冬去夏至,他在斗室里挥汗如雨,在杯盖上写了又擦,擦了又写,还要随时提防"看守"的搜查--如果被人发现,还不知道会有什么厄运在等待着他。他把自己对事业的执著追求和全部爱心,都尽情地倾注在自己创造的各种符号上。这些符号,看起来又像英文,又象像德文,但都不能拼出任何有意义的外文字句,也许自己也不一定能够完全弄清它们的含义。奇怪的是,有的时候他在茶杯盖上写的是一个又一个的汉字,而有的时候又是一个又一个的字母,更多的时候却是两者的交替。他没有资料,没有工具,也没有任何人可以探讨和交流,凭借的只是顽强的意志和超人的记忆力……。
整整六年过去了,当黎明又重新来临的时候,当知识又重新找回它的价值的时候,我们的仪器仪表专家额头上已爬满了皱纹,甚至只能够坐着轮椅来发表自己的论文。他终于看到自己含辛茹苦研究出的"神秘符号"取得了两项中国第一:中国报纸第一次报道的汉字编码,中国大陆第一个汉字信息处理系统。
这究竟是一项什么样的发明呢?中国的老百姓可能不太清楚。当时人们只记得,在大体相同年代成就的陈景润"1 +2 "陈氏定理,曾经被徐迟先生的那篇著名的报告文学弄得几乎是家喻户哓。那几麻袋草稿,那走路撞树的趣事,那"王冠上的明珠"拨动了多少人的心弦!然而,同是在六平方米斗室里开创的另一个绝不比攻克"哥德巴赫猜想"逊色的重要成果,却由于时机不备的局限而鲜为人知。也许,连发明者自己可能都未曾想到,他在"牛棚"的茶杯盖上写下的那些符号,会拉开70年代后期震惊神州大地的"编码现象"之帏幕,会触发古老汉字与现代电脑大碰撞的狂飙。
1978年7月19日,《文汇报》以整版的篇幅介绍了这位仪器仪表专家和他发明的汉字编码。人们记住了他的姓名--支秉彝,上海电工仪器研究所总工程师,他发明的编码做作"见字识码"
,是最早的"音码"方案之一。 1984年10月,张寿萱等学者用"支码"一举摘取了中国最早"换笔者"的桂冠。一本42万字的《中文信息的计算机处理》学术著作,由宇航出版社正式出版发行。这本书,从键入第一个字开始,到装订成册为止,全部写作、编辑、印刷、出版周期,只用了11个月。
---------------------------------------------- 1983年,刚出襁褓的中国汉字编码界,被一则激奋人心的消息搅得沸沸扬扬。
为了增加一点戏剧效果,我们先把时钟向后拨动整整一年。1984年9月,纽约联合国大厅里人头攒动,一位美国的迟到者一进大门就向别人打探。有人指了指前方,示意他观看表演。他顺着手指的方向,惊异地发现在前排就座的,是一群黄皮肤黑眼珠的中国人。两台微型电脑旁,分别端坐着两位美丽的小姐,正紧张地伸开十指,轻放在键盘上。迟到者怀着好奇,好不容易才从人群缝隙中挤了过去。低头观看操作员小姐面前的文件。一位小姐的文件用英文写成,他看得懂;而另一位小姐的文件,他看不太懂,可是猜得出是中国汉字。
正准备继续询问时,主持人发话了: "女士们,先生们,表演马上开始。我首先申明,这两位小姐面前的原稿,记录的是同样的内容,是我们刚才从各种文件中任意选择的。"说完,他停顿了一下,回头向身后的中国客人请示,得到首肯后,接着说道:"那么,表演现在开始。"
话音刚落, 只见两位电脑打字高手"噼噼啪啪" 地敲击起键盘,指动字成,字成指动,一眨眼的功夫,各自的屏幕上都已布满密密麻麻的文字。
大厅内的观众,似乎屏住了呼吸。时间一分一秒地过去,只见其中的一位小姐停下操作,长长嘘了一口气,而另一位却还在不停地敲打。那迟到者又往前凑了凑,他几乎不敢相信自己的眼睛。首先输入完毕的,正是那份他看不太懂的文件。迟到者目瞪口呆,彻底地震惊了。
当经久不息的掌声把他惊醒过来时,记时员正在宣布表演结果:中文电脑操作员,每分钟输入汉字120个。这个数字意味着什么,迟到者心里异常清楚,因为他就是一位行家里手,不久前还观看了台湾同行用他们的仓颉码输入汉字的演示,每分钟也不过四五十个字。这时,他看见有位中年学者从人群中站起来,频频点头感谢观众热情的掌声。这位学者留着长发,带着眼镜,穿着西服,却是地地道道的中国人。
不知怎的,迟到者突然想起了老莫尔斯的那句话:"上帝创造了何等奇迹"。可惜,眼前的这位中国学者肯定不相信什么上帝。他赶紧找到表演的主持人,仔细地了解了事情的来龙去脉,然后,又迅速地来到中国学者下榻的宾馆,递上自己的名片。
"王先生,我是纽约HT电脑公司总裁,今天有幸观看了先生发明的五笔字型输入表演,真是令人大开眼界。不知道王先生是否有意留在美国与我们合作?"迟到者惟恐别人抢了头彩,来不及寒暄就单刀直入:"我们可以为您提供最好的研究条件,至于先生的年薪嘛,可以在10万美金的数额上考虑"。
被称为王先生的那位中年学者,笑着摇摇头。 "如果不够,敝公司还可以增加更高的待遇。"HT公司的老板急忙补充道。
王先生仍然衿持地笑着:"非常感谢贵公司的盛情,可是我只能在祖国的大地上浇灌'五笔字型之花',这是他一生奋斗的宗旨!"
HT公司的老板不无惋惜地告辞了。王先生--我们知道他叫王永民,来自中国河南南阳地区科委的小小办事员--不禁思绪万千,沉溺在对往事的回忆里。 中州重镇南阳,地杰人灵,据说诸葛孔明曾在此结草庐而居。可是王永民并没有因此受到书香门第的熏陶,他的双亲都是目不识丁的淳朴农民。贫困的家庭,自小给了他一种特别能吃苦的品格和坚韧不拔的耐性;艰难的环境,反而玉成了他今后从事编码研究必须具备的能力。他以南阳地区第一名的成绩,考上了中国科技大学。毕业时却命运多舛,正赶上那场史无前例的浩劫,被分配到农场开荒种地,又在四川的大山沟里呆了好几年,最后还是因病回到了生他养他的南阳故园。
以后的经历似乎与莫尔斯十分相似。如果不是一次偶然的机会,王永民也许不会走上汉字编码的发明道路。他是因一场精彩的报告而发奋。那是1978年的金秋,
《英华大字典》 主编、我国著名学者郑易里教授来郑州讲学。郑老渊博的知识和汉字字根编码的理论,深深打动了听众中的王永民,使他对"修复汉字长城"的工作产生了极大的兴趣。他决心发扬光大郑老的理论学说,并通过自己的双手,创出一种新的编码方案。
一旦步入了"蜀道",以后4年艰辛的岁月可想而知。王永民先生自己写道:"那些年,没黑没明,日夜苦干,只觉得越研究越复杂,越试验越有兴趣,根本刹不住车。谁要说当时就预见到日后可以成功,那只能是吹牛"。
王永民毕竟没有吹牛。1983年8月29日,来自全国各地的40余名专家,聚集在郑州,在郑易里教授的亲自主持下,为王永民的编码--五笔字型做出鉴定。郑老给了它"世界先进水平"的最高评价,并代表专家们激动地宣布:"汉字输入电脑不能与西文相比的时代一去不复返了"。
从此, 王永民带着他的五笔字型 ,堂而皇之地闯入京城,一发而不可收。他研究、推广和销售的根据地不断地"星火燎原",一直发展到今天的"王码电脑公司",仍然没有"刹车"的迹象。快速打字的表演和宣传,在神州大地上刮起了"王码"旋风,久受困扰中国汉字像沐浴到甘霖。王永民的勤奋和不懈努力地推广收获了沉甸甸的蒴果:全国各地几十万中国人、500多家报纸杂志编辑、中央和地方政府机关的文秘人员接受了五笔字型,使自己的工作如虎添翼。国内微型电脑的70%装上了它,装机量居所有编码方案之首。五笔字型也不拂众望,连续取得了美国、英国和中国的发明专利,摘取了中国和国际多项发明金奖。王永民先生因此荣获了全国劳动模范、国家级专家、教授职称、优秀科技工作者等多项殊荣,中国人民对汉字编码发明者的历史功绩做出了最大的回报。
1993年,中央电视台又在隆重播出王永民教授的《五笔字型》讲座。有了这种每分钟能打100多字的编码,汉字与电脑的联姻是否就此进入"蜜月"?10万攻坚大军是否从此就"刀枪入库,马放南山"呢?
要回答读者的疑虑,不妨对后来改称王码的五笔字型编码方案略作一番浏览。 人们常常把五笔字型和五笔划混为一谈。实际上,虽然真正意义上的五笔字型,与我们上节提到的五笔划共存于王码系统,但它们却分属完全不同的类型。我们已经基本了解的五笔划输入,它是用笔画输入汉字方法的一种,容易学但打不快。五笔字型则是一种纯粹的拼形方案,它与五笔划仅在部件分类和键盘安排上有一定的联系。
王永民教授自己也曾讲到,东汉许慎提出的"独体为文,合体为字",就是讲中国汉字(字)都是由500来个基本的独体字(文),像搭积木那样拼合构成。他认为,许慎的这一见解,是汉字输入难题得以最终解决的"指路明灯"。
在这盏"指路明灯" 的指引下, 王教授把所有的汉字都归纳为130种基本部件即"字根" 的组合, 并把这些字根分布在25个字母键位上,比起拉丁字母来还少用一个键。每击键4次就能输入一个汉字,4次按键就是用字根来"拼装"汉字的过程。当然,王教授还找到一些简化的办法,以尽量减少常用字的击键次数。比如,有600多个常用的汉字,分别作为一、二级"简码字",每字只要击键1~2次。五笔字型的特点在于,它的130个字根均按照第一笔画的类型分为5种,即"横竖撇捺折",并在键盘上划分相应的5个区,以形成有规律的排列。因为130个字根在数量上无法与25个字母键匹配,所以每一键位被分配了3~12个不等的字根。王永民先生为了帮助初学者入门,也颇费心血地想了各种办法,比如,用儿歌的形式编歌诀,什么"王旁青头兼五一,土士二千十寸雨,大犬三羊古石雨"等等,一共有25句。
初学者背熟键盘字根图后,第二步的任务是学习各种汉字的分解。正如我们上节讲过的那样,五笔字型有自己规定的拆分方法。有的字,象"本"拆成"木一"、"太"拆成"大、",
问题不大;但有的字,像"那"拆成"刀二阝"、"曲"拆成"冂廿"、"其"拆成"艹三八"等等,不经过专门的培训,是学不到手的,因为它与我们日常的写字习惯相去甚远。在王永民教授编著的四大本分册的教材中,大部分内容是教学生如何拆分汉字。后来新著的《五笔字型》电视讲座教材,洋洋数万字,也是厚厚的一大摞。
在一般情况下,要想成为一个熟练的五笔字型汉字录入员,大都需要经过十天半月的专门训练,然后还要练上几个月的时间。若想真正打得快,必须把那600多个简码字的编码牢牢地背熟。在使用中,若间断时间过长,又很容易遗忘。当然,只要肯下苦功,通过自学也能成才,例如,著名作家马识途、徐迟等人,六七十岁的高龄,经过一段时间的苦练后,苦尽甘来,尝到了五笔字型输入汉字的甜头。
对于那些以处理大量汉字为职业的专业人员,例如打字员、录入员、秘书等等,王永民教授给了他(她)们一件威力巨大的"法宝",使他(她)们彻底告别繁重的案牍抄写或者笨重的机械打字机,潇洒地坐在计算机操作台前。
五笔字型非常适合于不看键盘的"盲打"操作,因为它几乎不必像拼音码那样"选字"。它的重码率大约只有万分之二,也就是说,
打一万字才有一两个同码汉字。平均来说,每个汉字的击键次数也不超过3下,尤其后期推出的新版王码系统,增加了词组功能,可以同时输入各种词汇,显著增强了它的速度优势。
王永民成功了,他用心血浇灌的"五笔字型之花"在祖国的大地上吐着芬芳。王永民的编码方案是否是拼形编码中最好的一种,专家们没有最后表态,学术界也没有最终下结论。在这一点上,同样用得着"物竞天择,优胜劣汰"的自然法则。但五笔字型至少已经为中国的某些专职人员架起了一座天桥,至少引导一部分中国人通过了艰险的"蜀道"。
可以认为,从五笔字型开始,中国优秀的专业电脑打字员,他们的打字效率已经超过了优秀的英文打字员。有关专家曾根据在计算机储存中的多种体裁文稿对比测算,同一文字材料,英文打字击键次数是汉字字数的4倍(这是汉字储存信息优势的又一例证)。汉字录入员如果能够达到每分钟80个汉字,同样效率的英文打字员就必须在每分钟里击键320次,即每秒种需敲击键盘6下。每秒钟80汉字,仅是我国有关部门拟定的中级电脑打字员技术等级标准。目前,熟练的五笔字型汉字录入员,能够达到120字/秒的速度者比比皆是,从输入信息的角度判断,他们都已经接近了英文打字世界冠军辛格先生的超级水平。
遗憾的是,五笔字型的学习,是一种严格的职业技术培训,如果指望学会这种本领像夏天吃冰棍那样舒服,往往是浅尝辄止,半途而废。现在人们所指的"打得快的方法不好学",就是针对五笔字型而言。对于更多的普通中国人,不可能有机会也没有必要去接受这种职业训练。五笔字型好比"望梅止渴",可望而不可及。
不是我们不愿意学习,也不是我们不能吃苦,我们确实没有时间,去背会130个字根的位置和600多个简码;我们也确实没有精力,去学习那四大本教材,记住那些繁杂的拆分规则。
想用五笔字型实现全体中国人的"换笔梦",离理想境界还相距太远! ---------------------------------------------------
创造一种绝大多数中国人都好学好用的输入方法,彻底解决中文电脑在汉字社会的大普及,实现亿万炎黄子孙的"换笔"夙愿--这是10万编码大军的"科学之梦"。
在五笔字型及一批优秀的汉字编码撕开"蜀道"的突破口后,攻坚战役已进入到白热化的阶段,科学的梦就快要变成现实……
1989年的日历刚翻了几页。 一张向学生普及计算机的报纸, 以"神奇的汉字编码"为题,长篇累牍专栏连载,呼唤全国的少年儿童们"跟我从头学……"。
从头学,学什么编码呢?请看这张报纸刊载的令人振奋的评语: --"该编码在各种拼形输入方案中具有先进性,达到了国际水平",国内著名专家在鉴定报告中这样写到。
--"汉字中唯一的一种密码被你们发现了",大学教授这样评价。 --"这套编码高出了一个数量级",四通电脑公司的总工程师推荐说,并当即决定作为四通中文打字机用户必选码。
--"只有根据这一方案, 才能彻底解决汉字编码问题, 我将大力协助推广这个编码","大众码"的发明人、国家级专家陈代宇于是说,虽然"大众码"已被国家有关部门评为优秀的A类方案。
这种"神奇的编码",正是1987年诞生的"表形码",它的发明人陈爱文先生更是壮志凌云,一语即出,震惊四座:
"表形码愿与王码在中央电视台打擂, 比赛汉字键盘输入,输方支付十万元人民币……"。 陈爱文,一位旅居法国的华侨人士,他在巴黎有个家,却在浙江的温州创办了一家个体研究所,自1984年以来长期逗留在祖国。他为研究所想出一个寓意深长的名称--"温州雨粟文字技术处理研究所"。想一想,"雨粟",它的喻义是什么?陈爱文先生期盼着再来一次"天雨粟,鬼夜哭"。
表形码从它的名称上就能看出它是典型的"形码",与五笔字型同属一类。陈爱文为何敢于向王永民"叫阵"呢?恐怕是因为表形码练就了几招厉害的"码功"。
表形码也采用26个英文字母为编码输入汉字,但突出了"表形"的特长,尽量选择与汉字部件形状相似的字母作为代码。一眼望去,很有些"似曾相似燕归来"的感觉。这里我们并没有把各字母所代表的汉字部件列全。例如,字母"X"除代表部件"十",还代表与其类似的"X"、"丿"等;字母"E"所代表的"彐",无论开口朝何方都行,如"山""巾"等等。当我们输入汉字时,键符上英文字母与纸上的汉字部件形象对应,这种反应在大脑中最直接,记住这些部件不那么吃力。
有的汉字, 马上就能够"拼"出来。如"OO"是"吕","OOO"是"品","EP"是"印","OX"是"叶","XXE"是"希","PTO"是"阿",而"OPTO"是"啊"……。那么,"XO"呢?可能是"古",也可能是"右"。这里出现了重码。
陈爱文先生想出一个很简单的办法来消除重码:在部件编码后加上汉字的读音,当然只须要加拼音的第一个字母。"古"(GU)字加"G",编码变成"XOG";"右"(YOU)字加"Y",编码变成"XOY",这两个字不再是同码字。
表形码也是击键1~4次输入一个汉字,它也能够方便地输入词组,以加快速度。但是, 请千万不要以为表形码输入汉字就是如此之简单, 某些宣传材料也只是说到此处,"点到为止",以至给人造成了某种错觉。其实,表形码同样要碰到汉字的拆分问题,与五笔字型类似,它也规定了分解汉字的规则。
表形码确定的汉字部件总数有373个。 这373个"拼形字母" 又分为离聚、交叉、包围、粘连、字架五种类型,构成了一张完整的"汉字字母表"。许多文字学家对表形码情有独钟,他们认为,这张"字母表"的分类方法,"上承汉字的造字历史,下接键符的直接安排",使用者并不需要一个个地记忆汉字的拆分,而是看到某个汉字就可分出它所包含的部件,不会产生歧义。例如,"且"字,有的方案把它拆为"冂三",这就违背了造字历史的依据;表形码则规定"且"不拆分,用字母"B"象形表示。于是,成批的类似字都能用它拼装,如"目、直、其、自、身、耳、睡、咱、躺、甚"等等,一下就学会了拆分好多字。
由于拆字较有规律,表形码比其他形码易学好记。举个例子说,60多岁的著名作家韶华,在陈爱文先生送他一套表形码软件后,二十多天就能熟练地用它写小说,至今已写完百万字,还参加打字比赛得过奖。有报纸报道,表形码在南方方言区的广东倍受青睐,大红大紫,成为南方人"换笔"的首选编码。1993年,它又捧走了两项中国科学技术博览会金奖,并进驻了中南海的国务院办公厅。
中国的教育专家们也对表形码产生了浓厚的兴趣。他们的热点在于:儿童学习表形码能够有力地促进识字教学。在北京一所小学实验班上,34名一年级小学生只用了30多个课时学习表形码,不仅掌握了电脑打字,而且语文成绩名列全年级第一。有了汉字的"拼形字母"作桥梁,儿童们对不认识的字,也能够自己学着拼装识记。有的学者甚至还出版了按表形码部件"字母"编排的汉字字典,以替代古老的部首查字。
也难怪陈爱文敢于站出来,在高手林立的"码林"华山论剑,争当"码林盟主"。表形码的成功,或许正如潘德孚先生在全国教育科学研究的权威学术杂志上指出的那样:
"我们在过去的一个时期中,曾竭力推行汉字拉丁化,其目的是想使汉字现代化、字母化。现在通过汉字字形编码的研究,我们可以这么说,这个目标将很快实现了"。
------------------------------------------------- 表形码虽然比较容易学习,但它毕竟还是要逼迫我们去记忆,也许还是更适合于专业性质的汉字输入。对于非职业汉字录入的普通人,还有没有更理想的编码,能直接利用我们过去已经掌握的知识,只学几天就能入门呢?
当然有。请读者回顾我们以前讲过的内容。只要你在小学一年级学过汉语拼音,几分钟就能上机打字。如果不怕慢,也不失为一条"换笔"的途径。不过,慢与快之间可以相互转化,既然"拼形编码"能够挣出"难学难记"的桎梏,"拼音编码"为什么不能插上"高速"的翅膀呢?
攻坚部队的另一支"方面军",从这里又"杀"开一条"血路"。 汉语拼音编码输入汉字,两个关键问题亟待解决,一是击键次数多,二是重码汉字的干扰。
仔细研究它的缺陷后,又冒出了若干新的障碍,把拼音编码的道路闭塞得更狭窄。 障碍之一是所谓的"多音字"。拼音输入引起重码的是"同音字",即多个汉字读一种音,而多音字则是一个汉字有不同的读音。例如,"参"字,在参加、参差、人参三个词里读音各不相同。据说,在广州曾有间铺子,门面不大,名气却不小。它的店名叫"行行行"
。 三个"行" 字, 应分别读作:"xing xing hang",意思是"施行德行的商行" 。
类似的多音字,还可以举出一批,如长长、种种、重重、数数……。据统计,在《辞海》 里, 多音字占16%,主要是一字二音,但也有三音四音,最多一个竟有八种音,就是"那"字。在拼音编码输入里,多音字虽然不会引起重码,但必须设法为它配上多组代码,否则仅根据某一读音就可能调不出这个字。
障碍之二是方言的干扰。我国地域辽阔,使用汉语的人群被划分为若干方言区。虽然我国大力推广了普通话,但只要有方言存在,就不可能要求所有的人,都能掌握普通话的准确发音。同一个"日"字,沈阳人读"一",武汉人读"二",上海人读"三",四川人读"四"。多数南方人"牛"、"刘"不分,"知"、"资"不分。要他们用拼音输入"宁"
字,往往要在nin、ning、lin 、ling四种读音里一个一个地试,更不用说完全不会讲普通话的人怎样使用拼音编码,总不能为他们专门设计出一种"南方拼音"吧!
上述问题,一件件都得用心解决,才能从"山重水复疑无路",走向"柳暗花明又一村"。 1989年,中国北京的周志农,当代最年轻的汉字软件专家之一,集各路"码林高手"的十八般"武艺"之大成,搞出了一个"一揽子"解决方案。他不仅使拼音编码实现了一次巨大的跨越,而且使这种编码--"自然码",跻身于我国智能汉字输入系统的巅峰。
自然码是一种音形结合、字词一体、智能联想的"拼音"。许多人在使用了自然码后,不惜用最美好的语言来赞誉它,说它是普及型拼音汉字输入系统里,"最先进、最好学、最方便、最快捷、最具智能特点"的编码。由于"最"字的头绪太多,且听我们细说端详。
周志农,1960年出生的"小字辈",文静腼腆,看上去比他的实际年龄还要小。王永民教授发明五笔字型的时候,他尚在大学里读书。初出茅庐的小伙子心比天高,刚离开北京工业大学的校门,就把人生奋斗的目标盯住了攻克汉字输入的世界难题。
投身于攻坚战役,周志农不算早,但正是"迟到者"才有可能站在前驱者的肩膀上,向更高的险峰继续登攀。 当时, 在各种编码方案,"新翻杨柳",层出不穷。音码、形码、音形结合的编码,各具优势,又各有不足,争论的焦点依然集中在"好学的打不快,打的快的不好学",这一"怪圈"像沉重的石头,时时压在周志农的心头。
初涉险地的周志农, 不久就"攻占" 了几处"山头"--他的金奖编码连续获得金奖,但是,他并不满足于几樽金杯和几块奖牌,他在自己的座右铭上,写上了"更好还要更好"的警句。为了追求这个"更好",周志农重新开始"修炼"一种"旷世码功"。
他走进《说文》向许慎老先生请教;他攻读小篆,同李斯丞相切磋。他更凭借他心爱的电脑,对汉字庞大家族进行全面透视。在所有的现代汉字编码里,周志农似乎对早期问世的一种简化拼音更感兴趣。在简化拼音启迪下,他意识到古人的另一创造能够改造为快速输入的拼音编码。一招一式,一拳一脚,冬练三九,夏练三伏。周志农又大胆地从各门各派的绝技里,不断地汲取精华,终于以"自然门"的"掌门人"的身份,创立了一门新的"码功"。1988年面世的这种编码,
如今已在周志农领衔创办的"超想公司"手下,发展成为第三代智能化的新版本--"超想自然码"。 自然码师承各家,功底虽算不上"正宗",却能一路"夺关斩将",把拼音码的狭隘关口逐一打通。自然码能够自如地悬挂在不同的汉字系统上,中文电脑的用户们说起它的特点来,如数家珍:
声韵双拼--针对拼音击键次数多、打不快的问题。在周志农的拼音方案里,无论哪个汉字,都只击键两下,奇数次击键为声母,偶数次击键为韵母,其拼音的声母和韵母均简化为一个字母符号,26个字母键充当52个使用。
我们用双拼键盘来输入"中文电脑" 四个字:vs wf dm nk ,只需击键8次,而用全拼音码来敲则为:zhong wei
dian nao,次数多一倍。双拼编码把汉语拼音的一些字母作了变形, 如把声母zh、ch、sh 变成 v、i 、u ,复韵母也相应作了简化,略为增加了记忆负担,但对于熟悉拼音的人来说,并没有造成太大的不便。
双拼编码的祖宗,最早来源于我国古代的"反切"注音法。"反切"用两个熟悉的汉字来为另一个新的汉字注音,
即把第一字的声母和第二字的韵母相拼,作为第三字的字音。例如,古代字典上对"刚"的注音是"刚,古郎切"。取"古"字的声母
g和"郎"字的韵母 ang , 拼成"刚"字的字音 gang 。早在魏晋三国时期,反切注音就很流行。我国某些初期的汉字编码,已经借用过这种古老的方法。CCDOS汉字磁盘操作系统的简化拼音只用了部分双拼,周志农把它接受并加以完善为自然码的基础,克服了拼音码击键次数多的弊端。
词组输入为主--解决拼音重码太多的困难。汉语中的单字在语言中实际使用量约只有五分之一,其余的都组成词组。我们赞颂一个人文章写得好,总说他"词汇丰富"而不说他"字汇丰富"。某个汉字,本来有一批同音字,但构成词组后,同音词就为数不多,输入效率大约是单字的4倍。
例如, 想要输入"意"字,必须在100多个同音字里挑选,而输入词组"意见",仅剩下两个音完全相同的词"意见"和"一件"。
对于两个字组成的词,自然码一般需击键4次,有的常用词,则只需敲入两字的声母。 更多字组成的词,最多也只要击键4次,比如"计算机"(jsj
)、中华人民共和国(vhrg)等。周志农在自然码里装进了一万五千条词组,如果还不够用,用户还可以在使用过程中随时"造出"特殊的词汇,一次造好,终身受益。所谓造词,其实与平常打字一样,仅仅多按一次键而已。
音形结合--加速单字输入。 词组问题解决后, 剩下的五分之一不便组词的单个汉字, 周志农想了一个绝妙的主意: 用字形来补充不足的信息。据有关专家统计,一个汉字从字音里可获得65%的信息,另外的35%,必须由字形提供。这样一来,音码和形码在周志农的自然码里有机地嫁接,它巧妙地吸收了五笔字型和表形码等形码的"码功",当遇到不会读音的汉字,也能够用简单"拼形"方法输入。
智能联想--把重码词的干扰也赶出了中文电脑。刚才讲到的"意见"和"一件",虽然只剩下几个词,顶多选择一次便完事。然而,周志农仍不放过,偏要"赶尽杀绝"。他在中文电脑中首创了一种智能处理的"绝活"。汉语中的词汇,通常有上下文之间的关联,"衣服"只能与"一件"相联,而"正确"只能与"意见"搭配。当你从键盘上输入"正确"后,再敲入
yijm 的拼音,自然码将自动为你选来"意见"而不是"一件"。这正是人脑的智能,是一种用机器模拟的"人工智能"。自然码也并非天生就如此聪明,它会在暗中向你学习。比如,"时间""事件"和"实践"是一组重码词,你第一次输入"恶性事件"一词时,它也许不清楚哪一词能与"恶性"搭配,但只要你告诉它一次,第二次再输入相同四字词,自然码就学会了把"恶性"与"事件"相连。智能处理是目前汉字编码最高的"码功",仅自然码一大"门派"达到了这种境界。
高频先见--最常用的字输入最快。有26个汉字,分别对应于26个键位,只要击键一次,也叫作简码字,约占日常文章的20%。 此外,为了消除南方人读不准普通话的疑虑,自然码还真的为他们"创造"了"南方拼音"方式,可以不区分卷舌不卷舌,是边音还是鼻音等等。此外,为了对付多音字,自然码又处心积虑地为这些字开辟了多扇门,例如,"重"字,无论敲入
vs,还是 is,都可以方便地输入。此外…… 自然码充分利用了汉字的字音、字形、字义、字频和智能联想等各方面知识。虽然它的计算机软件只占用键盘打字"弹指一挥间"的瞬刻,但是它却完成了一切繁杂的任务。
周志农用他的自然码,实现了"返朴归真"的超越;自然码重返大自然,领悟了伟大的祖先创造汉字的真谛。 老作家吴越先生满怀激情地写道:"我是一个以文字为业的作家,先后学习、使用过的汉字输入方案不下十几种。根据我个人的体会,以拼音为基础的所有汉字输入方案中,自然码是最好学、最好用、最适合非文字录入专业人员使用的普及型方案。"对于非专业打字员,自然码不仅好学,而且在熟练后也能"盲打"。如果输入包括词组的文稿,有的人甚至也能达到每分钟输入200个汉字的水平。
自然码能带来一个大众化的中文电脑的大普及吗?能彻底实现全体中国人的"换笔"梦吗?我们还是不能过早地下结论。 一些根本不会讲普通话的南方人偏爱表形码就是一个反例。
一些根本没学过汉语拼音的老作家宁可选择五笔字型就是另一反例。 汉字编码的攻坚部队仍在不同的战线上趁胜追击,东方的曙光已经在望了。
------------------------------------------------- 听了众多传的奇故事,人们不禁要问,"码家军"里年龄最高的"将领"会是谁呢?
1992年9月19日,第二届"海峡两岸中文电脑输入技术表演赛"在北京降下帏幕。63名选手两天来激烈的角逐爆出了冷门:来自大陆的两名学生,使用同一种汉字编码,分别在简体和繁体两种"离散文本"赛区里同时夺魁。其中,参加繁体汉字输入项目的小选手,使大陆的汉字输入速度第一次领先于台湾,并创造了该项目历史最高纪录。
小选手们眼含幸福的泪水站在领奖台上,各自接过一台作为奖品的386微机,他们的心里,一定想着那位白发苍苍的老爷爷,那位帮助他们力挫群雄的编码发明人。
白发皓首的老人,是张其浚老教授吗?张老先生在1982年中文信息学会成立时已是83岁高龄,在"码家军"里是数一数二的"老黄忠"。这位云南大学的教授,毕生从事高能物理研究,却"不务正业",只身创进汉字编码的"蜀道",明知艰险无所惧,充满着乐观的诙谐。他曾讲过一句名言:"高能的人,搞高能物理;低能的人,搞低能物理;我是无能的人,我就搞这个无能的物理"。张老搞出的编码,是最早的一批形码"方案之一
。可惜,张老并没有来得及看到他的编码造福于人类,就过早地离我们而去。 依然健在的这位白发人,其时业已八十有七。他是大陆外语学界的泰山北斗,自本世纪五十年代起,他主编的《英汉大字典》,曾抚育过几代莘莘学子。他是王永民步入汉字编码的启蒙者和恩师,也是我国字形编码理论的奠基人。想想看,大家一定在介绍五笔字型编码的文章里面看到过这位老者的名字……
郑易里老教授,通晓英日俄三国语言,对汉语汉字的研究更是炉火纯青。他用"字根编码法"的深邃理论,一手扶持王永民登上了成功的殿堂,同时也在实践的土地上辛勤地劳作。作为学术界的权威,"登泰山而小齐鲁",他追求的是更科学与更系统,希望研制出更好的拼形编码,亲自验证自己的理论学说。这种编码,不仅能快速输入,而且符合国家文字规范,与中小学的语文教学相互接轨。
"郑码"研制的起步的时间已显得较晚,郑老自己也感到力不从心。大量的实际工程由他的女儿接手,两代人带领着一批研究人员夜以继日地奋战,直到1990年底通过了权威的鉴定。语言学大师亲自发明的编码超群拔俗,郑码的汉字库,共收入了繁简体汉字达6万余,有效地支持着我国古籍的整理和研究。仅此一点,郑码就已经获得一项"中国编码之最"。
"老骥伏枥,志在千里"。后起的郑码终于在这场检验实力的比赛里,一举夺得两项冠军和两项亚军,郑易里教授令夕阳增辉,他又奋力登上了一座新的高峰。
由于我们掌握的情况有限,"码家军"中年龄最大的编码专家或许另有其人。 著名科学家钱伟长教授发明过"宏观字形码",香港著名学者安子介先生创造了"安氏笔形输入法",他们都已过耄耋之年……
于是,我们只好来讲年龄最小的编码发明者,"码家军"里"娃娃兵"的故事。 ------------------------------------------------
在我们电脑的资料库里,仍然储存着1990年报刊杂志关于这个女孩的报导。 1990年7月13日,新华社发出了一则举世嘱目的消息:加拿大的著名高等学府,向中国上海的一位初中三年级的学生杜冰婵发出邀请,请她以访问学者的身份前往讲学,介绍她发明的一种简便易用的汉字编码。紧接着,海内外几百家新闻媒介竞相渲染,醒目的标题都是--15岁的少女与她的"汉字全息码"。15岁的女孩名列于上海当年"十大科技新闻"人物的榜首。
然而,1993年的报纸却遗憾地发布消息:中国专利局以不符合新颖性、创造性、实用性等要求驳回了"汉字全息码"的发明专利申请。
从那些报刊资料中,我们又重新查阅到"汉字全息码"的发明思路。 出生在辞书编辑世家的小女孩,花了三年时间,用她想出的"笔顺原则",把几万个汉字筛选、浓缩到100个部首表内。她用掉了整整三麻袋草稿纸,堆起来比她的个子还高。每天放学作完作业,都把自己关在小房间里,一张张卡片铺满了床和桌子……
小女孩发明的这种"全息码",看上去很像音码,100个部首按音归类,每个汉字的第一代码是该部首的第一个拼音字母;但它又像是笔画码,后三个代码是该汉字的第一、二笔和最后一笔的读音字母。例如,"目"字,读音为
MU ,第一码就是 M ;它的第一、二笔画分别是"直"(ZI)和"弯"(WAM ),最末笔为"横"(HENG)。
组合起来,"目"字的全息码就是 MZWH 。 听起来好像是有一点"全息"的意思,既包含字音,又包含部首和笔画。但是,我们毕竟不是专家,可能这种方法别人早已率先采用。
凭心而论,年方及笄的女孩能够对汉字做出这种归类已属不易,我们并不想以成败论英雄。不过,关于汉字全息码的争论一波三折,1994年的报纸又传来消息:上海两家单位状告小女孩侵犯了他们的发明权益,原被告在法庭上已相持三年,本次开庭审理仍无结果,诉讼还在继续……
于是,我们又只得转向由此而起的另一"全息码"的故事。 江苏某监狱关押着一名等待处决的死刑犯。1992年才27岁,却利用工作之便,侵吞国家巨额财产达百余万元,被人民法院以"贪污罪"依法判处了极刑。
死神不久就要降临了。他带着痛苦的心情龟缩在牢房的墙角, 眼登登地望着天花板出神。 他,一个普通的农家子弟,全家人节衣缩食供他上学,把唯一的希望寄托在他的身上;是人民把他培养成中专生,又当上了国家干部。可是,他竟然经不起金钱的诱惑,悔恨交夹却为时太晚,上诉的请求恐怕也不会有什么更好的结果。
管教干部的喊声打断了他的思路。他顺从地跟着其他人犯,转移到另一间牢房。正巧他的床铺上,散放着从前的犯人留下的几本杂志。他顺手拾起一本,下意识地翻到一页,漫不经意地看了几行,不觉被文章深深打动。
这是一则非常简略的报道,说的就是上海那位女学生和她的全息码。年轻的死刑犯麻木的心开始有了一点躁动。他想,反正离上诉的最后判决期还有几个月,何不找点事来打发余生,也许,还可以为社会做些有益的事。在这种奇异的境况下,他萌生了自己也来发明汉字编码的奇怪念头。
更奇怪的是,监牢的管教干部居然全力支持他的想法,为这个死囚找来了参考书籍。从此后,他抓紧生命最后的日子,尝试着开始了艰苦的探索。 最后的日子是需要一天天扳着指头掐算的。死刑犯从来没有接触过什么电脑,对编码也是完全的门外汉。但是,也许正因为如此,他构思的编码,只想到要突出简单、易学和实用,这种编码应该像家用电器那样容易被普通人掌握。他把自己的编码,也命名为"全息中文码",至于是否与上海女孩的全息码相似,我们就不得而知了。
法律一共给了他6个月的时间。6个月后,江苏省高级人民法院做出驳回上诉、维持原判的决定。死刑犯交出了写满100多页稿纸的全息中文码,交还了借阅的图书,作好走向刑场的准备。
死刑犯做梦也没有想到,他的全息码给他的人生带来了戏剧般的变化。最高人民法院接到看守所呈交的全息编码后,立即指示下属法院派员核实情况。全息中文码也得以转到全国中文信息学会,专家们为死刑犯发明的编码进行了评审。结果出人意料,这种编码被认定为有创新,具有易学易用的优势。
1994年年初,死刑犯用颤抖的双手,接过最高人民法院的又一张判决书:鉴于他在归案后有悔改表现,所写的全息中文码具有发明价值,故改判死刑缓期两年执行。省高级法院并建议劳改部门为他提供一定条件,使他能够继续全息码的研究。
死刑犯泪流满面,泣不成声,法律又为他铺垫了一条重获新生的道路…… ---------------------------------------------------
编码大千世界,各色人等,真是无奇不有。 死刑犯新生的故事,只是其中一个小插曲。"码林"中人,更多的是中华民族的优秀儿女。有的人才,身怀绝技,对民族传统文化瑰宝《易经》的研究造诣精湛,试图从《易经》里寻找汉字编码的源头。戴顺天先生就是这样的奇人。
戴顺天,不知何许人也, 报刊杂志也多"密而不宣",只说他历经九年艰辛从《易经》的太极图中悟出了新的编码。顺天电脑公司为传播顺天先生"太极码",大言不惭地道出了两句"谶语":
--传八万里全球信息太极一码足矣,继五千年华夏文明阴阳两笔书之。 太极图是《周易》的精髓,两条交欢的阴阳鱼,隐喻着太极生两仪;两仪之上又分别各生一阴一阳,即两仪生四象;四象之上若再分别各生一阴一阳,即成为八卦图。戴先生发明的太极码,
正是遵循这种阴阳消长的思想, 破天荒地把汉字的基本笔画仅分为直画(阳)和折画(阴)两类,因此又叫"两笔字型"。它不计汉字笔画的长短、方向,只分曲折,既揭示了汉字笔画最深刻的本质特点,也便于人们学习拆分汉字。
太极码的键盘最能体现戴先生对易学的悟禅。 它把键盘从正中垂直一分为二,左为阳,右为阴,左手专打直画,右手专打折画,正所谓"太极生两仪",形成左右太极图式。左右太极键盘又按水平方向一分为二,上部是笔画不相交的阳区,下部为笔画相交的阴区,比喻"两仪生四象",形成上下太极图式。上下左右,各具特征。最底部的一排键位,依次排列着日月金木水火土,阴阳五行。在键盘的正中,安排着象征阴阳鱼眼的口囗键。西文字母键盘,被改造成了一幅相当完整的"太极图",堪称洋为中用的楷模。
太极码虽然按阴阳两笔分类汉字,但它也必须把汉字拆成"字元",也是一种按字形编码的方案。许多评价文章赞扬它首次成功地解决了汉字输入高效性与简易性的矛盾,说它适合与各种年龄、职业和文化程度的专业或非专业人员使用。
作为"码家军"中的新秀,太极是否就此一码足矣,尚需时间和实践的检验。不过,从西汉许慎在《说文解字》里把汉字分为540部首起,直到王永民的五笔字型把它浓缩为130个字根和五种基本笔画为止,两千年来,亦只有奇人戴顺天做出了阴阳两笔的总结。返朴归真,归于太极,这与和返归"自然"和传递"全息"有异曲同工之妙。
国内报刊对"码家军"披露的传奇,主要集中在形码的各路高手。音码的竞技场,也并非周志农的自然码一支独秀,吴越先生破解的"声数码"就是另一"神速"的编码。仅由于笔者的孤陋寡闻,只得痛失了向读者讲述其他音码发明家传奇故事的机会。
就笔者所知,现在流行极广的一种音码--"双拼双音编码",很多人都不清楚它的渊源。它的发明人刘卫民先生可是"正宗"的电子电脑专家,60年代毕业于清华大学的研究生,他研究成功的微波管,曾在国防尖端武器的试验研究中发挥巨大作用。人们偏爱刘氏"双拼"
,更爱其"双音"。别的编码都只有用单字联想词汇的功能,刘卫民的"双音"反其道而行之,独创了以词组联想单字的所谓"反联想"方法。
我们知道,采用拼音输入,输入词组比单字反而更快,因为词组有效地降低了重码。但有的时候,也要遇到只输入某一个字的情况。对此,自然码是用该字的字形信息加以补充,刘卫民却不想落入形码的"俗套"。刘先生通俗地解释他的"反联想",说它是中国人说话时常用的办法。比如,你要我输入"ji"字,我不知道是"机"还是"鸡"。你怎么告诉我呢?你会告诉我,是"机器"的机,不是"鸡蛋"的"鸡"。那么,我只要打入"机器"一词的双拼,就输入了该词组前一个单字。此举看似平常,却于平常之处显出玄机,这就是刘卫民先生的功底。
中国的"码家军"还在继续拼搏,汉字编码仍在不断地锦上添花,在高手林立的编码"码林",倚天屠龙,华山论剑,争当"码林盟主"者依然是大有人在。据悉,国家教委为了全国中小学汉字编码教学需要,1992年6月设立"八五"科技专项课题,组织众多专家学者协同攻关,所研制的编码名曰"认知码",受到了老师和学生们的普遍欢迎。
-------------------------------------------------- 中国的汉字编码,每一个编码都能演绎出一篇精彩的传奇。
中国的汉字编码,"如此多娇,引无数英雄竞折腰"。 700多种编码,百花园中,五彩缤纷,音码形码,竞相开放,让"换笔"的中国人看迷了双眼,
感到无所适从。究竟哪朵花是"国色天香"?哪朵花才"倾国倾城"?现在,到了应该总结的时候。 马俊仁的"马家军"只有在赛场上,方显出英雄本色。汉字编码的"码家军",也曾历经多次"擂台"比武,你争我夺,不断刷新汉字输入的世界纪录。这里仅把散见在报刊杂志中的若干赛事的部分冠军成绩,集中列于下表里。比赛项目分"连续文本"和"离散文本"汉字输入。连续文本指的是输入整篇的文章,其中含有词组;离散文本则是一些散乱排列的互无联系的单字,不能有词组。
●1989年 东方电脑杯赛 171.8字/分 (连续文本) 50.9字/分(离散文本) ●1990年 全国汉字录入公开赛 148.2
字/分 (连续文本) 83.8字/分(离散文本) ●1990年 首届海峡两岸表演赛 203.3 字/分 (连续文本) 147.8字/分(离散文本)
●1992年 全国排版录入公开赛 184.5 字/分 (连续文本) 112.0字/分(离散文本) ●1992年 第二届海峡两岸表演赛
259.7 字/分 (连续文本) 144.8字/分(离散文本) 根据各场比赛创纪录者使用的编码分析,我们得出一种印象:仅就输入速度讲,前期多是形码夺魁,后期则是形码、音码平分秋色;不含词组的单字输入,形码尽占天时地利,含有词组的连续文本,音码就要领先一步。音形之争似乎打了一个平手。
上表列出的"第二届海峡两岸中文电脑输入技术表演赛"的成绩, 仅仅是专业组简体字输入项目。不可思议的是,这两项冠军(连续文本和离散文本)均由山东选手刘爱萍一人独得。她在专业组繁体字连续文本项目中还获得另一项冠军。其中,简体字连续文本每分钟259.7字的速度,是历届全国比赛的最高记录,完全能与"马家军"王军霞创造的长跑成绩相媲美。她所用的输入编码正是唐懋宽的"声数码",该项目的亚军也是同一编码,第三名才为五笔字型所得。刘爱萍的输入速度,比第三名要高出69字/分,这个差距令人吃惊。它表明,音码在连续文本的汉字输入里,已经显示出绝对的优势。
有位早已"换笔"的作家站出来发表"高见":"你们搞的这种比赛,选手们都是专业打字员,打字时无需动脑子。我辈进行写作,卡脖子的不是电脑而是肉脑,是人的思维速度跟不上手指。哪怕每天只打2千字,一年下来就是70万,这样的高产作家国内并不多见。"言下之意,若只讲速度,无论音码、形码都能满足非专业打字员的要求。
有人又把汉字输入分成"三打",以便各人对号入座: --"看打",专业操作员眼看文稿,手打键盘,头脑不想文章的内容。
--"听打",文秘人员耳听长官口述,手击键盘,直接成文。 --"想打",一边思考,一边打字,不要稿子,直接写作。
对号入座的结果,普通中国人"换笔"写汉字,当然属于"想打"一类。 关于"想打",自然码大师周志农诚恳地劝告我们说:
中国说"看报"而外国人说"读报",我们应该承认看比读快。用拼形码输入,要加上"拆部件"和"反应部件键位"两个过程,如果自己输人自己的文章,还要再加上一个多余的"书写"(至少在脑中的)过程,而拼音码仅需要一个"反应键位"。
我们在脑中构思文章的确用的是字音而不是字形,周志农先生的劝告很有价值。 五笔字型大师王永民很不以为然,他也认真地向我们指出:
中国人从小学写汉字,想写"李",顺手就把"木"和"子"搬过来"拼"在一起。拼形码"按键"的过程,就与"写字"的过程完全一致。相反,如果迫使你把写"木"和"子"的动作,换成依"木"与"子"的读音来按键的动作,先想m再想z,那倒是非影响形象思维不可。
我们平常写字按部首顺序分解,确也习惯成自然,王永民先生的说法也很有道理。 在"码家军"传奇的最后,我们从汉字输入比赛写到了音码与形码之争。
音码乎?形码乎?是音码中的自然码、双拼码、声数码、未来码?还是形码中的王码、郑码、表形码、太极码?最好的编码究竟是什么? 著名科学家钱伟长教授早在1986年时曾经指出:"好的编码方案还没有出来,好的编码方案应该是一种文字,或者是准文字"。
能够以中国电脑文字身份出现的编码,恐怕至今仍然没有成熟,各种编码的百家争鸣,虽然打通了汉字输入的"蜀道",但目前还只能各领风骚,各显神通。
不过,我们翘首期待着中国汉字编码的"书同文",期待着中国的"码家军"像"秦王扫六合"那般,早日托起中国统一的电脑文字。
点此发表您的文章!(发表文章均可获得梦码软件免费赠送)
提供自由空间,交流先进思想,展示卓越才华,尽显个性魅!
|