汉字输入法的梦码mm123感谢您访问! 如果你不想花时间学习……
如果你想成倍提高打字速度……
如果你感到打字是一件困难的事……

请立即使用 梦码 输入法
汉字输入法爱好者、梦码输入法用户的家园!汉字输入法初学者、汉字输入法专家的乐园!
首页 输入法下载 输入法简介 输入法特色 输入法购买 输入法版本 梦码新闻 梦码偏旁 梦码招聘 免费赠送 我要写信 来信选登 我要加盟
输入法论坛 输入法大全 网址大全 梦幻五笔 梦幻火星文 五一放假安排 2013
梦幻组合①知音输入法-特点简介 梦幻组合②双笔输入法-特点简介 梦幻组合③风行输入法-特点简介 梦幻数码 梦幻6笔数码 梦码中文键盘
 

早期文章列表


精华区:

形码输入 六大误区


——“梦幻组合③风行输入法”的诞生

摘 要本文在对目前流行的拼形输入法的缺点进行全面剖析的基础上,指明了当前拼形输入法走入的“六大误区”,提出了全新的拼形输入法的设计理念,在新的设计原理指导下设计完成的“梦幻组合③风行输入法”,则进一步说明和验证了这一设计原理的科学性和实用性。这一系列崭新理论的提出也将为今后各种拼形输入法的设计提供科学的指导。

关键词输入法 拼形输入法 风行输入法 字根 原理

一、不顾笔顺,生硬拼凑形状的“拼形”误区

会拼音的人都知道汉字拼音是先声母、后韵母,而不能反过来先拼韵母后拼声母。其实拼形也应该这样,即按照结构和笔顺拼“形”。

但是,目前的拼形输入法几乎都存在严重的生硬“拼凑”构字,有些“拼凑”属不得已而为之,而有些则完全不必要。除了“那、丑”等极个别字,很少有人掌握正确的书写顺序需要做专门处理外,其他汉字拆分时都应遵守书写的笔顺,这是一种汉字输入法易学的基础,需要严格的规范,否则不可能拥有广泛地使用人群。试想一下,在学校学习时辛辛苦苦掌握了汉字的规范笔顺,可使用计算机输入汉字,却又要学习错误的书写笔顺,能不觉得痛苦、能不觉得难学难记吗?这些既不规范,又不符合国家标准的处理不但不易学,还增加了记忆的负担,而且是每出现一个这样不科学的处理,就多增加一条记忆量,相当于增加了一条细的规则。

如果说记忆大量未经优化精简的字根(未经优化精简的字根数量多、规律性差)我们不得不接受的话,如果说记忆大量的构字规则,甚至规则中的大量细则我们也无奈地接受的话,记忆大量错误的笔顺实在让人难以接受。换句话说,我们将“那”、“丑”拆得易于学习和记忆是我们的义务,我们将剩下的几乎全部汉字拆得规范标准而不是随便想当然的定义成其他的笔顺或拆法更是我们的义务。我们甚至有义务让每个会写字的人通过短时间简单的学习,最好是可以通过自学即可轻松高效的掌握汉字拼形输入法。这应该是每一个大众汉字输入法追求的目标!

二、“不择手段”追求低重码率的误区

低重码率是拼形输入法的最大优点。为了实现盲打、追求更低的重码率,目前,几乎所有的拼形输入法都在使用一些不规范、不合理、不科学的方法。如:采用不规范的字根,不规范的笔顺,不合理的强硬定义,不科学的用键数量。

实际上,作为优秀的大众汉字输入法,首先应该满足词语多这一基本要求,在拥有海量词库的前提下,保证所有词语较低重码率或者说保证字词混输时的综合重码率才具有实际意义。而现行输入法都不约而同追求单字低重码率,显然偏离了大众化汉字输入法的方向。

从另一个方面说,单字重码率对于一个普通用户甚至于对一个专业打字员都不是最有意义的。

因为,如果一种输入法是以打词为主,他遇到单字的机会相对就小得多。而输入法简码本身没有重码,已经解决了绝大多数常用汉字的单字输入问题。

当两个字发生重码时,可能这两个字都是简码字。

或者只有一个字是简码字,也不存在问题,因为简码字已不用考虑了,另一个非简码字如果调整到第一位置,即让有简码的汉字在第二位置,非简码字就可以用无重码字的方式来打。

最坏的是两个字都无简码。其实这种情况极少,也不用担心,由于汉字的简码是经过优选的,通常当两个重码字都没有简码时可能两个字都是冷僻字,就算只有一个是冷僻字,只要将那冷僻字放在后面,相对常用的那个汉字就可以用无重码字的方式来打。

“梦幻组合③风行输入法”经过以上技术处理,重码的单字实在是少之又少,而在打字时真正需要用选择重码字的方式来打单个汉字的情况几乎没有真正发生过!出现这样美妙的结果,要归功于“打词为主”的思想,更要归功于“没有词语打不到”的智能成词新技术。

三、词语数量的误区

大词库与重码率似乎永远是一对矛盾。

那么,追求更低的重码率还是追求更多的词语数量?

这种情况任何人都必须承认:对于绝大多数非专业地文字录入人员常常会因为一个比较高频的词没有办法用词语的方式来录入而深感别扭!就算不是一个很高频的词,如果他认为是词语了,但没有找到,也一定会觉得别扭。或者反过来是这样,明明词库里已经有了这个词语,但按照打字教程,他在拿不准的时候,他就要打单字。如果打单字,他打键就多,上字就慢,拆字就会难一些,就别扭。

因此,这应该是一个最佳的选择,在保证重码率低于国家标准的前提下追求尽可能大的词条数量。

目前较流行的拼形输入法早期版本,如 DOS版本,往往只收录7千 - 8千条词语,后来采用的词语数量又不断增加。随着词语数量的增多,重码率同时也成指数级上升,甚至为了显得大众化,重码率远远地超出了国家标准的限制。尽管这样,初学者或不常使用的人也都能接受这样的大词库。但是,对于一个熟手,过多的重码是难以忍受的,因为会极大影响速度和流畅的感觉。因此,从某种意义上讲,这样的大词库也没有太多的实用性。

但是,如果重码率被控制在可以接受的范围,那么结果正好相反。

这一点不难理解,实际上也是一个很简单很基本的原理,即 输入法原理之首:词语越多越好打。

其实说重码率成指数级上升,也大约只是一种近似。试想,如果仍然用 4键打一字词,字根只分布在10个键上,则上升的曲线会更陡,而如果将字根分布在40个甚至更多的键上,则上升会平缓得多。这样就从另一层意义上反映了用较多地键获得较大地容词空间会更有利于装入海量词条。实际上“梦幻组合③风行输入法”为此所采用的技术还不只是“多使用键来分布字根”和“使字根的分布尽可能减少词的重码”这两项技术。

可是,无论装入多少词语,甚至配备有“专业词库”的选装,总也有你打不到的词语。越是提倡多多打词,越是不可避免这种情况的出现,而不是有了十多万、几十万条词语就万事大吉了。

所有打不出来的词语必须让它成为词语,不管它是不是冷僻的词语,因为可能它只是对你不冷僻(这个问题非常现实而不是空谈理论!),那就更需要按词语方式来录入了。还有,如果能在你不知不觉中,而不是像现在通行的那样手工强行加入的办法,才最完美。当然,还有你的确认过程也是在不知不觉中完成的。

确认可以避免人的操作失误,也可以避免程序误定义。虽然经过严格的程序设计程序误定义已经极少可能发生,但一旦误操作、误定义发生,必须有好的机制来防止误造的词语对录入产生干扰,同时也能确保重码率的稳定。这里强调确认的过程必须是在不知不觉中完成的。

在不知不觉中完成确认过程的意义,除了可以避免造出任何垃圾词语对录入产生恶劣影响。在不知不觉中完成确认过程的意义还在于,因为能在不知不觉中完成造词,所以,没有了对想要打的词语是否存在的担心或猜测,也没有了明明词库中有想要打的词语却又不敢打,却要用更多的击键、更慢的速度、更难的拆分来打,甚至是一个单字一个单字的打,更没有必要在每条词语造完后再手工确认一次。

传统形码要么不能自动造词,要么可能制造大量垃圾词语,而且垃圾会越积累越多,多到让人没法正常打字,要么每一条新造的词语都必须经过手工确认。每一条新造的词语都必须经过手工确认,这是传统形码智能造词与智能拼音输入法智能造词的最大技术差距,以至于这种技术几乎没有走上实用。众所周知,智能拼音的最大优点就是智能造词,但是,这种新的形码输入法智能造词技术,这种可以在不知不觉中完成造词和确认过程而且是一次成词的新技术,让智能拼音的智能造词功能黯然失色。

在不知不觉中完成造词、在不知不觉中确认新造词语有效,带给你的只有轻松流畅的美妙感觉和愉快心情。

输入法原理之二:完全自动地产生每一个你想要的新词语,以对海量词语进行再补充,真正完美地实现了以“打词为主”的理想。

因为它的确做到了除了垃圾词语,任何词语,只要是你想要的,都“有”了。

接下来最需要讨论的是,用多少个键来打字最好。

四、用键数量的误区

字词兼容是拼形的基本思路。可上面刚刚提到,常用词汇数量较多,因此,需要一个较大的容码空间,才有可能保证只有较少的词语发生重码。

较早的拼形输入法一般都采用25个键来安排码元,码长为4时,其4码编码空间为:25×25×25×25=390625,如五笔字型输入法。当精选 7000条高频词时,重码率为5%,较为优秀,但当词语增加时,重码率急剧上升,当使用4万条词语时,重码率高达25%以上(根据快乐五笔统计),而智能陈桥五笔、形音码(也属于五笔字型输入法)重码率更高。

对于一个普通电脑用户,他需要的是“海量”词库和低重码率的最优匹配,使用25键显然难以满足这一要求。

“qwertyuiop asdfghjkl; zxcvbnm,./”,这30个键是手指最容易击打的,而只用25个键则浪费了其中的5个。采用 30 个键的容码空间为 30 × 30 × 30 × 30=810000 ,是采用 25 个键的容码空间的两倍多。其意义就在于,在等同条件下,可以多装一倍的词或装入相同数量的词语而将重码率下降一半!

正是基于以上思想,并优先考虑词语的输入,使得“梦幻组合③风行输入法”的重码率和其他各项性能指标一样有了一个质的飞跃和突破: 1 万条词语的重码率为 4.1% , 3 万条词语的重码率为 6.1% ,装入约 6 万条词语的重码率仍低于 10% 。

使用36 个键或 40 个键甚至48个键,词的容量更大,但却不是常人的手指能够轻松击打的,显然也是不科学的用键数量,尤其是使用了十个数字键。

比较而言,除了“qwertyuiop asdfghjkl; zxcvbnm,./”这30 个键外,其他的键也有相对好击打和相对不好击打的区分。比如,中排键最右边的引号键“'”, 上排键最右边的两个中括号键“[”和“]”,相对也较容易击打。这三个键被“梦幻组合③风行输入法”用作功能键,给你打字提供最人性化的提示和最贴心的帮助。在此不再赘述。

五、字根数量的误区

目前,几乎所有的拼形输入法都认为字根数量难以减少,要至少维持在 200 个左右。

实际上:字根数量越少越好。

这个道理很简单,在相同的规律性等条件下,数量反映的就是记忆量。

为什么字根数量可以特别少?

简单地说,这是对字根优中选优、精简再精简,苦心经营的结果。“梦幻组合③风行输入法”偏旁字根是高频偏旁,笔画字根是特色笔画。

字根的选用基于以下原理:

㈠“字根互补”原理

梦码输入法的原理之三:“字根互补”原理。同一键上的偏旁字根、笔画字根在高频成字成词方面互补性优秀。

舟、酉(西),鱼,禾相对来说成字成词频率低,相同键上的笔画字根一、二,丨,コ则成字成词频率高。

亻(人)、口、扌(手)、木、水(氵)、艹成字成词频率极高,相同键上的笔画字根亖、彡、匚、廴辶之、力、“四竖”成字成词频率极低。

㈡字根越少越好打

由于字根数量少,单字拆分时拆出的字根就多。很多人在想:一个字拆出的字根多了,会影响打字速度吗?

不会!

即使拆出再多的字根,仍然是四键打一词和四键打一全码字,并且单字依然优先采用打一、二、三级简码的方法。

假如每个字、词只需要打出“横竖撇点折”五种笔画中的四个笔画而不是四个字根,你一定认为最简单、最好学了,可惜,虽然简单好学,但这样的方案会重码堆成山,没有任何实用价值。

当然,这样说,只是为了让人更清楚的看到,梦码风行输入法的这种设计思路可以确保简单易学。梦码风行输入法的效率则由更多的技术方案和设计来保证。

梦码输入法的原理之四:“字根越少越好打!”

梦码输入法的原理之五:在保证你所选用的字根能构成所有汉字的前提下, “字根数量越少,平均每个单字拆出的字根数量就越多”。

㈢一个字能拆分出的字根多,它重码的概率就小

假设6763 个常用字都是由两个字根构成的,对五笔字型输入法来说,它将分布在 25 × 25=625 个容码空间里(即使加上五笔字型的末笔识别码,容码空间也只能达到 625 × 5 × 3=9375 ),重码可想而知,而如果都是四个字根构成的,它的分布空间将是 625 × 25 × 25=390625 。重码概率自然大大降低。

这就是梦码输入法的原理之六:“一个字能拆分出的字根多,它重码的概率就小”。

拆字规则中的后四个字规则“交取笔画”即是根据这一原理和“尽可能简化拆法”这一指导思想获得的构思。

用“结束键”代替“识别键”同样来自以上构思。

㈣“结束键”原理

梦码输入法的原理之七,“结束键”原理:就是当汉字取完全部字根仍不足四码时,加打代码结束键。

“梦幻组合③风行输入法”采用斜杠键“ / ”。 注意:不是“空格键”!

首先,选用字根的数量越少,一个字分出的字根就越多,就越适合用“结束键”代替“识别码”,与其它字重码的概率越低;其次,采用“交取笔画”这一规则后,相当一部分字避免了使用“结束键”或其它输入法目前采用的“识别码”,至少也可以少用一个结束键,不使用或少用结束键客观上能避免由于使用这一技术造成的不必要的额外重码;最后一点也是最重要的一点,用“结束键”代替“识别码”大大降低了拼形输入法的学习难度,提高了打字速度,减少了脑、手的负担,使人们能真正体会到轻松而又流畅的打字新感觉。

具体情况是这样的:

因为每个键上能直接成字的字根极少,且直接成字的字根分布既规则又平均,所以字根字可以打成字根字所在键加三个“结束键”“斜杠 /键”。

如,中排键的左手小指负责击打的键是 a ,a 键上安排的字根有“舟、一”。打 a/// 可以是“舟”和“一”,则定义编码: a 为“一”; a/ 为“一”; a// 为“舟”; a/// 为“一”。

相同的,左手无名指负责 s 键 ,s 键上安排的字根有“二、酉、西”。打 s/// 可以是“二、酉、西”,则定义 s/ 为二; s// 为酉; s/// 为“西酉二”。

汉字“ 一二三四五 六七八九十 ”均为二级简码,依次分布在中排的“asdfghjkl;”十个键上。

偏旁字根“ 日月禾手足 金木水火土 ” 均为二级简码,依次分布在上排的“qwertyuiop”十个键上。

偏旁字根“ 鱼言宀艹⺮ 虫耳衤口 ” 均为二级简码,依次分布在下排的“zxcvbnm,./”十个键上。

偏旁字根“ 舟酉石人山 心纟女王目 ” 只能作为三级简码,依次分布在中排的“asdfghjkl;” 十个键上。

以上处理,使得这100 个左右的字根字,尤其是其中的高频字,成了最容易记、容易打的汉字。

同样是因为字根少,直接由两个字根、三个字根构成的汉字数量大大减少,换句话说,在“梦幻组合③风行输入法”中,只有较少数量的常用字是由两个字根或三个字根构成的。

必须承认,这样处理的结果将会导致重码率上升,尤其表现在对字根字的处理结果上。但是,当优先选用高频字为简码字或使高频重码字在前等处理办法,感觉上几乎就象没有重码。前面的举例中,利用二级简码和三级简码成功地对字根字进行了极有规律性的处理正好可以说明这一点。

因此,这样处理的结果是最实用的。是一种简化的极致。是一场最具挑战精神的革命。实践证明,这样的处理,不但是可行的,而且是成功的。

统计表说明:(略)

六、字根的规律性误区

字根的规律性主要指字根布局合理,便于理解、记忆。

但是,由于字根数量多,字根自身并没有太多的规律性和相互间的联系,许多拼形输入法于是出现了强加于人地所谓“口诀”记忆或按起笔分类、按字母形状分类、按字根象形分类、按字根近义分类等等。但实际效果却并不理想。

如果能够真正做到符合中国人的习惯和思维,琅琅上口,富有情趣,甚至于无需花力气去记忆,则大大大大降低了步入拼形输入法殿堂的门坎。

梦幻组合③风行输入法为此付出了极其艰辛的努力。按30个键的位置依次来安排30个高频偏旁字根,按30个键的位置依次来安排特色笔画字根,使输入法字根的记忆量降到了最低。

当然,还有另一项核心技术使初学者不用记忆直接上机就可以练习试用,那就是,“屏幕键盘提示图”随时提示字根和字根所在键的位置。

这样的汉字输入法,相信每一个人在打字时都情愿一试,并且一试钟情、一打情深。



 ★ 梦码:春华秋实》

 ★ 中国的码家军
 ★ 中文输入法基础
 ★ 输入法通用超级技巧
 ★ 各种传统输入法的优缺点比较

 ★ 破译汉字密码,再创汉字辉煌
   ——郑易里教授和计算机全汉字信息处理

 IT业界精英(转)

 ☆ 1.金山电脑公司董事长求伯君
 ☆ 2.金山电脑公司总经理雷军
 ☆ 3.用友新总裁何经华
 ☆ 4.孙家广与清华同方
 ☆ 5.东大阿尔派股份有限公司总裁刘积仁

 ☆ 6.七喜电脑公司总裁易贤忠
 ☆ 7.张静君 从零开始
 ☆ 8.美女CEO王树彤
 ☆ 9.Napster创始人肖恩·范宁
 ☆ 10.托普集团总裁宋如华

 ☆ 11.真实的张朝阳
 ☆ 12.天极网的掌门人--李志高
 ☆ 13.吴士宏自传
 ☆ 14.蝶公司董事长兼总裁--徐少春
 ☆ 15.“软件狂”:梁肇新的成长之路

 ☆ 16.周志农和“自然码”的故事
 ☆ 17.瑞星电脑公司总工程师刘旭
 ☆ 18.原新浪网总裁王志东
 ☆ 19.北京王码电脑总公司总裁王永民
 ☆ 20.北京江民新技术有限公司总经理王江民

 ☆ 21.联想-柳传志
 ☆ 22.王文京,用友总裁
 ☆ 23.史玉柱:东山再起?
 ☆ 24.海尔集团总裁张瑞敏
 ☆ 25.亚洲首富孙正义 我的发达之路

 ☆ 26.与深圳一起成长起来的财富英雄
 ☆ 27.王兟:爱笑的Tom掌门
 ☆ 28.勤·信·智·诚·李东生
 ☆ 29.李嘉诚(上)
 ☆ 30.李嘉诚(下)

 ☆ 31.李嘉诚的人生感悟
 ☆ 32.李嘉诚的交易艺术
 ☆ 33.李嘉诚与理财秘诀
 ☆ 34.网络少年--丁磊
 ☆ 35.alibaba CEO马云

 ☆ 36.互联网先生——思科系统公司总裁约翰·钱伯斯
 ☆ 37.商海女王----惠普公司总裁兼首席执行官卡莉·菲奥里纳
 ☆ 38.戴尔1000美元起家,34岁拥有250亿
 ☆ 39.王选最大的人生梦想
 ☆ 40.比尔·盖茨 The Bill Gates Interview


点此发表您的文章!(发表梦码宣传文章 获得梦码软件赠送)  
提供自由空间,交流先进思想,展示卓越才华,尽显个性魅力。

设为首页加入收藏

梦码包括:梦码拼音输入法、梦码笔画输入法、梦码拼形输入法、梦幻数码输入法、梦码中文键盘。其中梦幻组合①知音输入法是 最新智能拼音输入法,梦幻组合②双笔输入法是最新万能笔画输入法,梦幻组合③风行输入法是最新规范形码输入法。梦幻火星文输入法。
欢迎试用>>>