|
有关汉字键盘输入的国家标准与规范
华绍和 蒋顺炳 陈一凡
(汉字编码专业委员会)
【摘 要】本文列出了汉字键盘输入系统设计者应遵循的五个国家标准和三个语委规范,并指出了这些标准和规范内容要点。
【关键词】国家标准,语委规范,性能指标,键选率
一、国家标准和规范具有一票否决权
为适应中文信息处理量的迅猛增长、计算机应用的普及化和参加WTO后与国际接轨,人大常委会、信息产业部、国家技术监督局、国家语委从上世纪九十年代中期开始加快了语言文字和中文信息处理领域的立法和国家标准、规范的制定。世纪之初,国家颁布了《语言文字法》。九十年代后公布的与汉字键盘输入系统有关的国家标准有:
GB13000.1《信息技术多八位编码字符(UCS)》
GB18030 《信息技术 信息交换用汉字编码字符集 基本集的扩充》
GB18031 《信息技术 数字键盘汉字输入通用要求》
GB15834 《标点符号用法》
即将公布的有GBXXXXX《信息技术 通用键盘汉字输入通用要求》,
语委颁布的规范有:
GF3001 《信息处理 GB13000.1字符汉字部件规范》,
GF3002 《GB13000.1字符集汉字笔顺规范》
GF3003 《信息处理用汉语拼音方案表示规范通用键盘》。
据悉,上述标准与规范将纳入国家技术法规而强制执行。作为产品出售的汉字键盘输入系统,无论是编码层次还是软件层次,均应遵循标准和规范,否则不能通过产品认证。
二、与汉字编码有关的标准与规范
1.编码字符集
GB2312 6763字
GB13000.1 20902字
GB18030 27533字
GB/T 18031 对数字键盘编码的要求是:“应包括GB2312或GB13000.1或GB18030中定义的全部汉字字符。”
GBXXXXX对通用键盘编码的要求是:“应包括GB18030中定义的全部汉字符号和现代汉语标点符号”。
2.键位设置
GB/T 18031规定“输入汉字的编码元素,设定在0~9的数字键范围内。”并对五种基本笔画和汉语拼音符号的键位作了规定。多笔画部件及笔画组合可以自由设定。
GBXXXXX规定“‘A’~‘Z’26个字母键输入汉字和词语的特征编码信息”。“‘0’~‘9’10个数字键,除用来输入阿拉伯数字外,还可用来输入汉字和词语的特征编码信息的辅助信息,包括汉语声调、重码字选择等。”
这就明确规定了在通用键盘上只能用26个字母键进行编码。
3.标点符号
GB/T 15834定义了23个标点符号,国家标准《通用键盘汉字输入通用要求》对这23个标点符号的键位进行了规定。
4.部件规范
GF 3001对GB 13000.1的20902个汉字进行逐个拆分、归纳与统计后给出了560个基础部件。形码设计者应重点关注《规范》要求的以下几点:
⑴基础部件也称末级部件,是最小的不可拆分的部件。
⑵基础部件可以组合成成字部件使用,但不得组合成非字部件。
⑶汉字拆分为部件时,应遵循“相离、相接可拆;交重不拆(可拆成笔画)”的原则。
1998年5月1日 GF 3001正式实施后,一批原本素质较好的编码迅即修正了拆分规则,成为既完全符合规范要求又不失本身特点的优秀编码,如表音码(沈码)、表形码、自然码、郑码和认知码等。
部件称谓规范正在制定之中。
5.笔顺规范
GF 3002明确了汉字的基本笔形是五种“其排列顺序一(横)、丨(竖)、丿(撇)、丶(点)、乛(折),分别用符号1、2、3、4、5表示。
GF 3002还给出了GB 13000.1的20902字的规范笔顺。
三、汉字键盘输入系统的性能指标
国家标准将编码层次和软件层次视为统一的键盘输入系统进行性能考核。GB18031和《通用键盘汉字输入通用要求》提到的系统性能指标有三个:易学性,汉字输入平均码长和重码字词键选率。国家标准给出的指标是当前应达到的最低要求。
1.易学性
“学会使用汉字编码输入系统的时间应尽量短,并应符合使用汉语作为母语的使用者的思维习惯”。GB 18031对数字编码更进一步提出要求:“做到上手能用”。
2.汉字输入平均码长
定义:在输入给定的测试样本时,测得的输入每个汉字的平均击键次数。
计算公式:平均码长= 输入样本的击键次数/测试样本总字数(键/字)
《通用键盘汉字输入通用要求》给出的指标
编码类型
平均码长(键/字)
汉语拼音,笔画为主的简易编码
形码(部件码)、音形码(形音码)、双拼
<3.2
<2.2
GB 18031(数字键盘)给出的指标
输入方式
平均码长(键/字)
逐字字段输入
字、词混合输入
<6
<4
3.重码字词键选率
我们应该特别注意直接面对汉字键盘输入的两个国家标准均用“键选率”来考核输入系统的速度素质和易用程度,而舍弃了沿用多年的“重码率”。
定义:在输入给定测试样本过程中,通过重码选择键确认的汉字字数与测试样本总字数的百分比。
计算公式:重码字词键选率=(重码选择键确认的字数/测试样本总字数)×100%
《通用键盘汉字输入通用要求》给出的指标
编码类型
重码字、词键选率(%)
汉语拼音,笔画为主的简易编码
形码(部件码)、音形码(形音码)、双拼
<6
<1.5
GB 18031(数字键盘)给出的指标
输入方式
平均码长(键/字)
逐字字段笔画、部件码输入
字、词混合笔画、部件码输入
逐字字段拼音输入(10键位)
逐字字段拼音输入(8键位)
字词混合拼音输入(10键位)
字词混合拼音输入(8键位)
<8
<10
<13
<14
<12
<14
四、汉字键盘输入系统的考核
作为面向市场的汉字键盘输入系统,应该通过标准符合性测试、产品论证和专家技术鉴定。下列单位是政府授权或具有行业权威的测试、论证和鉴定部门。
1.标准、规范、性能指标测试 中文信息处理产品标准符合性检测中心
2.产品论证 中文信息技术产品认证中心
3.专家技术鉴定 中国中文信息学会汉字编码委员会
第1项测试输入系统是否符合国家已颁布的规范、标准和性能指标,给出《测试报告》。
第2项从产品的角度论证输入系统是否具备商品软件生产的条件,如能通过,给出《论证合格证书》。
第3项由本领域专家从技术的角度评审输入软件特色、优缺点和水平。技术鉴定给出《鉴定意见》。在上述三种考核中,第一项测试具有一票否决权。
参见:《形码输入
六大误区》
★ 《梦码:春华秋实》
★ 中国的码家军
★ 中文输入法基础
★ 输入法通用超级技巧
★ 各种传统输入法的优缺点比较
★ 破译汉字密码,再创汉字辉煌
——郑易里教授和计算机全汉字信息处理
IT业界精英(转)
☆ 1.金山电脑公司董事长求伯君
☆ 2.金山电脑公司总经理雷军
☆ 3.用友新总裁何经华
☆ 4.孙家广与清华同方
☆ 5.东大阿尔派股份有限公司总裁刘积仁
☆ 6.七喜电脑公司总裁易贤忠
☆ 7.张静君 从零开始
☆ 8.美女CEO王树彤
☆ 9.Napster创始人肖恩·范宁
☆ 10.托普集团总裁宋如华
☆ 11.真实的张朝阳
☆ 12.天极网的掌门人--李志高
☆ 13.吴士宏自传
☆ 14.蝶公司董事长兼总裁--徐少春
☆ 15.“软件狂”:梁肇新的成长之路
☆ 16.周志农和“自然码”的故事
☆ 17.瑞星电脑公司总工程师刘旭
☆ 18.原新浪网总裁王志东
☆ 19.北京王码电脑总公司总裁王永民
☆ 20.北京江民新技术有限公司总经理王江民
☆ 21.联想-柳传志
☆ 22.王文京,用友总裁
☆ 23.史玉柱:东山再起?
☆ 24.海尔集团总裁张瑞敏
☆ 25.亚洲首富孙正义 我的发达之路
☆ 26.与深圳一起成长起来的财富英雄
☆ 27.王兟:爱笑的Tom掌门
☆ 28.勤·信·智·诚·李东生
☆ 29.李嘉诚(上)
☆ 30.李嘉诚(下)
☆ 31.李嘉诚的人生感悟
☆ 32.李嘉诚的交易艺术
☆ 33.李嘉诚与理财秘诀
☆ 34.网络少年--丁磊
☆ 35.alibaba CEO马云
☆ 36.互联网先生——思科系统公司总裁约翰·钱伯斯
☆ 37.商海女王----惠普公司总裁兼首席执行官卡莉·菲奥里纳
☆ 38.戴尔1000美元起家,34岁拥有250亿
☆ 99.比尔·盖茨 The Bill Gates Interview
点此发表您的文章! (发表梦码宣传文章 获得梦码软件赠送)
|