输入码、机内码和字形码
被考次数: 1次
被考频率: 低频率
答错率:    58%
知识难度:
考试要求: 掌握     
知识路径:  > 文字处理基础知识  > 文字处理基础知识  > 文字处理的基本过程  > 文字处理过程


本知识点历年真题试卷分布
>> 试题列表    
 

 
       汉字处理包括汉字的输入、汉字的存储和汉字的输出环节。其中,汉字的输入采用输入码,汉字的存储采用机内码,汉字的输出采用字形码。计算机处理汉字首先必须将汉字代码化(即对汉字进行编码),这样,用户可以从键盘上输入代表某个汉字的编码。采用不同的编码系统进行汉字输入的方案称为汉字的输入法,如区位码、五笔字型码、拼音码、智能ABC、微软拼音等输入法。
       输入码。
       中文的字数繁多,字形复杂,字音多变,常用汉字就有7000个左右。在计算机系统中使用汉字,首先遇到的问题就是如何把汉字输入到计算机内。为了能直接使用西文标准键盘进行输入,必须为汉字设计相应的编码方法。汉字编码方法主要分为三类:数字编码、拼音编码和字形编码。
       .数字编码:将汉字按一定顺序逐一赋予数字编号,即用数字串代表一个汉字的输入,常用的是国标区位码。特点:无重码,难记忆,不适合普通用户。
       .拼音编码:采用拼音规则编码,如全拼、双拼等。特点:重码多,遇到不会读音或读音不准的汉字,输入困难。
       .字形编码:采用汉字字形方面的特征(如整字、字根、笔画、码元等),按一定规则编码,如五笔字型码等。特点:需记忆规则,速度快,适于专业录入人员。
       机内码。
       汉字内部码(简称机内码)是汉字在设备或信息处理系统内部最基本的表达形式,是在设备和信息处理系统内部存储、处理、传输汉字用的代码。西文在计算机中没有交换码和机内码之分,但汉字数量多用一个字节是无法区分的。因此,国家标准GB2312—80中规定的汉字国标码(或称汉字交换码)规定,一个汉字用两个字节表示,每个字节只有7位,与ASCII码相似。汉字机内码采用国标码作为基础,且每个字节的最高位置“1”。由于两个字节各用7位,因此可表示16 384个可区别的机内码。例如汉字“大”,国标码(交换码)为3473H,将两个字节的高位置“1”,得到的机内码为B4F3H。
       字形码。
       汉字字形码是表示汉字字形的字模数据,通常用点阵、矢量函数等方式表示。用点阵表示字形时,汉字字形码指的就是这个汉字字形点阵的代码。字形码也称为字模码,是用点阵表示的汉字字形码,它是汉字的输出方式,根据输出汉字的要求不同,点阵的多少也不同。简易型汉字为16×16点阵,高精度型汉字为24×24点阵、32×32点阵、48×48点阵等。
       字模点阵的信息量是很大的,所占存储空间也很大,平时存放在外存的汉字库中。例如,一个16×16点阵的汉字就需要占用32个字节。字库中存储了每个汉字的点阵代码,当显示输出时才检索字库,输出字模点阵得到字形。
 

更多复习资料
请登录电脑版软考在线 www.rkpass.cn

京B2-20210865 | 京ICP备2020040059号-5
京公网安备 11010502032051号 | 营业执照
 Copyright ©2000-2025 All Rights Reserved
软考在线版权所有