|
知识路径: > 文字处理基础知识 > 文字处理基础知识 > 文字处理的基本过程 > 文字处理过程 >
|
被考次数:1次
被考频率:低频率
总体答错率:58%  
知识难度系数:
|
由 软考在线 用户真实做题大数据统计生成
|
考试要求:掌握
相关知识点:3个
|
|
|
|
汉字处理包括汉字的输入、汉字的存储和汉字的输出环节。其中,汉字的输入采用输入码,汉字的存储采用机内码,汉字的输出采用字形码。计算机处理汉字首先必须将汉字代码化(即对汉字进行编码),这样,用户可以从键盘上输入代表某个汉字的编码。采用不同的编码系统进行汉字输入的方案称为汉字的输入法,如区位码、五笔字型码、拼音码、智能ABC、微软拼音等输入法。
|
|
|
|
中文的字数繁多,字形复杂,字音多变,常用汉字就有7000个左右。在计算机系统中使用汉字,首先遇到的问题就是如何把汉字输入到计算机内。为了能直接使用西文标准键盘进行输入,必须为汉字设计相应的编码方法。汉字编码方法主要分为三类:数字编码、拼音编码和字形编码。
|
|
|
.数字编码:将汉字按一定顺序逐一赋予数字编号,即用数字串代表一个汉字的输入,常用的是国标区位码。特点:无重码,难记忆,不适合普通用户。
|
|
|
.拼音编码:采用拼音规则编码,如全拼、双拼等。特点:重码多,遇到不会读音或读音不准的汉字,输入困难。
|
|
|
.字形编码:采用汉字字形方面的特征(如整字、字根、笔画、码元等),按一定规则编码,如五笔字型码等。特点:需记忆规则,速度快,适于专业录入人员。
|
|
|
|
汉字内部码(简称机内码)是汉字在设备或信息处理系统内部最基本的表达形式,是在设备和信息处理系统内部存储、处理、传输汉字用的代码。西文在计算机中没有交换码和机内码之分,但汉字数量多用一个字节是无法区分的。因此,国家标准GB2312—80中规定的汉字国标码(或称汉字交换码)规定,一个汉字用两个字节表示,每个字节只有7位,与ASCII码相似。汉字机内码采用国标码作为基础,且每个字节的最高位置“1”。由于两个字节各用7位,因此可表示16 384个可区别的机内码。例如汉字“大”,国标码(交换码)为3473H,将两个字节的高位置“1”,得到的机内码为B4F3H。
|
|
|
|
汉字字形码是表示汉字字形的字模数据,通常用点阵、矢量函数等方式表示。用点阵表示字形时,汉字字形码指的就是这个汉字字形点阵的代码。字形码也称为字模码,是用点阵表示的汉字字形码,它是汉字的输出方式,根据输出汉字的要求不同,点阵的多少也不同。简易型汉字为16×16点阵,高精度型汉字为24×24点阵、32×32点阵、48×48点阵等。
|
|
|
字模点阵的信息量是很大的,所占存储空间也很大,平时存放在外存的汉字库中。例如,一个16×16点阵的汉字就需要占用32个字节。字库中存储了每个汉字的点阵代码,当显示输出时才检索字库,输出字模点阵得到字形。
|
|
|