|
计算机处理的数据不仅有数码,还有字符、汉字、声音、图像等。
|
|
|
|
目前计算机中用得最广泛的字符集及其编码是由美国国家标准局(ANSI)制定的ASCII码(American Standard Code for Information Interchange,美国标准信息交换码),它已被国际标准化组织(ISO)定为国际标准,称为ISO 646标准。
|
|
|
标准ASCII码用7位二进制数表示,可以表示128种代码,每种代码对应一个字符(或控制码),ASCII码的低4位用作行编码,高3位用作列编码。其形式如下图所示。
|
|
|
|
|
在计算机的存储单元中,一个ASCII码值占8个二进制位,其最高位在计算机内部通常保持为0,在数据传输时可用作奇偶校验位。
|
|
|
由于标准ASCII字符集字符数目有限,在实际应用中往往无法满足要求。为此,国际标准化组织又制定了ISO 2022标准,它规定了在保持与ISO 646兼容的前提下将ASCII字符集扩充为8位代码的统一方法。ISO陆续制定了一批适用于不同地区的扩充ASCII字符集,每种扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均为高位为1的8位代码(即十进制数128~255),称为扩展ASCII码。
|
|
|
|
(1)汉字国标码。我国国家标准局于1981年颁布了《信息交换用汉字编码字符集.基本集》(GB 2312),规定6763个常用汉字和其他字符682个,共7445个符号。国标码规定,每个字符由一个两字节的代码组成。每个字节的最高位恒为0,共可表示128×128=16 384个符号。国标码规定了所有符号为94×94的方阵,行称为"区",列称为"位",行号和列号组成区位码。国标码并不等于区位码,而是由区位码稍作转换得到的,其转换方法为:先将十进制区码和位码转换为十六进制的区码和位码,再将这个代码的第一个字节和第二个字节分别加上20H,就得到国标码。如"保"字的国标码为3123H,它是经过下面的转换得到的:1703D→1103H+20H→3123H。
|
|
|
(2)汉字机内码。在计算机内部传输、存储、处理的汉字编码称汉字机内码,就是在国标码的基础上将两个字节的最高位全改为1,以便和ASCII码区分,也就是先将十进制国际码转换为十六进制,高字节和低字节分别加上80H。从区位码转换为机内码时先将十进制区码和位码转换为十六进制的区码和位码,再将这个代码的第一个字节和第二个字节分别加上A0H,就得到机内码。
|
|
|
(3)汉字输入码。为了方便从键盘输入汉字而设计的编码称为输入码,不同的输入法有不同的输入编码。实际上不管采用什么输入法,存入计算机的都是它的机内码。
|
|
|
(4)汉字字形码。文字字形存储在字库中的数字化代码称为字形码。汉字字形是以点阵方式表示汉字。用16×16点阵存储汉字时占用16×16÷8=32B。常用的有24×24点阵(占用24×24÷8=72B)、32×32点阵(占用128B)等。
|
|
|
|
矢量图形是用一系列计算机指令来描述和记录的一幅图的内容。一幅图像可认为是由一个个像点构成的,每个像点必须用若干二进制位表示出现实世界五彩缤纷的颜色。当将图像分解为一系列像点、每个点用若干比特表示时,这幅图像就被数字化了。以像素点阵形式描述的图像称为位图。图像的属性有分辨率和图像深度。图像的分辨率是指组成一幅图像的像素密度,即用每英寸多少点表示数字化图像的大小。图像深度是指存储每个像素所用的位数。如果一幅图像的图像深度为n位,则该图像的最多颜色数为2n种。数字图像数据量特别巨大,一个没有进行压缩的图像需要占用的内存空间可以使用以下公式进行计算:文件所占容量=(图像总像素×图像深度)/8B,假定画面上有150 000个点,每个点用24B来表示,则这幅画面就要占用450 000B。如果想在显示器上播放视频为25帧的画面,相当于处理1125 000B的信息量。因此,用计算机进行图像处理要求是很高的。所以要进行图像编码与压缩。从本质上来说,就是对要处理的图像源数据用一定的规则进行变换和组合,从而达到以尽可能少的代码(符号)来表示尽可能多的数据信息的目的。压缩通过编码来实现,或者说编码带来压缩的效果,目前对动态图像的压缩比一般在20~200倍,一般把此项处理称为压缩编码。对动态图像进行压缩处理的基本条件是:动态图像中帧与帧之间具有相关性。彩色图像可以用红、绿、蓝三基色表示。
|
|
|
|
|
(2)JPEG 2000标准:1997年提出,1999年完成。JPEG 2000基于小波变换的静止图像压缩标准,不仅有更优秀的压缩性能,而且有更丰富的处理功能。
|
|
|
(3)MPEG-1标准:用于多媒体和广播电视,数据率要求1.5Mb/s。
|
|
|
(4)MPEG-2/H.262标准:DVD制式的压缩标准,数据率要求4~10Mb/s。
|
|
|
(5)MPEG-4标准:1999年完成第3版,是一个新的视频和音频编码的国际标准。最大特点是基于对象的编码方式以及对合成对象的编码能力。支持固定和可变速率视频编码(低速小于64kb/s,中速64~384kb/s,高速384kb/s~4Mb/s),目的在于提供适合用于交互多媒体环境下应用的核心技术,解决视频信号的有效存储和传输问题。
|
|
|
(6)MPEG-7标准:对图像内容进行描述,根据描述进行一般检索。
|
|
|
|
|
|
声音是一种连续变化的模拟量,可以通过"模/数"转换器对声音信号按固定的时间进行采样,把它变成数字量(一旦转变成数字形式,便可把声音存储在计算机中并进行处理了)。和图像一样,声音也必须进行压缩,常见的格式有WAVE、MOD、MIDI、MP3、RA系列(RA、RAM和RM)、VQF、MD、CD等。
|
|
|
|
(1)采样。采样是把时间连续的模拟信号转换成时间离散、幅度连续的信号。
|
|
|
(2)量化。量化处理是把在幅度上连续取值的每一个样本转换为离散值表示,也称为A/D转换。
|
|
|
(3)编码。将量化后的声音信号按照一定的要求进行数据压缩和编码,以减少数据量,并按规定的格式将数据组织成为文件。
|
|
|
|
动画是将静态的图像、图形及图画等按一定的时间顺序显示出来的,从而形成连续的动态画面。电视是现代最有影响的多媒体信息传播工具,它传播的信号是模拟信号。数字视频与动画一样,是由一幅幅帧序列组成,这些帧以一定的速率播放就形成动态画面。
|
|
|
数字视频的信息量很大,必须对其进行压缩编码处理。帧间和帧内压缩是数字视频压缩中常用的压缩分类。
|
|
|
常用的视频文件格式有GIF文件、Flic文件、AVI文件、Quick Time文件、MPEG文件、RealVideo文件等。
|
|
|