第二讲 信息的数字化

第二讲 信息的数字化

一、 教学目标:

1) 知识与技能: 知道ASCII 码

知道汉字在计算机里是如何表示的

理解声音和图象的数字化

理解信息是如何压缩的

2)过程与方法:通过自学微视频完成任务单,在教师引导下通过自学掌握知识。

3)情感与价值观:通过讨论, 探索解决问题的方法,增加学生合作交流,培养学生自主

学习的积极性, 体验到微视频教学中带来的好处。

二、 教学重点与难点:

重点:字符、汉字在计算机里的表示

声音和图象的数字化

难点:图象的数字化

三、 教学过程:

复习引入:

讨论课堂作业单:选择题第15、19、44题

直观地说,信息的数字化就是以二进制数的形式来表达信息。由于计算机内部处理的信息都是以二进制形式表示的,所以数字化是计算机处理信息的基础。

信息可识别的符号形式称为数据。是描述信息的数字、字母、和各种符号的集合。 数据是信息的载体,数据所荷载的内容是信息。

师生交流:请学生讨论信息和数据的区别,举例说明。

数据分成两类:数值型数据和非数值型数据,如文字、图像、声音等都是非数值型数据。 由此,当各种数据与二进制代码存在一定的对应关系后,人类才能有效的与计算机交换各种信息。而建立数据与代码之间的对应关系,需要统一的规则,这种规则就称为“编码”。

一、字符的数字化

字符包括英文字母、阿拉伯数字、常用符号以及我们的汉字。

1.ASCII 码

ASCII 码是美国信息交换标准代码的简称,是目前应用最广泛的一种编码规则,已为世界各国所采用,成为了国际通用标准。

ASCII 码用7位二进制代码表示,可表示27=128个不同的字符。包括94个字符(10个阿拉伯数字,大、小写英文字母各26个,常用符号32个)和34个控制符。

在计算机内实际使用时,是用8位二进制数表示一个字符,最高位是“0”。存储时占用一个字节。

ASCII 编码表参阅教材P108。

由于这些字符在ASCII 码表中占据了一个位置,有了先后顺序,就可以比较大小。 观察ASCII 表,(解释高位和低位概念),比较以下内容:

(1)同类字母的编码大小关系;(比如”A ”和”B ”)(按字母顺序排列)

(2)大写字母和小写字母的编码大小关系;(比如”A ”和”a ”)(所有小写字母大于大写字母)

(3)字母和数字字符的关系;(所有字母大于数字字符)

我们也可以根据一个字母的位置推算出其他字母的ASCII 码或者相反。

例1:已知字符A 的十进制编码是65,那么字符E 的十进制编码是什么?

请思考:已知二进制编码1100111B 是字符g 的ASCII 编码,则二进制编码1100100B 是哪个字符的ASCII 编码?

2.汉字编码

汉字在计算机内部也是以二进制方式存放的。

(1)汉字信息交换码(国标码,GB2312-80):

1980年颁布。包括6763个汉字(分为一级常用汉字3755个和二级常用汉字3008个)和682个非汉字常用符号。2个字节表示, 各字节的最高位为0。

2000年,我国又颁布了国标GB18030,包括27484个汉字。

(2)汉字的机内码(内码):

计算机内部进行汉字的存储、处理、传输的汉字编码。2个字节表示, 各字节的最高位为1。是将国标码的两个字节的最高位分别置为1而得。 所以它与国标码之间具有明显的对应关系,同时也解决了中西文字符机内码的二义性问题。

(3)汉字输入码(外码):

用于将汉字通过键盘输入计算机而设计。同一个汉字的输入码可能不同,它与汉字的输入法有关。

(4)汉字的字形码:

为显示和打印输出而形成的汉字编码。目前汉字字形的产生主要有点阵、矢量和曲线轮廓三种方式。汉字字形点阵有16×16、24×24、32×32等,每一个点用一个二进制位保存。保存汉字字形码的文件,就称为汉字字库。

课堂讨论:作业单选择题第16、25 题

二、模拟量和数字量

模拟量:用连续的物理变量表示的数量。如电流、电压、声音的变化。

从宏观的角度看,人类在日常生活中所体验的几乎都是模拟量,如声音的大小、音调的高低、电视图像的色彩明暗的变化。

而从微观角度看,则完全不同。最典型的例子是电视图像。经仔细观察可以发现,一幅图像实际上是由色彩和明暗不同的足够多的小方格(称为象素)组成。只要每个象素足够小,屏幕上的色彩和明暗变化看上去就是连续的。就象用描点法作函数图像一样。

从信息的收集、储存、复制、处理的角度看,使用模拟量不是最佳选择。因为,模拟信息(即模拟量的某一个状态)的收集、储存、复制、处理具有不精确的倾向,并且,模拟信息每传递一次,就有更加不精确的可能。

那么,能否用离散量来表示模拟量呢?可以。

事实上,任何一种信息都可以用0和1这两个数字组成的二进制数来表示,用二进制数来表示模拟量,将模拟量转化为数字量的过程就是数字化。

模拟量和数字量都是对某一种物理状态的表达,区别在于模拟量是连续的,而数字量是间断的。模拟量可以独立存在,而数字量必须与某种计量方式关联。

将模拟量转化成数字量称为模数转换(A/D)。

经过计算机处理的数字量要让人能够接受,必须转换成模拟量,这一过程称为数模转换(D/A)。

模数转换的关键是:以很小的时间间隔不断测得模拟量在这些瞬间的幅度值(采样),并以某种数值(量化)形式加以保存。

而数模转换则相反,以相同的时间为间隔,产生以电压等幅度形式表示的数值,并使之平滑过渡,还原出原来的模拟量。

三、声音信息的数字化:

声音是振动产生的波,是一种模拟信号。通常,声音的数字化需要通过采样和量化两个步骤来实现。声波数字化过程:

1、首先将声波变化转化为电压的连续变化。如使用话筒。

2、定时采样:每隔一定的时间,读取一次声波模拟电压的数值。时间间隔越短,数据精度越高。每秒钟采样样本的数量称为采样频率。

3、量化:将读取到的模拟量数值转化为二进制数序列。目前常用的有单字节和双字节量化,即8位或16位二进制数记录一次采样获得的数据。

在计算机内部我们使用声卡完成以上工作(A/D转换)的。

声音处理软件可以将我们采集的数据保存为声音文件,如Windows 中的录音机软件。 目前常见的各种格式的声音文件中,音质最好的是CD 音频格式和W A V 格式,MP3格式和WMA 格式的音质次之,RA 格式适合于在线播放。

声音文件播放时,声卡起的作用正好与录音时的作用相反(D/A转换)。

声音存储的数据量与采样频率、量化级数成正比。

例如:为了将一段音乐保存为声音文件,我们使用的采样频率为44.1KHz ,量化值使用16位二进制数,双声道。则保存1秒钟音乐的数据量为44100×16×2÷8=176400字节。

想一想:按要求22.1KNz 、8位、单声道录制一段2分钟的音乐,其W A V 格式的声音文件的大小是多少字节?

课堂讨论:作业单选择题第26、37、45 题

四、图像信息的数字化:

图像数字化的基本思想:

将一幅图像分割成许多按行列排列的“图像元素”(简称为像素),然后对每一个像素进行采样和量化。

相同面积的图像,分割越细,像素越多,图像就越清晰。像素的数量就是图像的分辨率,表示的形式是X ×Y 。如1024×768,表示该图像水平方向的像素有1024个,垂直方向的像素有768个。

每个像素可以用1、8、24位等二进制数来表示颜色的信息,位数越多,图像的色彩就越丰富。如果使用1位二进制数,这将是一幅只有黑白两色的图像;如使用8位二进制数,可以表示一幅只有某一种颜色层次(灰度等级)的单色图像;如使用24位二进制数,则可以表示一幅由红、绿、蓝三种颜色层次组合的彩色图像。

以这种思想建立的图像文件称为位图格式。目前我们主要使用微软推出的BMP 格式。 例如:一幅分辨率为800×600,24位的彩色图像,其存储数据量为800×600×24÷8=1440000字节

课堂讨论:作业单选择题第17、21 题

五、压缩技术

为什么采用压缩技术?

按照一般信息数字化所获得的编码数据量太大,计算机难以存储。

数据压缩就是采用特殊的编码方式来保存数据,使数据占用的存储空间相对减少。不同的数据有不同的压缩方法。

常用的压缩软件有WinRAR ,WinZip 等。

常用的压缩方法分为无损压缩和有损压缩两种。

无损压缩:在压缩过程中,所有信息都被保留,能够完全恢复原始数据。

解压缩:将压缩包还原为正常编码形式以便于使用。

有损压缩:在压缩过程中,允许损失一些信息,而且损失的信息也不能再完全复原。一般而言,有损压缩以不影响人的使用要求为准。一般使用于声音文件、图像文件和视频文件等。

图像文件中,BMP 格式的位图文件没有压缩,JPG 、GIF 格式是有损压缩,TIF 可以有损也可以无损。

音频文件中W A V 格式没有压缩,MP3、WMA 、RM 、RA 等都是有损压缩。

各种视频文件都是有损压缩的。

程序文件和文档文件不能进行有损压缩。

课堂讨论:作业单选择题第20、23、31、46 题


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn