计算机文化基础第11讲学习笔记

运动图像压缩编码标准MPEG

3、MPEG2 主要针对高清晰度电视的需要

l          传输速率为10Mbps,与MPEG1兼容,适用于1.5-60Mbps甚至更高的编码范围。

l          有每秒30帧704×480的分辨率。

l          最为引人瞩目的的产品是数字电视机顶盒与DVD。

4、MPEG4:采用基于模型/对象的第二代压缩编码技术

l         视频对象平面(Vop,Video Object Plane)

l         支持基于视频内容的交互功能。

l         典型应用:DIVX-MPEG4影碟和网上MPEG4电影。

静态图像压缩编码标准JPEG

1、 JPEG确定的目标

l         达到(近乎)完美的图像质量。

l         可以压缩任何连续色调的静止图片,包括灰度和色彩,任意的色彩空间和大多数尺寸。

l         可适用于大部分通用的计算机平台,硬件实现条件适中。

图像准备

像素

pixel

block

最小编码单元

MCU

图像处理

预测器

prediction

DCT

正变换

量化

熵编码

行程编码

Huffman

编码

算术编码

JPEG编码的基本处理过程

变换编码原理

变换编码是指先对信号进行某种函数变换,从一种信号(空间)变换到另一种(空间),然后再对信号进行编码。

JPEG 与  JPEG2000

l         具有两种编码模式,:离散余弦转换(DCT)和小波转换(Wavelet transform)编码模式。

l         压缩率比JPEG高约30%左右。

l         同时支持有损和无损压缩。

l         能实现渐进传输。

l         支持所谓的“感兴趣区域(Rol,region of interest)”特性。

两种类型的数字音频

1.          计算机声音有两种产生途径

l         一种是通过数字化录制直接获取(波形音频)。

l         另一种是利用声音合成技术实现,可用于语音合成和音乐合成。

2语音合成:文句转语音(Text-To-Speech,TTS)是指将输入的文字或储存于电脑中的文件转换成以清新、流畅、自然的语音输出技术。

3音乐合成:MIDI(乐器数字接口)是在1983年MIDI制造者协会(MMA)提出作为一个控制电子乐器的标准化串行通信协议提出的。

让计算机说话

1、文字-语音转换(Text-To-Speech)

l         把计算机内的文本转换成连续的自然语音流,是语音合成的技术延伸。

文本

预处理

语言学处理

语音学处理

波形编辑合成

语音数据库

语音

MIDI音乐   (链接:http://www.hudong.com/wiki/MIDI%E9%9F%B3%E4%B9%90)

MIDI(Music Instument Digital Interface)

数字化乐器接口是一个供不同设备进行信号传输的接口标准。MIDI三要素:音源、音序器、输入设备。

声卡

MIDI接口

合成器

音序器

MIDI文件

计算机

MIDI乐器


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn