数字媒体技术导论-课后习题参考答案

数字媒体技术导论-习题参考答案

Chap1

P13~P14页

一填空题

1. 传递信息的载体 存储信息的的实体

2. 感觉媒体 表示媒体 显示媒体 存储媒体 传输媒体

3. 比特(bit )

4. 数字化 交互性 趣味性 集成性 技术与艺术的融合

5. 媒体技术

6. 有损 无损

7. 加密技术 数字水印技术

二简答题

1. 略

2 . 数字媒体技术的研究领域有数字声音处理、数字图像处理、数字视频处理、数字动画处理、数字游戏设计、数字媒体压缩、数字媒体存储、数字媒体管理和保护、数字媒体传输技术等;应用开发领域主要有教育培训、电子商务、信息发布、游戏娱乐、电子出版、创意设计等。

Chap2 P34~P35页

1. 模拟音频记录设备有:

机械留声机 最早用来记录声音的机械式留声机;

钢丝录音机 第一次用磁性记录的方式进行记录声音;

磁带录音机 根据电磁感应定律把声音记录在磁带上,接着再用磁带进行还原。

模拟音频处理设备有:

话筒 进行声音能量的收集;

音箱 进行声音还原,将音频电流信号变换成声音信号;

模拟调音台 具有多路输入,每路的声音信号可以单独被处理,如被放大,做高中低音的音质补偿,多路输出等功能。

2. 第一步是采样,就是将话筒转化过来的模拟信号以某一频率进行离散化的样本采集。 第二步是量化,将采集到的样本电压或电流值进行等级量化处理。

第三步是编码,将登记值变换成对应的二进制表示值(0或1),并进行存储。

3. 1s 内采样22 *1000次,双声道每次的数据量为16*2=32(bit ),那么1min 的总数据量为22*1000*32*60=42240000(bit )=42240000/1024 =41250(KB )

4. D

5. B

6. 略

chap3 P67~P68页

1. C

2. A

3. RGB 颜色模型也称为加色模型,各种颜色由不同比例的红、绿、蓝3中基本色的叠加而成。当三基色按不同的强度相加时,得到的颜色称为相加色。任意颜色F 的配色方程为 F=r[R] +g [G]+ b [B]其中, r[R]、g [G]、b [B]为F 色的三色分量。这样共可以表示16777216种颜色。RGB 颜色模型可以用来描述发光设备,比如计算机显示器,电视机等装置所表示的颜色。

4. 略

[***********]购买一部数码相机主要关注数据指标有:

镜头、镜头焦距、镜头口径、对焦速度、图像传感器、变焦能力、光圈、快门、开机速度和连拍能力、白平衡模式、曝光补偿、ISO 、微距能力、数据传输接口、LCD (Liquid crystal display)显示屏、存储卡、电源等

6. 略

7. 略

Chap4 P100~P101页

一、选择题

1. A

2. D

3. C

4. D

二 简答题

1. 目前世界上现行的彩色电视制式有三种:NTSC 制、PAL 制、SECAM 制。

2.每一帧图像均是由电子束顺序地一行接着一行连续扫描而成,这种扫描方式称为逐行扫描,也叫非隔行扫描。逐行扫描方法使信号的频谱及传送该信号的信道带宽均达到很高的要求。电视专家想出了一个巧妙的方法,把一幅625行图像分成两场来扫,第一场称奇数场,只扫描625行的奇数行(依次扫描1、3、5、…行) ,而第二场(偶数场) 只扫描625行的偶数行(依次扫描2、4、6、…行) ,通过两场扫描完成原来一帧图像扫描的行数,这就是隔行扫描。对于每帧图像为625行的隔行扫描,每帧图像分两场扫,每一场只扫描了312.5行,而每秒钟只要扫描25帧图像就可以了,故每秒钟共扫描50场(奇数场与偶数场各25场) ,即隔行扫描时帧频为25Hz 、场频为50Hz ,而行扫描频率为15.625kHz 。

隔行扫描的行扫描频率为逐行扫描时的一半,因而电视信号的频谱及传送该信号的信道带宽亦为逐行扫描的一半。这样采用了隔行扫描后,在图像质量下降不多的情况下,信道利

用率提高了一倍。由于信道带宽的减小,使系统及设备的复杂性与成本也相应减少,这就是为什么世界上早期的电视制式均采用隔行扫描的原因。但隔行扫描也会带来许多缺点,如会产生行间闪烁效应、出现并行现象及出现垂直边沿锯齿化现象等不良效应。自从数字电视发展后,为了得到高品质的图像质量,逐行扫描也已成为数字电视扫描的优选方案。

3.复合视频信号 分量视频信号 S-Video 信号

4.电视机的显示器采用扫隔行描方式;计算机的显示器采用非隔行扫描方式

5. 每一条扫描线的有效显示像素是720个。

6. 优势主要有:

(1)比模拟信号更精确,不易受到干扰

(2)画面质量不会下降,可以多次复制而不失真

(3)处理方式多样化,可制作多种特技效果

(4)可以被压缩,在带宽一定的频道内传输

7. 略

8. 简单的说就是将其他数据源(如电视机,模拟录像机、VCD 机、模拟摄像机等) 输出的视频数据或者视频音频的混合数据输入计算机,并转换成计算机可辨别的数据,存在计算机中,成为可编辑处理的数字文件。

9. 后期特效处理主要工作是处理电影或其他影视作品中特殊镜头和画面效果,如镜头的转场效果、淡入淡出及圈出圈入。动画特殊效果等。

特效的作用科技将平淡的视频片段转化入奇幻的世界,还可以产生包括画面的转化、旋转、模仿旧电影胶片、色调变化等视频效果。

10. 略

11. 略

Chap5 P143页

1. 动画是通过连续播放一系列画面,给视觉造成动态变化的图面,能够展现食物的发展过程和动态。它不仅仅指传统意义上的在屏幕上看到的带有一定剧情的影片和电视片,而且还包括在教育、工业上用来进行演示的非实物拍摄的屏幕作品。

动画的分类:从制作技术和手段看分为以手工绘画为主的传统动画和以计算机为工具手段的数字动画;从空间的视觉效果上看分为平面动画和三维动画;按动作的表现形式看分为完善动画和局限动画;从播放效果看分为顺序动画和交互式动画;从每秒播放的幅数分为全动画和半动画。

2. 简单的说,关键步骤包含以下六个:(1)由编导确定动画剧本及分镜头稿本(2)美术动画设计人员设计出动画人物形象(3)美术动画设计人员绘制、编排出分镜头画面脚本(4)动画绘制人员进行绘制(5)摄影师根据摄影表和绘制的画面进行拍摄(6)剪辑配音。可以

分为四个阶段:总体规划(包括剧本、故事板、摄制表等的设计)、设计制作(内容设计和设置音响效果)、具体创作(原画创作、中间画制作、描线和着色)和拍摄制作(检查、拍摄、编辑和录音)。

3. 相似之处有:(1)都是平面上的运动(2)共同的技术基础—“分层”技术(3)共同的创意来源—人的创意(4)制作的基本流程相似。

不同之处有:(1)两者的实现工具和手段不同(2)两者的创作步骤稍有出入(3)两者在最终成果形式上以及应用领域上有所不同。

4. 主要应用于以下领域:电影业、电视片头和电视广告、科学计算和工业设计、模拟、教育和娱乐以及虚拟现实和3D Web等。

5. 略

6. 略

7. 略

Chap6 P171~P172

一、填空题

1. 虚拟特征 学习特征 社会特征

2. 概念文档 设计文档 技术设计文档

3. 前期策划 制作阶段 测试阶段 提交阶段

二、简答题

1. 游戏创意设计主要内容有:(1)游戏构思,需要定义游戏的主题和如何使用设计工具进行设计和构思;(2)游戏的非线性,包括故事介绍、多样的解决方案、顺序、选择等;(3)人工智能,目标是为游戏者提供一种合理的挑战;(4)设计关卡。

2. 以DirectX 8.0为例,主要包含五大方面部分:(1)DirectX Graphics,功能是通过硬件抽象层和硬件仿真层来保证设备无关性。是程序员不必了解硬件的工作机制也能编写游戏程序,并能正确运行;(2)DirectX Audio,为播放集成的音乐和声音效果提供新的体系结构;

(3)DirectX DirectPlay ,是应用程序和通信服务之间的高级软件接口;(4)DirectX DirectInput ,为游戏杆、头盔、多键鼠标以及力回馈设备等各种输入设备提供最先进的接口;

(5)DirectX DirectShow,主管视频、音频流的捕捉和回放,同时也提供各种过滤功能对它们进行实时处理。

3. OpenGL 是一个开放的三维图形软件包,它独立于窗口系统和操作系统,以它为基础开发的应用程序可以十分方便地在各种平台间移植;OpenGL 可以与Visual C++紧密接口,便于实现机械手的有关计算和图形算法,可保证算法的正确性和可靠性;OpenGL 使用简便,效率高。它具有七大功能:(1)建模:OpenGL 图形库除了提供基本的点、线、多边形的绘制函数外,还提供了复杂的三维物体(球、锥、多面体、茶壶等)以及复杂曲线和曲面绘制函数。(2)变换:OpenGL 图形库的变换包括基本变换和投影变换。基本变换有平移、旋转、变比镜像四种变换,投影变换有平行投影(又称正射投影)和透视投 影两种变换。其变换

方法有利于减少算法的运行时间,提高三维图形的显示速度。(3)颜色模式设置:OpenGL 颜色模式有两种,即RGBA 模式和颜色索引(Color Index )。(4)光照和材质设置:OpenG L 光有辐射光(Emitted Light )、环境光(Ambient Light )、漫反射光(Diffuse Light )和镜面光(Specular Light )。材质是用光反射率来表示。场景(Scene )中物体最终反映到人眼的颜色是光的红绿蓝分量与材质红绿蓝分量的反射率相乘后形成的颜色。(5)纹理映射(T exture Mapping )。利用OpenGL 纹理映射功能可以十分逼真地表达物体表面细节。(6)位图显示和图象增强图象功能除了基本的拷贝和像素读写外,还提供融合(Blending )、反走样(Antialiasing )和雾(fog )的特殊图象效果处理。以上三条可使被仿真物更具真实感,增强图形显示的效果。(7)双缓存动画(Double Buffering )双缓存即前台缓存和后台缓存,简言之,后台缓存计算场景、生成画面,前台缓存显示后台缓存已画好的画面。此外,利用OpenGL 还能实现深度暗示(Depth Cue )、运动模糊(Motion Blur )等特殊效果。从而实现了消隐算法。

OpenGL 与DirectX 的区别:(1)OpenGL 只是图形函数库。DirectX 包含图形, 声音, 输入, 网络等模块。 (2)OpenGL 稳定,可跨平台使用。DirectX 仅能用于Windows 系列平台,包括Windows Mobile/CE系列以及XBOX/XBOX360。

4. 游戏引擎是指一些已编写好的可编辑游戏系统或者一些互交式实时图像应用程序的核心组件。

游戏引擎一般包括以下几种:(1)图形引擎,功能主要包括游戏中的场景管理与渲染,角色的动作管理绘制,特效管理与渲染,关照和材质处理,级别对象细节管理等;(2)声音引擎,功能主要包括音效、语音、背景音乐等的播放;(3)物理引擎,包含在游戏世界里的物体之间、物体与场景之间发生碰撞后的力学模拟以及发生碰撞后物体骨骼运动的力学模拟;(4)数据输入-输出处理,负责玩家与计算机之间的沟通,处理来自键盘、鼠标、摇杆和其他外设的信号。

三、设计题

Chap7 P200

1.Web 是环球信息网(World Wide Web )的缩写,中文名字为“万维网”或全球信息网,是目前Internet 上最为流行、最受欢迎的一种信息检索和浏览服务。

HTTP (HyperText Transfer Protocol)超文本传输协议,是互联网上进行信息传送的一种网络协议。所有的WWW 文件都必须遵守这个标准。

URL (Uniform / Universal Resource Locator 的缩写)统一资源定位符,也被称为网页地址,是因特网上标准的资源的地址(Address) 。

网站(Website),是指在因特网上,根据一定的规则,使用HTML 等工具制作的用于展示特定内容的相关网页的集合。简单地说,网站是一种通讯工具,就像布告栏一样,人们可以通过网站来发布自己想要公开的资讯,或者利用网站来提供相关的网络服务。人们可以通过网页浏览器来访问网站,获取自己需要的资讯或者享受网络服务。

2. 基本工作过程包括以下步骤:(1)用户启动客户端应用程序(浏览器),在浏览器中输入将要访问的页面URL 地址。(2)浏览器根据URL 地址,向该地址所指向的Web 服务器

发出请求。(3)Web 服务器根据浏览器送来的请求,把URL 地址转换成页面所在的服务器上的文件全名,找到相应的文件。(4)如果URL 指向HTML 文档,Web 服务器使用HTTP 协议把该文档直接送给浏览器。(5)浏览器解释HTML 文档,在客户端屏幕上显示结果。

3.HTML (HyperText Mark-up Language)即超文本标记语言或超文本链接标示语言,是目前网络上应用最为广泛的语言,也是构成网页文档的主要语言。HTML 文本是由HTML 命令组成的描述性文本,HTML 命令可以说明文字、图形、动画、声音、表格、链接等。HTML 的结构包括头部(Head )、主体(Body )两大部分,其中头部描述浏览器所需的信息,而主体则包含所要说明的具体内容。

HTML 文档制作不是很复杂,且功能强大,支持不同数据格式的文件镶入,其主要特点如下:(1)简易性,HTML 版本升级采用超集方式,从而更加灵活方便。(2)可扩展性,HTM L 语言的广泛应用带来了加强功能,增加标识符等要求,HTML 采取子类元素的方式,为系统扩展带来保证。(3)平台无关性。HTML 可以使用在广泛的平台上。

4. 略

5. 略

Chap8 P222~P223

一 填空题

1. 空间冗余 结构冗余 时间冗余 视觉冗余 知识冗余 信息熵冗余

2. 2

3.MPEG 标准,H.26系列视频标准,A VS 标准

4. 010,2.55

5. 26:1

二计算与简答题

2. (1)脉冲编码调制PCM 原理:PCM 是实现语音信号数字化的一种方法,一语音信号的数字化 。语音信号是连续变化的模拟信号,实现语音信号的数字化必须经过三个过程:抽样(把连续信号变为时间轴上离散的信号的过程)、量化(把幅度连续变化的模拟量变成用

有限位二进制数字表示的数字量的过程)和编码(用一种位数的脉冲码组表示量化采样值)。语音信号先经防混叠低通滤波器,进行脉冲采样,变成8kHZ 采样信号,然后将幅度连续的PCM 信号用“四舍五入”的办法量化为有限个幅度取值的信号,再经编码后转换成二进制码。PCM 编码的误差来源是

(2)差分脉冲编码调制(DPCM)原理:DPCM 是利用样本与样本之间存在的信息冗余度来进行编码的数据压缩技术,利用信号的相关性找出可以反映信号变化特征的一个差值量进行编码。根据过去的样本去估计下一个样本的幅度大小,这个值为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个信号的位数。

(3)统计编码原理:主要针对无记忆信源,根据信息码字出现概率的分布特征而进行压缩编码,寻找概率与码字长度间的最优匹配。常见的有霍夫曼编码,香浓编码等。

(4

)变换编码原理:如果利用映射变换来实现对数据的建模表达,就称为变换编码。

其中映射变换是把原始信号中的各个样值从一个域变换到另一个域,然后针对变换后的数据再进行量化与编码操作。映射变换的关键在于能够产生一系列更加有效的系数,对这些系数进行编码所需的总比特数少的多,使数据率得以降低。映射变换的方法很多,一般是指函数变换法,而常用的又是正交变换法。比如我们所熟知的傅立叶变换,就是利用复数域正交变换,将一个函数从时域描写变成频域的频谱展开。数据恢复时先对收到的信号进行解码和逆量化,然后进行逆变换获得在一定保真度意义下的原来信号。

3.DCT 即离散余弦变换,是一种与傅立叶变换紧密相关的数学运算。在傅立叶级数展开式中,如果被展开的函数是实偶函数,那么其傅立叶级数中只包含余弦项,再将其离散化可导出余弦变换,因此称之为离散余弦变换。以8×8像素块为单位进行变换。

4. 略

5. MPEG-1标准的目标是用于传输1.5Mb/s传输率的数据传输媒体运动图像及其伴音的编码。

MPEG-2标准的目标是针对HDTV 和DVD 等制定的运动图像机器伴音编码标准。 MPEG-4标准的目标是支持多种多媒体的应用。

MPEG-7标准的目标是产生一个描述多媒体内容的标准,支持对多媒体信息在不同程度层面上的解释和理解,从而使其可以根据用户的需要进行传递和存取。

MPEG-21标准的目标是一个可以互操作和高度自动化的多媒体框架。

6. AVS 标准的是我国自主制定的音视频编码技术标准,用A VS 取代MPEG 系列标准,可使中国的A V 产业得到较好的发展环境。

Chap9 P251

一 选择题

1. B

2. C

3. D

4. D

5. C

6. B

7. B

二 简答题

1. 略

2. 硬盘的优越性有:容量大,速度快,可靠性高,几乎不磨损等优点。

硬盘接口标准有:ST506/412接口与ESDI 接口、ATA 、SCSI 接口、Serial ATA 接口、IEEE1394接口、USB 接口等。目前市场上主流接口产品是Ultra ATA/133。

3. 光盘有3类:只读关盘(CD-ROM )、一次写入光盘(CD-R )和可擦写关盘(CD-RW )。 光盘是通过冲压设备压制或激光烧刻,从而在其上产生凹槽来记录信息的存储媒体,不同于磁盘,光盘主要利用激光原理存储和读取信息。

4. CD-ROM工作原理:只读光盘是利用在盘上压制凹坑的机械办法,利用凹坑的边缘来记录“1”,而凹坑和非凹坑的平坦部分记录“0”,并使用激光来读出。由于只读光盘的物理特性,用户只能读取光盘上的数据,而不能把数据写到CD 上。

5. CD-ROM驱动器主要技术参数:速度,数据传输率,读盘方式,平均访问时间,CPU 占用时间,数据缓冲区,光盘格式兼容性,纠错能力,Ultra DMA 33/66数据传输标准。 市场上主要的CD-ROM 驱动器有:SONY ,美达(MIDA),源兴,华硕,Acer ,TARGA ,NEC ,顺新等。

Chap10 P275

1. 数据管理经历了三个阶段:人工管理、文件系统管理和数据库系统管理。

2. 目前数字媒体数据的管理方式有:文件系统管理方式、扩充关系数据库的方式、面向对象数据库、超文本。

3. 媒体存储数据模型主要有:(1)NF2数据模型:是在关系数据库中引入抽象数据类型,使用户能够定义和表示多媒体信息对象。(2)面向对象数据模型:具有较强的抽象能力,能更好表述复杂的对象。更好维护对象的语义信息。有三个最基本的概念(抽象数据类型、继承、对象标识)。(3)对象-关系模型:对传统的关系数据库加以扩展,增加面向对象的特性,把面向对象技术与关系数据库相结合,建立对象-关系数据模型。

4. 数字媒体版权保护经历了两个阶段:传统的数字媒体版权保护是将整个数字媒体内容加密封装,封装后的档案无法被浏览软件开启,消费者只能借其他的文字描述来了解此数字媒体内容。数字版权保护是一种提供可行的知识产权解决方案与合理使用这些数字媒体的新兴研究。

数字媒体版权保护基本方案主要有两种:基于加密认证技术的基本方案和基于数字水印技术的基本方案。

数字媒体版权保护系统框架:DRM 是一个系统概念,设计商业运营模式、法律只读、社会文化习惯和技术机制等多方面内容。下图是它的总体框架:

核心思想是通过使用数字许可证来保护数字内容的版权、用户得到数字内容后,必须获得相应的许可证才能使用该内容。DRM 典型系统包含三个模块:(1)内容服务器:包含存储数字内容的内容仓库,产品信息库和对数字内容进行安全处理的DRM 打包工具。(2)许可证服务器包含权利库,内容密钥库,用户身份标识库和DRM 许可证生成器。(3)客户端主要包括DRM 控制器和数字内容使用工具。

5. 目前主要的加密算法有:

(1)对称密码算法:对称密码算法有时又叫传统密码算法,就是加密密钥能够从解密密钥中推算出来,反过来也成立。在大多数对称算法中,加密解密密钥是相同的。这些算法也叫秘密密钥算法或单密钥算法,它要求发送者和接收者在安全通信之前,商定一个密钥。对称算法的安全性依赖于密钥,泄漏密钥就意味着任何人都能对消息进行加密解密。只要通信需要保密,密钥就必须保密。对称算法的加密和解密表示为:

Ek(M)=C Dk(C)=M

对称密码算法,其主要特性就是加密解密密钥能互相推算。

(2)非对称加密算法,也被称作公钥密码术,在加/解密时,分别使用了两个不同的密钥:一个可对外界公开,称为“公钥”;一个只有所有者知道,称为“私钥”。公钥和私钥之间具有紧密联系,用公钥加密的信息只能用相应的私钥解密,反之亦然。同时,要想由一个密钥推知另一个密钥,在计算上是不可能的。 特性有:非对称密码算法的加密密钥和解密密钥不相同,而且从加密密钥推算出解密密钥极其困难。1) EK1(P) = C //E:加密算法,K1:加密密钥,P :明文,C :密文,下同。

2) 从K1推导出K2极其困难。如果密钥长度足够长,银河系中的任何一种生物都应该不可能轻易从K1

推出K2,或者从K2推算K1。

3) 某些优秀的非对称密码算法还具有如下特性,但不是所有的算法都具备:

EK1(DK2(P)) = P 也就是加密函数E 与解密函数D 互为反函数,解密函数可以当成加密函数来用,加密函数也可以当成解密函数来用。

6. 数字水印有3个条件:隐蔽性、隐蔽位置的安全性、鲁棒性。

7. 典型的数据版权保护系统:(1)面向电子文档的DRM 保护系统包括微软的RMS 系统、书生SEP DRM、方正的CEB 系统等;(2)面向电子图书的DRM 系统有微软DAS 、Adobe Content Server以及国内的方正Apabi 、书生SEP 、超星PDG 。(3)面向图像的DRM 系统(4)面向流媒体的DRM 系统主要有:IBM 的EMMS 和微软的Windows Media DRM。

8. 它的的基本工作流程如下:

第一步,打包。Windows Media 权限管理器将对数字媒体文件进行打包。打包的文件将加密并使用一个“密钥”锁定。该密钥存储在一个加密许可证中,该许可证将单独分发。(这是 Windows Media权限管理器所独有的功能。)它还会向数字媒体文件中添加其他信息,例如用于获取许可证的

URL 。打包的数字媒体文件将保存为Windows Media Audio格式(文件扩展名为 .wma )或Windows Media Video 格式(文件扩展名为.wmv )。

第二步,分发。打包的文件可放在网站上以供下载、放在数字媒体服务器上以供流式处理、通过CD 进行分发或使用电子邮件发送给消费者。Windows Media DRM 还允许消费者将受版权保护的数字媒体文件发送给朋友。

第三步,建立许可证服务器。内容提供商可选择许可证交换中心,该交换中心将存储许可证的特定权限或规则并提供Windows Media 权限管理器许可证服务。交换中心的作用是对请求许可证的消费者进行身份验证。数字媒体文件和许可证是分开存储和分发的,因此更便于管理整个系统。

第四步,获取许可证。要播放打包的数字媒体文件,消费者首先必须获取一个许可证密钥为该文件解锁。当消费者试图获取打包的数字媒体文件、获取一个预先传递的许可证或首次播放该数字媒体文件时,都将自动启动获取许可证的过程。Windows Media 权限管理器或者引导用户进入注册页(该页要求输入信息或付费),或者从交换中心检索一个许可证而不提示任何问题。

第五步,播放数字媒体文件。要播放数字媒体文件,消费者需要能支持Windows Media DRM 的播放机。然后,消费者即可根据许可证中所提供的规则或权限来播放文件。许可证可提供多种不同权限,如开始时间和日期、持续时间以及对操作计数。例如,默认权限可能允许消费者在特定计算机上播放数字媒体文件并可将该文件复制到便携设备。但是,许可证是不可转让的。如果消费者将打包的数字媒体文件发送给一位朋友,则该朋友必须获取自己的许可证,然后才能播放该文件。这种按PC 颁发许可证的模式可确保打包的数字媒体文件只能在已获得该文件的许可证密钥的计算机上播放。

Chap11 P303

1. 流媒体的概念:所谓流媒体是指采用流式传输的方式在Internet 播放的媒体格式。 流媒体又叫流式媒体,它是指商家用一个视频传送服务器把节目当成数据包发出,传送到网络

上。用户通过解压设备对这些数据进行解压后,节目就会像发送前那样显示出来。

与传统媒体相比,流媒体的特点是运用可变带宽技术,以“流”的形式进行数字媒体的传送,是人们可以在28~1200kb/s 的带宽下都可以在线欣赏到接连不断的高品质的音频和视频节目。缩短等待的时间,节省存储空间,可以实现实时传输和实时播放。

2. (1)顺序流式传输

顺序流式传输是顺序下载,在下载文件的同时用户可观看在线媒体,在给定时刻,用户只能观看已下载的那部分,而不能跳到还未下载的前头部分,顺序流式传输不象实时流式传输在传输期间根据用户连接的速度做调整。由于标准的HTTP 服务器可发送这种形式的文件,也不需要其他特殊协议,它经常被称作HTTP 流式传输。顺序流式传输比较适合高质量的短片段,如片头、片尾和广告,由于该文件在播放前观看的部分是无损下载的,这种方法保证电影播放的最终质量。这意味着用户在观看前,必须经历延迟,对较慢的连接尤其如此。对通过调制解调器发布短片段,顺序流式传输显得很实用,它允许用比调制解调器更高的数据速率创建视频片段。尽管有延迟,毕竟可让你发布较高质量的视频片段。顺序流式文件是放在标准HTTP 或 FTP 服务器上,易于管理,基本上与防火墙无关。顺序流式传输不适合长片段和有随机访问要求的视频,如:讲座、演说与演示。它也不支持现场广播,严格说来,它是一种点播技术。

(2)实时流式传输

实时流式传输指保证媒体信号带宽与网络连接配匹,使媒体可被实时观看到。实时流与HTTP 流式传输不同,他需要专用的流媒体服务器与传输协议。实时流式传输总是实时传送,特别适合现场事件,也支持随机访问,用户可快进或后退以观看前面或后面的内容。理论上,实时流一经播放就可不停止,但实际上,可能发生周期暂停。实时流式传输必须配匹连接带宽,这意味着在以调制解调器速度连接时图象质量较差。而且,由于出错丢失的信息被忽略掉,网络拥挤或出现问题时,视频质量很差。如欲保证视频质量,顺序流式传输也许更好。实时流式传输需要特定服务器,如:QuickTime Streaming Server、RealServer 与Windows Media Server 。这些服务器允许你对媒体发送进行更多级别的控制,因而系统设置、管理比标准HTTP 服务器更复杂。实时流式传输还需要特殊网络协议,如:RTSP (Realtime Streaming Protocol) 或MMS (Microsoft Media Server)。这些协议在有防火墙时有时会出现问题,导致用户不能看到一些地点的实时内容。

3. 流媒体系统组成:一般都由编码器、服务器和播放器三个部分组成。

主流流媒体格式:RealVideo 的.rm 视频影像格式和.ra 的音频格式,Microsoft Media technology 的.asf 格式。

主要有用于Internet 上针对多媒体数据流的实时传输协议RTP (Real-time Transport Protocol )、与RTP 一起提供流量控制和拥塞控制服务的实时传输控制协议RTCP (Real-time Transport Control Protocol)、定义了一对多的应用程序如何有效地通过IP 网络传送多媒体数据的实时流协议RTSP (Real-time Streaming Protocol)。

4.P2P 技术的概念:P2P 技术即点对点技术(peer-to-peer , 简称P2P )又称对等互联网络技术,是一种网络新技术,依赖网络中参与者的计算能力和带宽,而不是把依赖都聚集在较少的几台服务器上。P2P 网络通常用于通过Ad Hoc连接来连接节点。网络的参与者共享他们所拥有的一部分硬件资源(处理能力、存储能力、网络连接能力、打印机等),这些共

享资源需要由网络提供服务和内容,能被其他对等节点直接访问而无需经过中间实体。 P2P 技术的特点:非中心化,可扩展性,健壮性,高性价比,隐私保护,负载均衡。

5. P2P应用系统有:即时通信软件ICQ ,文件和其他内容共享—BT 技术,基于P2P 技术的流媒体网络视频。

6. IPTV的概念:IPTV 即交互式网络电视或网络电视,是一种利用宽带有线电视网的基础设施,以家用电视机或计算机作为主要终端设备,集互联网、多媒体、通讯等多种技术于一体,通过互联网络协议IP 向家庭用户提供包括数字电视在内的多种交互式服务的崭新技术。用户在家中可以有两种方式享受IPTV 服务:(1)计算机,(2)网络机顶盒+普通电视机) 。它能够很好地适应当今网络飞速发展的趋势,充分有效地利用网络资源。

IPTV 的特点:点播功能,双向互动功能。

7. IPTV基本系统模型包括三个组成部分,即(1)IPTV 业务系统平台,主要包括了流媒体系统、存储设备、编码器、信源转换设备等。(2)IP 网络,包括骨干/城域网络、宽带接入网络、内容分发网络。(3)用户端,一般有三种接收方式,包括个人计算机、机顶盒+电视和手机。

8. 略

Chap12 P319

1. 数字媒体产业发展面向文化娱乐消费市场和广播电视事业,以视音频信息服务为主体的数字媒体内容关键技术和现代传媒信息综合内容平台。

数字媒体产业技术趋势:高清晰电视和数字电影,网络游戏,数字动画,网络出版。

2. 数字媒体内容处理技术包括:可伸缩编/解码技术,音/视频/解码技术,内容条码技术,内容聚合技术,虚拟现实技术,数字版权保护技术等。

3. 基于内容的图像检索(Content Based Image Retrieval, CBIR)是一项从图像数据库中找出与检索式内容相似的图像的检索技术。通常有三种检索模式,浏览检索、样例检索、草图检索。目前许多科研机构还在开发新的检索方式,以最大限度的方便用户。系统的图像库实现按一定的分类方式分成若干个类别。用户按照一定的目的去浏览相关的图像类,找到感兴趣的图像之后,提交做基于内容的检索,在检索结果中也能选择感兴趣的照片继续提交做基于内容的检索。;有时用户希望找一张和自己手中的图片相似的图片。这时可以通过“样例检索”的方式进行.

4. 视频检索领域主要针对3个问题:视频分割,高层次语义特征提取和视频检索。 视频检索算法有:

(1) 基于关键帧的检索

视频被抽象为关键帧后,搜索就变成按照某种相似度来检索数据库中与查询描述相似的关键帧。通常使用的查询方法是通过目标特征说明(直接) 的查询和通过可视实例(示例) 的查询。检索时,用户也可以指定使用特定的特征集。如果检索到关键帧,用户就可以利用播放

来观看它所代表的视频片断。浏览可以跟随检索,作为检验检索到的关键帧的上下文边界联系。浏览也可以初始化查询,即当浏览时,用户可以选择一个图像来查询所有与该图像相似的关键帧。

(2) 基于镜头动态的检索 基于镜头和主体目标的运动特征来检索镜头是视频查询的进一步要求。可以利用摄像机操作的表示来查询镜头,可以利用运动方向和幅度特征来检索运动的主体目标。在查询中还可以将运动特征和关键帧特征结合起来,检索出具有相似的动态特征但静态特征不同的镜头。

(3) 视频浏览

对于视频来说,浏览与有明确目的的检索同样重要。浏览需要视频具有在语义层次上的表示,有学者提出了场景转换图(STG)的概念,以一个有向图的节点表示场景,边表示时间上的转换。通过对STG 的化简,可以去掉不重要的镜头,得到视频的紧凑的表示。由于单纯从图像从获得语义信息非常困难,也有学者提出了综合采用视频中的图像、语音以及文字信息的方法。

(4) 视频的检索反馈

在检索的实现中除利用图像的视觉特征进行检索外,还应根据用户的反馈信息不断学习改变阈值重新检索,实现人机交互,直到达到用户的检索要求。

如何定义是否两个视频相似,仍然是尚未解决的问题,限制了检索系统的应用范围。而且由于视频内容的复杂性,不同用户在检索过程中,即使对同一部视频,其注重的角度也有可能不同,因此接受用户的反馈意见,当用户对查询结果不满意时可以优化查询结果,突出用户的需要。在综合了人类视觉心理特征的基础上,介绍了一种视频相似衡量的模型,从镜头、视频等多个层次,多种视觉判断角度,对视频间相似度进行衡量。并在此基础上提出了从多个粒度——镜头层次和视频层次进行检索反馈的方法。整个过程是自动进行的,根据用户的意见灵活地优化检索结果。

5. 略

6. 内容集成分发技术原理:内容集成和分发被看做两个阶段,内容分发网络(Content distribution network),有时也被称作内容传递网络(Content delivery network)。内容分发和传递一方面可以看作是CDN 的两个阶段,分发是内容从源分布到CDN 边界节点的过程,传递是用户通过CDN 获取内容的过程;另一方面,分发和传递可以看作是CDN 的两种不同的实现方式,分发强调CDN 作为透明的内容承载平台,传递强调CDN 作为内容的提供和服务平台。CDN 网络的设计有两种思路:一种是将CDN 设计为一种透明的承载网络;另一种是将CDN 设计为一个分布式内容服务网络。

7. 异构网络互通融合需要的技术可以分为两大类:

(1)兼容已有音视频压缩标准的转码技术。特点是着眼于现有编码码流之间的转换处理。

(2)面向下一代媒体编解码标准的可伸缩编解码技术。为了适应传输网络异构、传输带宽波动、噪声新到、显示终端不同、服务需求并发和服务质量要求多样等问题。目标是“异构网络无缝接入”。


© 2024 实用范文网 | 联系我们: webmaster# 6400.net.cn