现在我们来学习第三节的内容:多媒体的关键技术


(1)多媒体数据压缩技术

数据压缩、解压缩是多媒体的关键技术,图像声音视频文件

数据量非常大,致使在计算机上实时地处理声音、视频等多媒体信息十分困难,如果不经过数据压缩,多媒体信息对计算机的运算速度和存储空间都会提出极高的要求。数据压缩技术的发展,大大减轻了计算机的负担,推动了多媒体技术的发展。对于数据压缩技术,我们稍后将做更详细的介绍。

(2)大容量信息存储技术

多媒体音频、视频、图像等信息虽然经过压缩处理,但仍需要相当大的存储空间,大容量光盘存储器的出现解决了多媒体信息存储空间及交换问题

(3)多媒体输入/输出技术

多媒体输入/输出技术主要包括媒体的变换技术、媒体识别技术和综合技术等。各种多媒体输入/输出设备都牵涉到这些技术。

(4)多媒体专用芯片技术

专业的多媒体技术需要实现音频、视频信号的快速压缩、解压缩处理,需要大量的快速计算;实现图像的许多特殊效果、图形的处理、语音信号处理等,也都需要较快的运算和处理速度,只有采用专业芯片才能取得满意效果

(5)其它多媒体技术

其它技术还包括:多媒体内容的编辑与制作、多媒体数据库管理技术、多媒体通信技术。

多媒体数据种类繁多,目前,在虚拟现实技术中实现三维空间、3D立体声效果和在实境中进行仿真交互,会产生海量的信息数据。

下面我们以音频信息为例: 

高保真立体声音频信号的采样频率为44.1kHz、16位采样精度,一分钟存储量为10.34MB。换句话说,一片CD-ROM(存储量为650MB)可存放约63分钟的音乐。如果使用48 kHz采样频率的话,需要的存储量就更大了。

可见,庞大的数字化信息给存储器的存储量、通信线路的信道传输率以及计算机的速度都带来极大的压力。通过数据压缩技术可以大大降低数据量,以压缩的形式存储和传输,既节约了存储空间,又提高了通信线路的传输效率,同时也使计算机得以实时处理音频、视频信息,从而保证视频和音频节目的播放质量。

每种多媒体数据都有各自的特性,下面我们以图像数据为例,来研究数据的冗余及压缩技术。

图像数据压缩技术就是研究如何利用图像数据的冗余性来减少图像数据量的方法,通俗地说,就是通过减少图像中重复数据的存储来实现存储量的压缩。

图像数据的冗余主要有以下几种

(1)空间冗余。

在静态图像中有一块表面颜色均匀的区域,在这个区域中所有点的光强和色彩以及色饱和度都相同,具有很大的空间冗余。

(2)时间冗余。电视图像、动画等序列图片,当其中物体有位移时,后一帧的数据与前一帧的数据有许多共同的地方,如背景等位置不变,只有部分相邻帧改变的画面,显然是一种冗余,这种冗余称为时间冗余。

(3)结构冗余。在有些图像的纹理区,图像的像素值存在着明显的分布模式。例如,方格状的地板图案等,称此为结构冗余。

(4)知识冗余。对于图像中重复出现的部分,我们可以构造出基本模型,并创建对应各种特征的图像库,进而使图像的存储只需要保存一些特征参数,从而可以大大减少数据量。

(5)视觉冗余。事实表明,人的视觉系统对图像的敏感性是非均匀性和非线性的。在记录原始的图像数据时,不记录人眼看不见或不能分辨的部分,来降低视觉冗余。

(6)图像区域的相同性冗余。它是指在图像中的两个或多个区域所对应的所有像素值相同或相近,从而产生的数据重复性存储,这就是图像区域的相似性冗余。

随着对人的视觉系统和图像模型的进一步研究,人们可能会发现图像中存在着更多的冗余性,使图像数据压缩编码的可能性越来越大,从而推动图像压缩技术的进一步发展。

多媒体数据压缩方法分类标准很多,根据解码后数据是否能够完全无丢失地恢复原始数据,可将它们分为两种无损压缩和有损压缩

(1)无损压缩:也称为可逆压缩、无失真编码等。工作原理为去除或减少冗余值,但这些被去除或减少的冗余值可以在解压缩时重新插入到数据中以恢复原始数据。它大多使用在对文本和数据的压缩上,压缩比较低,大致在2:1~5:1之间。典型算法有:哈夫曼编码、香农-费诺编码等。

2)有损压缩:也称不可逆压缩。这种方法在压缩时减少的数据信息是不能恢复的。在语音、图像常采用这类方法。它对自然景物的彩色图像压缩,压缩比可达到几十倍甚至上百倍。如:我们熟悉的JPEG、WMA、MP3格式都采用有损压缩的方法。

如:JPEG、H.261MPEG等标准。

(1)JPEG

JPEG是由ISO与CCITT成立的“联合图片专家组(Joint Photographic Experts Group,JPEG)”制定的,用于灰度图、彩色图的连续变化的静止图像编码标准,于1992年正式通过。

JPEG压缩是有损压缩,它利用了人的视觉系统的特性,去掉了视觉冗余信息和数据本身的冗余信息。在压缩比为20:1的情况下,压缩后的图像与原始图像相比较,非图像专家难辨“真伪”

(2)H.261

H.261是被可视电话、电视会议中采用的视频、图像压缩编码标准,由CCITT制定,1990年12月正式批准通过。

(3)MPEG

MPEG标准是以H.261标准为基础发展而来的它是由IEC和ISO成立的“运动图像专家组MPEG”制定的,该组织成立于1988年,致力开发视频、音频的压缩编码技术。

目前为止,MPEG到已经制定和正在制定的标准有:

MPEG-1:是第一个官方的视讯音频压缩标准,在随后Video CD中被采用,其中的音频压缩的第三级(MPEG-1 Layer 3)简称MP3,成为比较流行的音频压缩格式。

MPEG-2:是广播质量的视讯、音频和传输协议,于1994年11月正式被确定为国际标准。被用于无线数字电视-ATSC、DVB以及ISDB、数字卫星电视、数字有线电视信号,以及DVD视频光盘技术中。

MPEG-3:原本目标是为高分辨率电视(HDTV)设计,随后发现MPEG-2已足够HDTV应用,故MPEG-3的研发便中止。

MPEG-4:2003年发布的视讯压缩标准,主要是扩展MPEG-1、MPEG-2等标准以支持视频/音频对象的编码、3D内容、低比特率编码和数字版权管理。它的应用领域主要在公用电话交换网、可视电话和电子报纸等。

MPEG-7:并不是一个视讯压缩标准,它是一个多媒体内容的描述标准,支持用户对其感兴趣的各种“资料”的快速、有效地检索。MPEG-7主要应用在数字图书馆、多媒体目录服务、广播式媒体的选择(例如无线电频道、TV频道等)、个人电子新闻服务、多媒体创作等领域。 

MPEG-21:MPEG-21是一个正在制定中的标准,它的目标是为未来多媒体的应用提供一个完整的平台。