电脑技术学习

MPEG的新发展—MPEG4、MPEG7

dn001


;
;;;;网络应用最重要的目标之一就是进行多媒体通信。多媒体信息主要包括图像、声音和文本三大类,其中视频、音频等信号的信息量是非常大的。而且这些信息的表达方式、输入、输出的要求也各不相同,因此在多媒体通信中,对这些数据进行有效的表达和适当处理是非常重要的。其中,多媒体信息的压缩技术是多媒体通信领域的要害技术之一。MPEG(MovingPictureEXPertGroup)应运而生,它是ISO(InternationalStandardOrgnization)与IEC(InternationalElectronicCommittee)于1988年联合成立的,致力于运动图象及其伴音编码标准化工作。它包括MPEG系统,即MPEG视频及MPEG音频。原先共有三个版本MPEG1、MPEG2、MPEG3,后又增加了MPEG4、MPEG7,不同版本表示了不同用途和质量,对多媒体通信的发展起到了革命性的推动作用。

一、MPEG1、MPEG2和MPEG2AAC
MPEG1(ISO/IEC11172)制定于1993年,是针对1.5Mbps以下数据传输率的数字存储媒质运动图像及其伴音编码的国际标准。MPEG1用于在CD—ROM上存储同步和彩色运动视频信号。可优化为中等分辨率,并在其优化模式下,采用所谓的标准交换格式(SIF)。MPEG1对色差分量采用4∶1∶1的二次采样率。MPEG1旨在达到VRC质量,其视频压缩率为26∶1。MPEG1现已成为常规视频标准的一个子集,该子集称为CPB流。

1995年又出台了MPEG2(IOS/IEC 13818),它追求的是CCIR 601建议的图象质量DVB、HDTV和DVD等制定的3Mbps~10Mbps的运动图象及其伴音的编码标准。该标准最初的目的是在与MPEG1兼容的基础上,实现低码率和多声道扩展。后为适应演播电视要求,MPEG于1994开始致力于定义一个可以获得更高质量的多声道音频标准。该标准不与MPEG1兼容,定名为MPEG2AAC。AAC标准完成于1997年,经BBC(U.K.)和NHK(Japan)使用、测试表明已达到最优化ITU—R601推荐的分辨率。AAC(Advanced Audio Coding)对于低比特率的多声道编码能提供相当高的声音质量。由于它不向后兼容,故具有更高的压缩效果。据测试它以320Kbps传送的音频信号比MPEG2以640Kbps传送的音质还略好些。AAC标准的发展标志着标准化工作向着模块化方向演变的趋势。

MPEG3是ISO/IEC最初为HDTV开发的编码和压缩标准。但由于MPEG2的高速发展,MPEG3的功能已被淘汰,其原来的工作由MPEG2小组承担。

二、MPEG4
与前两者不同,于1998年11月公布,原预计1999年1月投入使用的国际标准MPEG4不仅是针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。MPEG4试图达到两个目标:一是低比特率下的多媒体通信;二是多工业的多媒体通信的综合。据此目标,MPEG4引入AV对象(Audio/VisaulObjects),使得更多的交互操作成为可能。

1.AV对象(AVO)

AV对象的基本单位是原始“AV对象”,它们可能是一个没有背景的说话的人,也可能是这个人的语音或一段背景音乐等。它具有高效编码、高效存储与传播及可交互操作的特性。

在MPEG4中,AV对象有着重要的地位。MPEG4对AV对象的操作主要有:

1采用AV对象来表示听觉、视觉或者视听组合内容。

2答应组合已有的AV对象来生成复合的AV对象,并由此生成AV场景。MPEG4采用SNHC的方法来组织这些AV对象。

3答应对AV对象的数据灵活地多路合成与同步,以便选择合适的网络来传输这些AV对象数据。

4答应接收端的用户在AV场景中对AV对象进行交互操作。

5MPEG4支持AV对象知识产权与保护。

2.MPEG4标准的构成


1)DMIF(TheDelliveryMultimediaIntegrationFramework)

DMIF即多媒体传送整体框架,它主要解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过传输多路合成比特信息来建立客户端和服务器端的握手和传输。通过DMIF,MPEG4可以建立起具有非凡品质服务(QoS)的信道和面向每个基本流的带宽。

2)数据平面

MPEG4中的数据平面可以分为两部分:传输关系部分和媒体关系部分。

为了使基本流和AV对象在同一场景中出现,MPEG4引用了对象描述(OD)和流图桌面(SMT)的概念。OD传输与非凡AV对象相关的基本流的信息流图。桌面把每一个流与一个CAT(ChannelAssosiationTag)相连,CAT可实现该流的顺利传输。

3)缓冲区治理和实时识别

MPEG4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求非凡的缓冲区和实时模式。通过有效地治理,可以更好地利用有限的缓冲区空间。

4)音频编码

MPEG4的优越之处在于,它不仅支持自然声音,而且支持合成声音。MPEG4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。

5)视频编码

与音频编码类似,MPEG4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D动画和人面部表情动画等。

6)场景描述

MPEG4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息就组成了场景描述,这些场景描述以二进制格式BIFS(BinaryFormatforScenedescription)表示,BIFS与AV对象一同传输、编码。场景描述主要用于描述各AV对象在一具体AV场景坐标下,如何组织与同步等问题。同时还有AV对象与AV场景的知识产权保护等问题。MPEG4为我们提供了丰富的AV场景。

3.应用前景

MPEG4的应用前景将是非常广阔的。它的出现将对以下各方面产生较大的推动作用:数字电视;动态图象;万维网(WWW);实时多媒体监控;低比特率下的移动多媒体通信;于内容存储和检索多媒系统;Internet/Intranet上的视频流与可视游戏;基于面部表情模拟的虚拟会议;DVD上的交互多媒体应用;基于计算机网络的可视化合作实验室场景应用;演播电视等。

三、MPEG7—多媒体内容描述接口
继MPEG4之后,要解决的矛盾就是对日渐庞大的图像、声音信息的治理和迅速搜索。针对这个矛盾,MPEG提出了解决方案MPEG7。MPEG7力求能够快速且有效地搜索出用户所需的不同类型的多媒体料。该工作提议于1998年10月提出,预计于2001年初最终完成并公布。MPEG7将对各种不同类型的多媒体信息进行标准化的描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。该标准不包括对描述特征的自动提取,它也没有规定利用描述进行搜索的工具或任何程序。其正式的称谓是“多媒体内容描述接口”。

MPEG7可独立于其它MPEG标准使用,但MPEG4中所定义的对音、视频对象的描述适用于MPEG7,这种描述是分类的基础。另外我们可以利用MPEG7的描述来增强其它MPEG标准的功能。

MPEG7的应用范围很广泛,既可应用于存储(在线或离线),也可用于流式应用(如广播、将模型加入Internet等)。它可以在实时或非实时环境下应用。如:数字图书馆(图象目录,音乐字典等);多媒体名录服务(如黄页);广播媒体选择(无线电信道,TV信道等);多媒体编辑(个人电子新闻业务,媒体写作)等。


另外,MPEG7在教育、新闻、导游信息、娱乐、研究业务、地理信息系统、医学、购物、建筑等各方面均有较深的应用潜力。

四、结束语
与同样是音频压缩标准的杜比公司的AC系列标准相比,MPEG标准系列由于存在专利权的问题,所以更适合于我国国情。MPEG1使得VCD取代了传统的录象带,而MPEG2将使数字电视最终完全取代现有的模拟电视,而高画质和音质的DVD也将取代现有的VCD。随着MPEG4和MPEG7新标准的不断推出,数据压缩和传输的技术必将趋向更加规范化。