通信专业设备环境考试培训频压缩编码

动力与环境 责任编辑:akliuqi 2013-12-10

摘要:通信专业设备环境考试培训频压缩编码:虽然表示图像需要大摄的数据,但图像数据是髙度相关的。一幅图像内部以及视频序列中相邻图像之间有大量的冗余信息。对于一幅二维图像.可以注意到图像中的许多部分的灰度或颜色差别并不是太大,某些区域是均匀着色或高度相关的。

  1.视频压缩编码
  (1)视频信息的冗余
  虽然表示图像需要大摄的数据,但图像数据是髙度相关的。一幅图像内部以及视频序列中相邻图像之间有大量的冗余信息。对于一幅二维图像.可以注意到图像中的许多部分的灰度或颜色差别并不是太大,某些区域是均匀着色或高度相关的。例如,图像的背众可能是一堵墙,它是均匀上色或显示出规则的模式,称为空间相关或空间冗余。对干没有场景切换或镜头快速推拉摇移的视频序列,画面中的背景一般并无变化,只有移动的物体产生画面的差异.因而各帧图像间的差别极小,即视频序列中的图像是高度相关的,称为时间相关或时间冗余。静止图像压缩的一个目标是在保持重建图像的质量可以被接受的同时,尽量去除空间冗余信息。对于活动视频压缩,在去掉空间冗余的同时去除时间冗余,可以达到较高的压缩比。
  除空间冗余和时间冗余外,在一般的图像数据中,还存在着其他各种冗余信息,主要表现为以下几种形式。
  ①信息熵冗余
  信息熵冗余也称为编码冗余。由信息论的有关原理可知,为表示图像数据的一个像素点,只要按其信息熵的大小分配相应比特数即可。然而对于实际图像数据的每个像素,很难得到它的信息熵,因此在数字化一幅图像时,对每个像素用相同的比特数表不,这样必然存在冗余。
  ②结构冗余
  在有些图像的部分区域内存在着非常强的纹理结构,或是图像的各个部分之间存在有某种关系,如自相似性等,这些都是结构冗余的表现。
  ③知识冗余
  在有些图像中包含的信息与某些先验的基础知识有关,例如,在-般的人脸图像中,头、眼、鼻和嘴的相互位置等信息就是一般常识,这种冗余称为知识冗余。
  ④视觉冗余
  在多数情况下,重建图像的最终接收者是人的眼睛,为了达到较高的压缩比,可以利用人类视觉系统的特点得到高压缩比。人类的视觉系统对于图像的注意是非均匀和非线性的.特别是人类的视觉系统并不是对于图像中的任何变化都能感知。例如,图像系数的量化误差引起的图像变化在一定范围内是不能为人眼所察觉的。
  (2)压缩编码
  ①预测编码
  预测编码可以在一幅图像内进行(帧内预测编码),也可以在多幅图像之间进行(帧间预测编码)。预测编码基于图像数据的空间和时间冗余特性,用相邻的已知像素(或图像块)来预测当前像素(或图像块)的取值,然后再对预测误差进行量化和编码。这些相邻像素(或图像块)可以是同行扫描的,也可以是前几行或前几帧的,相应的预测编码分别称为一维、二维和三维预测。其中一维和二维预测是帧内预测,三维预测是帧间预测。
  帧内预测编码一般采用像素预测形式的DPCM。其优点是算法简单,易于硬件实现;缺点是对信道噪声及误码很敏感,会产生误码扩散,使图像质量大大下降。同时,帧内DPCM的编码压缩比很低,因此现在已很少独立使用,一般要结合别的编码方法。帧间预测编码主要利用活动图像序列相邻帧间的相关性,即图像数据的时间冗余来达到压缩的目的,它可以获得比帧内预测编码高得多的压缩比。帧间预测编码作为消除图像序列帧间相关性的主要手段之一,在视频图像编码方法中占有很重要的地位。帧间预测编码一般是针对图像块的预测编码,它采用的技术有帧重复法、阈值法、帧内插法、运动补偿法和自适应交替帧内/帧间编码法等,其中运动补偿预测编码现已被各种视频图像编码标准采用,得到了很好的结果。这类图像编码方法的主要缺点在于对图像序列不同的区域,预测性能不一样,特别是在快运动区,预测效率较差。
  预测编码的关键在于预测算法的选取,这与图像信号的概率分布很有关系,实际中常根据大傲的统计结果,采用简化的概率分布形式来设计最佳的预测器,有时还使用自适应预测器以较好地刻画图像信号的局部特性,提高预测效率。
  ②变换编码
  与预测编码技术相比,消除图像数据空间相关性的一种更有效的方法是进行信号变换。变换编码通常是将空间域相关的像素点通过正交变换映射到另一个频域上,使变换后的系数之间的相关性降低。在变换后的频域上应满足:所有的系数相互独立;能量集中于少数几个系数上;这些系数集中于一个最小的区域内。尽管图像变换本身并不带来数据压缩,但由于变换后系数之间相关性明显降低,图像的大部分能量只集中到少数几个变换系数上。采用适当的横化和熵编码可以有效地压缩图像的数据量。而且图像经某些变换后.系数的空间分布和频率特性有可能与人眼的视觉特性匹配,因此可以利用人类视觉系统的生理和心理特点来得到较好的编码系统。
  K-L变换是在以上思路下构造出来的最佳线性变换方案。它是用数据本身的相关矩阵对角化后构成的。这种变换将产生完全不相关的变换系数。K-L变换虽然是均方误差准则下的最佳变换,但在实际编码工作中,人们更常采用离散余弦(DCT:Discrete Cosine Transform)变换。对大多数图像信源来说,DCT变换是在现行变换编码方法中,最接近K-L变换的方法。
  对变换后图像系数的编码一般采用门限编码加区域编码的形式。以DCT变换为例,根据变换系数的能虽分布,可以将图像划分为不同的区域,其中变换后幅值较大的围像系数大多集中于图像块的左上角。与其他系数相比,这些低频系数具有的能量最大,包括了图像的大部分内容,在变换图像中的地位最重要,应使它们的量化误差最小。同样,对于图像块的其他区域,也应采用与该K域相配的景化和编码形式。这种按能量分布对不同区域采用不同量化编码的技术就称为区域编码。另一方面,变换图像中有许多系数的幅度很小,只具有原图像中很小比例的能量,对图像质量影响甚微,因此一般采用设定阈值的方法,置小于阈值的变换系数为零,从而大大提髙编码效率。经门限和区域编码后,变换图像的大部分系数为零,如何采用有效的方法将非零系数和零系数组织起来,在带来最少冗余的同时保证最大的连零系数出现概率,是变换图像编码中的又一关键问题。在DCT图像编码方法中,对变换系数进行Zig-Zag排序非常巧妙地解决了这一问题,但对有些图像变换方法,这种技术并非最佳方案。
  在一般图像中,对应边缘轮廓的位置附近含有大量高频信息,它们相对干原图像是非常局部的,代表了图像数据的精细结构。按人眼的视觉特性,这些边缘轮廓信息对于图像的主观质量很重要,在编码时应给予特别考虑。然而由于传统的正交变换时频局域性很差,变换后的系数失去了对原图像精细结构的描述,从变换图像得不到图像边缘轮廓等局部信息,W此在量化编码时无法采用特殊的方法。而且在传统的变换图像编码方法中,大多是靠丢弃高频系数来提髙压缩比的,从而导致图像的边缘轮廓模糊,严重影响复原图像的主观质量,这是传统变换编码方法的缺点之一。传统变换编码方法的另.缺点是提高编码压缩比时会出现块效应。这是因为为降低变换算法的运算复杂度和提髙编码效率,传统图像变换均采用了分块变换技术。图像块大,相关性就高,压缩比也就大。但是块的尺寸太大又会丢失数据的平稳性,从而引人误差,包括失去高频细节、引人沿物体边界的噪声和可见的DCT图块边界。实验证明,块大小为16X16或8X8是较好的选择。
  要实现一个实用的变换编码系统,需要四个步骤第一步是选择变换类型,CT变换是得到最广泛应用的一种类型;第二步是选择方块的大小,较好的方块尺寸是8X8或16X16;第三步是选择变换系数,并对其进行高效的量化,以便传输或存储;第四步是对量化系数进行比特分配,通常使用Huffman编码或游程编码。
  ③具有运动补偿的帧间预测编码
  在图像传输技术中,活动图像(特别是电视图像)是被关注的主要对象。活动图像是由时间上以帧周期为间隔的连续图像帧组成的时间图像序列,它在时间上比在空间上具有更大的相关性。消除活动序列图像在时间上的冗余度是图像压缩编码的一个重要途径。与消除图像中相邻像素间的空间冗余度一样,消除序列图像在时间上的相关性也可采用预测编码的方法,即不直接传送当前帧的像素值,而是传送当前帧的像素值和其前一帧或后一帧的对应像素X之间的差值,这称为帧间预测。当图像中存在着运动物体时,简单的预测不能收到好的效果。例如,在图2.3中,当前帧与前一帧的背景完全一样,只是小球平移了一个位S,如果简单地以A-1帧像素值作为A帧的预测值,则在实线和虚线所示的圆内的预测误差都不为零。如果巳经知道了小球运动的方向和速度,可以从小球在A-1帧的位置推算出它在A帧中的位置,而背景图像(不考虑被遮挡的部分)仍以前一帧的背景代替,将这种考虑了小球位移的A-1帧图像作为A帧的预测值,就比简单的预测准确得多,从而可以达到更高的数据压缩比。这种预测方法称为具有运动补偿的帧间预测。

  具有运动补偿的帧间预测编码是视频压缩的关键技术之一,它包括以下儿个步骤:首先,将图像分解成相对静止的背景和若干运动的物体,各个物体可能有不同的位移,但构成每个物体的所有像素的位移相同,通过运动估值得到每个物体的位移矢量;然后,利用位移矢量计算经运动补偿后的预测值;最后对预测误差进行量化、编码、传输,同时将位移矢量和图像分解方式等信息送到接收端。
  ④具有运动补偿的帧间内插编码
  在具有运动补偿的预测编码系统中,利用了活动图像帧间信息的相关性,通过对相邻顿图像的预测误差进行编码而达到压缩数据的0的。运动补偿技术的引人,大大提高了预测楮度,使传输每一帧图像的平均数据。量进一步降低。在此系统中,图像的传输帧率并没有变化,仍与编码前的帧率一样。然而在某些应用场合,如可视电话、会议电视等,对图像传输帧率的要求可适.当降低,这就为另外一种活动图像压缩编码方法一一帧间内插——提供了可能。活动图像的帧间内插编码是在系统发送端每隔一段时间丢弃一帧或几帧图像,而在接收端再利用图像的帧间相关性将丢弃的帧通过内插恢复出来,以防止帧率下降引起闪烁和动作的不连续。
  在帧间预测中引人运动补偿的目的是为了减少预测误差,从而提高编码效率。运动估值的不准确会使预测误差加大,从而使传输的数据率上升,但接收端据此位移矢最和预测误差解码不会引起图像质量下降;而在帧间内插中引人运动补偿的目的,是使恢复的内插帧中的运动物体不致因为内插而引起太大的图像质量F降。这是由于在丢弃帧内没有传送任何信息,要确定运动物体在丢弃帧中的位置必须知道该物体的运动速度。运动估值的不准确,将导致内插出来的丢弃帧图像失真。另外,在帧间内插中的位移估值一般要对运动区的每一个像素进行,而不是对一个子块;否则,内插同样会引起运动物体边界的模糊。因此.在帧间内插中较多使用能够给出单个像素位移矢懂的像素递归法。
  除了上述介绍的几种目前应用最为广泛的压缩编码方法外,矢贵晕化编码、子带编码、小波变换、分层编码、分形编码、模型编码等均是近年来研究十分活跃的编码方法。

返回目录:通信工程师设备环境考试通信业务汇总

相关汇总推荐:

通信专业实务互联网技术数据通信基础教程

通信专业实务考试设备与环境教程汇总

设备环境考试培训通信接地与防雷汇总

通信电源系统的维护与测试汇总

更多资料
更多课程
更多真题
温馨提示:因考试政策、内容不断变化与调整,本网站提供的以上信息仅供参考,如有异议,请考生以权威部门公布的内容为准!

通信工程师备考资料免费领取

去领取

距离2025 通信工程师考试

还有
  • 0
  • 5
  • 2
专注在线职业教育24年

信息系统项目管理师

信息系统项目管理师

!
咨询在线老师!