著录项信息
专利名称 | 视频编码方法 |
申请号 | CN00802445.6 | 申请日期 | 2000-10-23 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2002-02-13 | 公开/公告号 | CN1336080 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 皇家菲利浦电子有限公司 | 申请人地址 | 荷兰艾恩***
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 皇家菲利浦电子有限公司 | 当前权利人 | 皇家菲利浦电子有限公司 |
发明人 | D·斯诺克 |
代理机构 | 中国专利代理(香港)有限公司 | 代理人 | 陈景峻 |
摘要
MPEG-4标准描述了四个预测模式:一个直接预测模式、一个双向预测模式、一个正向预测模式,和一个反向预测模式。这些模式可以用于根据一个过去基准帧和一个未来基准帧编码一个数据块。因此,为了编码一个给定数据块,本发明提供一个有益的策略,实现在这四个可能模式中一个良好的自适应预测模式的选择。该建议的策略操作倾向直接模式,并且给出当使用此具体预测模式时将要被满足的判据。
1.一种图像序列的编码方法,每一图像被分区成非重叠的像素数据块,针对 属于在一个过去基准帧P0和一个未来基准帧P2的基础上编码的一个图像P1的一 个数据块Y,以下称作将要被编码的数据块,本方法至少包括步骤:
根据所述过去基准帧和在所述过去基准帧中的一个相应的最佳预测数据块 X,针对在未来基准帧中的与将要被编码的所述数据块位置相同的一个数据块 Z而得出一个最佳运动矢量MV;
-得到在所述未来基准帧中的具有与将要被编码的数据块相同位置的数据 块和在所述过去基准帧中的最佳预测数据块之间的差的绝对值的取和,以下称 作SADref;
-根据所述最佳运动矢量和在所述过去基准帧中的一个相应的正向预测数 据块W,得出针对所述将要被编码的数据块的一个正向运动矢量MVf;
-得到在所述将要被编码的数据块和所述正向预测数据块之间的差的绝对 值的取和,以下称作SADf;
-根据所述最佳运动矢量和在所述未来基准帧中的一个相应的反向预测数 据块V,得出针对所述将要被编码的数据块的一个反向运动矢量MVb;
-得到在所述将要被编码的数据块和所述反向预测数据块之间的差的绝对 值的取和,以下称作SADb;
-如果下列条件之一被满足,则根据一个直接预测模式编码所述将要被编 码的数据块:
-所述最佳运动矢量的空间坐标是在一个给定范围I之内;
-SADref朝着SADb的偏移小于一个给定阈值;
-SADref朝着SADf的偏移小于一个给定阈值。
2.按照权利要求1中所述的一种编码方法,其中,当所述最后步骤的条件没有 任何一个被满足时,本方法至少进一步包括步骤:
-得到在将要被编码的数据块和所述过去基准帧数据块之间的差的绝对值 的取和的最小值,此最小值被称作SADfwd,并且所述过去基准帧的相应的数据 块被称作正向基准数据块;
-得到在将要被编码的数据块和所述未来基准帧数据块之间的差的绝对值 的取和的最小值此最小值被称作SADback,并且所述未来基准帧的相应的数据 块被称作反向基准数据块;
-得到在将要被编码的数据块和所述未来基准数据块与所述过去基准数据 块的平均数据块之间的差的绝对值的取和,此差的绝对值的取和被称作SADbidir ;
-当SADfwd既低于SADback又低于SADbidir时,根据一个正向预测模式编 码将要被编码的数据块;
-当SADback既低于SADfwd又低于SADbidir时,根据一个反向预测模式编 码将要被编码的数据块;
-当SADbidir既低于SADback又低于SADfwd时,根据一个正向预测模式编 码将要被编码的数据块。
技术领域
本发明涉及一个图像序列的编码方法,每一图像被分区成非重叠的像素数 据块。
本发明还涉及用于执行这种方法的一个滤波装置。
背景技术
国际标准化组织已经在MPEG-4标准中定义了涉及交互性多媒体应用装置 将要满足的要求。首先此标准把视频目标平面(VOP)的一个概念定义为可从 该比特数据流直接访问的一个实体。VOP可被是一个基本的图形或一个声频基 元。因此,一个图像的编码包括出现于该图像中的VOP的后续编码。
图像的序列可以包括I帧、P-帧和B-帧。I-帧被根据一个帧内模式编码,使 用在该图像之内的空间冗余度而不参考任何其它帧。除了涉及一个I-图像的空 间冗余度之外,P帧的编码还使用P-图像和先前图像之间的暂态冗余度作为一个 图像基准,其先前图像主要是先前的I或P-图像。一个B图像具有两个暂态基准, 并且通常被从已经编码并且重建的一个在前的P或I-图像以及随后的I或P-图像 预测编码而得。
MPEG-4标准限定了根据一个过去基准帧和一个未来基准帧编码一个图像 的四个预测模式。第一预测模式是直接编码。此预测模式使用从H.263获得的 双向运动补偿方案,其采用针对未来基准帧的宏数据块而得到的运动矢量,并 且将它们定标以便得到针对在所说将被编码图像中的数据块的正向和反向运动 矢量。第二预测模式是正向模式,其使用与MPEG-1/2中同样的正向运动补偿, 其差别在于用于预测的是一个VOP而不是一个图像。第三预测模式是反向编 码,其使用与MPEG-1/2中同样的反向运动补偿,其差别在于用于预测的是一 个VOP而不是一个图像。最后预测模式是双向编码,其使用与MPEG-1/2中同 样的内插运动补偿,其差别在一个VOP被用于预测而不是使用一个图像。
1998年2月1日的MPEG-4视频确认模式版本10.0 ISO/IEC JTCI/SC29/WG1 1公开了一种策略,用于在编码一个B-VOP的四个可能模式当中判定一个具体 的预测模式。针对一个B-数据块,该预测误差的估计,在此文献中的差的绝对值 的取和,针对四个预测模式得出,并且选择给出该最小SAD的预测模式用于该B- 数据块的编码。此建议的策略具有的主要缺点是非常多的计算。
发明内容
因此本发明的一个目的是提供一种更有效的编码方法,给出在速度和编码 质量之间的有益取舍。
为此目的,本发明提供了一种图像序列的编码方法,每一图像被分区成非 重叠的像素数据块,针对属于在一个过去基准帧P0和一个未来基准帧P2的基础 上编码的一个图像P1的一个数据块Y,以下称作将要被编码的数据块,本方法至少 包括步骤:
根据所述过去基准帧和在所述过去基准帧中的一个相应的最佳预测数据块 X,针对在未来基准帧中的与将要被编码的所述数据块位置相同的一个数据块 Z而得出一个最佳运动矢量MV;
-得到在所述未来基准帧中的具有与将要被编码的数据块相同位置的数据 块和在所述过去基准帧中的最佳预测数据块之间的差的绝对值的取和,以下称 作SADref;
-根据所述最佳运动矢量和在所述过去基准帧中的一个相应的正向预测数 据块W,得出针对所述将要被编码的数据块的一个正向运动矢量MVf;
-得到在所述将要被编码的数据块和所述正向预测数据块之间的差的绝对 值的取和,以下称作SADf;
-根据所述最佳运动矢量和在所述未来基准帧中的一个相应的反向预测数 据块V,得出针对所述将要被编码的数据块的一个反向运动矢量MVb;
-得到在所述将要被编码的数据块和所述反向预测数据块之间的差的绝对 值的取和,以下称作SADb;
-如果下列条件之一被满足,则根据一个直接预测模式编码所述将要被编 码的数据块:
-所述最佳运动矢量的空间坐标是在一个给定范围I之内;
-SADref朝着SADb的偏移小于一个给定阈值;
-SADref朝着SADf的偏移小于一个给定阈值。
在有效时,这种方法有利于直接预测模式,使得当可能时避免该正向、反 向和双向预测的计算。与已有技术建议的一个方法比较,当选择直接模式时,不 需要在先的与该直接模式相关的差的绝对值的取和计算,该计算是非常大的计 算。由于计算代价的降低,本发明的优点是在确定的一个适应预测模式的处理中 的更高的速度。
附图说明
现将参照下文描述的实施例和有关附图说明本发明的具体方面,其中:
图1示出根据本发明的一个方法的各个步骤,
图2描述一个宏数据块的直接预测。
具体实施方式
在下面段落中可能出现单词″数据块″的误用。当读出数据块时,应该理解是 宏数据块,如ITU标准中定义的那样。
根据本发明的编码方法在图1中给出。让我们考虑一个图像的序列。可以 根据一个过去基准图像P0并且根据一个未来基准图像P2编码一个图像P1,例如 图2中描述的那样。P0最好是一个I或P-图像,而P2最好是一个I或P-图像。为了 编码的目的,每一图像还被分区成非重叠的像素数据块,并且一个VOP的编码包 括覆盖该VOP的数据块的编码。图1中给出的本方法是针对预测模式的选择的 一个策略,被使用在图像P1的数据块Y的编码中。本发明的一个实施例中的数 据块Y是16×16的大小。
图1中的方法的第一步骤1包括根据过去帧P0执行对于具有与数据块Y相同 位置的在未来基准帧P2中的数据块Z的一个运动补偿。为此目的,得到用于B-数 据块的最佳运动矢量MV。可以通过最小化方程式(1)中给出的一个函数SAD(差 的绝对值的取和)得到此矢量MV:
其中Vi,j(m,n)表示在空间的位置(ij)的16×16数据块Y的第(m,n)像素,并 且Bi-u,j-v(m,n)表示在空间位置(ij)的、由该矢量(u,v)移动的过去基准图像P0中 的一个选择宏数据块的第(m,n)像素。最佳运动矢量MV是在给定最小SAD(下文 称作SADrfe)的P0-帧中的数据块Z和候选宏数据块-数据块X之间的位移(u,v)。
第二步骤2包括:根据在先前步骤1中得到的最佳运动矢量MV得出一个非 精化正向运动矢量MVf以及得出一个非精化反向运动矢量MVb。运动矢量MV f和MVb的计算以方程式(2)所示的具有零精度矢量MVd的标准MPEG-4给出:
MVf=(TRb×MV)/TRd
MVb=((TRb-TRd)×MV)/TRd (2)
MVb=MVf-MV
其中TRb是在来自过去基准帧P0的帧P1的暂态基准中的增量,而TRd是在来 自过去基准帧P0的未来基准帧P2的暂态基准中的增量。这些数据块Y相关的非 精化运动矢量MVf、MVb定义了在过去基准帧P0和未来基准帧P2中的对应数据 块,下文中分别称作帧P0的数据块W和帧P2的数据块V。
随后在步骤3中得到数据块Y和数据块W之间的差的绝对值的取和,下文称 作SADf,以及得到数据块Y和数据块V之间的差的绝对值的取和,下文称作SAD b。
在根据本发明方法的步骤4、5和6中,在每一步骤中表明一个条件,允许 确定是否该直接预测模式必须使用在数据块Y的编码中。根据本发明,如在下 文详细说明的那样,当满足在步骤4、5、6中限定条件的至少一个条件时,该 数据块Y在步骤10中必定被直接编码。
首先在步骤4中表明相关该运动矢量MV的空间坐标值的状态。的确,当运 动矢量MV的空间坐标位于给出范围I之内时,数据块Y将应在步骤10中直接编 码。在本发明的一个实施例中,运动矢量MV的空间坐标必须处在半象素单元 中的范围[-2;2]中。结果是,此判据保证在帧P0、P1和P2之间的低移动,并且由 于如在标准MPEG-4中说明的那样通过一个矢量MVd精炼的可能性还保证该直 接预测模式将提供针对该数据块Y的一个良好的预测。当此第一判据不被满足 时,在步骤5和6中说明附加条件。
在步骤5以及步骤6中,一方面根据帧P0和P1分别表明涉及在该数据块Y非精 化正向和反向运动估计之间的一致性的一个状态,并且另一方面根据该帧P0表明 涉及该数据块Z的运动估计的一个状态。在该步骤5中,得到SADb和SADref之间 的偏移,并且当该偏移的绝对值小于一个给定阈值T1时,数据块Y将应在步骤10 中直接编码。否则,在步骤6中,得到SADF和SADref之间的偏移,并且当该偏移 的绝对值小于一个给定阈值T2时,该数据块Y将应在步骤10中直接编码。在本 发明的一个实施例中,阈值T1和T2是相同的。在本发明的一个实施例中,步骤6是 在步骤5之前执行的。步骤5和6允许给出直接编码的的品质估计。的确,根据帧 P0预先获得SADref作为提供数据块Z的最佳预测的差的绝对值的取和。因此,考 虑到SADf或SADb不朝着SADref的方向偏离太多将保证该直接预测模式用于该 数据块Y的编码实现优质的预测,或至少几乎是与以SADref针对该数据块Z获得 的预测一样好。
在本发明的一个最佳实施例中,例如图1中描述的方法包括附加步骤,由于 上述条件当中谁都不被满足,当该直接传输方式已经在步骤4中被拒绝时,附加 步骤允许确定在正向、反向和双向中选择哪个预测模式用于该数据块Y的编 码。为此目的,在未来基准帧P2的基础上数据块Y的反向运动估计在步骤7中被 执行。此运动估计包括使用方程式(1)得出在属于帧P2的数据块Y和候选宏数据 块之间的函数SAD的最小值。该最小值在下文称作SADback。该值SADback定 义了帧P2的一个候选宏数据块A和与数据块Y的反向预测相关的差的绝对值 的取和。以同样方式,还根据过去基准帧P0执行该数据块Y的正向估计而产生在 属于帧P0的数据块Y和候选宏数据块B之间的最小SAD,下文称作SADfwd。SA Dfwd是与数据块Y的正向预测相关的差的绝对值的取和。另外,还得到宏数据 块A和B的平均值以及得到差的绝对值的取和作为SADbidir。SADbidir是与数据 块Y的双向预测相关的差的绝对值的取和。SADfwd、SADback以及SADbidir 分别表示从数据块Y的正向、反向以及双向预测产生的误差。在本发明的最佳 实施例中,根据给出最小误差的预测模式编码该数据块Y。
因此,在步骤7中,把三个值SADfwd、SADback和SADbidir与它们的最小 值SADmin比较。在步骤8中,如果SADbidir等于SADmin,数据块Y遵循双向预测 模式在步骤11中编码。在步骤9中,如果SADbidir等于SADmin,数据块Y遵循正 向预测模式在步骤12中编码。在步骤8中,如果SADbidir等于SADmin,数据块Y遵 循反向预测模式在步骤13中编码。
图像的序列可以包括连续的I、P-帧和B-帧。这种图像的一个序列可以编 码如下。首先该I-帧遵循一个帧内模式编码,随后P-帧参照I-帧编码,最终该B-帧 参照过去的I-帧以及未来P-帧编码。由于P-帧的编码在B-帧的编码之前执行,所 以在B-帧的编码阶段,已经可根据过去的I-帧得到P-帧的数据块的运动补偿的相 关参数。因此,在根据本发明的一个方法中,要参照一个过去基准帧P0和一个未 来基准帧P2编码的一个帧PI将在帧P0的编码和帧P2的编码之后而被编码。结果 是,正象图1中描述的编码方法那样,最佳运动矢量MV和步骤1描述的过去基准帧 P2的运动估计给出的误差SADref能够从帧P2的在先编码提取。根据本发明的 这种方法不意味高的CPU代价。
注意,有关该描述编码方法可能在不背离本发明的范围的条件下建议改进 或改善。例如,此编码方法显然能够被以几个方式实现,例如借助于有线电子电 路,或也可以借助于存储在计算机可读介质中的一组指令实现,所说的指令至少 替代一部分所说的电路并且可在一个计算机或一个数字处理器的控制下执行,以 便执行所说的被替代电路中实行的相同的功能。本发明还涉及包括一个软件模 块的一个计算机可读介质,该软件模块包括计算机可执行指令,用于执行该描 述方法的步骤或某些步骤。图1的框既表示根据本发明的一个方法又表示用于 执行这种步骤的编码装置总体的一个处理电路。
法律信息
- 2007-12-19
专利权的终止未缴年费专利权终止
专利权的终止未缴年费专利权终止
- 2004-12-29
- 2002-02-13
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |