ADV601为成本、图像质量和灵活性设定标准-电子发烧友网

Alex Zatsman, Mark Rossman, Rich Greene, Will Hooper, Phil Halmark, Bill Valentine, 和 David Skolnick

ADV601是一款低成本、单芯片、全数字、专用功能CMOS VLSI芯片，用于实时压缩和解压缩数字视频信号。它可以支持高达 350：1 的压缩率，对自然图像进行基本上无损的 4：1 压缩。ADV601支持所有常见的隔行扫描视频格式（见表1）。该器件针对要求以低成本实时压缩的视频应用进行了优化，并具有广播级质量的应用，如非线性视频编辑、视频捕获系统、远程闭路电视监控、便携式摄像机、高质量电话会议和视频分发系统、视频插入设备、图像和视频存档系统以及数字录像带。除压缩和解压缩外，ADV601的子带编码架构还提供视频缩放和空间滤波的固有支持。

表 1.ADV601 场速率和尺寸

标准	活动区域		场速率	像素率
	水平	垂直	（赫兹）	（兆赫）
CCIR-601/525	720	243	59.94	13.50
CCIR-601/625	720	288	50.00	13.50
平方像素/525	640	243	59.94	12.27
平方像素/625	768	288	50.00	14.75

由于具有里程碑意义的标准已经以JPEG，H.261，MPEG 1和MPEG 2的形式存在，我们是否需要新的压缩范式？简而言之，是的。在许多封闭系统应用中，成本、图像质量和灵活性比互操作性（标准的优势）更重要。对于不需要互操作性的应用程序，压缩解决方案的选择应由这些因素的评估以及对称性（编码（压缩）和解码（解压缩）的低成本和复杂性来驱动。以下对小波压缩及其在ADV601中的作用的概述应该有助于理解它可以为视频压缩应用带来的价值。

图1

图1显示，在编码模式下，ADV601通过其视频接口接受分量数字视频，并通过主机接口输出压缩比特流。在解码模式下，情况正好相反：ADV601在其主机接口上将压缩的比特流转换为视频接口上的分量数字视频。主机可通过主机接口访问ADV601的所有控制和状态寄存器。

ADV601编解码器的压缩算法基于双正交小波变换，由7抽头高通和9抽头低通滤波器组成，并实现与场无关的子带编码。子带编码器将二维空间视频数据转换为空间频率滤波子带。然后使用可调量化和熵编码过程来提供压缩（见图2）。

图2

ADV601基于小波理论，小波理论是一种新的数学工具，在1980年代中期Morlet和Grossman的地球物理学著作中首次明确引入。[1]这一理论很快在理论物理和应用数学中流行起来;80年代末和90年代，小波在信号和图像处理中的应用急剧增长。[2,3,4,5]

了解小波内核是理解小波在视频应用中的优势的关键。设备的这一部分包含滤波器和抽取器，可在水平和垂直方向上处理图像。滤波器基于精心挑选的分段小波基函数，如图 3 所示。这些基函数具有 3 个主要优点：与傅里叶变换的正弦波相比，它们与图像的宽带性质的相关性更好;ADV601可以通过简单、紧凑的7抽头和9抽头FIR滤波器（低成本硅的关键）实现这些功能;这些功能提供全图像过滤，从而消除压缩图像中出现的块状伪影，当图像被分解成更小的区域进行单独压缩时（在某些应用程序中，JPEG 和 MPEG* 都可能受到此伪影的影响）。

图3

*压缩基于联合图像专家组和电影专家组的标准。

滤波树涉及二维（x 和 y）数据的连续高通和低通滤波，每一步抽取 2（图 4a），从而产生连续更小的数据块，组合在 Mallat 图（4b）中。所有三个组件（例如，Y，Cb，Cr）的彩色视频信号场交替通过过滤器树，以创建总共42个新图像（14个代表Y，14个代表Cr，C 为 14b).

图 4a

图 4b

图 5 显示了变换对黑白图像（仅亮度）执行的操作示例。在这种情况下，ADI 公司总部映像已转换为14个新映像，每个映像包含有关原始映像的不同信息集。人们可以清楚地看到块A中高通x滤波产生的垂直边缘，块D中高通y滤波产生的水平边缘，以及块N中抽取和低通滤波产生的缩小尺寸的原始图像。用于描述显示的 14 个块的数据点总数与原始图像中使用的数据点总数相同。.但是现在图像已经转换，我们可以做一些有用的事情：1）实现几乎无损的压缩，2）以恒定质量或恒定比特率实现有损压缩，3）在没有计算开销的情况下创建高质量的缩放图像，以及4）创建容错的压缩位流，因为每个块都包含有关整个图像的信息。

图 5b

图6显示了在无损模式下使用ADV601的方案。在这种情况下，42 个转换后的块被发送到 2 种类型的无损熵编码器。熵编码器受益于在转换后的块中发现的相关性增加。在这种操作模式下，压缩性能与原始的复杂程度有关。如果原始图像是简单的斜坡，则除左上角最小的块（N）外，所有块都将包含零。这将产生超过 300：1 的无损压缩（对于每秒 0 场的 5：4：2 编码 CCIR2 分辨率视频，需要不到 601.60M 位/秒）。但是，如果图像是白噪声，则没有相关机会，并且压缩必须接近1：1（需要大约168M位/秒）。在典型的真实视频应用中，压缩范围从 2：1 （84Mb/s）到 5：1 （16Mb/s），具体取决于每个场的复杂性。在需要近乎无损压缩的应用中，如果允许比特率大幅波动，ADV601可以在此模式下使用。

图6

图7显示了如何在有损压缩模式下使用ADV601。在转换图像时，将提取所有 42 个块的一组统计信息，包括每个块的平方和（或能量）、最小像素值和最大像素值。这些信息进入量化器，并与人类视觉模型耦合，该模型将每个块的重要性与人类视觉系统联系起来。量化器算法获取所有这些信息，加上用户编程的比特率，并为每个字段计算 42 个值“箱宽度”;它们可以被认为是每个块的精度预算。当轻微量化（即许多小量子）时，这个数字会很大。重量化（很少有大量子）导致数量少得多。下面有两个示例来帮助说明其工作原理。实际量化器位于ADV601上，但主机或外部DSP执行箱宽计算。

Figure 7

第一种情况是高质量的应用程序，需要视觉无损压缩，同时保持准确的比特率。在这种情况下，所有低频段（较小的块）都将被赋予最大的箱宽，以确保完美的重建。根据图像的复杂性，高频带（最大的块）将获得可以分配的尽可能多的箱宽度。在这种情况下，为了保持所需的比特率，会放弃少量的高频信息精度。这并不构成一个难题，因为人类视觉系统无法将高空间频率分辨到与低空间频率相同的水平。已经表明，人眼无法检测到具有光量化的频率块（即使使用广播级质量的视频播放设备也是如此）。

在第二种情况下，需要极高的压缩率（超过 100 比 1）。这意味着必须消除每个字段中99%的位！在这里，只有最小的块才能获得较大的箱宽。剩余的位预算散布在其余块上，由箱宽分配器确定。仅基于每个字段中的信息的典型压缩方案通常在高压缩时失败;因此，ADV601保持图像相关信息的能力非常出色。当该算法以350：1的足球序列进行测试时，可以清楚地识别动作，甚至可以读取球员制服上的数字。如此高的压缩比下的视频质量并不适合所有应用，但对于视频序列识别和监控来说绰绰有余。

那么，当压缩比太高而无法准确渲染图像时，使用小波的伪像是什么样子的呢？随着压缩比的增加，越来越多的噪声被注入高空间频率;由于描述高频的精度较低，这些频段的噪声会增加。因此，小波视频压缩会像传统的广播模拟视频一样降低。虽然视频中的伪像从来都不令人愉悦，但人类已经高度习惯于接受这种类型的伪影。由于ADV601允许控制每个子频段的增益，因此可以通过使图像“柔和”来降低噪声。大多数其他压缩方案将图像分解为更小的块，每个块都单独处理。随着压缩的增加，出现的第一个伪影是放置在图像顶部的块的固定网格。人们普遍认为，这种阻塞伪像比高频噪声或图像柔化更能引起人类视觉系统的反感。

图8

图8是ADV601的功能框图，图9显示了如何在典型的基于主机的ADV601应用中使用它。ADV601视频接口设计用于所有常用的模拟视频解码器和编码器，包括ADI公司、飞利浦、布鲁克特里和雷神公司的解码器和编码器。视频接口还能够直接连接到所有符合CCIR656标准的并行设备（也称为“D1”）。表1显示了ADV601支持的场速率和镜像尺寸。DRAM管理器为256Kx16快速页面模式DRAM提供无胶合接口，这是在编码和解码模式下支持ADV601所必需的。通用主机接口的宽度可配置为 8 位、16 位和 32 位。主机接口还包括一个 512x32 位 FIFO，有助于实现压缩视频数据的流畅传输。