Page 177 - 公共安全18年12月刊

Page 177 - 公共安全18年12月刊_150dpi

P. 177

获得高效压缩。图像频率反映了像素灰度在空间中变设置若干个 ROI 感兴趣区域，ROI 编码率可调。
化的情况，是灰度在平面空间上的梯度。一般来说，图动态跟踪智能编码
像的低频部分描述了图像的整体形状，图像的高频部智能网络摄像机支持脸部等目标识别，通过动态
分描述了图像的细节。常见的变换编码算法有 K-L 变跟踪目标，对该动态 ROI 区域进行重点编码。很多情
换、离散余弦变换（DCT）、离散傅里叶变换、小波变换等。况下，感兴趣区域就是人眼所关注的区域。人眼具有从
量化编码一张图像中快速定位显著性区域，并过滤掉次要的信
量化编码分为标量量化和矢量量化。标量量化是息，提取有用信息并传输给大脑进行处理的能力机制，

最基本的有损编码，通过将信源映射成码字表中的码这一机制被称为人眼视觉注意机制。
字来达到压缩目的；标量量化又分为均匀量化、非均匀人类的视觉系统对周围环境的感知机制分为两种：
量化和自适应量化。矢量量化是一次量化多个样本点一是自底向上的视觉注意机制，这种机制受视觉刺激，
的量化方法，即将输入数据几个一组地分成许多组，成与任务无关；二是自顶向下的视觉注意机制，这种机制
组的进行量化编码。受意识驱动，与任务相关。人眼视觉注意机制的研究
熵编码方向包括图像显著性区域检测和目标检测等，其中图
熵编码即编码过程中按熵原理不丢失任何信息的像的显著性区域检测就是模拟实现上述两种视觉注意
编码。信息熵为信源的平均信息量（不确定性的度量）。机制。图像的显著性区域检测包括图像压缩、图像分
常见的熵编码有：香农 (Shannon) 编码、哈夫曼 (Huffman) 割、图像检索等图像处理任务。
编码和算术编码 (arithmetic coding)。在视频编码中，图像显著性区域检测方法大多依据自底向上的人
熵编码把一系列用来表示视频序列的元素符号转变为眼视觉注意机制，该机制主要受到图像的低级对比特
一个用来传输或是存储的压缩码流。征的刺激作用产生。简而言之，如果图像中某一位置在
当前主流视频编解码标准有：MJPEG、MPEG-4、亮度和色彩等方面与其周围区域存在较大的差别，则
H.264、SVAC、H.265。这一区域最有可能引起人眼的视觉注意。根据这一事

实，传统显著性检测模型采用各种数学建模方法建立
基于人眼视觉关注点的感兴趣区域编码数学模型，对图像的所在位置与其周围区域进行数据

视频画面中，有些区域不会被特别关注，例如天空、对比计算，将各种对比结果数据（差异性）进行整合处
墙壁、草地等。对整个区域进行视频编码并传输，会给理，得到最终的显著图。
网络带宽和视频存储带来巨大压力。ROI（Region of 这些年自顶向下的注意机制成为了研究热点，该
Interest）感兴趣区域编码可以通过智能或人工的选择机制是受到图像中的语义特征对人的意识驱动作用产
画面中感兴趣的区域，重点进行高质量甚至无损地编码，生。图像中的文字、人脸、动植物等富含语义信息的目
而对其他区域降低其码率和图像质量，进行标准清晰标通常会引起人们的视觉注意，这些语义目标便是自
度的视频压缩，甚至不传输该部分区域的视频，从而达顶向下的视觉注意机制的具体体现。近些年，先进的图
到节省网络带宽的占用和视频的存储空间。目前，ROI 像显著性区域检测模型开始模拟实现自顶向下的人眼
智能视频编码技术包括：固定区域和动态跟踪两类。视觉注意模型，使用各种高级特征用于显著性区域检
固定区域智能编码测，例如在其检测模型中加入了人脸、文本、动物和汽
用户可以用鼠标在监控画面中选择多个 ROI 感车等目标的高级特征。然而图像中的这些富含语义的目
兴趣区域进行智能编码。如在 H.265 网络摄像机中标特征提取和识别是一个复杂而困难的问题，目前基

2019第四届深圳国际无人机展览会（2019.6.20-22 深圳会展中心） www.china-drone.com.cn 155

భခ࠯ඌ JOEE ྒ௹ؽ

172 173 174 175 176 177 178 179 180 181 182