Page 177 - 公共安全18年12月刊_150dpi
P. 177
获得高效压缩。图像频率反映了像素灰度在空间中变 设置若干个 ROI 感兴趣区域,ROI 编码率可调。
化的情况,是灰度在平面空间上的梯度。一般来说,图 动态跟踪智能编码
像的低频部分描述了图像的整体形状,图像的高频部 智能网络摄像机支持脸部等目标识别,通过动态
分描述了图像的细节。常见的变换编码算法有 K-L 变 跟踪目标,对该动态 ROI 区域进行重点编码。很多情
换、离散余弦变换(DCT)、离散傅里叶变换、小波变换等。 况下,感兴趣区域就是人眼所关注的区域。人眼具有从
量化编码 一张图像中快速定位显著性区域,并过滤掉次要的信
量化编码分为标量量化和矢量量化。标量量化是 息,提取有用信息并传输给大脑进行处理的能力机制,
最基本的有损编码,通过将信源映射成码字表中的码 这一机制被称为人眼视觉注意机制。
字来达到压缩目的;标量量化又分为均匀量化、非均匀 人类的视觉系统对周围环境的感知机制分为两种:
量化和自适应量化。矢量量化是一次量化多个样本点 一是自底向上的视觉注意机制,这种机制受视觉刺激,
的量化方法,即将输入数据几个一组地分成许多组,成 与任务无关;二是自顶向下的视觉注意机制,这种机制
组的进行量化编码。 受意识驱动,与任务相关 。人眼视觉注意机制的研究
熵编码 方向包括图像显著性区域检测和目标检测等 ,其中图
熵编码即编码过程中按熵原理不丢失任何信息的 像的显著性区域检测就是模拟实现上述两种视觉注意
编码。信息熵为信源的平均信息量(不确定性的度量)。 机制。图像的显著性区域检测包括图像压缩 、图像分
常见的熵编码有:香农 (Shannon) 编码、哈夫曼 (Huffman) 割 、图像检索等图像处理任务。
编码和算术编码 (arithmetic coding)。在视频编码中, 图像显著性区域检测方法大多依据自底向上的人
熵编码把一系列用来表示视频序列的元素符号转变为 眼视觉注意机制,该机制主要受到图像的低级对比特
一个用来传输或是存储的压缩码流。 征的刺激作用产生。简而言之,如果图像中某一位置在
当前主流视频编解码标准有:MJPEG、MPEG-4、 亮度和色彩等方面与其周围区域存在较大的差别,则
H.264、SVAC、H.265。 这一区域最有可能引起人眼的视觉注意 。根据这一事
实,传统显著性检测模型采用各种数学建模方法建立
基于人眼视觉关注点的感兴趣区域编码 数学模型,对图像的所在位置与其周围区域进行数据
视频画面中,有些区域不会被特别关注,例如天空、 对比计算,将各种对比结果数据(差异性)进行整合处
墙壁、草地等。对整个区域进行视频编码并传输,会给 理,得到最终的显著图。
网络 带宽和视频存储带来巨大压力。ROI(Region of 这些年自顶向下的注意机制成为了研究热点,该
Interest)感兴趣区域编码可以通过智能或人工的选择 机制是受到图像中的语义特征对人的意识驱动作用产
画面中感兴趣的区域,重点进行高质量甚至无损地编码, 生。图像中的文字、人脸、动植物等富含语义信息的目
而对其他区域降低其码率和图像质量,进行标准清晰 标通常会引起人们的视觉注意,这些语义目标便是自
度的视频压缩,甚至不传输该部分区域的视频,从而达 顶向下的视觉注意机制的具体体现。近些年,先进的图
到节省网络带宽的占用和视频的存储空间。目前,ROI 像显著性区域检测模型开始模拟实现自顶向下的人眼
智能视频编码技术包括:固定区域和动态跟踪两类。 视觉注意模型,使用各种高级特征用于显著性区域检
固定区域智能编码 测,例如在其检测模型中加入了人脸、文本、动物和汽
用户可以用鼠标在监控画面中选择多个 ROI 感 车等目标的高级特征。然而图像中的这些富含语义的目
兴趣区域进行智能编码。如在 H.265 网络摄像机中 标特征提取和识别是一个复杂而困难的问题,目前基
2019第四届深圳国际无人机展览会(2019.6.20-22 深圳会展中心) www.china-drone.com.cn 155
భခඌ JOEE ྒ௹ؽ