Page 177 - 公共安全18年12月刊_150dpi
P. 177

获得高效压缩。图像频率反映了像素灰度在空间中变                         设置若干个 ROI 感兴趣区域,ROI 编码率可调。
                     化的情况,是灰度在平面空间上的梯度。一般来说,图                        动态跟踪智能编码
                     像的低频部分描述了图像的整体形状,图像的高频部                            智能网络摄像机支持脸部等目标识别,通过动态
                     分描述了图像的细节。常见的变换编码算法有 K-L 变                      跟踪目标,对该动态 ROI 区域进行重点编码。很多情
                     换、离散余弦变换(DCT)、离散傅里叶变换、小波变换等。                    况下,感兴趣区域就是人眼所关注的区域。人眼具有从
                     量化编码                                            一张图像中快速定位显著性区域,并过滤掉次要的信
                         量化编码分为标量量化和矢量量化。标量量化是                       息,提取有用信息并传输给大脑进行处理的能力机制,

                     最基本的有损编码,通过将信源映射成码字表中的码                         这一机制被称为人眼视觉注意机制。
                     字来达到压缩目的;标量量化又分为均匀量化、非均匀                           人类的视觉系统对周围环境的感知机制分为两种:
                     量化和自适应量化。矢量量化是一次量化多个样本点                         一是自底向上的视觉注意机制,这种机制受视觉刺激,
                     的量化方法,即将输入数据几个一组地分成许多组,成                        与任务无关;二是自顶向下的视觉注意机制,这种机制
                     组的进行量化编码。                                       受意识驱动,与任务相关 。人眼视觉注意机制的研究
                     熵编码                                             方向包括图像显著性区域检测和目标检测等 ,其中图
                         熵编码即编码过程中按熵原理不丢失任何信息的                       像的显著性区域检测就是模拟实现上述两种视觉注意
                     编码。信息熵为信源的平均信息量(不确定性的度量)。                       机制。图像的显著性区域检测包括图像压缩 、图像分
                     常见的熵编码有:香农 (Shannon) 编码、哈夫曼 (Huffman)           割 、图像检索等图像处理任务。
                     编码和算术编码 (arithmetic coding)。在视频编码中,                图像显著性区域检测方法大多依据自底向上的人
                     熵编码把一系列用来表示视频序列的元素符号转变为                         眼视觉注意机制,该机制主要受到图像的低级对比特
                     一个用来传输或是存储的压缩码流。                                征的刺激作用产生。简而言之,如果图像中某一位置在
                         当前主流视频编解码标准有:MJPEG、MPEG-4、                  亮度和色彩等方面与其周围区域存在较大的差别,则
                     H.264、SVAC、H.265。                               这一区域最有可能引起人眼的视觉注意 。根据这一事

                                                                     实,传统显著性检测模型采用各种数学建模方法建立
                     基于人眼视觉关注点的感兴趣区域编码                               数学模型,对图像的所在位置与其周围区域进行数据

                         视频画面中,有些区域不会被特别关注,例如天空、                     对比计算,将各种对比结果数据(差异性)进行整合处
                     墙壁、草地等。对整个区域进行视频编码并传输,会给                        理,得到最终的显著图。
                     网络 带宽和视频存储带来巨大压力。ROI(Region of                     这些年自顶向下的注意机制成为了研究热点,该
                     Interest)感兴趣区域编码可以通过智能或人工的选择                    机制是受到图像中的语义特征对人的意识驱动作用产
                     画面中感兴趣的区域,重点进行高质量甚至无损地编码,                       生。图像中的文字、人脸、动植物等富含语义信息的目
                     而对其他区域降低其码率和图像质量,进行标准清晰                         标通常会引起人们的视觉注意,这些语义目标便是自
                     度的视频压缩,甚至不传输该部分区域的视频,从而达                        顶向下的视觉注意机制的具体体现。近些年,先进的图
                     到节省网络带宽的占用和视频的存储空间。目前,ROI                       像显著性区域检测模型开始模拟实现自顶向下的人眼
                     智能视频编码技术包括:固定区域和动态跟踪两类。                         视觉注意模型,使用各种高级特征用于显著性区域检
                     固定区域智能编码                                        测,例如在其检测模型中加入了人脸、文本、动物和汽
                         用户可以用鼠标在监控画面中选择多个 ROI 感                     车等目标的高级特征。然而图像中的这些富含语义的目
                     兴趣区域进行智能编码。如在 H.265 网络摄像机中                      标特征提取和识别是一个复杂而困难的问题,目前基




                                                                2019第四届深圳国际无人机展览会(2019.6.20-22 深圳会展中心) www.china-drone.com.cn  155




          భခ࠯ඌ JOEE                                                                                                       ྒ௹ؽ
   172   173   174   175   176   177   178   179   180   181   182