数字可视对讲技术探讨— 数字智能家居新秀

20世纪60年代,电视改变了人们的生活,出现了电视一代;20世纪80年代,电脑改变了人们的工作方式,促进了电脑一代;20世纪90年代,互联网改变了人们获取信息的方式,诞生了网络一代。在21世纪,数字生活方式将无处不在,最终将完全进入每个人的家庭,数字家庭的浪潮已经飙升。

传统数字家庭中心之争:PC中心论、TV中心论及SetBox在中心论上,它的优缺点是显而易见的,单一产品很难独自承担数字家庭的重任。近年来,市场上出现了越来越多的功能和责任,即数字可视对讲。传统建筑视觉对讲产品逐渐向数字、网络、智能方向发展,视觉对讲产品除了视觉对讲、遥控解锁、报警功能外,还实现了远程视频监控、变更报警、门禁、三表复制、信息发布、智能家居控制、互联网视频点播甚至手机联动增值服务。这些产品大多内置性能强Soc处理器和触摸TFT显示屏,特别是标准的网络功能,给产品带来了更多的想象空间,并将越来越多的集成PVR、DPF数字媒体功能,如数字相框、可视电话、媒体播放器等。数字视觉对讲机悄悄地扮演着数字家庭另一个中心的角色。

可视对讲的发展趋势

可视对讲机经历了从模拟黑白、色彩到数字化的过程,朝着网络化、智能化的方向发展,并逐步整合多种媒体功能。模拟视觉对讲(黑白、彩色)、音视频通过同轴电缆传输,控制信号通过单片机总线传输,其技术特点决定了产品的先天缺点,数字网络传输不仅通过音视频和所有控制信息通过网络线传输克服模拟传输的缺点,更重要的是为用户增加更实用的增值业务。下表显示了模拟对讲与数字对讲的对比。

未来,数字视觉对讲机的发展将更加集成智能家居控制,逐渐成为智能家居控制中心,增加越来越多的附加功能。 

620)this.style.width=620;" border=0>

图1 数字可视对讲Roadmap plan

数字可视对讲技术原理和框图

数字可视对讲系统的组成一般包括室内机、梯口机、交换机、管理机等几个模块。如图2所示。 

620)this.style.width=620;" border=0>

图2 可视对讲系统框图数字 

访客来访时,通过梯口机拨号呼叫指定的室内机。梯口机将访客的视听信息数字化,编码压缩并传输到指定的室内机。室内机接收网络传输的视听信号进行解压显示。确定访客身份后,按下解锁键打开梯口门锁。同时,梯口机和室内机也实现了VoIP,两个终端可以实现双向语音对讲,为业主识别游客身份提供进一步的沟通和确认。 

该系统在两台室内机或室内机和管理机之间提供双向视频和语音传输功能。梯口机、管理机在功能实现上可归结为室内机。室内机的功能是最全面的,可以实现音视频的压缩传输、接收解压显示和回声抵消功能,也可以作为各种网络增值业务的终端。本文采用海思半导体多用途媒体网络处理芯片Hi以3510为例,介绍室内机的构成。Hi3510是针对媒体压缩/解压缩处理的海思半导体络传输VoIP多功能混合应用市场开发的处理芯片已广泛应用于可视电话、网络摄像头、网络视频服务器、数字可视对讲等产品。从Hi在数字可视对讲系统框图中应用3510,可以看到完整的信号处理元素和流程。 

620)this.style.width=620;" border=0>

图3 Hi3510数字可视对讲最小系统框图

以Hi以3510为核心,配备图像传感器作为图像输入源,视频信号通过ITU656接口输送给Hi3510,Hi3510压缩数字视频后,PHY将数据以TCP/IP同时,将包传输到目的地,Hi3510对通过PHY传送的TCP/IP解码缩放包,通过RGB888接口送至TFT Module显示;为了方便用户选择操作,可以通过SPI接口及GPIO通过音频实现触摸屏和按键功能;语音数据Codec进行AD编码后通过I2S总线送往Hi3510处理,Hi3510不仅需要压缩语音进行传输,还需要实现双向语音传输所需的回声抵消功能、唇音同步和双音多频按钮DTMF等。多达两个的USB1.1界面提供了丰富的个人存储界面,各种视频可以通过网络传输或通过USB及USB转SD存放到本地,必要时播放。多达两个的USB1.1界面提供了丰富的个人存储界面,各种视频可以通过网络传输或通过USB及USB转SD存放到当地,以便在必要时播放。如需扩展WIFI无线传输,另一个USB1.1接口可以提供低成本、易于实现的接口USB转Wi-Fi方案。

技术核心:视频压缩、语音处理、网络传输

未来多媒体产品的核心无非是音视频压缩、语音处理和网络传输。无论是从PC娱乐、SetBox,还是Digital TV任何多媒体产品都可以看到这三个元素。作为数字家庭的新秀,这三个元素也是构成数字视觉对讲系统的基础。

由于历史原因,早期数字可视对讲的视频编码格式多为H.其目的是与可视电话兼容。H.264作为H.升级版263提供了更大的压缩比和更好的网络适应性。基于此,越来越多的数字可视对讲产品被使用H.视频压缩格式采用264标准。 H.264最大的特点是带宽要求很低,图像质量相同,H.264要比MPEG-节省50%以上的码率。同时,H.在设计之初,就考虑了不同网络资源下的分级编码传输。H.264具有较强的容错能力,在质量不稳定的网络环境中可以比较MPEG4编码视频质量更好。当然,H.264的好处不是免费的,压缩比高,网络适应性好,而是处理算法的复杂性,对处理器的性能要求更高。

语音还需要低带宽、高音质的音频编码标准,以适应网络传输的特点。常见的日常生活MP3、AAC多媒体音频格式不能很好地满足语音网络通信的要求。语音网络通信使用更多G.7xx和AMR(Adaptive Multi-Rate)为了在有限的带宽下提供多路语音数据业务,语音编码。例如,G.729是一种高效的压缩编码技术,可采样64kb/s声音以几乎不失真的质量压缩到8kb/s,非常适合在VoIP使用系统;AMR主要用于移动设备的音频,压缩相对较大,但与其他压缩格式相比质量较差,因为主要用于人声通话,效果仍然很好。同时,为了支持双向语音对讲业务,语音处理模块仍需提供回声抵消、唇音同步、噪声抑制、双音多频DTMF的支持。普通的多媒体处理器通常只能提供单一的语音处理功能,因此应用于数字视觉对讲机的处理器需要提供更灵活和强大的语音支持。

海思半导体Hi3510芯片灵活的多核架构,满足视频需求H.264复杂编码和音频压缩格式要求,内置双MAC,带路由功能的网络配置方便,减少eBOM。图4为Hi3510内部逻辑图。 

620)this.style.width=620;" border=0>

图4 Hi3510功能逻辑图

内置的H.264/263 硬件加速器完成视频编解码算法,保证视频画面流畅H.263的兼容性使得采用Hi以3510为主芯片的设备可与早期的可视电话系统兼容,实现多终端对接。32位的语音DSP,在提供从MP3、WMA到G.7xx,AMR支持回声抵消、噪声抑制、唇音同步等处理需求。主频220MHz的ARM处理器可以实现更多的增值业务,IE浏览、数码相框、信息发布ARM上完成。Hi3510以ARM+Audio DSP+H.多核处理架构,264/263硬件加速,配备丰富的通信接口,如MAC、UART、USB等。

结语

数字视觉对讲机在市场和技术上都处于加速发展的时期,并越来越成为数字家庭的重要作用。它有三个要素:视频压缩、语音处理和网络传输,使数字视觉对讲机与其他家庭多媒体产品相结合。因此,随着技术的发展,对内置处理器的要求也越来越高。

本文来源:rfid世界网