随着人们对安全关切的持续增长,如反恐,以及传统在城市,办公室和家庭中所发生的犯罪行为,如偷窃,以及在仓储,超市的偷窃和破坏行为,对智能监控的需求呈现爆发式增长。ABI Research预测称,全球智能监控市场规模将从2016年的220亿美金,增长至2023年的550亿美金,年复合增长率(CAGR, Compound Annual Growth Rate)达13.6%。
智能监控需要忽略正常情况,可以迅速对异常事件作出反应,因此需要实现本机智能(On-device)。
单纯视觉智能监控有诸多限制,比如视角(FOV, field-of-view)的限制,以及可能的视觉遮挡等。比如,当发生异常枪声的时候,可能不发看见,但一定可以听到枪声。
解决纯视觉监控局限性的解决方案
显然,我们可以在智能视觉监控中加入智能音频功能。智能音频方案需要加入在智能音箱产品中已经非常成熟的多麦克风 (Multiple Microphone) 和波束成型技术 (Beam-forming),从而可以支持声源方位探测,以及音频AI技术所支持的异常声音检测,如枪声,尖叫,玻璃窗破碎等。在多麦克风阵列360度检测到异常声音的方向后,即可导引摄像头予以跟踪拍摄。
此方案的另一个好处是,在检测到异常声音事件之前,摄像头可以处于待机状态减少电力消耗。在远程使用环境中,监控需要通过电池供电,此方案可以大大提升待机时间。
不仅如此,在很多情况下,监控需要将视频与音频信息结合起来,可以提供更多信息以供判定情况。如仅仅通过视频拍摄并不能判定两个人是在讨论还是在争吵。
监控中的人工智能
人工智能用以保证所有疑似异常可以被有效过滤,记录,并上传。将视频AI和音频AI结合起来,使非常自然的解决方案。
以上给传统视频智能监控增加音频检测功能,需要增加如多麦克风,波束成型,及音频AI技术。这些技术非常成熟。
本文分享自 SmellLikeAISpirit 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!