用AI理解视频—对象识别与结构化分析

作为人工智能的主要应用领域之一,基于深度学习的计算机视觉在视频对象识别方面取得很大的进展。如果说语音识别是代替人去“听”,对视频中对象的识别和语义分析就是对摄像机“看”到的场景进行理解。

在下面的视频中,AI对实时视频进行实时对象分析,自动识别汽车、行人、自行车、电动自行车等。通过多目标对象识别和跟踪,可对在ROI区域出现的对象根据识别类型和属性进行结构化分析和存储,从而实现对视频的语义分析和结构化。

这种视觉分析和理解具有广泛的实用价值,例如某些区域不允许电动自行车进入或需对电动自行车超速预警,就可将电动自行车设置为报警类型,一旦ROI区域出现电动自行车,进行红色预警。下面的视频分别是对电动自行车和狗出现在ROI区域的识别报警。

通过对象识别的组合,可实现更多的应用,例如对人员和救生衣的组合识别可判断游客是否穿了救生衣。将对象识别与周界入侵检测组合应用,可仅对某些特定类型对象越界报警,实现精确预警。这种基于视觉理解的应用将会渗透到各个民用和工业领域,极大提高这些领域管理和生产的智能化水平。

BCI对象识别和结构化分析系统基于先进的深度神经网络模型,在识别准确率和识别速度等关键指标上处于国际先进水平,有以下主要功能:

识别80多个对象类别

包括各种车、动物、日常用品等,而且还可以根据用户的特定需求,定制新的识别对象。

多目标识别和跟踪

能够实现ROI区域内多目标对象的同时识别和跟踪,可同时识别静态和动态目标对象。

对象识别与结构化存储

在多目标识别和跟踪的基础上,用户可设置希望记录存储的目标类型,对该类型进行结构化存储,便于事后查询。例如仅对行人进行结构化存储,或者仅对抓拍人脸进行结构化存储。

特定对象目标报警

可通过设置报警对象类别,对该类对象的出现自动报警并进行记录存储。

开放数据接口

在提供一体化智能管理平台同时,向第三方提供开发接口,基于TCP/IP协议将结构化信息或报警消息发送给第三方应用或平台,为用户二次开发或集成提供通用数据接口。

关于蓝讯智能

北京蓝讯智能科技有限公司(BCI)专注于人工智能前沿技术和行业深度应用,应用领域包括安防、金融、交通和工业生产等,主要研发人员来自清华大学和国内外一流高校,在视频监控与智能分析、计算机视觉、人工智能和大数据分析等方面有多年的经验积累和领先的技术水平。产品涵盖人脸识别、视频智能分析与结构化、智能安防平台与云存储、智能云服务、安全生产视频智能分析等方面。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180802G0R3I200?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券