视频检测和处理领域的现状和前景怎么样?

  • 回答 (9)
  • 关注 (1)
  • 查看 (687)

视频检测和处理领域的现状和前景怎么样?目前图像识别在人工智能领域已经相对成熟了,那么视频的发展和前景是怎样的?

青之软件青之软件提问于
khghjgj3linux回答于

这是人工智能领域的一个十分有前景的课题。视频的检测和处理也就是视频理解。这需要利用深度学习等理论进行视频的结构化分析。比如将视频进行帧分割,在多个层次上对视频的场景和故事进行处理。

这在很多领域都有着较为广泛的应用。比如说安防领域的智能识别、车辆的跟踪检测、视频中的人脸识别、视频内容的识别和提取等等。

最简单的视频识别方法就是单帧识别,就是将视频进行简单的帧拆解。但是这种识别的识别率低,很容易丢失掉视频中的大量隐含信息。

LSTM识别方法:该方法是在RNN的基础上发展而来的,识别过程是以已经相对成熟的CNN网络为基础。在CNN网络中加入LSTM记忆单元,可以将视频不同帧在时间上的联系提取出来,

3维卷积核(3D CNN)法:该方法是将卷积神经网络的卷积核扩展到时域中去。使得卷积在空间和时间上同时进行这样既可以提取到单帧空间上的信息,也可以提取不同帧时间上的信息。

除此之外还有阿里聚安全内容安全和iDT(Improved Dense Trajectories) 等方法。

砸蛋大叔回答于

近几年深度学习在图像识别领域得到了飞速的发展,但是在日常生活中,基于视频的目标检测有着更加广泛的需求。由于视频中存在着运动模糊、遮挡、变化等等问题,如果单单将视频拆分成一张一张的图像很难

达到理想的识别检测效果。视频检测技术在图像识别的基础上还要利用到视频中目标的时序变化信息来提高检测的性能。

目前视频检测领域常见的方法:

1、 MGP(Motion-guided Propagation)运动指导传播。如果将视频拆分成单帧图像来处理很容易漏检目标,因此提出了借助光流信息将当前帧的检测结果向前后传播。这就成为MGP处理,该方法可以

有效提高目标的召回率。

如图所示:单单某一帧图像并不能完全将目标识别检测出来,但是将不同时刻的视频信息综合起来就能够很好的识别出来。这里的视频信息综合不单单是简单的识别结果的叠加。

而是按照时序信息和目标的运动信息进行识别得出的结果。

2、MCS(Multi-context suppression)多上下文抑制。与MGP类似,该方法也是在图像识别的基础上充分利用视频的上下文信息。比如说某一帧图像前后都只有人出现水中的生物,这种情况下就不太可能出现沙漠中的生物

。这种方法可以有效地减小单帧图像的错误识别。

由于视频的普遍程度和包含的信息量要远远高于图像,所以在以后基于深度学习的视频检测、识别、处理一定会得到很好的发展。在以后视频检测可能要涵盖图像处理、语音识别、场景预测、动作判断等等技术。

袁弋雯只有你回答于

人工智能领域有名的专家李飞飞在2017年的Google Next Cloud大会上清楚的指出“像素(pixel)的世界已经超过了图片(picture),然而多年来视频仍是机器学习研究人员面临的挑战”,

“视频就像是计算机视觉里的暗数据,我们正在开始关注数字世界的暗数据问题"。视频在我们生活当中也变得越来越重要,视频已经成为大多数人获取信息的重要渠道,

在未来几年还会有许多设备增加,像是智能监控摄影机到自动驾驶汽车等,这些设备都是以相机作为感知的工具、以影像作为理解世界的入口,因此,如何让机器看得懂视频,

对于 AI 的技术发展及商业应用只会越来越重要。在真实世界中,生活不只是一系列的快照,也不仅仅是认识图像中的动物、花朵或汽车,如果期待 AI 能够越来越像人,

或至少要达到有如人类般感知周遭一切的能力,那么理解视频就是第一步,至少,现在这个暗数据已经因众多科学家投入而逐渐被点亮。

麻酱huo白糖宅男回答于

这样的话无人驾驶技术就少了一个大瓶颈

风华一代paranoid android回答于

视频处理会不会很慢。难以应用到实时场景?

ikdoy野生小猴子回答于
Smile淡莣YK回答于

应该来说大多数人获取信息是视频而不是文字了

jyayfpvrHELLBOY回答于

目前的人工智能技术还做不到理解的效果把

最爱开车啦互联网的敏感者回答于

很期待能够有一种智能地理解视频的技术出现

扫码关注云+社区

领取腾讯云代金券