谷歌新开放了一个数据库,要让机器自动识别视频中的动作行为 | 技术

谷歌希望通过开放这个数据库,进一步改进他们基于视频识别的机器视觉能力。

谷歌在机器视觉学习方面积累大量的数据以及技术,最近,他们推出了一个新的视频数据库,名称为“原子视觉行为(AVA)“,该数据可由一个或多个标签组成,能够推动计算机视觉识别影像中行为的研究。

说到图像识别,其实谷歌的照片应用就可以自动识别出宠物图像,很多公司也在图片识别上作出很多优化尝试,比如Shutterstock上周公布了一项全新的测试功能,用户可以根据自己的布局来搜索股票照片。

相较于这些发生在静态图像领域的机器视觉识别技术,应用到视频中的难度会更大,因为在视频中,每一帧画面的都包括各种复杂的场景,而且很多时候视频中一个动作是由不同的人发出的。不过视频识别方面的应用现在也有一些案例,比如著名色情网站Pornhub,它可以自动对成人视频进行分类,包括让系统识别出特定的性姿势。

谷歌的软件工程师也解释道, “让机器去识别影像中的人类行为是发展计算机视觉的一大难题,尽管过去几年在图像分类和寻找物体方面取得了突破。”所以谷歌推出了这个AVA数据库,AVA包括80多个被动作标签标注的Youtube视频网址,比如握手、接吻、喝酒、拥抱等等。

谷歌希望通过开放这个数据库,进一步改进他们基于视频识别的机器视觉能力。

原文发布于微信公众号 - 镁客网(im2maker)

原文发表时间:2017-10-23

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏about云

什么是机器学习技术?

问题导读 1.什么是机器学习? 2.机器学习可以来做什么? 3.机器学习技术可以被应用于哪三种不同方式? 这篇博客文章由微软研究院的杰出科学家J...

299100
来自专栏机器之心

业界 | 快手科技李岩:多模态技术在产业界的应用与未来展望

李岩在演讲中表示,多模态技术有两大应用方向,一是会改变人机交互的方式,二是将使信息分发更加高效;视频本身就是一个多模态的问题,而快手则拥有海量的多模态数据,多模...

13530
来自专栏灯塔大数据

荐读|电信大数据关键技术挑战

电信大数据来源于运营商通信网络平台的BSS和OSS,沉淀了海量用户7个维度的信息:1维用户真实ID、1维行为数据、1维社交数据、1维时间数据和3维空间数据。运营...

40270
来自专栏量子位

机器学习产品宝典:这是谷歌内部总结的七大要点

李林 若朴 编译整理 量子位 报道 | 公众号 QbitAI 产品经理新入机器学习坑,应该注意什么? Google的用户体验设计团队总结了7点,量子位编译如下:...

35640
来自专栏腾讯移动品质中心TMQ的专栏

腾讯TMQ在线沙龙回顾|线性回归&逻辑回归

线性回归&逻辑回归 活动时间:2017年12月27日QQ群视频分享 活动介绍:TMQ在线沙龙第三十七期分享 ? 本次分享的主题:线性回归&逻辑回归。 共有73位...

22880
来自专栏AI科技评论

免费中文版!谷歌机器学习速成课程今日上线!

AI 科技评论按:谷歌的人工智能学习平台横空出世,还有谷歌的免费中文机器学习速成课程! ? 今天,谷歌在以往介绍自己的 AI 产品、开源代码和研究成果的 ai...

37880
来自专栏机器之心

业界 | 快手AI技术副总裁郑文:为什么说AI是短视频平台的核心能力

郑文是美国斯坦福计算机系博士,研究方向主要集中在计算机图形学和电影特效方面,毕业之后在美国从事机器学习和计算机视觉相关研究,2016 年回国后加盟快手,现任快手...

16030
来自专栏大数据文摘

业界 | Kaggle问卷主成分分析,16000万数据从业者面临这5类挑战

16360
来自专栏AI科技评论

现场 | 英特尔中国研究院认知计算实验室主任陈玉荣博士:如何“享用”视觉识别技术的低廉化大潮

英特尔中国研究院认知计算实验室: 致力于视觉认知和机器学习前沿领域的科技创新,开发视觉内容理解和视觉内容创建的领先技术,从而在英特尔平台上实现视觉数据的智能处理...

29490
来自专栏新智元

【解读2015】自然语言处理:持续探索,稳中前行

2015年,整个IT技术领域发生了许多深刻而又复杂的变化,InfoQ策划了“解读2015”年终技术盘点系列文章,希望能够给读者清晰地梳理出技术领域在这一年的发展...

34550

扫码关注云+社区

领取腾讯云代金券