Facebook 图像机器学习平台 Lumos 升级,不是计算机视觉专业也能使用

【新智元导读】Facebook的图像机器学习处理Lumos日前进行了系统更新,在原来对照片和视频进行分类的基础上,运行速度更快,自动识别图像边界,能解释图中人物行为,并且利用以往的知识。Lumos 依靠Facebook的图像文本转换系统和 FBLearner Flow,Facebook表示其目标是使其达到像素般精确。

Facebook去年在Web Summit会议上公布了Lumos平台。它是一个可扩展的系统,用于对照片和视频进行分类。它可以扫描照片,快速训练A.I.识别新照片,查看照片中的对象并描述对象,从而向视觉障碍用户描述照片的信息,或者方便用户语言搜索照片。

Lumos的背后是Facebook的图像文本转换(Automatic Alt Text for Photos)系统和 FBLearner Flow机器学习系统。这些系统在图像分类方面取得了12处改进,而 Lumos是它们在图像分类方面的前端。在数据标注方面,Facebook 使用人类雇员为13万张包含人的Facebook照片撰写描述。

Facebook Lumos 新进展

更容易使用:没有经过深度学习和计算机视觉训练的人也能用它进行工作。

能够解释行为:本周四,该系统取得重大升级,它不仅可以描述照片中的对象,而且可以解释其中的人正在做什么。Lumos 现在可以使用12个新的动作短语来描述图片,例如“人们在走路”,“人们在玩乐器”或“人们在跳舞”。

识别边界:经过更新后,Lumos可以更好地识别图像中的跳跃和边界。

速度提升:与去年相比,Facebook每个月都能多执行六倍的相关A.I.实验。通过FBLearner Flow系统的训练,Facebook已经让训练A.I.的过程比以往更简单,工程师能够轻松地进行代码更改,而不必做大量繁琐工作。

能够利用以往知识:训练者可以使用先前教导过的图片描述来加速学习过程,例如,如果A.I已经知道马是什么样,它就可以过滤掉所有的非马照片,这样训练A.I.识别骑马的人就会更容易。

Facebook 为什么要推进 Lumos

Facebook的应用机器学习总监Joaquin Quiñonero Candela说:“当你思考你最喜欢的记忆时,很难记起是什么时候发生了什么事情。 ……我们希望建立一个搜索系统,利用图像理解来对大量的图像信息进行分类,并快速、轻松地取得那些最相关的照片。” Candela还说,作为社交媒体巨头,Facebook的目标是“将AI编织到Facebook的工程结构之中”。

在Facebook的第四季度财报电话会议上,CEO Mark Zuckerberg则说:”我认为 AI 将为用户带来极好的社区体验。我们正在努力尝试几种类型的系统,一个是关于视觉内容,另一个是关于语言。对于视觉内容,我们希望AI能够查看照片并了解其内容,以及该内容是否是用户会感兴趣的内容。同样,AI可以查看视频并理解这是否是用户会感兴趣的东西。你可以想象,今天我们会把你所关注的朋友、页面或者朋友喜欢的东西放在你的消息推送中。然而,我们没有理由不去把用户可能感兴趣的成千上万的内容与用户匹配起来,我们还没有这么做仅仅是因为还没有AI技术能实现这一点。因此,要是能够理解人们发出的消息、阅读人们想要看的文章,看懂视频和照片,这样的技术组合将是伟大的。“

Lumos 和 FBLearner的工作量和近期目标

数十个团队已在Lumos上进行了训练和部署了超过200个视觉模型。这些部署用于令人反感内容的检测,垃圾邮件识别和自动图片字幕等等。

Facebook每月在FBLearner Flow上运行120万次AI实验。

Lumos通过新标记数据和来自应用程序的注释信息进行改进。

Facebook表示,当前目标是提高该机器学习系统的精度(precision)和召回率(recall),使其达到像素般的精确。

编译来源:

  1. http://www.zdnet.com/article/facebook-to-outline-lumos-its-machine-learning-platform-for-images/
  2. https://www.inverse.com/article/27321-facebook-photo-ai-machine-learning-action-shots

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2017-02-03

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

专访 | 追一科技首席科学家杨振宇:对话机器人里不能「耳闻目览」却又「无所不在」的 AI

机器之心原创 作者:邱陆陆 对话机器人是「怎样炼成的」。 相比于语音和图像,自然语言是一个有「更多需求」和「更少标准答案」的领域。扎根自然语言的公司通常也不是从...

3919
来自专栏量子位

语音合成论文和英伟达撞车,韩国小哥紧急放出全部草稿代码和样本 | 资源帖

10月31日,英伟达在arXiv网站上传了一篇论文——WaveFlow:一个用于音频合成基于流的生成网络。

1412
来自专栏机器人网

有望在2018年大行其道的10种机器学习工具和框架

2017年是机器学习大放异彩的一年,这归功于众多公司广泛而深入地研究和开发更新颖、更高效的工具和框架。这里介绍,有望在2018年大行其道的10种机器学习的工具和...

4075
来自专栏FD的专栏

什么是最小可行性数据产品(MVP)?如何用它做机器学习?

本文作者是一名数据科学家,现在离开了Pivotal公司加入了idealo公司,正在帮助其搭建数据科学团队以及把机器学习整合到公司的产品中。

792
来自专栏人工智能

23个深度学习库的排名

本文对 23 个深度学习库进行了排名,衡量的标准有三个:GitHub、Stack Overflow 以及谷歌搜索结果。TensorFlow 凭借最大、最活跃的社...

4408
来自专栏数据科学与人工智能

【数据挖掘】常用的数据挖掘方法

数据挖掘又称数据库中的知识发现,是目前人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡...

2956
来自专栏FD的专栏

什么是最小可行性数据产品(MVP)?如何用它做机器学习?

本文作者是一名数据科学家,现在离开了Pivotal公司加入了idealo公司,正在帮助其搭建数据科学团队以及把机器学习整合到公司的产品中。

1002
来自专栏PPV课数据科学社区

【观点】数据挖掘之七种常用的方法

利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。 ...

3526
来自专栏ATYUN订阅号

【学术】麻省理工学院的学生们愚弄了谷歌图像识别技术 计算机视觉算法仍然很容易被骗

人工智能图像识别技术已经取得了一些令人惊叹的进步,但正如一项新的研究表明的那样,这些系统仍然可以被那些愚弄的例子所绊倒。 一群麻省理工学院的学生最近愚弄了谷歌开...

3013
来自专栏数据派THU

手把手教你用Kaggle开启机器学习之旅(附资源链接)

本文分析了Kaggle利于数据科学领域新手学习的几点特征,并带你学习ML相关知识。

1812

扫码关注云+社区

领取腾讯云代金券