业界 | Facebook 图像识别平台 Lumos 是什么?

大多数人懒得给照片加标签。如果你属于这一类(大概率事件),那么你一定知道搜索某张照片有多辛苦。 但这很有可能即将成为过去。

本周,Facebook 披露了其机器学习平台 Lumos 的更多信息: Lumos 将使用户们利用相片内容进行搜索,而不是图片名称或是标签。

Facebook 应用机器学习负责人 Joaquin Quiñonero Candela 解释说:

“换句话说,搜索‘黑衬衫照片‘时,系统能识别出每张照片里是否有黑衬衫,并据此搜索;即便照片并没有被添加标签也没有关系。

Lumos 利用了计算机视觉技术来识别照片中的人、动物和一系列其他物体。但它远不止于此,而是更进一大步,能识别出照片中发生的“事”。所以在识别某相片中有某个人之外,它还能够判断该人是在行走、骑马、弹琴还是在做其他的事情。AI 科技评论按,Facebook 并没有提供一张 Lumos 所能识别的人物行为列表,因此目前并不清楚它究竟神通广大到了何种地步,以及识别的正确率如何,会不会犯下“妖精打架”那样的错误。假使正确率尚在接受范围以内,相比目前各照片管理软件还停留于人脸识别的层次(除了 Google Photos),便是极大的进步,其技术可能成为 Google Photos 的直接竞争对手。

Lumos,一个计算机视觉平台

介绍 Lumos,就不得不提 FBLearner Flow。Facebook 使用了它的 FBLearner Flow 平台来开发 Lumos。前者是一个通用型的机器学习流水线(pipeline),开发它的初衷是让 Facebook 工程师们能同时执行多个 AI 项目,而不需要每次都借助必要的硬件。据 Facebook 透露,现在每月有超过 120 万个 AI 实验在 FBLearner Flow 上运行。包括 Lumos 在内的这些项目,能够获取社交网络和 app 上永不停歇的数据流。

AI 科技评论获知,一开始,FBLearner Flow 平台只是 Facebook AI 研究部门(FAIR)的一个小研究项目。但当它达到量产规模后,它和开发团队被转移到了应用机器学习团队。现在,FBLearner Flow 已是 Facebook 计算机视觉团队的引擎。

建立在 FBLearner Flow 基础上的 Lumos,是一个 Facebook 为处理图像和视频理解任务而开发的平台。Facebook 的工程师并不需要接受过深度学习或者计算机视觉培训,就能使用 Lumos 训练、布置新模型。 Lumos 平台在不断改进,这主要有两种途径:

  1. 导入新添加标记的数据;
  2. 利用 Facebook 应用中有注解的数据。

深度学习的进步使得开发者在图像分类上取得巨大进展——类似于“图片中有什么”、“东西在哪?”这样的问题被系统以前所未有的精确度回答出来。 Facebook 表示,通过设计出能对给定图片中的物体进行检测、分离的新技术,他们大幅推动了在该领域的研究。

当 Facebook 应用这些技术时,相片会穿过一个深度学习引擎,后者能分离图像、识别物体和场景、向照片加入更多含义。这产生出任何 Facebook 产品、服务都能使用的丰富数据。

前景

Joaquin Quiñonero Candela 还表示,Lumos 涵盖的技术有一系列广阔的应用场景,远不止于单纯地优化图像搜索。他进一步解释:

“出于‘争议内容检测,反垃圾信息和自动图像抓取’等目的,已经有超过 200 个视觉模型被十几只不同团队训练出来,并布置于 Lumos。它们的应用领域十分广,从我们的 Connectivity Labs (互联实验室)到搜索团队,再到 Accessibility (可达性)团队,大家都在用 Lumos 的技术。”

虽然 Facebook 在 Lumos 上取得可喜进展,但它还称不上是独步天下。谷歌一直在开发图像扫描 AI 来提高图像搜索。去年,谷歌声称它的 Inception v3 AI 能够以 93.9% 的精确度抓取图片内容。AI 科技评论消息,最近 Inception v3 又有突破:在它基础之上将开发能预警皮肤癌的新 AI。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-02-07

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CSDN技术头条

教授机器视物和理解——Facebook人工智能研究进展

许多人认为Facebook只是一个蓝色图标的大型应用,或者认为只是个网站,但是近年来,我们已经建立了一套应用和服务体系,为用户之间相互交流和分享提供了广泛的方式...

1879
来自专栏机器人网

神奇软体机器人:丢进热水里就能自己折叠

为了演示一种制造兼容、可控机器人结构体的全新方法,研究人员构建了一个能够自主折叠的兔子、金枪鱼和海星的3D模型。这些构造物浸泡在热水之后,会从平面形式上折叠起来...

2323
来自专栏人工智能快报

谷歌提出帮助人工智能开发人工智能的方法

澳洲科学媒体Sciencealert刊登了David Nield的一篇文章,称谷歌的研究者们正在利用人工智能开发更强大的人工智能。 谷歌已经宣布了人工智能的另一...

2654
来自专栏机器之心

学界 | 谷歌提出机器对话Self-Play框架M2M,提高自动化程度

2877
来自专栏新智元

深度学习识别10000物种,手机上的@博物杂志

【新智元导读】iNaturalist 推出一个识别动物和植物物种的app,使用TensorFlow训练神经网络,已经能够识别出超过10000种不同的物种,而且每...

3465
来自专栏PPV课数据科学社区

数据分析师职业要求

1. 懂业务 从事数据分析工作的前提就是需要懂业务,即熟悉行业、公司业务及流程,甚至有自己独到见解,若脱离行业认知和公司业务背景,分析的结果只会是脱了线的风筝,...

2594
来自专栏大数据文摘

人工智能的基础--知识分类

20811
来自专栏IT派

喜大普奔!TensorFlow中文社区论坛 (测试版) 发布上线!

昨天,TensorFlow与 Caicloud (才云) 联合发起和创建的 TensorFlow 中文社区论坛测试版(https://www.tensorflo...

490

机器学习自学指南

你有许多方法和资源来学习机器学习:阅读书籍、学习课程、参加比赛和各种可用的工具。在这篇文章中,我想使这些活动更为体系化,并列出一个大致的顺序,以说明在普通程序员...

2168
来自专栏新智元

【专访微软黄学东】0.1%,0.2%与0.3%,语音识别军备竞赛中小数点差距有何意义

【新智元导读】 微软语音识别研究团队在黄学东的带领下,去年将语音识别的单词错误率降至5.9%,又在最近降至5.1%。在本次专访中,我们讨论了语音识别错误率百分之...

2767

扫描关注云+社区