首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Facebook AI 年度总结来啦

雷锋网 AI 科技评论按:2019 年已经过去半个月啦,大家的年末总结和新年计划做好了吗?最近,Facebook 做了一份 AI 年度总结,详述了他们过去一年在 AI 上所做的代表性工作(看到眼花)。Emmm,要是哪位同学的年度总结像 Facebook 一样丰富多彩,相信一定发 paper、拿 offer 到手软。

内容如下,一起来看看吧~

在 Facebook,我们认为,人工智能以更有效的新方式学习,就像人类一样,可以在将人们聚集在一起发挥重要作用。这一核心信念有助于推动我们的 AI 战略,将投资重点放在与使用真实数据学习的系统相关的长期研究上,激励工程师与更广泛的人工智能社区共享尖端工具和平台,并最终展示使用技术造福世界的新方法。

通过半监督和无监督训练促进人工智能学习

Facebook 人工智能研究(FAIR)小组的创建目标之一是致力于开发具有人类智能的系统。实现这一里程碑还需要多年的研究,但我们相信,我们在2018年所做的努力有助于展示出一条通向通用人工智能的道路。虽然目前大多数 AI 系统使用监督学习来理解特定的任务,但对大量标记样本的需求限制了他们可以学习的任务数量,并限制了技术的长期潜力。这就是为什么我们正在探索多种方法来减少训练中所需的监督,包括展示从半监督甚至非监督数据中学习从而受益的项目。

例如,为了增加系统可能翻译或理解的语言数量,我们演示了一种

新的方法

,在无监督数据上训练自动翻译 NMT 模型,其性能与在监督数据上训练的系统相当。我们的系统的准确性比以前的无监督方法有了很大的提高。通过减少该领域对标记训练数据的大型语料库的依赖,它打开了翻译更多语言的大门,包括资源比较少的语言(如乌尔都语),和英语相比,它们的数据集是非常有限的。

多种语言中的二维单词嵌入可以通过简单的旋转进行对齐

另一个项目完全使用资源比较少的语言,使用多种方法来规避标记训练数据的相对稀缺性。这项工作包括使用多语言建模来利用给定语言组(如白俄罗斯语和乌克兰语)中方言之间的相似性。这是一项应用研究,该团队采用的一系列技术在今年为我们的自动翻译服务增加了 24 种语言。此外,在与纽约大学的合作中,我们在现有的 MultiNLI 数据集中添加了 14 种语言,这些语言被广泛用于自然语言理解(NLU)研究,而在此之前,我们只研究了英语。我们更新的 XNLI 数据集(https://code.fb.com/ai-research/xlni/)中的语言包括两种资源很少语言(斯瓦希里语和乌尔都语),我们的方法有助于跨语言理解,从而减少了对监督训练数据的需求。

哈希标签可以帮助计算机视觉系统识别图像中的特定的子类别和附加元素

加速 AI 研究向生产的转变

AI 已经成为 Facebook 几乎所有产品和服务的基础,应用程序的多样性反映在我们的工程师正在构建和增强的各种基于 AI 的平台和工具中。2018 年我们平台工作的共同主题是:将我们正在研究的 AI 技术转化为可以部署的 AI 系统。

自 2017 年我们发布 PyTorch 以来,深度学习框架已被 AI 社区广泛采用,目前,它是 GitHub 上增长速度第二快的开源项目。PyTorch 的用户友好界面和灵活的编程环境使其成为人工智能发展中快速迭代的通用资源。它的开放设计确保了框架将继续增长和改进。2018 年,我们希望给 PyTorch 社区提供一套更统一的工具,重点是将他们的人工智能实验转化为生产就绪的应用程序。

PyTorch 还为 Horizon(https://code.fb.com/ml-applications/horizon/)提供了基础,Horizon 是第一个使用应用强化学习在大规模生产环境中优化系统的开源端到端平台。Horizon 采用了 RL 大量研究但很少部署的基于决策的方法,并对其进行了调整,使之用于可能包含数十亿条记录的数据集的应用程序。

在 Facebook 内部部署该平台后,在优化流媒体质量和改进 Messenger 中 M suggestions 等用例中,我们开源了 Horizon,使得任何人都可以抵达连接 RL 研究和生产的桥梁。

显示 Horizon 反馈循环的高级图。首先,对现有系统记录的一些数据进行预处理,然后,训练模型并分析离线环境下的反事实的策略结果,最后,将模型部署到一组人员中,并度量真正的策略。来自新模型的数据会反馈到下一个迭代,大多数团队每天都会部署一个新模型。

2018 年是 Oculus 研究向 Facebook Reality 实验室过渡,以及对 AI 和 AR/VR 研究重叠领域进行新探索的一年。我们不断努力,想要开源尽可能多的人工智能相关工具,作为这些工具的一部分,我们已经发布了 DeepFocus 项目的数据和模型,该项目利用深度学习算法在 VR 中渲染逼真的视网膜模糊。DeepFocus 是一种将深度学习用于 AR /VR 的全新应用,它使用一个完全新型的网络结构来适配于 Half Dome 头显,以及其他头显装置。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190123A15RGM00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券