Deepmind“好奇心”强化学习新突破!改变奖励机制,让智能体不再“兜圈子”

Deepmind“好奇心”强化学习新突破!改变奖励机制,让智能体不再“兜圈子”

Google、Deepmind和苏黎世联邦理工学院的研究人员提出“好奇心学习”新方法,改变了智能体“好奇心”的生成方式和奖励机制,奖励机制不再基于智能体的“意外”,而是其记忆和所在情景。研究人员称,新方法可以有效降低智能体“原地兜圈子”、“拖延”等不良行为,有效提升模型性能。强化学习是机器学习中最活跃的研究领域之一,在该领域的研究环境下,人工智能体(agent)做到正确的事情时会获得积极的奖励,否则获得负面的奖励。

NIPS不改名引发学界大佬联名抗议,Jeff Dean领衔!

近日,NIPS董事会决定,NIPS不会改名。而就在今天,由Anima Anandkumar发起、包括Jeff Dean在内近百人联名,对NIPS董事会表示抗议。此次联名抗议是由英伟达机器学习研究负责人Anima Anandkumar发起,他在抗议声明中表示: 由于NIPS名称所产生的这些事件给他们当中的一些人带来了不愉快的回忆,使其职业道路受到不友好或骚扰行为的影响。

Julia加入TPU,这是一个靠自己也要融入机器学习的编程语言

Julia 语言发展非常迅速,它可以视为同时具备了 Python 的灵活性与 C 的速度,但目前 TensorFlow 和 PyTorch 等框架官方都不支持 Julia 语言。因此近日有研究者借助 XLA 底层编译器为 Julia 构建 TPU 支持,他们表示该方法能够将 Julia 程序编写的 VGG19 模型融合到 TPU 可执行文件中,并调用 TPU 实现高效计算。而 Google.ai 的负责人 Jeff Dean 在推特上也表示「Julia + TPUs = fast and easily expressible ML computations!」。

Facebook开源Mask R-CNN的PyTorch 1.0基准,比mmdetection更快

近日,Facebook AI Research 开源了 Faster R-CNN 和 Mask R-CNN 的 PyTorch 1.0 实现基准:MaskRCNN-Benchmark。相比 Detectron 和 mmdetection,MaskRCNN-Benchmark 的性能相当,并拥有更快的训练速度和更低的 GPU 内存占用。Detectron 是 Facebook AI Research 实现顶尖目标检测算法(包括 Mask R-CNN)的软件系统。该系统是基于 Python 和深度学习框架 Caffe 2 而构建的。Detectron 目前包含以下目标检测算法的实现:Mask R-CNN 、RetinaNet、Faster R-CNN、RPN、Fast R-CNN、R-FCN。

谷歌推机器学习标注图片中物体界面 整体速度提高3倍

Google在2018 ACM多媒体会议上,推出一种使用机器学习来标注图片界面,让使用者快速为图片中物体标记出轮廓以及标签,提高整体标记速度达三倍。由于现代基于深度学习电脑视觉模型的性能,取决标签训练资料的多少,越大的资料库将能让机器学习有更好的表现。Google在许多深度学习的研究都一再提到,高品质的训练资料取得并不容易,而这个问题已经成为发展电脑视觉的主要瓶颈,对于诸如自动驾驶、机器人或是图片搜寻等这类以像素为辨识基础的工作更是如此。

来源:新智元、机器之心、高工智能未来等。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181025B1D7KF00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券