机器学习智能体没有学习相对“简单”的任务 - 腾讯云开发者社区

选自Hackernoon 作者：Michaël Trazzi 机器之心编译参与：程耀彤、路雪人工智能已经在围棋、图像识别和语音识别等领域达到或超越了人类专家的水平，但今天看来，智能化的机器还离我们很远。要想实现通用智能，AI 智能体必须学习如何在共享环境中与「他人」进行互动：这就是多智能体强化学习面临的挑战。本文将通过地图寻宝问题为例，向你简要介绍多智能体系统实施时的困难程度及其原因。「研究人工智能三十五年来的主要经验是：困难的问题是易解的，简单的问题是难解的。」Pinker (1994)，《The

微软刘铁岩经验分享：形成机器学习研究的闭环（附演讲视频）

导读：3月18日，微软AI讲堂2019校园行在第一站——中国科学院计算技术研究所启幕，微软亚洲研究院副院长刘铁岩博士为同学们带来了一场精彩的主题演讲，分享如何弥合研究与实际应用的裂隙，从现实中发现机器学习的研究问题，做帮助人们解决现实痛点的机器学习研究。

您找到你想要的搜索结果了吗？

是的

没有找到

机器学习模型中的 bug 太难找？DeepMind 呈上了三种好方法！

写给人类的机器学习一、为什么机器学习重要

本指南旨在让任何人访问。将讨论概率，统计学，程序设计，线性代数和微积分的基本概念，但从本系列中学到东西，不需要事先了解它们。

Uber提出有创造力的POET：自行开发更困难环境和解决方案

作者：Rui Wang、Joel Lehman、Jeff Clune、Kenneth O. Stanley

一文祛魅AI核心概念（全）

在并不算漫长的AI（人工智能）发展史，各种行业背景的专家助力了AI极大的发展，也带来了很多专业术语、概念。术语对于专业研究者是比较清晰及严谨，但对于初学者可能就有理解层面的困扰。

年度回顾 | 从九大国际AI顶会接收论文一窥ML算法趋势（上）

在本文的上篇，我们尝试分别从机器学习算法、计算语言处理、计算机视觉及机器人分领域对ML算法发展趋势进行总结。在本文的下篇，我们尝试打破领域的边界，形成一份全局性的总结。本文仅选取分析结论部分，详细数据及分析过程将收录在《2021-2022年度 AI科技发展趋势报告》完整版中。

AI 入行那些事儿（2）人工智能的应用和技术

目前人工智能技术已经开始应用在很多领域，对人工智能技术的提升和发展也成了人们的重要工作任务。

专访天数智芯倪岭：如何赋能企业更有效地进行AI应用开发

近年来，在大数据、云计算等技术升级的共同推动下，人工智能技术及应用取得了蓬勃发展。如今，继“互联网+”之后，“AI+”已蔚然成风。

OpenAI智能体上演捉迷藏攻防大战，自创套路与反套路

为了进行这个捉迷藏游戏，OpenAI 首先构建了一个包含墙、盒子和斜坡的 3D 环境。在这个环境中，智能体以团队为单位进行捉迷藏游戏。

机器之心走近全球顶尖实验室：UCL多智能体强化学习研究团队

机器之心知识站与国际顶尖实验室及研究团队合作，将陆续推出系统展现实验室成果的系列技术直播，作为深入国际顶尖团队及其前沿工作的又一个入口。赶紧点击「阅读原文」关注起来吧！人工智能已经在围棋、图像识别和语音识别等领域达到甚至超越了人类专家水平，但智能化的机器离我们仍然很远。要想实现通用智能，AI智能体必须学习如何在共享环境中与「他人」进行互动，由此便产生了人工智能的一个前沿研究领域：多智能体学习。多智能体学习的问题存在于多个领域。在这些问题中，多个智能体不仅与环境相互作用，而且彼此互动，由此造成的复杂和多变

算法工程师到底是做什么的？

前者如实现一个功能、搭建一个服务、实现一种展现交互方式等。更关注的是如何实现功能，如何对于各种复杂甚至小众的场景都不出错。互联网中典型的后端、前端、平台、网络工程师的主要工作是这一类。

10款必备神器：机器学习开源工具助你从新手到高手

在厦门人工智能峰会上，依图科技联合创始人、CEO朱珑介绍到短短的5年时间机器的算法水平又提升了100万倍！过去或许只能从1万人中识别出1个人，后来发展到1000万、1亿、10亿甚至20亿人中识别出这个人！与此同时，算力方面提升了10万倍。从过去用1万量级规模的数据做训练，到百万规模的数据做训练，到现在用10亿的数据集做训练，又提升了1万倍！

10款必备神器：机器学习开源工具助你从新手到高手

人工智能的界定

在2017年，“人工智能”这个词得到了公众前所未有的关注，究其原因我认为与两方面有关，一方面人工智能学术领域自身产生了一些进步，另一方面则更多与媒体和业界噱头式的鼓吹有关，两相叠加促使“人工智能”一词被滥用，进而导致其含义变得模糊和广义，偏离了人工智能的初衷。这篇文章就结合我的理解从以下几个方面来讨论下这个热词。公众号文章篇幅不宜冗长，故斟字酌句力求无赘述，如有错谬之处，敬请不吝告知。人类期待的人工智能谈到人工智能的科幻色彩，有几部非常经典的影视作品：2001太空漫游(1968)、银翼杀手(1982

数学与 AI「融通」，徐宗本院士进行超强“迁移学习”

9 月 21 日至 22 日，为期两天的 CCAI 2019 正在秋意浓浓的中国青岛胶州隆重举行。本次会议选址室外体育馆召开，为原本严肃的学术会议增添了几分活泼、惬意的色彩。

雀神，微软亚研推出超级麻将AI Suphx，还上了专业十段水平

麻将无疑是我国最家喻户晓，老少咸宜的一项棋牌游戏。近年来，随着人工智能在围棋、德州扑克、Dota、星际争霸等众多游戏中获得亮眼的成绩，AI 在麻将领域却一直缺少跨越性的突破。

机器学习公平性研究，走在正确的道路上吗？

随着人工智能的发展，机器学习的技术越来越多地被应用在社会的各个领域，来帮助人们进行决策，其潜在的影响力已经变得越来越大，特别是在具有重要影响力的领域，例如刑事判决、福利评估、资源分配等。

DeepMind发布Acme，高效分布式强化学习算法框架轻松编写RL智能体

DeepMind 本周发布了一个强化学习优化框架 Acme，可以让AI驱动的智能体在不同的执行规模上运行，从而简化强化学习算法的开发过程。

DeepMind最新力作：分布式强化学习框架Acme，智能体并行性加强

近年来，在深度学习技术和算力提升的双重加持下，强化学习已经在众多复杂的 AI 挑战中取得了辉煌战绩。无论是象棋、围棋、麻将，还是王者荣耀以及各类雅达利经典游戏，强化学习的表现都足以令人叹服。

DeepMind最新力作：分布式强化学习框架Acme，智能体并行性加强

机器学习的核心：优化的简介

优化是几乎所有机器学习和统计技术的核心。在本文中，我们讨论最流行的机器学习和统计建模方法背后的核心优化框架。通常，数据科学（DS）和机器学习（ML）的新手通常被建议去学习统计学和线性代数方面的所有知识。想要在数据科学或机器学习取得事业成功，确实需要在两个科目中建立坚实基础。然而，优化这个话题虽然不那么受关注，但对于任何严肃的数据科学和分析从业者来说同样重要。

强化学习-Reinforcement learning | RL

强化学习算法的思路非常简单，以游戏为例，如果在游戏中采取某种策略可以取得较高的得分，那么就进一步「强化」这种策略，以期继续取得较好的结果。这种策略与日常生活中的各种「绩效奖励」非常类似。我们平时也常常用这样的策略来提高自己的游戏水平。

Twitter 开源增强学习框架Torch-twrl ，可与OpenAI 无缝对接

【新智元导读】大公司关于增强学习的开源项目目前还不多，Twitter 这次走在了前面。增强学习除了玩游戏以外，在解决现实问题上也可以得到应用，比如，高自由度的机器人控制以及大规模的推荐任务，这些任务往往附带着复杂的目标。智能的推荐系统任务对于 twitter 的信息流呈现非常重要，决定着用户的使用体验。机器学习的进步由多个领域的创新和创意驱动。从人类学习事物的方式获得启发，增强学习（RL）指的是系列算法，能够通过试错的回馈来进行提升，可以进一步优化未来的表现。棋类游戏和电子游戏通常都会有定义明确的回馈函

人工智能的核心技术是什么？

这个系统能做的事情特别简单，就是在一个封闭的狭小空间里移动一些积木块，比如可以用自然语言来命令这个系统把红色立方体上面的绿色椎体挪下来。

干货 | 机器学习没有你想的那么复杂

作者 | Anish Phadnis 翻译 | Mika 本文为 CDA 数据分析师原创作品，转载需授权人脑是最神奇的。你知道我更感兴趣的是什么吗？是我们的学习能力。我们如何能够适应并学习全新的技能

利用好奇心做稀疏反馈任务的学习

AI 研习社按：近期，Unity 发布了版本 0.4 的机器学习智能体工具包（ML-Agent toolkit v0.4），其中最为突出的新功能是通过额外的基于好奇心的内在激励进行智能体的训练。由于这个新功能在解释时有很多方面需要解开，作者 Arthur Juliani 独立编写了一篇文章进行描述。AI 研习社把这篇文章编译如下。

利用好奇心做稀疏反馈任务的学习

AI 科技评论按：近期，Unity 发布了版本 0.4 的机器学习智能体工具包（ML-Agent toolkit v0.4），其中最为突出的新功能是通过额外的基于好奇心的内在激励进行智能体的训练。由于这个新功能在解释时有很多方面需要解开，作者 Arthur Juliani 独立编写了一篇文章进行描述。AI 科技评论把这篇文章编译如下。

机器学习和人工智能之间的区别

人工智能和机器学习都是计算机科学领域的术语。本文讨论了一些要点，我们可以根据这些要点来区分这两个术语。

让人工智能发明自己的语言：OpenAI语言理解研究新方向

选自OpenAI 作者：Igor Mordatch 等机器之心编译参与：李泽南、蒋思源、微胖、黄小天在本文中，OpenAI 展示了自己的新研究，让人工智能体开发自己的语言。 OpenAI 研究人员认为：人工智能只有将学习的语言与实践相结合才能真正理解语言，而不是从巨大语料库中找寻语言模式。作为人工智语言之旅的第一步，我们应该研究人工智能是否可以通过交互合作自发产生一种简单的语言作为其通信工具，该研究的两篇论文已经发表在arXiv 上（见文末）。让人工智能发明自己的语言 OpenAI 刚刚发布了让人工

IEEE智能系统10大AI青年科学家公布：南大俞扬、腾讯AI Lab刘威入选

机器之心编译近日，IEEE Intelligent System 评选的「AI's 10 to Watch」青年科学家榜单公布，其中有许多我们熟知的华人研究者，包括腾讯 AI Lab 的刘威、南京大学的俞扬等。 IEEE Intelligent System 一直致力于通过「AI's 10 to Watch」特辑向人们介绍全球最有抱负的青年 AI 科学家。和往常一样，今年的榜单包含了 10 位 AI 领域里的新星研究者。2017 年，IEEE Intelligent System 从全球范围内寻找候选提

实时反馈避障控制无人机飞向目标代码讲解

https://learnableloop.com/posts/FlyToTarget_PORT.html

Yoshua Bengio：深度学习如何实现系统进化？

8月29日至30日，主题为“智周万物”的2020年中国人工智能大会（CCAI 2020）在位于江苏南京的新加坡·南京生态科技岛举办。

Leslie Valiant：机器学习所面临的挑战

9月6日，以“AI赋能，驱动未来”为主题的2018中国人工智能峰会（CAIS 2018）在南京国际博览会议中心成功召开。本次峰会汇聚了Leslie Valiant、吴恩达、周志华、李波等人工智能领域的多位顶级大咖以及京东、ARM、华为、小米、拜腾等企业代表。其中，2010年图灵奖得主、英国皇家学会会士，美国科学院院士，哈佛大学教授Leslie Valiant带来了主题为《Challenges for Machine Learning》的演讲。

免费报名丨RLChina 2021 强化学习暑期课，20位RL专家为你保驾护航！

免费报名丨RLChina 2021 强化学习暑期课，20位RL专家为你保驾护航！导读 RLChina 暑期课是由 UCL 汪军老师发起，所有参与教师共同分享给广大强化学习爱好者的免费网络直播课程。2020 年的课程吸引了超过 3 千名报名学员，获得了广泛的好评。今年，RLChina 暑期课全新升级，20 位来自全球顶级高校和企业的强化学习专家共同为大家讲解从入门到前沿的强化学习知识，此外还准备了习题课、智能体竞赛日、决策智能创业日帮助大家全方位地接触强化学习落地实践。课程安排时间 2021 年 8

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐