选自Hackernoon 作者:Michaël Trazzi 机器之心编译 参与:程耀彤、路雪 人工智能已经在围棋、图像识别和语音识别等领域达到或超越了人类专家的水平,但今天看来,智能化的机器还离我们很远。要想实现通用智能,AI 智能体必须学习如何在共享环境中与「他人」进行互动:这就是多智能体强化学习面临的挑战。 本文将通过地图寻宝问题为例,向你简要介绍多智能体系统实施时的困难程度及其原因。 「研究人工智能三十五年来的主要经验是:困难的问题是易解的,简单的问题是难解的。」Pinker (1994),《The
导读:3月18日,微软AI讲堂2019校园行在第一站——中国科学院计算技术研究所启幕,微软亚洲研究院副院长刘铁岩博士为同学们带来了一场精彩的主题演讲,分享如何弥合研究与实际应用的裂隙,从现实中发现机器学习的研究问题,做帮助人们解决现实痛点的机器学习研究。
CSDN 出品的《2018-2019 中国人工智能产业路线图》V2.0 版即将重磅面世!
AI 科技评论按:现在提到 AI 的时候,大家已经很少联想到电影《终结者》中的天网那样有自己独特思维逻辑以至于得出了反人类结论的「超人类智能」了。这当然是件好事,说明我们都知道了现阶段的 AI 并不具有那样的逻辑思维能力,沿着现有方向继续发展下去也不会有;也说明我们已经了解了身边就有形形色色的运用机器学习解决具体问题的技术成果。
强化学习是机器学习领域中一种重要且强大的学习范式,它通过智能体与环境的交互学习,在不断尝试和错误的过程中,优化其行为以最大化累积奖励。强化学习在许多现实场景中展现出了卓越的应用潜力,如自动驾驶、游戏策略优化、机器人控制等领域。
Facebook研究人员使用35亿公众Instagram照片来训练算法,以便为自己分类图像。拥有如此多的培训图像帮助Facebook的团队创造了一项测试的新纪录,该测试挑战软件将照片分配到1,000种类别,包括猫,汽车轮子和圣诞袜。 Facebook表示,在10亿Instagram图像上训练的算法正确识别出测试中85.4%的照片。随着顶级机器学习研究人员雇用的成本很高,他们可以更快地运行他们的实验,工作效率就会提高。(via Wired)
这篇文档可能还是会非常长,因为机器学习并不是纯软件开发,简单地调用库函数 API,需要有一定的理论支撑,如果完全不介绍理论部分,可能就不知道为什么模型要这样设计,模型出了问题应该怎样改善。
本期 Arxiv Insights 将重点介绍机器学习中的子领域“强化学习”,也是机器人最具智能前景的方向之一。
「博弈论」这个词可能对于一些仅仅致力于机器学习前沿算法的人并不算熟悉。其实,有意无意的,博弈论的思想一直存在于很多机器学习的探索过程中,不管是经典的 SVM,还是大火的 GAN,这些模型的背后都有博弈论的影子。
AI 科技评论按:喜欢机器学习和人工智能,却发现埋头苦练枯燥乏味还杀时间?油管频道 Arxiv Insights 每周精选,从技术视角出发,带你轻松深度学习。
选自arXiv 作者:Andrea Banino等 机器之心编译 编辑:陈萍、杜伟 来自 DeepMind 的研究者提出了用于强化学习的 CoBERL 智能体,它结合了新的对比损失以及混合 LSTM-transformer 架构,可以提高处理数据效率。实验表明,CoBERL 在整个 Atari 套件、一组控制任务和具有挑战性的 3D 环境中可以不断提高性能。 近些年,多智能体强化学习取得了突破性进展,例如 DeepMind 开发的 AlphaStar 在星际争霸 II 中击败了职业星际玩家,超过了 99.8
正如吴恩达所言,当代机器学习算法的成功很大程度上是由于模型和数据集大小的增加,在大规模数据下进行分布式训练也逐渐变得普遍,而如何在大规模数据、大模型的情况下进行计算,还是一个挑战。
技术的新变革时代 以机器学习为代表的人工智能技术,已经被业界公认为是自互联网以来最伟大的技术革命。通过深度学习算法、大数据、计算硬件这三方面的积累和跃迁,IT业界也终于迎来新一轮的范式转换(Parad
假期时我曾看过电影《模仿游戏》,对阿兰·麦席森·图灵的故事产生了浓厚的兴趣。而现在在大学里,无论是在走近数据科学、信息处理基础的课堂上,还是在这几次的专题讲座报告中,我都经常地能够听到图灵的名字。我想,不妨就把他当做我的一个论文的研究方向吧,也能让我收获一种小小的满足。
【导读】本文是数据科学家Vijay Yadav的一篇帖子,主要内容是介绍机器学习和人工智能的概念。对于很多刚刚入门人工智能的读者,可能会有这么一个疑问:人工智能和机器学习到底都是什么?本文介绍了人类智
AI 科技评论按:计算机编程发展至今,bug 和软件就一直如影随形。多年来,软件开发人员已经创建了一套在部署之前进行测试和调试的最佳方法,但这些方法并不适用于如今的深度学习系统。现在,机器学习的主流方法是基于训练数据集来训练系统,然后在另一组数据集上对其进行测试。虽然这样能够显示模型的平均性能,但即使在最坏的情况下,保证稳健或可被接受的高性能也是至关重要的。对此,DeepMind 发布文章介绍了能够严格识别和消除学习预测模型中的 bug 的三种方法:对抗测试(adversarial testing)、鲁棒学习(robust learning)和形式化验证(formal verification)。AI 科技评论编译如下。
本指南旨在让任何人访问。将讨论概率,统计学,程序设计,线性代数和微积分的基本概念,但从本系列中学到东西,不需要事先了解它们。
作者:Rui Wang、Joel Lehman、Jeff Clune、Kenneth O. Stanley
在并不算漫长的AI(人工智能)发展史,各种行业背景的专家助力了AI极大的发展,也带来了很多专业术语、概念。术语对于专业研究者是比较清晰及严谨,但对于初学者可能就有理解层面的困扰。
在本文的上篇,我们尝试分别从机器学习算法、计算语言处理、计算机视觉及机器人分领域对ML算法发展趋势进行总结。在本文的下篇,我们尝试打破领域的边界,形成一份全局性的总结。本文仅选取分析结论部分,详细数据及分析过程将收录在《2021-2022年度 AI科技发展趋势报告》完整版中。
目前人工智能技术已经开始应用在很多领域,对人工智能技术的提升和发展也成了人们的重要工作任务。
近年来,在大数据、云计算等技术升级的共同推动下,人工智能技术及应用取得了蓬勃发展。如今,继“互联网+”之后,“AI+”已蔚然成风。
为了进行这个捉迷藏游戏,OpenAI 首先构建了一个包含墙、盒子和斜坡的 3D 环境。在这个环境中,智能体以团队为单位进行捉迷藏游戏。
机器之心知识站与国际顶尖实验室及研究团队合作,将陆续推出系统展现实验室成果的系列技术直播,作为深入国际顶尖团队及其前沿工作的又一个入口。赶紧点击「阅读原文」关注起来吧! 人工智能已经在围棋、图像识别和语音识别等领域达到甚至超越了人类专家水平,但智能化的机器离我们仍然很远。要想实现通用智能,AI智能体必须学习如何在共享环境中与「他人」进行互动,由此便产生了人工智能的一个前沿研究领域:多智能体学习。 多智能体学习的问题存在于多个领域。在这些问题中,多个智能体不仅与环境相互作用,而且彼此互动,由此造成的复杂和多变
前者如实现一个功能、搭建一个服务、实现一种展现交互方式等。更关注的是如何实现功能,如何对于各种复杂甚至小众的场景都不出错。互联网中典型的后端、前端、平台、网络工程师的主要工作是这一类。
在厦门人工智能峰会上,依图科技联合创始人、CEO朱珑介绍到短短的5年时间机器的算法水平又提升了100万倍!过去或许只能从1万人中识别出1个人,后来发展到1000万、1亿、10亿甚至20亿人中识别出这个人!与此同时,算力方面提升了10万倍。从过去用1万量级规模的数据做训练,到百万规模的数据做训练,到现在用10亿的数据集做训练,又提升了1万倍!
在2017年,“人工智能”这个词得到了公众前所未有的关注,究其原因我认为与两方面有关,一方面人工智能学术领域自身产生了一些进步,另一方面则更多与媒体和业界噱头式的鼓吹有关,两相叠加促使“人工智能”一词被滥用,进而导致其含义变得模糊和广义,偏离了人工智能的初衷。这篇文章就结合我的理解从以下几个方面来讨论下这个热词。公众号文章篇幅不宜冗长,故斟字酌句力求无赘述,如有错谬之处,敬请不吝告知。 人类期待的人工智能 谈到人工智能的科幻色彩,有几部非常经典的影视作品:2001太空漫游(1968)、银翼杀手(1982
9 月 21 日至 22 日,为期两天的 CCAI 2019 正在秋意浓浓的中国青岛胶州隆重举行。本次会议选址室外体育馆召开,为原本严肃的学术会议增添了几分活泼、惬意的色彩。
麻将无疑是我国最家喻户晓,老少咸宜的一项棋牌游戏。近年来,随着人工智能在围棋、德州扑克、Dota、星际争霸等众多游戏中获得亮眼的成绩,AI 在麻将领域却一直缺少跨越性的突破。
随着人工智能的发展,机器学习的技术越来越多地被应用在社会的各个领域,来帮助人们进行决策,其潜在的影响力已经变得越来越大,特别是在具有重要影响力的领域,例如刑事判决、福利评估、资源分配等。
DeepMind 本周发布了一个强化学习优化框架 Acme,可以让AI驱动的智能体在不同的执行规模上运行,从而简化强化学习算法的开发过程。
近年来,在深度学习技术和算力提升的双重加持下,强化学习已经在众多复杂的 AI 挑战中取得了辉煌战绩。无论是象棋、围棋、麻将,还是王者荣耀以及各类雅达利经典游戏,强化学习的表现都足以令人叹服。
优化是几乎所有机器学习和统计技术的核心。在本文中,我们讨论最流行的机器学习和统计建模方法背后的核心优化框架。通常,数据科学(DS)和机器学习(ML)的新手通常被建议去学习统计学和线性代数方面的所有知识。想要在数据科学或机器学习取得事业成功,确实需要在两个科目中建立坚实基础。然而,优化这个话题虽然不那么受关注,但对于任何严肃的数据科学和分析从业者来说同样重要。
强化学习算法的思路非常简单,以游戏为例,如果在游戏中采取某种策略可以取得较高的得分,那么就进一步「强化」这种策略,以期继续取得较好的结果。这种策略与日常生活中的各种「绩效奖励」非常类似。我们平时也常常用这样的策略来提高自己的游戏水平。
【新智元导读】大公司关于增强学习的开源项目目前还不多,Twitter 这次走在了前面。增强学习除了玩游戏以外,在解决现实问题上也可以得到应用,比如,高自由度的机器人控制以及大规模的推荐任务,这些任务往往附带着复杂的目标。智能的推荐系统任务对于 twitter 的信息流呈现非常重要,决定着用户的使用体验。 机器学习的进步由多个领域的创新和创意驱动。从人类学习事物的方式获得启发,增强学习(RL)指的是系列算法,能够通过试错的回馈来进行提升,可以进一步优化未来的表现。 棋类游戏和电子游戏通常都会有定义明确的回馈函
这个系统能做的事情特别简单,就是在一个封闭的狭小空间里移动一些积木块,比如可以用自然语言来命令这个系统把红色立方体上面的绿色椎体挪下来。
作者 | Anish Phadnis 翻译 | Mika 本文为 CDA 数据分析师原创作品,转载需授权 人脑是最神奇的。你知道我更感兴趣的是什么吗?是我们的学习能力。我们如何能够适应并学习全新的技能
AI 研习社按:近期,Unity 发布了版本 0.4 的机器学习智能体工具包(ML-Agent toolkit v0.4),其中最为突出的新功能是通过额外的基于好奇心的内在激励进行智能体的训练。由于这个新功能在解释时有很多方面需要解开,作者 Arthur Juliani 独立编写了一篇文章进行描述。AI 研习社把这篇文章编译如下。
AI 科技评论按:近期,Unity 发布了版本 0.4 的机器学习智能体工具包(ML-Agent toolkit v0.4),其中最为突出的新功能是通过额外的基于好奇心的内在激励进行智能体的训练。由于这个新功能在解释时有很多方面需要解开,作者 Arthur Juliani 独立编写了一篇文章进行描述。AI 科技评论把这篇文章编译如下。
人工智能和机器学习都是计算机科学领域的术语。本文讨论了一些要点,我们可以根据这些要点来区分这两个术语。
选自OpenAI 作者:Igor Mordatch 等 机器之心编译 参与:李泽南、蒋思源、微胖、黄小天 在本文中,OpenAI 展示了自己的新研究,让人工智能体开发自己的语言。 OpenAI 研究人员认为:人工智能只有将学习的语言与实践相结合才能真正理解语言,而不是从巨大语料库中找寻语言模式。作为人工智语言之旅的第一步,我们应该研究人工智能是否可以通过交互合作自发产生一种简单的语言作为其通信工具,该研究的两篇论文已经发表在arXiv 上(见文末)。 让人工智能发明自己的语言 OpenAI 刚刚发布了让人工
机器之心编译 近日,IEEE Intelligent System 评选的「AI's 10 to Watch」青年科学家榜单公布,其中有许多我们熟知的华人研究者,包括腾讯 AI Lab 的刘威、南京大学的俞扬等。 IEEE Intelligent System 一直致力于通过「AI's 10 to Watch」特辑向人们介绍全球最有抱负的青年 AI 科学家。和往常一样,今年的榜单包含了 10 位 AI 领域里的新星研究者。2017 年,IEEE Intelligent System 从全球范围内寻找候选提
https://learnableloop.com/posts/FlyToTarget_PORT.html
8月29日至30日,主题为“智周万物”的2020年中国人工智能大会(CCAI 2020)在位于江苏南京的新加坡·南京生态科技岛举办。
9月6日,以“AI赋能,驱动未来”为主题的2018中国人工智能峰会(CAIS 2018)在南京国际博览会议中心成功召开。本次峰会汇聚了Leslie Valiant、吴恩达、周志华、李波等人工智能领域的多位顶级大咖以及京东、ARM、华为、小米、拜腾等企业代表。其中,2010年图灵奖得主、英国皇家学会会士,美国科学院院士,哈佛大学教授Leslie Valiant带来了主题为《Challenges for Machine Learning》的演讲 。
免费报名丨RLChina 2021 强化学习暑期课,20位RL专家为你保驾护航! 导读 RLChina 暑期课是由 UCL 汪军老师发起,所有参与教师共同分享给广大强化学习爱好者的免费网络直播课程。2020 年的课程吸引了超过 3 千名报名学员,获得了广泛的好评。今年,RLChina 暑期课全新升级,20 位来自全球顶级高校和企业的强化学习专家共同为大家讲解从入门到前沿的强化学习知识,此外还准备了习题课、智能体竞赛日、决策智能创业日帮助大家全方位地接触强化学习落地实践。 课程安排 时 间 2021 年 8
领取专属 10元无门槛券
手把手带您无忧上云