前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >专访阿里研究员袁全:从 AI 玩《星际争霸》谈认知智能的现状与趋势

专访阿里研究员袁全:从 AI 玩《星际争霸》谈认知智能的现状与趋势

作者头像
用户1737318
发布2018-07-20 16:07:35
5710
发布2018-07-20 16:07:35
举报
文章被收录于专栏:人工智能头条人工智能头条

不同于以提升点击率和转化率等优化指标为主的机器学习模型,认知计算以实现算法和智能化为核心,训练智能体的自主学习能力,以及多个智能体之间的协作和配合能力,和原来优化大数据和算法具有很大的区别。

近日,CSDN记者就认知计算、应用场景、算法优化、深度学习以及云计算&大数据技术的关系等问题与阿里认知计算实验室研究员、资深总监袁泉(花名:袁全)进行了深入探讨。

阿里认知计算实验室研究员、资深总监袁全(左一)

深耕细作,瞭望人工智能新征程

“人工智能时代,我们专注认知计算研究,以积累核心算法系统为首要目标”——袁全。

袁全的研究始于06年开始的个性化推荐,彼时他在IBM研究院率先研发这一新技术。在12年加入阿里后,他主要负责手机淘宝、天猫的个性化推荐技术,包括算法、平台和产品的协同。袁全和他的团队致力于个性化推荐算法,典型产品有“有好货”、“猜你喜欢”等。15-16年团队主要研究淘宝首页的全面个性化,在去年年中的时候,以AlphaGo为代表的人工智能、认知决策技术的升级带来了非常多的新理念和新技术,袁全所带领的新团队也转战认知计算这一领域,目标是在人工智能时代,积累核心算法系统和能力。

挑战与机遇并存,认知学习深入解读

“最大的挑战在于它是一个非常新的多种类交叉学科,涉及内脑科学、认知心理学、机器学习甚至是博弈论,是一个全新的开始”——袁全。

推荐是经典的机器学习&大数据任务,依赖于每天产生的上亿用户数据,而认知计算最核心的能力是实现算法的智能化,提升智能体的自主学习能力,对大数据依赖性会变弱。从商品推荐到认知计算这一转变过程中,最重要的是要依靠认知科学来启发算法的认知设计,袁全表示,因为人脑是我们唯一所知的具有举一反三学习能力的物体,所以其中最大的挑战就在于它是一个非常新的多种类的交叉学科,涉及脑科学、认知心理学、机器学习甚至是博弈论,是一个全新的开始。

最近袁全带领团队在星际争霸游戏中对智能体的研究,则恰好验证了这一点。他们与伦敦大学学院计算机系汪军教授紧密配合,发布并开源了Gym StarCraft https://github.com/alibaba/gym-starcraft 框架,探索新的训练智能体的方式,而不再像以前那样仅以提升学习指标为目标,而是致力于在一个干净的的环境中,训练智能体的自主学习能力,以及多个智能体之间的沟通与协作。事实上,《星际争霸》有其自身的特点,它的搜索空间比围棋更大,围棋是10的100次方数量级,而完整的星际游戏却是10的1000次方,整整大了10个数量级。而且不同于围棋双方博弈的透明性,《星际争霸》的决策是不确定性博弈,需要平衡短中长期的收益,与电商中的若干主要问题联系也很密切。(论文下载:Multiagent Bidirectionally-Coordinated Nets for Learning to Play StarCraft Combat Games https://arxiv.org/abs/1703.10069)

应用于《星际争霸》游戏中的双向协调网络(BiCNet)

深度学习作为认知学习中重要推动力和实验工具,也已演化成研究智能的一个非常重要的平台,包括越来越多的国内外高校都在用深度学习去模拟人脑结构,尤其是深度神经网络对人脑的罗列和实现能力。当然后续也会结合其他流派的一些算法,例如结合符号主义、概率推理等,从而实现更好的学习能力。

机遇与挑战并存,更好的学习能力往往意味着更艰难的当下。袁全表示,在应用过程中,团队不断改进算法等技术,以期实现更佳的效果和用户体验。细化到算法调优上,不仅从agent通信机制间提高通信效率,还兼顾agent个体和全体收益,智能体的反馈激励机制优化、全局和动态信息的组合运用等,使得模型的通用性和扩展能力大大增强。

不过随着智能发展的火爆,各种AI威胁论也随之发酵。从团队的整个学习过程,以及AlphaGo等例子来看,智能的学习能力确实很有可能超越人类,机器协同效率远高于人的协同效率,很可能是一个催化要素,加之硬件和算法不断进步,智能对人类的威胁的确可能存在。现在看来最好的方式,是开放研究、共享新技术,多方共同逼近和实现目标;同时在AI的机制设定上,多引导其往人类不擅长、解决不了的问题上进行,与人类形成良性协作,相互增强。

另外,袁全还谈到了云计算、大数据与认知学习的微妙关系。诚然,智能体的训练对海量数据的处理能力提出了更高的要求,三者相辅相成,但是目前从很多的进展来看,小样本学习的技术也在不断提升,所以数据量级并非越大越好,学习能力越强的智能体对数据的依赖程度越低,这也是一个新的认知。

立足当下,美好蓝图亟待描绘

“引进智能化,理想情况就是说,每个用户背后都会有个智能体在专注地为他服务”——袁全。

在研究认知计算的过程中,袁全的团队由浅入深,不断补缀;结合AI在推荐等领域的应用,袁全认为利用AI去解决推荐的惊喜性问题,是一个技术和商业的很好结合。基于AI提供用户需要但自身并未意识到的商品和信息服务,逐步引进智能化,理想情况就是说,每个用户背后都会有个智能体在专注地为他服务。

给初学者的建议

对于想要从事个性化推荐、认知计算、通用智能的同学,袁全表示,扎实的功底必不可少,包括基础的编程能力和数学能力。在此之上,再根据个人的特点选择分支:甚至是一些偏深入研究的方向,例如,受脑神经科学启发的认知学习机制;或者选择通用智能领域,很多做通用智能的人都具有扎实的机器学习、强化学习背景;最后是非常重要的工程和系统架构能力,这是实现智能必不可少的一点。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-05-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 人工智能头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档