机器学习与模式识别是走在正确的路上吗?刘成林、李航、周明等这样回答

为了更好地引导和推动我国人工智能领域的发展,由中国人工智能学会发起主办,CSDN承办的2015中国人工智能大会(CCAI 2015)于7月26-27日在北京友谊宾馆召开。本次会议的主旨是创办国内人工智能领域规模最大、规格最高的高水平学术和技术盛会,汇聚国内外顶级的专家学者及产业界人士,围绕当前最新热点和发展趋势的话题进行交流与探讨,并针对“机器学习与模式识别”“大数据的机遇与挑战”“人工智能与认知科学”“智能机器人的未来”四个主题进行专题研讨,努力打造国内人工智能前沿技术和学术交流的平台。

在7月27 日下午的下午“机器学习与模式识别”分论坛环节,中科院自动化所模式识别国家重点实验室主任刘成林、华为诺亚方舟实验室主任李航、北京交通大学计算机科学系主任于剑、北京大学信息科学技术学院智能科学系教授查红彬、微软研究院首席研究员周明、京东智能通讯部总监刘丹等专家,就人工智能的概念、深度学习、关于自然语言理解、关于图像视频分析、关于智能系统、关于跟踪与坚守等七个话题各抒己见。本次分论坛由中科院自动化所研究员宗成庆主持。

中科院自动化所研究员 宗成庆

作为主持人,宗成庆提出了他最近对人工智能的七个思考,请六位专家就其中的某问题发表自己的意见。问题如下:

1.人工智能技术包括什么。上世纪80-90年代,人工智能一度“受宠若惊”,而后“臭不可闻”。30年后的今天,人工智能再度获得热捧。人工智能是否有 了新的内涵?什么是人工智能核心内容?抛开自然语言理解、图像视频识别和理解、搜索算法、知识工程外,还有什么?

2.机器学习在不到10年时间中,迁移学习、增强学习、概率图模型、深度学习等相继被热捧。而深度学习方法之前的每一种都不过持续2-3年时间便黯然失宠。无论哪一种统计学习方法都是建立在大规模测试样本之上的模型,难以做到以一反三。现在机器学习是在正确的路上,并向正确方向发展么?

3.深度学习(DL)方法与人工神经网络(ANN)方法在数学上没有本质区别?难道仅是网络层数的加深,那么多少层网络才算“够深”?

4.关于自然语言理解,在自然语言处理(NLP)中,很多问题都被转化为分类问题或者序列标注问题。但不同的问题使用相同解决方法,对于不同处理任务用同一样处理思路,自然不会得到很好 的处理结果。要真正实现从“处理”到“理解”的出路何在?

5.图像、视频分析作为模式识别最基础性的问题,在边界分割和模式匹配,检索等方面取得了若干优秀成果。但多大程度上体现了“智能”,离“理解”还有多远?

6.智能系统,一个实用系统需要多种技术集成,而不是某个单项技术的结果。如无人驾驶汽车。而简单的技术集成是否会成为“智能系统”?除了“图灵测试”, 如何测量一个应用系统的智 能行?

7.最后是关于跟踪和坚守。每年技术变化都很快。有些被抬高,有的昙花一现,有的被冷落后由于硬件性能改变而在此推向波峰,甚至多次轮回。如何在热闹中把握 冷和热的平衡,既保持冷静的头脑,又坚守自己的学术理想?

北京大学智能科学系教授、机器感知与智能教育部重点实验室主任 查红彬

北京大学智能科学系教授、机器感知与智能教育部重点实验室主任查红彬就“从深度学习中得到了什么?还应该做些什么”展开分享。在他看来,智能的本质是对环境自身状态变化的一种预测的能力,他认为这中预测能力同生物进化论很相近,在已有知识和数据不充分情况下的预测。而获得预测能力的基本途径是学习。

学习就是人工智能研究的核心内容。从研究进程来看,查教授将其分为物理符号主义:人为定义推理与行为规则;专家系统:手工构建专家知识库;浅层神经网络:简单规整数据的学习;深度学习:利用大规模网络数据来进行多层网络学习四个过程。从手工操作、死记硬背到学习再到自主学习一步步的发展,但深度学习真的自主 吗?查教授认为自主学习要能自动定义学习目标,自主获取所需数据,通过自身能力完成学习,建立社会网络,实现知识的积累。谈到自主学习的意义,查教授表示第一是解决符号接地问题,重点在于概念与意义的获取;其次是解决框架问题,

就是如何在问题领域的界定与尝试有所提高。这样智能演化将会迎来智能发展的起点。最后,对于机器感知研究的重要性,查教授认为只有机器感知才能人机环境互动,进而才能自主学习,从而达到智能演化。并且查教授讲到未来人工智能还有很长的路要走。

微软研究院首席研究员、自然语言计算组经理周明

微软研究院首席研究员、自然语言计算组经理周明从自然语言理解的角度分享了自己对人工智能的看法:他认为强大的需求驱动、大数据推动系统水平提升、计算能力(云计算)、用户自然进入了Loop,人-机有了更好的配合等,成为人工智能新的发展机遇。技术方面来看,计算智能、记忆智能已经解决;感知智能接近实用化;认知智能(主 要是自然语言理解)快速发展,比如从分词、NER、SRL、问答等,建立了不错的技术体系,但仍然存在与篇章、上下文、领域自适应问题;然后周明谈到了自己对于机器学习和深度学习的亲身体会,目前统计机器学习中用到多种技术,瓶颈转到了数据,尤其是带标注的数据的大规模获取和占用。目前同样面临着数据稀疏、领域迁移、训练能力等问题。对于深度学习,周明表示深度学习对自然语言很多任务都有很好的前景,只是我们还存在着差距,并建议利用深度学习的技术来重做自然语言的各个任务,进而观察是否会有进步。

最后他谈到了自身的的一点思考,第一个是从人工智能的角度深入研究,规则系统、模型系统如何进行融合,而不是说只是去追求某一项技术,第二个是从应用驱动的角度考虑,即人工智能+,去做有用的技术,考虑到人的因素,追求最佳的用户体验而不是纯粹自动化。

中科院自动化所模式识别国家重点实验室主任刘成林

中科院自动化所模式识别国家重点实验室主任刘成林从模式识别的角度分享了他对人工智能的看法,包括模式识别的现状和发展趋势。人工智能是一个很热的词,范围很广,最主要的是感知和认知,他表示从80年代开始模式识别和人工智能开始融合。模式识别领域最重要的是深度学习和大数据,因为有了深度学习和大数据将模式识别的性能向前推进一大步,但模式识别的基础理论并没有太大的进展,理论和方法的进展得益于过去几十年不断的积累,历史上即使是某一段时间比如长达十年的期间觉得这个领域没有太大进展,实际上它的基础理论研究还是在不断的进行,不断的涌现出一些新的进展。对于模式识别未来,他表示从模式识别的应用角度来看,有两方面明显不足,第一个是建立在大数据基础上,在现实中需要收集大量的样本和数据,所以门槛较高,第二模式识别和人的模式识别不一样,还有很大的提升空间。所以,未来的模式识别还是内容的识别,以及自适应学习,小样本学习,多模态学习,多任务协同等。对于自主学习,刘主任谈到,即便是在将来谈自主学习,也并不是将过去完全推翻从新来过,而是将过去的学习方法综合起来将其应用的更好,这应该成为未来研究的趋势。

华为诺亚方舟实验室主任李航

华为诺亚方舟实验室主任李航就深度学习发表了自己的看法,他认为深度学习可以给我们带来很大的机会,虽然不一定能达到最终目标,但有可能会前进一大步。紧接着他分享了三个实例。第一是深度学习 2006年开始出现,但一直到2012年,都是第一阶段。2012年-现在,深度学习进展让人耳目一新。谷歌的DeepMind深度强化学习,以及Q- learning等,有了更强计算能力,会出现更强的机器。第二是神经网络图灵机的出现,可以模拟人类大脑的短期记忆,外部网络的读写通过外部存储器完成,而在存储记忆之后,通过检索从而执行一些有逻辑性的任务。第三是深度学习带来了自然语言处理的很大机会。有了大数据,有了非常强大的计算机,我们就越来越强大,我们以前可能敢想不敢做的事情慢慢都有了可能。李航从另一个角度也谈到不要对深度学习期望过高,因为仅靠深度学习不太可能实现和人类一样的智能。但是深度学习很有可能能够使得计算机变得越来越智能化,包括神经图灵机这样的概念,这出现基于大数据、基于网络控制的图灵机,进而很有可能更接近人的行为,可能更像人。这应是我们目前看到的挑战和机遇。

北京交通大学计算机科学系主任 于剑

北 京交通大学计算机科学系主任于剑从一个老师的角度就人工智能发表了自己的看法:他首先谈到知识是什么?这个问题严重制约了下一步的发展,知识的表述有框架结构和语义等,但两个结构也不可能表示所有的知识,只是表示了部分知识。到学习阶段,就无法实现自动化。对于知识图谱,首先应该弄清楚什么是知识,知识怎么表示 ,他认为并没有一个很好的途径。另外,对于学习,通俗来说学习就是通过数据的积累,将系统的性能提高,随着经验的增长,知识相应提高。知识是由概念组成的。提 到概念首先应该清楚命题 。而这里很多概念是没法明晰的定义,所以识别概念是人工智能重要的能力,人工智能关键是理论的进展,不要稀里糊涂的就做下去。最后他表示人工智能目前当然技术都可以研究,但是更重要的是在它的基础问题应该更加有所突破,不要沾沾自喜于我们目前技术的进步。因为随着时间的演化,技术总是在进步,但是更重要的就是理论的进展。

京东智能通讯部总监刘丹

京东智能通讯部总监刘丹从实践方面主要分享了三方面:目前人工智能(深度学习)除了图灵测试之外有没有更好的产品来评测,而京东做的在线智能客服机器人,通过在线用户沟通后,给出满意度评价,具体分析系统是否智能,从第三方数据显示,比人工满意度还高。

第二点人工智能包含多方面技术,封闭式环境这类特定场景中,是可以量化评估的;例如电商领域人工智能对问题回答满意度,包括上下文处理方面,80%的人是对回答非常满意,所以人工智能目标应是特定场景里面的应用。

第三个人工智能对深度学习意义大不大?刘丹认为意义很大。京东智能通讯部在做知识图谱相关东西,其中包括用户画像,用户画像不单单只是做标签,这个人的姓名、爱好、画像。深度学习可以做深层次的推理,得到更深层次关系,包括他的妻子,包括他的妻子有什么爱好,包括他购买什么东西有什么爱好,这样在精准营销方面达到比较好的效果。京东通过深度学习支持的算法得到的效果是一般人工效果的2.3倍,人工就是通常讲的打标签。这块路是最准确的,就像是做火箭的过程,做火箭不是一天两天达到登月球的过程。这是特定的环境,通过一个领域才能达到人工智能的极致。

更详细的会议日程和相关信息请随时关注大会官网(持续更新中):http://ccai2015.csdn.net/。

【公告】更多人工智能技术分享与交流,请加入CSDN 人工智能技术交流QQ群,群号:465538150。我们将邀请一线专家进行分享!

原文发布于微信公众号 - 人工智能头条(AI_Thinker)

原文发表时间:2015-07-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

探讨自然语言处理的商业落地:从基础平台到数据算法 | CCF-GAIR 2018

AI 科技评论按:2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了...

2034
来自专栏大数据文摘

百度余凯:数据是极好的竞争壁垒

27811
来自专栏量子位

提到强化学习只知道AlphaGo?其实,RL在工业界还有这些应用

原作 Ben Lorica 唐旭 编译自 Oreilly 量子位 出品 | 公众号 QbitAI 关于作者: Ben Lorica,O’Reilly Media...

2803
来自专栏钱塘大数据

发展大数据不要一味追求数据规模大,要“应用为先”

作者:李国杰 ? 中国信息化百人会学术委员、中国工程院院士李国杰认为,目前大数据技术还不成熟,面对海量、异构、动态变化的数据,传统的数据处理和分析技术难以应对...

33411
来自专栏互联网数据官iCDO

《让数据说话—浅析数据分析在销售管理过程中对企业发展的价值》

前言:“数据(data)”已经成为21世纪商业的代名词。聚拢大量数据的浪潮正变得愈加猛烈。公司无论所属行业和规模大小,都竭力想要实现以数据为基础驱动公司内部和外...

2875
来自专栏企鹅号快讯

量子计算结合机器学习,即便是在初始阶段也极具前景

虽说爱因斯坦曾经拒绝量子力学,说上帝不会掷骰子,但有些投资人及公司都迫切希望,上帝就是靠掷骰子的。 Alexa 和 Siri 可以理解你在说什么,自动驾驶汽车穿...

2309
来自专栏PPV课数据科学社区

【学习】如何成长为顶级数据分析师和数据挖掘师?

#玩转大数据#12点的钟声敲响后,意味着已经跨过2015,进入2016了。新的一年应该拥有新的开端以及新的计划目标,也标志着新的希望。一个数据科学家在年尾做了一...

3824
来自专栏钱塘大数据

《哈佛商业评论》:人工智能商业之路的机遇和挑战

250多年来,经济增长的根本动力一直是技术创新。其中最重要的是经济学家所谓的通用技术——包括蒸汽机、电力和内燃机。每一个都催化了互补创新和机遇的浪潮。例如,内燃...

37311
来自专栏钱塘大数据

【大咖说】发展大数据不要一味追求数据规模大,要“应用为先”

导读:中国信息化百人会学术委员、中国工程院院士李国杰认为,目前大数据技术还不成熟,面对海量、异构、动态变化的数据,传统的数据处理和分析技术难以应对,现有的数据处...

3696
来自专栏AI科技大本营的专栏

Google Brain团队最新视频介绍

刚刚,Google Brain团队发布了一个全新的介绍视频"Meet a few of our machine learning makers",Jeff De...

4106

扫码关注云+社区