【CCAI 2016专访】今日头条李磊:研发不能只靠有监督学习 知识表示框架是未来AI核心

8月26日至27日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会发起主办、中科院自动化研究所与CSDN共同承办的2016中国人工智能大会(CCAI 2016)在北京辽宁大厦盛大召开,这也是本年度国内人工智能领域规模最大、规格最高的学术和技术盛会,对于我国人工智能领域的研究及应用发展有着极大的推进作用。大会由CSDN网站进行专题直播,并由百度开放云提供独家视频直播技术支持。

在本次大会的“机器学习的明天论坛”中,今日头条科学家、头条实验室总监李磊博士发表了题为《会思考的通用智能机器还有多远?》的演讲,对人工智能的内涵、进展以及面临的挑战三个方面进行了阐述,并接受CSDN记者专访,结合今日头条的研究/研发经验分享了人工智能在实际应用中应当注意的问题,以及未来的关键技术方向。

今日头条科学家、头条实验室总监李磊博士

李磊博士,今日头条科学家、头条实验室总监,原百度美国深度学习实验室少帅科学家。上海交通大学计算机系本科,卡耐基梅隆大学计算机系博士,毕业论文获美国计算机学会SIGKDD最佳博士论文之一。曾于微软研究院、Google、IBM TJ Watson、加州大学伯克利分校工作。研究方向为深度学习、概率模型与推理、自然语言理解。

人工智能的定义与作用

李磊博士援引Stuart Russell和Peter Novig在《人工智能:一种现代方法》一书中对人工智能的两种定义:类人智能和理性智能。

类人智能的目标是让机器像人那样思考、决策、解决问题,具备学习能力和行动能力。

理性智能是研究如何通过计算方法达到合理的感知、决策、解决问题、学习和行为能力。不是和人去比较,而是把计算导出的智能看成自然现象。

李磊认为人工智能可以解决工作效率和质量的问题。以今日头条为例,作为一个鼓励用户创作和内容分发的平台,其实现需要有一个好的推荐算法技术来支持。在这个过程中,今日头条依靠人工智能技术来提升效率和质量。在过去半年时间当中,今日头条发现依靠前沿的人工技能可以大大提高他们最关心的四个环节的效率和质量,分别是:内容的创作,内容的分发和推荐,社区的讨论,以及最后的是审核环节。

监督学习目前最成熟,但好的知识表示框架才是关键

访谈中,李磊说道,整个人工智能领域到现在解决得最好的问题是有监督学习。从2006年到现在的10年时间,最热门的深度学习是解决监督学习这一类问题行之有效的方法,很可能是迄今最有效的方法。但我们在实际的产品研发过程中和实际生活当中需要用来解决的人工智能问题不只是有监督学习,而且需要用的方法也不仅仅是深度学习。李磊认为,我们需要解决的是更多更难的问题,比如逻辑推理或让机器人有更通用的能力。今日头条最近和同北大计算机所万小军教授团队合作研发了新闻写作机器人Xiaomingbot,里约奥运期间它在16天内发布450多篇新闻报道,并且这些报道的可读性非常高,已有超100万用户阅读。但是,要让机器人具备通用能力还是比较棘手的,Xiaomingbot目前可以写体育类新闻,要让他写科幻小说仍然难度。

李磊进一步表示,通用人工智能里面需要解决的问题,最核心就是找到理想的知识表示框架,这个框架需要既能够通用的表示各种各样的知识,同时还有一些高效的计算方法,可以对这个表示方法做快速的计算。

头条实验室的三个研究方向

头条实验室现在做的主要工作包含三个方向,分别是机器学习、自然语言理解和计算机视觉。具体成型的技术应用项目,包括即将问世的自动问答机器人。头条实验室最近在国际自然语言大会(ACL2016)上面发表的一篇论文《CFO: Conditional Focused Neural Question Answering with Large-scale Knowledge Bases》,该技术使得自动问答机器人在回答知识类的问题上可以达到世界第一大准确率,这些问题通常非常困难,候选答案可能就有几千万个。而头条实验室训练数据只有10万个,但回答准确率达到75%,同类世界第二的机器人是Facebook发明的,准确率是62.9%,差距大约是12%。

头条实验室还有另外一项工作,就是概率程序语言(PPL)的推理,其论文《Swift: Compiled Inference for Probabilistic Programming Languages》被2016年国际人工智能联合大会(IJCAI2016)录用。Swift技术把概率逻辑推理速度提升100倍,大幅度超过微软(剑桥研究所)、麻省理工学院、哥伦比亚大学等单位研发的同类系统。

概率程序就是一种知识表示框架,它的核心思想是能够设计出一种程序语言,让很多非专业的人都可以学会。应用这个系统的人可以是心理学家,社会学家,甚至产品设计人员,他们有各自的需求、各自的问题,但都可以用这个语言来描述他们领域里需要处理的问题。他们不需要太熟悉了解机器学习,就可以使用一个通用的计算引擎,自动地用程序语言描述这个问题,自动地推理。这是概率程序语言需要解决的实现目标。

头条实验室的研究挑战

关于技术研究上的难题,李磊表示,每一项工作几乎都是非常困难的,就像黑暗当中去寻找一点光明。头条实验室的每一项工作,包括前面提到的自动问答、写稿机器人,以及概率推理引擎,都需要投入大量的时间和精力。其中概率推理引擎这项工作是2012年李磊在加州大学伯克利的时候就开始有的想法,已经做了非常多的准备,一直到现在才有初步的成果。中间遇到了非常多的困难,包括这个理念一开始出来,并没有得到很多人的接受,一度即使摆出实验结果证明方法的有效性,也很难去发表论文。当然,现在可以看到很多人慢慢开始接受概率与逻辑结合的观念。

另一个挑战与技术无关。李磊表示,在技术上的难度,研究人员都有各种方法去解决,但是研究人员通常还会碰到另外一个难题就是教育大众。不管是学术领域还是大众,认识上都存在很多盲区。今年AlphaGo在围棋上取得的成功,在很大程度上教育了大众,所以李磊认为AlphaGo的工作对所有研究人员而言大有裨益。

绝非取代人类,机器人是帮助人们提高效率

李磊同样指出了大家常常谈论的问题,即机器人会不会取代人类。他首先表示,写稿机器人的目的并不是取代记者,而是要去帮助内容创作者更高效地产出更有质量的内容。头条实验室在机器人方向上面投入了比较大的研发力量,希望达到协作人类高效工作的效果。而写稿机器人是其中表现最突出的。

写稿机器人项目最初是头条实验室和北大计算机系的团队分别独立研究,在今年7月20号,双方在一次学术交流中一拍即合,决定把各自的技术融合在一起,同时运用头条研发力量、运营力量可以快速地把这个技术形成产品,通过机器算法引擎推向用户。从7月20号开始合作,到8月6号就快速地上线并发出第一稿。其技术应用包括两个方面:一个是概率文法来生成,这个句子得有主语谓语宾语,看起来是一个通顺的句子;第二个方法是通过智能选取,把网上文字直播的精彩内容摘选出来融入到新闻当中。基于这两个技术并用做出了可写简讯和长文报道并智能配图的写稿机器人。

原文发布于微信公众号 - 人工智能头条(AI_Thinker)

原文发表时间:2016-09-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

观点 | MSRA副院长周明:未来5到10年是NLP的成熟期

机器之心原创 作者:虞喵喵 「接下来,NLP 将迎来 60 多年来发展最迅速的时期。」 6 月 1 日,在微软亚洲研究院(MSRA)的自然语言处理(NLP)主题...

38911
来自专栏CSDN技术头条

谷歌百万美元项目,研究发现优秀的团队必须具备这五个关键特质

原文:Google Spent 2 Years Studying 180 Teams. The Most Successful Ones Shared Thes...

1956
来自专栏镁客网

「人物特写」电子科技大学陈建文:没有完美的大数据,现实世界都是小数据

890
来自专栏Java技术栈

如何在一分钟内搞定面试官?

有的人,可以口若悬河、妙语连珠讲3分钟,有的人,可能磕磕巴巴,讲了30秒,前者一定能胜过后者,然则未必,今天就来聊一聊,面试的经典问题——自我介绍。

581
来自专栏量子位

英伟达新开源GPU加速平台:主打数据科学和机器学习,50倍于CPU

因为这个名为RAPIDS的开源GPU加速平台出现,固有的数据工作,看起来将迎来变革。

743
来自专栏ATYUN订阅号

休斯敦大学开发机器学习算法,可更快预测10万种化合物特性

休斯敦大学的研究人员设计了一种新的机器学习算法,该算法足以在个人计算机上运行并预测超过10万种化合物的特性,以寻找那些最有可能成为LED照明的高效荧光粉的化合物...

601
来自专栏量子位

NYU心理学教授:深度学习狂热正把人工智能引入歧途

李杉 编译自 TechCrunch 量子位 报道 | 公众号 QbitAI 如今,只要访问科技网站,几乎不可能看不到跟深度学习有关的文章,似乎人工智能即将解决我...

2554
来自专栏DT数据侠

他可能是中国最极客的营销专家 | 数据科学50人·王炼

如今,我们每个人都在谈论“数据科学”。哈佛商业评论杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学家又究竟是...

1330
来自专栏PPV课数据科学社区

20张图片完美捕捉数据科学发展的瞬间

概述 数据不会让过去更好,但是,它确实可以创造一个美妙的未来。 近年来,许多公司已经在数据科学领域投资数百万美元。这显示了对数据科学潜力的巨大信仰,相信它可以创...

36311
来自专栏IT技术大会

2018全球机器学习技术大会40位大神即将开讲!

​​​"Can Machine Think?" 1936年阿兰· 图灵提出「图灵机」以及机器具备「思维」的可能性。历经82年,以机器学习为代表的人工智能经过近几...

1686

扫码关注云+社区