【新智元导读】百度副总裁王海峰博士受美国问答网站Quora邀请回答网友提问,回答了颇具代表性的十个问题,覆盖从中国人工智能的发展阶段到百度工程师的日常工作状态,十问十答的形式,为美国网友打开了解百度,了解中国人工智能的一扇窗。
Quora 是问答型SNS网站,被誉为“获取高质量内容的来源地”,聚集了大量高质量知识用户。海峰受邀答疑的session上线后,大量海外网友关注,提问纷至沓来。
王海峰是百度搜索业务的负责人,同时还负责手机百度、百度信息流、百度新闻、百度手机浏览器、自然语言处理、知识图谱、互联网数据挖掘等业务。他是自然语言处理领域世界上最具影响力的国际学术组织ACL(Association for Computational Linguistics)50多年历史上唯一出任过主席的华人,也是目前最年轻的ACL fellow,在人工智能领域有着重要影响力。此次参与网友问答,阐述他对人工智能及相关技术现状和未来的理解,王海峰在答案中写到,人类正在逐步进入人工智能时代,而百度的优秀工程师们将在其中发挥重要作用。
Quora问答为英文,以下为问答实录的中文翻译。
1、中国人工智能的现状如何?
中国的人工智能正在高速发展。今年,中国政府工作报告中首次提到人工智能,这表明中国十分重视人工智能的发展。包括百度在内的很多互联网企业都在加大人工智能方面的投入。其中许多企业都设立了专门的部门,推动人工智能在各自业务中的研发与应用。传统企业也在利用人工智能降低成本,以人工智能为核心业务的创业企业也像雨后春笋般涌现。
此外,中国有许多大学和研究机构也在开展人工智能方面的研究。近些年来,越来越多的优秀科学家与学者们投入到人工智能领域,其中不乏业内公认的佼佼者。在今年的旧金山AAAI大会上,有大约三分之一的论文来自中国,比例与美国相当。
人工智能不仅迅速应用于各大行业,也在改变人们的日常生活,包括交通、教育、医疗等各个方面。我相信,人类正逐步进入人工智能时代。
2、百度的机器学习团队会不会录用不会讲中文的人才?
百度已经有不会讲中文的员工,而且不光是机器学习团队,其他团队也有。
3、自然语言处理技术在中文和英文上主要有哪些不同?
从语言学上来讲,中文与英文截然不同。中文是孤立语,文本的词与词之间没有空格,主要通过词序来表示语法关系。这些因素加大了中文在词汇、句法和语义层面消除歧义的难度。相比中文,现代语言学的概念与语法更适用于英文。
目前,大多数主流自然语言处理技术都同语言无关,比如各种统计或神经网络的算法。我们会根据不同的应用需求,对这些方法再进行语言相关的优化。
比如,百度在2015年5月推出了首个在线神经机器翻译系统。其核心的NMT模型是与语言无关的,可以得到相当好的翻译结果。为进一步优化翻译效果,我们又根据具体语言的特征对翻译系统进行了优化。
4、百度有没有与 IBM Watson 或者 Facebook 的 Wit.ai 类似的可访问的 AI API?
请访问 ai.baidu.com,就可以使用语音、图像、NLP、用户画像等百度人工智能技术。
5、未来十年里搜索引擎会有怎样的发展?
现在一说到搜索引擎,大多数人会想到搜索框和搜索结果。那么未来的搜索引擎会是什么样子呢?现在还不好说。但是我们都愿意看到更加强大的搜索引擎,能够让我们在任意场景和产品中利用视觉、听觉甚至触觉等交互形式搜索。搜索将会无处不在。
首先,对用户意图和内容更加深入的理解,以及更加精准的对意图与内容的匹配,都将大大增强搜索引擎的使用体验。理解用户意图不再仅依赖一次查询,而是包括更加复杂的搜索上下文、时间、位置、设备和用户的个性特征。而对内容的理解也将大大深入,不仅能更好的理解语义、语境、观点,还能理解内容的其他各个方面,从内容中抽取出知识。意图与内容的匹配也将考虑上述所有因素,提供更加贴合个人特征与具体语境的搜索结果。此外,搜索引擎也会更像“应答引擎”和“执行引擎”,能够直接回答问题或执行用户指令。
其次,搜索引擎与用户的交互界面也将有更多创新变化。除键盘输入外,还将更加广泛地使用语音和图片等输入方式。随着语音、图像等技术更加成熟和实用,用户将可以使用更加高效、便捷的多模搜索。自然语言交互将成为搜索引擎的主流交互模式。用户可以与搜索引擎对话,直接告诉搜索引擎他们的需求,这比打开键盘输入要方便实用得多。用户可以通过多轮对话与搜索引擎交互,百度是最早尝试运用这种全新的交互方法提升用户搜索体验的公司之一。
第三,搜索将不仅仅是使用搜索引擎,还会融入到各种产品中。比如说,搜索将成为智能硬件产品的核心功能。未来,搜索将无处不在,随处可见。而且,我们还将重新定义可搜索的内容,不仅包括当前搜索引擎已经索引的内容,还将纳入更多服务、物体、设备和数据。
搜索引擎已是大家日常生活中必不可少的工具。用户需求决定搜索引擎的发展方向,而技术进步决定了搜索引擎的发展高度。
6、百度产品如何应用NLP?
百度研发了多种NLP技术,包括知识图谱、语义理解、内容标签、情感分析、文本生成、摘要、深度问答、机器翻译和对话系统等。这些技术广泛应用于百度的搜索、信息流、智能助手等产品中,为数亿用户提供服务。我们还将这些技术集成到统一的平台之中,名为NLPC平台。NLPC平台提供二十多个NLP模块和技术解决方案,为百度产品提供全方位支持。我们的NLPC平台每天有上千亿次请求。
比如在搜索上,分词、命名实体识别、句法分析和复述等NLP模块都是其必不可少的基础模块。这些模块一直在根据应用需求优化并实现技术突破。另一个NLP技术在搜索中的典型应用是问答。高性能的问答系统需要对查询实行精准的语义语法分析,构建大规模知识图谱,以及对网页搜索结果全面深入的分析。用户在搜索框中输入问题,搜索引擎就可以直接提供答案。很多用户会使用搜索引擎查找相关信息,来帮助做出决策。在这种情况下,情感分析(即观点挖掘),可以抽取出很多候选观点,聚合后提供给用户作为决策参考。
再比如在信息流产品中,文章质量十分重要。NLP技术用于甄别并去除谣言、剽窃等垃圾文章。另外,文本分析可以识别出高质量文章,并为文章打上描述其质量的标签。从各个层面说明用户偏好的用户模型也要用到NLP技术。
总而言之,对于各种与语言相关的产品,NLP技术都是必不可少。
7、你如何看待自己从科学家到互联网公司业务副总裁的职业转变?
我热爱技术,并且喜欢投入到技术研究中去。我相信技术可以改变世界。百度为我提供了一个理想的平台,在这里,我的技术工作得以快速、直接地惠及用户。这就是我加入百度的首要原因。我在百度的前几年负责包括NLP、语音、图像、数据挖掘、知识图谱、机器学习和深度学习等在内的技术团队。后来,我意识到伟大的产品是连接技术和广大用户的桥梁,并能推动技术进步。伟大的产品不仅需要先进的技术,更需要出色的产品设计、运营和高效管理。因此,我逐步从只带技术团队转变为全面的业务管理者。我现在的团队超过3000人,包括技术、产品、运营等各方面人才,他们年轻、充满活力、富有激情。我们同心协力,致力为用户提供更好的技术和产品,进而使人们的生活更美好。
在管理大型综合业务团队时,首先要设定战略和目标,然后组建合适的执行团队。良好的制度和文化对于一个大团队来说非常重要,这是业务健康发展的支持和保证。与此同时,我会始终关注技术突破,用户需求的演变以及整个社会环境的发展变化 。
8、“百度”这个词的意思是什么?
我们的名字“百度”,其灵感来源于800年前中国宋代的一首词。“....。.众里寻他千百度,蓦然回首,那人却在灯火阑珊处。”百度的字面意思是“数百次”,代表对理想的不懈追求探索。
9、在未来5到10年,我们将在自然语言处理领域看到哪些进步?
在机器翻译、语义理解、问答和对话技术方面将会有重大突破。而且这些技术将被广泛应用,使得人与计算机之间、人与各种智能硬件之间以及人与人之间的沟通和交互方式都会发生改变。
上述技术进步将受益于以下四个方面的技术进展:大数据、学习机制、知识图谱、推理和规划。
推理和规划——有了更完善更庞大的知识图谱,我们可以在推理和规划方面取得突破,推理和规划的能力将使自然语言处理系统变得更加智能。
10、百度工作的工程师是怎样的?
百度工程师的典型工作状态是这样的:坐在工位戴上耳机一写代码就是数个小时;在会议室或休息室与其他工程师一起讨论技术问题或系统设计。你会看到他们一边在餐厅吃午饭或晚餐,一边在互相谈论算法优化;你会看到他们工作到深夜,废寝忘食。
这里的工程师有他们自己鲜明的风格:务实、自驱和负责到底。我们鼓励工程师将想法付诸实践,有激情,有毅力,有责任感,能使梦想成真。百度搜索引擎每天为数亿人提供服务的同时,也使百度工程师能更好理解大多数用户的需求,进而有机会专注于最有价值的问题,并提出创新解决方案。百度作为一个平台,支持这有才华有热情的工程师实现他们的梦想。
年轻的工程师也有机会去丰富自己的爱好,业余时间可以在健身房和瑜伽室进行锻炼。
在百度,我们为每个新入职的工程师提供导师计划。导师会指导提升他们的技术能力,并帮助他们熟悉公司。我们为工程师提供在线学习课程,还有资深高工的技术讲座。工程师可以选择自己感兴趣的话题,了解前瞻技术进展。我们定期举办黑客马拉松,鼓励工程师大胆思考,与产品、设计等不同角色合作,创造出惊艳的产品。
我相信百度是工程师钻研技术、提升自己最好的平台之一。