搜索有AI,缔造黑科技背后的超级大脑

最近几年,人工智能这个炙手可热的黑科技,吸金又吸睛。似乎就在一夜之间,身边很多很多事物都被冠上了“智能”的帽子,越来越能读懂用户的心。

搜狗汪仔机器人登陆《一站到底》、立知问答推出、智能硬件上市、“汪仔”预测世界杯……就在这波AI技术潮中,搜狗也交出了一份份精彩答卷。

在这一个个让人惊喜的产品背后,搜索智能问答项目组的身影吸引了小编的注意。这不,小编近日有幸见到了项目负责人、AI研究部总监刘明荣,听他讲讲项目背后的故事。

AI研究部总监刘明荣

1

有问题?上网搜一下!

随着移动互联网的发展,网络已经成为很多人生活中不可或缺的一部分,更是获取信息的重要来源。

可是要在这个庞大的信息库中,寻找到那个心仪、准确的答案却绝非易事,消耗大量时间不说,一不小心还会中了广告的招。尤其是在医疗、法律、金融等专业领域,一个权威、精准的答案更是难得。

让用户更便捷获得最精准的答案,我狗搜索智能问答项目出现了。

刘明荣告诉小编,问答项目于16年下半年启动,17年年中开始成立智能问答组。目前,近40位正式同学,主要负责问答的基础算法能力提升,在保证搜索场景下为用户提供更加精准的答案的同时,实现搜狗在智能硬件领域的技术输出。

谈起问答项目,他是很自豪的,对于自己的团队方向,也有着很明确的规划。在他看来,只有过硬的技术能力,才能让问答项目在多场景下顺利落地。

2

小编认识到搜狗的智能问答,是从搜狗汪仔机器人登陆江苏卫视《一站到底》开始的。最后一场比赛中,“汪仔”以极快的反应能力与极高的准确率战胜人类选手,成功问鼎。听懂问题、检索答案、语音表达……其庞大的知识储备与智能识别能力让人惊叹。

这其中的知识储备与最终答案检索就是由我们智能问答组的同学完成的。

事实类问答和用户的常规搜索还是有很大区别的。不只是庞大的知识库储备与算法升级,面对人脑的挑战,如何提升问题的识别理解也是一个重要问题。“汪仔”只能读懂文本内容,问题是要通过搜狗语音、图像识别技术转化,速度是一个挑战。为了达到更好的效果,从16年年中接到任务到“汪仔”开启人机大战,数位同学针对汪仔可能遇到的问题做了大半年的专职研究。

17年初,“汪仔”凯旋回归。而如何快速在搜索场景下上线事实类问答,给问答组提出了更高的要求,出题方式的改变让检索技术手段也要随之升级。刘明荣和他的团队再次出色完成了挑战,证明了同学们的研发能力,也让项目同学和产品同学一起获得了搜狗优秀团队的荣誉。

3

有了事实类问答的基础,在搜索场景下实现更多类别问题的答案检索,是智能问答组主要的落地项目;尽可能为搜索用户提供精准答案,也是智能问答非常核心的产品方向。

刘明荣告诉小编,智能问答和常规检索、百科社区的技术难度要求不可同日而语。

常规搜索主要还是关键词匹配,并为用户提供内容链接及摘要,不需要太多理解;百科社区主要是通过网友自主回复与检索匹配相似问题,答案质量参差不齐。

而智能问答不再是简单链接的提供,是要读懂问题、并在庞大的互联网信息库中阅读检索、比较分析,带给用户比较精准的答案。

但不可否认的是,前面两者是智能问答获取答案信息的很好途径。换句话说,智能问答就是代替用户很好完成了大部分信息的阅读和筛选工作。

那么如何提升答案的准确率与权威性呢?刘明荣表示,除了在用户搜索问题时,后台通过算法进行的线上搜索和机器阅读理解之外,项目同学们还在线下做了大量工作,通过充分挖掘优质数据、形成大规模知识库,并基于知识库提供快速问答服务。

同时在用户问题检索过程中,后台也会针对高频率问题进行记录,并就热点、时事等问题对数据库做好更新补充。

4

对于搜索与智能问答的变化与未来方向,作为一名8年老员工,刘明荣也有自己的体会。

10年刚来搜狗时,他主要负责搜索项目,如何提升搜狗搜索的市场占有率与品牌价值,一直是搜索同学们在探索的方向。在他看来,搜索最大的转变就是在这一两年通过差异化发展,在以医疗搜索、英文搜索为代表的各专业领域中的垂直深耕,效果还是显而易见的,当然也有更大的提升空间。而这也是智能问答重要的落地方向。

用户使用搜索,就是为了找到答案、解决问题,很多垂直领域的专业问题恰恰是用户需求最大的。目前,智能问答组正在对医疗、法律、金融等用户最关心、也最需要精准答案的垂直领域投入更多精力,并配备专门同学做答案的挖掘和理解。

起步当然是比较困难的时期。到目前,业界也都没有在智能搜索领域达到完善的技术阶段。我们能做的就是不断学习、不断革新,使搜狗技术在行业里面占领并保持优势。

5

当然,除了搜索场景下智能问答技术的不断革新,刘明荣和他的团队在自然语言对话的完善上也在做努力。

其实自然语言对话在很多年前就已经出现,小黄鸡等一众陪聊机器人在QQ时代也曾红极一时。但是因为其智能性差、用户粘性不高,热度也很快消减。

而如今,随着人工智能技术的发展,全新的自然语言对话技术也在不断探索中。

就在不久之前的世界杯期间,相信很多同学都有去和“汪仔”聊聊胜率、聊聊喜好。虽然在主观对话上出了一些有趣的小问题,但是“汪仔”已经在事实类、非事实类以及任务型对话上取得了很高的问答能力。相信有了智能问答技术加持,“汪仔”的自然语言对话也将是搜狗搜索的一个未来发展方向。

机遇永远是与挑战并存的,在人工智能的技术革新中更是这样。

交流中,刘明荣反复提到,智能问答项目不只是服务搜索场景的,更是会与公司各项产品密切配合,共同提升搜狗技术实力与品牌价值,从而达到技术输出。

近年来,我狗在翻译、问答、图像、语音等人工智能领域的研究,都在各类产品中占到了举足轻重的地位。随着旅行翻译宝、录音翻译笔等智能硬件的上市,搜狗AI的品牌、技术都更为用户所认可。

在未来,相信搜狗会在以AI为基础的智能硬件领域取得更大的突破,为用户带来更丰富的产品体验。

刘明荣和他的团队

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180807B1BIWA00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券