科大讯飞年度发布会:讯飞超脑摘取认知智能桂冠,输入法领衔AI+ (刘庆峰、胡郁演讲实录)

新智元导读】作为中国人工智能产业的标杆企业,科大讯飞2016年度发布会受到业界高度瞩目。11月23日北京国家会议中心,科大讯飞携产业链合作伙伴的人工智能+黑科技澎湃而来。A.I.+万物互联输入法、A.I.+教育、A.I.+翻译、A.I.+司法….. 人工智能+生态系统越来越强大,讯飞植根产业链的深厚积累迎来爆发。科大讯飞董事长刘庆峰在会上强调,正在经历第三次热潮的人工智能并不是概念泡沫,而确实可以运用到所有这些行业中。科大讯飞一年来再次挑战AI巅峰,在被称为“代替图灵测试”的Winograd 挑战赛中摘得桂冠。刘庆峰激情四溢的报告,为产业界展示了AI+创造新世界的可能。科大讯飞轮值总裁胡郁在大会现场则发布并演示讯飞7大新产品,共涉及机器翻译、车载系统、智能客服、语音合成和智能家居等AI前沿技术和应用。

本次发布会还吸引了手机界三位超级大佬360周鸿祎,华为余承东、锤子科技罗永浩助阵,声势浩大。中国人工智能学会理事长李德毅院士、IBM 大中华区首席技术官,IBM中国研究院院长沈晓卫、中国移动副总裁李正茂、海底捞董事长张勇也共襄盛会。李正茂提到中国移动是讯飞的最大股东,而且在刚刚结束的国际5G标准架构讨论中,被推举为领导企业。看来5G和物联网时代,会给讯飞AI+带来更宽广的舞台。

纵观整场发布会,可以看到,讯飞以语音为切入口的、从感知智能到认知智能的人工智能革命正在稳步推进:战略上,讯飞专注人工智能的决心非常坚定,认为本次人工智能的爆发是真正的行业浪潮,其中蕴含巨大的机会;技术研发上,讯飞利用多年在人工智能上积累,拿下多项国际比赛的冠军,不仅语音,还有知识图谱、自然语言理解等;产品应用上,科大讯飞在车载和家居上扩展布局,推出相关产品。行业竞争上,讯飞人工智能生态建设取得初步进展,多个领域的市场与技术上都有布局,与3000多家机器人公司达成合作,拥有20万开发者。市场上,在稳固B端和G 端的前提下,继续寻求To C端的突破,发布了专门To C的产品。

科大讯飞董事长刘庆峰在演讲中谈到了他对人工智能技术发展的独特见解,他认为,人工智能技术的进化路径可以分成三种:

第一种,信息完全输入的状况,在这种状况下得到一个输入就可以充分准确的得到相应的输出,就像语音转写、人脸图像识别等,是由输入可以准确得到输出,这些领域机器将来可以完全替代人工。

第二种,是仅仅有当前的输入信息还不够,还需要有经验判断,还需要有常识的情况。在这样的情况下还是要有不断迭代的专家知识,是人和机器耦合的,比如说教育,机器绝不可能替代所有老师,而是帮助老师更好地提高课堂效率,帮助孩子减轻课后的无效重复学习的时间,这是第二种场景,包括医疗,学习顶尖医疗专家的知识,并不断逼近它,这是需要人和机器耦合的。

第三种类型,是没有输入信息支撑的,是主要靠创意,靠想象力的,就像我们今天的艺术大师所做的成果一样。

他认为,目前的人工智能技术,有80%是处于第二种,也就是中间状态的。

作为以智能语音起家,正在全力打造人工智能生态圈的行业龙头企业,科大讯飞轮值总裁胡郁在本年度的发布会上带来了7款新产品:

  1. 物联网时代输入法的标准——讯飞万物互联输入法。通过综合世界上最高水平的中文语音输入,语音命令,手势识别,手写图像识别等人工智能前沿技术,面向万物互联时代智能硬件的输入需求,讯飞万物互联输入法前瞻性的定义了物联网时代输入法的技术和产品标准。
  2. 中英互译神器——“讯飞便携翻译机”。 除了英语,“讯飞便携翻译机”还支持汉维互译功能,未来将不断加入更多语种,实现不同语言之间的便捷交流,为不同语言的人之间的沟通扫除障碍。
  3. 汽车智能车载系统——飞鱼助理。该系统将远场识别、全双工、多轮交互、方言识别等技术应用于汽车,打造智能语音交互界面,定义了车联网时代人车交互的新标准。目前,科大讯飞已与30多个国内外汽车厂商建立了长期合作,并已在100多款量产车型中搭载相关产品。
  4. 智能客服机器人——晓曼。本次推出的晓曼机器人,则是科大讯飞在机器人领域的集大成者。科大讯飞将其世界领先的语音合成、语音识别、语义理解和人脸识别等技术运用到智能服务机器人本体上,结合麦克风阵列、3D摄像头、身份证读卡器、取号小票机等外设应用,以语音、触屏、动作等多模态的交互方式为用户提供优质的服务,在政府、金融、运营商、医疗等多个领域具有广阔应用前景。
  5. 讯飞快听。讯飞快听APP,通过打造个性化音库,为用户提供个性化语音合成服务。
  6. 配音阁。为用户提供智能语音合成、真人配音及各种特色化、个性化配音服务。采用世界领先的语音合成技术,文字一秒变声音,傻瓜式操作,简单高效、让用户极速制作优质配音。
  7. 智能家居方面,科大讯飞以超脑魔盒为入口,打造了一个通过语音便捷控制家居设备的智能环境。超脑魔盒集合了科大讯飞语音识别、自然语言理解等核心技术,包含全网影音、智能家居、遥控器K歌、英语翻译学习、生活百科问询等五大功能,并且包括切换、快进等设置全程语音操控,0.2秒的语音搜索速度,老人小孩都能轻松上手,由此开启更智能、更有趣的智能家庭互动体验。

讯飞本年度发布的产品主要还是基于其语音技术,朝更广范围的应用在逐步扩展。本次大会讯飞展示的另外一些比较值得关注的技术是增加了实时翻译功能的讯飞听见语音展示技术。现场演示中,讯飞听见可以不仅可以将演讲人的语音转化成文字显示中大屏幕上,还可以进行中文到英语、中文到维语的翻译。将语音翻译成文字,很吸引人眼球。

在大会场外的展台区,科大讯飞合作企业展出的人工智能产品展出,三排展台上,各式各样的机器人在展示了人机交互的最新技术进展,以服务机器人为主,涉及陪伴、客服、教育等多个热门应用领域。

科大讯飞董事长刘庆峰中本次大会上发表题为《人工智能+,未来已来》的主题演讲,谈到了他们对当下人工智能热潮的判断和理解、讯飞多年来在人工智能上的积累、2016年讯飞在技术上取得的突破、人工智能大趋势等话题。

以下是科大讯飞董事长刘庆峰在会上的演讲实录。

人工智能是产业大潮还是概念泡沫?

尊敬的各位领导,各位来宾,女士们,先生们。首先热烈欢迎大家光临科大讯飞2016年度发布会的现场,也对正在视频直播观看我们发布会的各位朋友表示热烈欢迎。应该说,今年是人工智能正式提出60周年,去年的这个时间,就在同一个会场,科大讯飞举办“AI复始,万物更新”的年度发布会。在发布会上,我们给大家分享了人工智能第三次浪潮可能给我们带来的无比广阔的灿烂前景。同时,也跟大家分享了人工智能在当前的阶段性成果。一年下来,可以说2016年已经成了中国人工智能的历史原点,伴随AlphaGo和李世石的围棋对决,人工智能更是引起了社会各界的高度关注,不仅是科技界产业界,包括所有的创业者和投资机构,媒体和普通百姓,都在津津乐道人工智能。全球范围内对人工智能的普及和关注,一年来热度居高不下,人工智能一直处于热点,处于风口浪尖之上。

一年下来,到今天这个时点,也会有人在讨论人工智能第三次浪潮究竟是什么?是不是第三次浪潮也像前两次一样,很快会大潮退去?是不是今天我们对人工智能未来的预测过于乐观了?它一个真正的产业大潮还是概念的泡沫?我想这是今天科大讯飞即将揭晓给大家看到我们一系列令人激动的进展之前,想跟大家探讨的话题。

要解答这个话题,我想首先要有科学的精神,要用理性的思维来看今天我们的技术,到底可以达到什么样一个阶段,而不是用预言家的角度、非常感性地来做判断。

我想跟大家说的是,人工智能在1956年的达特莫斯会上被提出来时,就是有着非常严谨的科学基础的。当年在达特茅斯会议上,是一批数学家、计算机专家、通讯专家共同提出的人工智能概念,其中包括麦肯锡、明斯基、香农等等。这些大科学家们很多都是图灵奖、诺贝尔奖的得主。人工智能概念被提出来之后,在1970年第一次浪潮达到顶峰时,就已经通过第一代的人工智能神经网络算法证明了《数学原理》这本书中的绝大部分数学原理。第二次浪潮发生在1984年,当时霍普菲尔德网络被推出来,让人工智能的神经网络具备了历史记忆的功能。

但是前两次的大潮,后来都破灭了,为什么?是因为神经网络本身算法的局限性,同时也受到当时整个运算能力的一些限制。那么今天的第三次浪潮,以深度神经网络为基础,基于大数据、云计算运算平台,再加上移动互联网源源不断地把各种训练数据收集到后台。今天我们认为,以目前的时间节点,人工智能的第三次大潮已经切实到来了,它已经不再是一个概念,而是可以进入一个又一个的行业(的技术)。今年3月9号AlphaGO跟李世石对决之前,两会期间几十个媒体采访科大讯飞,当时,基本上业界、舆论和专业界,绝大部分人都认为机器今年很难获胜,但是科大讯飞很坚定地说机器一定大比分领先,为什么?因为围棋后台的算法是基于深度神经网络,这个神经网络其实科大讯飞早在今年之前就已经在很多领域取得了很好的应用成效,全球的科技产业界也做了很好的探索。谷歌(DeepMind)是把它用到了一个大家都很关注又喜闻乐见的围棋领域,这个算法和围绕它的科技和产业界持续的创新,推动了今天人工智能第三次大潮的到来。

2006年,深度神经网络的基本理论框架正式提出来,2011年就开始在语音识别领域崭露头角,科大讯飞是中国第一个把深度神经网络用到语音识别领域的。2010年,我们在全球首次发布了云平台,宣告语音、手机的听写时代正式到来。2011年之后,可以看到2012年在图像识别中,深度神经网络开始异军突起,14年机器翻译取得突破……今年,我们即将让大家看到一个又一个行业的令人欣喜的成果。

讯飞2016年深度学习技术成绩单

首先是语音合成技术。让机器能听会说,首先要给机器装上一个人工的嘴巴。今年,在全球的语音合成大赛暴风雪竞赛中科大讯飞再次获得第一名。今年的比赛比的是什么?比的是英语合成,而且是英语的故事级合成。小说和故事,也就是要求更加深情并茂,难度更大。

但是我非常高兴地告诉大家今年的国际比赛结果:在一堆的国际的顶尖研究机构和产业界精英全部参加的前提下,科大讯飞再次在英文领域获得全球第一名,而且不仅是全球第一,是全世界唯一把英语合成做到了超过普通人说话水平的公司!

比赛中,五分是播音员的水平,四分是普通的说话水平,而今年的国际英文大赛科大讯飞得分是4.2分,第二名只有3.9,也就是说,小说风格,故事风格的语音合成,只有中国人做到超过了普通人的水平。我想告诉大家,这已经不是第一年,科大讯飞连续11年蝉联了全球语音合成大赛的第一名。去年国际组织比的是印地语,我们照样是全球第一,是3.9分。我非常高兴地告诉大家今天的中文我们已经做到了4.5分,播音员是5分,我们在座各位平均下来是4,计算机达到4.5,这个我也很自豪。

当前的中文、英文、印地语的第一名都是科大讯飞代表中国做出来的。我们中国人、中国用户享受了全球语音合成最高水平的成果。

那么在语音合成的进展上,我们再看一下语音识别,大家已经看到我说话的时候,同步的文字字幕转写出来,那么去年12月21号科大讯飞的发布会上是全球第一次,敢于在几千人的会场演讲风格下同步把语音自动转成文字。现场机器跟人的对比结果表明,机器在转写准确率上大大超过了专业速记人员。

在讯飞2015年发布会之后,2016年5月份谷歌开始发布英文转写,国内也有一些公司开始跟风,但是我想告诉大家,即便到今天为止,能够任意人不用做任何训练,能够在不用联网的单机情况下,满足保密和网络的各种不同异常环境下,能够做到百分之九十几的准确率,全行业到迄今为止只有科大讯飞一家。

今天我还想告诉大家的是,当时我还发布了万物互联时代最重要的人机交互的几个关键特征:一个特征是远场识别,我们可以在3到5米,5到8米之外,用语音跟机器人、智能家居交流,可以多轮对话,上下文可以随时随地打断。我们定义了万物互联时代的语音交互标准,并且推出了人工智能人机交互平台AIUI,这平台当时以叮咚音响为应用代表,不光可以听音乐,可以控制所有家居。

今年5月份,谷歌发布会也推出来了类似的产品谷歌Home。我想这是万物互联时代,业界英雄所见略同。但是我想更进一步告诉大家,面对未来真正的万物互联,我们中国企业不再仅仅是在跟风,而是要引领和推动整个产业的到来。就语音来说,最重要的就是在交互过程中远场识别和噪音环境下的语音识别,以及在多个人同时讲话时语音识别能不能达到使用标准。

国际上有一个非常著名的语音识别比赛,在噪音口音和多人情况下进行,那就是CHiME国际语音识别大赛,这个比赛的研讨会今年就是在谷歌公司举行,我很高兴告诉大家,几乎全球顶尖机构全部参加的情况下,科大讯飞在所有3项指标中都是全球第一名。

而且,在六麦克风这个最难的麦克风场合下,我们的准确率已经可以做到97%以上,也就是我们亲爱的老罗同志在锤子发布会上说97%的准确率。准确率不是中文而是英文的在谷歌做的国际比赛的结果,并且在噪音环境下我们的错误率只有2.24%。这些的识别技术,都会真正的推动我们整个产业的革命和创新。

今天我们也有自己非常著名的长安汽车的董事长到场,其实到目前为止,根据宝马、奔驰这些国际大厂测试,汽车速度在100公里以上、空调打开的噪音环境下,目前为止,只有科大讯飞的独家技术能够做到使用。

在机器翻译领域,2014年基于深度神经网络的这些算法上的创新和突破,科大讯飞的机器翻译取得了突破性的历史进展,国际口语翻译大赛 IWSLT 我们获得了全球第一,这个第一是具有历史意义的,因为以前国际翻译大赛,汉英国际比赛都是日本研究机构全球第一,英汉国际比赛都是美国机构全球第一。2014年11月的这次比赛,终结了这个历史,科大讯飞英汉和汉英都是全球第一名。在这基础上,2015年2月,美国国家标准技术研究院也就是NIST 组织的机器翻译大赛中我们继续是全球第一,今年,我们又面对国家一带一路的重大战略,正式推出面向一带一路的多语种翻译,所以我在今天一开场讲话时,大家就可以看到两边屏幕上不光有中文,对应的还有英语,有维语出来。除了维语,还有藏语。其实我们同样的还有日语和韩语的同步翻译,未来我们要把世界所有主要语种全部放进去。

我想跟大家说,今天我们展示的成果,绝不仅仅是我们的发布会演示会上经过定制的成果,就在4天前,上海高级法院招待了11个国家的法院大法官和高层管理者。上海高院如此高端的接待中就是用我们的听见给他做实时翻译,得到了所有参会的国际友人的高度评价,所以我想这已经不是一个概念,而是切切实实的用我们的技术在一个又一个的行业和专业领域给我们带来更便捷的生活,带来更美好的沟通。

去年发布会上,我们还告诉大家人工智能未来的核心是认知智能,而以语音和语言为入口的认知计算,是人工智能的必由之路。在过去一年之中,科大讯飞在人工智能最核心的可以说是皇冠上的明珠的认知计算领域,又取得了令全球瞩目的成果。我们在今年参加国际非常知名的Winograd的认知智能的测试,获得全球第一名。这比赛是要用来替代图灵测试的,因为今天移动互联网传输到后台的对话数据越来越多,所以图灵测试已经越来越容易过关。

这就是看机器真正的认知结果,我在这里给大家看的一个例子,比如说这是一个比赛的原题,当然是英文的,父亲如果举不起孩子,是因为他太重,那就会要继续判断到底是谁重,机器要知道说这是因为孩子重,如果说举不起孩子,是因为他太虚弱,到底是谁虚弱,这是因为父亲虚弱,这些的基本推理对人类看起来今天是自然而然的。当机器具备了这样基本的认知判断能力,就可以真正的在一个又一个的领域来学习我们人类最顶尖专家知识。

所以在2015年科大讯飞获得全球第一名,我觉得对中国人工智能历史是有标志意义的。就在不久前,在11月15号,又一次传来喜讯,由美国国家标准技术研究院NIST的组织的国际非常知名的认知测试Knowledge Base Population的大赛中间,在对于实体的发现,以及关联信息的关系中的最关注的比赛项目中,包括卡内基梅隆,包括IBM这些我们非常尊敬的企业和研究机构都参加了,科大讯飞是全世界第一名。

这个比赛我告诉大家是英语,汉语和西班牙语3个语种同时上,科大讯飞是全世界第一名,所以我想这些认知成果都是真正的,在国际顶尖舞台上证明了我们中国人在人工智能领域已经不仅仅是一个科普、科幻或者带有所谓先知角度的感性判断,而是在踏踏实实做理论创新。在这创新的基础上,我想告诉大家的是,我们在跟教育部考试中心合作,在事关国家教育未来的考试阅卷中,机器已经运用在今年上海的四六级考试。

那么这个技术的突破和进展,我想跟大家分享的是,不仅仅是在教育领域的应用,它可以用在医疗行业;在法院系统学习了最高法院科技法庭大量的司法大数据,就可以对一线法官的判案形成非常大的参考和助力,甚至说可以超过人工。我们的机器,这两年对我们认为就可以通过国家的医学考试。那么这些,其实是在一个又一个的领域,给我们带来了无比令人欣喜的突破,可以说,就是因为今天技术的进展,因为有着无限互联网传输的不断的学习训练的数据,有着云计算的无比强大的运算平台。

人工智能今天的技术水平,在学习了顶尖专家知识以后,将来就能达到一流专家水平,从而超过90%的普通专业人,这就是我们面临的这个时代的趋势。当然在源头创新上,科大讯飞继续基于数理统计、神经网络基础上做算法的突破和创新,我们同样还跟一批顶尖医疗机构以及心理学、认知学的专业机构科学的研究,希望在脑神经的传导机制上找到突破,但今天我想说的是,即便没有传统的数理统计、神经建模方式上的重大突破,即便没有脑神经科学的突破,就用科大讯飞已经达到的深度神经网络和我们的创新成果,结合移动互联网大数据这一些已经配套成型的产业框架,我们已经可以改变一个又一个的行业,这时代已经到来了。

人工智能+时代到来,催生各行业新的趋势

这不仅仅是科大讯飞的判断,我们可以看看一些行业方面的趋势分析:去年10月份麦肯锡给出的报告认为,将来45%的知识活动是可以被自动化的。科学杂志,在今年年初给出的判断是,到了2045年,将有全球50%的工作岗位由人工智能的机器来替代,而在中国这个数据是多少,是77%。大家可以想一想,也就是说鼎鼎有名的科学期刊认为,未来的30年之内,在中国每4个工作会有3个由人工智能来替代。这是它的预测,但是我想说的是,这时间还会大幅度提前。所以今天,人工智能已经不仅仅是一个企业、一个行业的事情,事关我们今天在座的每一位。在这个过程中,我想跟大家说的是,今天人工智能+的时代已经正在到来了。这是不可逆转的最大国际趋势。

那么在这个人工智能+的时代中,在各个不同行业,到底会有一些什么样的行业不同特点呢?显然人工智能不是能做一切的,也不是能够代替所有人的,所以我们科大讯飞的研究院经过分析,我们把它分成3种主要的状况:第一种,所谓的信息完全输入的状况,在这种状况下得到一个输入就可以充分准确的得到相应的输出,就像我们今天在会议上的语音转写,就像我们在进场安保时的人脸图像识别等,是由输入可以准确得到输出,这些领域机器将来可以完全替代人工。

第二种领域是什么?仅仅有当前的输入信息还不够,还需要有经验判断,还需要有常识,还是要有不断迭代的专家知识,是人和机器耦合的,比如说教育,机器绝不可能替代所有老师,而是帮助老师更好地提高课堂效率,帮助孩子减轻课后的无效重复学习的时间,这是第二种场景,包括医疗,学习顶尖医疗专家的知识,并不断逼近它,这是需要人和机器耦合的。

第三种类型,是没有输入支撑的,是主要靠创意,靠想象力的,就像我们今天的艺术大师所做的成果一样,所以我们今天说机器可以作图、画画,可以写诗,但是他做出来的,我认为是工艺品,真正的艺术今天还很难做到。那是靠我们人类无比充满灵感的想象来做的,真正的机器今天替代了大量的传统体力劳动,这是要把人类释放得更加无比美好和广阔的创意空间中去,为这是一个大的趋势。

从这3块来看,今天越来越多的可以说80%是集中在中间这一块的状态的,那这个状态中人和机器是一个什么样的耦合模式呢?对一个人来说,比如说我本人在这有一个,我的助手机器人。当然未来人工智能不仅仅表现为阿凡达、大白这样的机器人,它可以是无所不在的一个后台,处处为我们服务,像水和电一样,这就是互联网+时代的到来。那么对于我们每个个体人工智能的服务,也许今天它只能做10%的服务,但是我每完成一次,我每做一次,机器就可以学习,3个月或者半年,它又可以做到20%,三年他就能做到80%甚至90%,这就是机器后台的迭代学习。今天我们的翻译为什么已经达到大学六级的水平,出国的衣食住行基本都没问题了,就是因为有几百万人不断的使用,每天几百万就不断使用,他不断地学习、迭代,所以人工智能和人类耦合是不断的学习你的知识,分担你的劳动。

未来的世界应该是由顶尖专家和顶尖管理者协同管理人和机器的联合体的一个大未来,这就是我们认为的人机协同的机制。人类今天的工作会越来越多的由后台的学习系统不断地学习到机器中,由机器来代替我们,我们释放出来,想象更大的未来,去做更有创意的事情,这就是科大讯飞,我们认为今天的人机协同机制,而在这样一个人机协同机制下,人类智慧大爆炸时代正在到来。

所以正是因为有这样一个人类智慧大爆炸时代到来,所以会使得我们的人工智能,可以未来精准满足每一个人的个性化需求,今天手机,也许未来在万物互联时代会变成眼镜、手表、纽扣、胸针和项链,因为任何设备都能连网,都能交互,那么他就会不再是统一的形状,会变成跟每个人的审美情趣和穿戴习惯有关。那这时候,在人工智能时代,各细分领域的创业英雄更容易成功,有自己的独特创意,独特的品位和感觉,就能打动喜欢它的独特的人群,不再像原来的windows英特尔时代,以及像现在的安卓和ios,一两个产品品类可以一统天下。

新的人工智能时代的创业者,由于独特品位和创造力,会很难被其他的巨头用资金、用数据和入口来血洗出去,所以在这时代,我们更要强调打造人工智能的产业生态,每一个创业者也更拥有前所未有的历史机遇,科大讯飞在去年发布会上,把我们的平台开放给所有创业者以来,我们可以看到一些令人鼓舞的数据进展。

首先,我们人工智能云平台上的总用户数,今天已经达到8.9亿。比去年同期增长48%,8.9亿是什么概念?过去18个月,累计下载人工智能相关应用的独立终端,如果一个手机装了3个跟讯飞人工智能相关的应用,我们只算一个,过去18个月,累计已经有8.9亿不同的终端,因为中国人一年半换一次手机,那么第二个更重要的数据是,每天有多少人在用,一个人用一次叫一人次,去年这个时候每天是10亿人次的访问量使用量,今天,已经突破30亿人次。4月26号习近平总书记,亲自亲临视察科大讯飞的技术成果,当时他非常高兴的看到我们每天的数据量是15亿人次,短短半年到了30亿人次,我们认为很快会突破百亿人次,围绕我们的第三方创业团队,去年有7万家,现在已经达到21万家,这就是人工智能的产业生态,我们希望跟所有创业者共同成长、共同创造、共同分享人工智能的伟大未来。

所以说,人工智能绝对是为各个细分行业的创业英雄提供了前所未有的创业舞台,只要你有创意,只要你有品位,有感觉,你再也不用担心被别人的数据入口和资金瞬间血洗出场,所以我们在今天这时代,我觉得大家都更加的高兴,因为我们更有想象力和创新空间了。其实各国政府也在高度关注,今年1月份日本就正式提出来超智能社会的发展规划,10月13号,美国正式出台了人工智能产业规划,而且专门出了一本教育美国民众如何面对人工智能未来生活的这样一个专门产业规划,包括科技产业,人文和伦理。我们在中国,习近平总书记在G20会议之前的工商20国峰会上,把科技创新提到了前所未有的高度,但是点名的产业,只有人工智能和虚拟现实,认为这些技术会给未来的生产和生活带来革命性的变化。

中国其实在今年的4月8号,就已经在工信部的指导下,科大讯飞跟华为等众多企业一道发布了《人工智能深圳宣言》,这个宣言中,特别强调了人工智能首先必须强调源头技术创新,因为必须在核心技术上拥有话语权,你才会在未来的产业上有布局的优势,第二,必须强调人工智能产业生态,第三,必须要有标准体系。

讯飞开放平台上就有21万家的合作伙伴,在各个领域,光智能家居从音箱到台灯到各种灯光到电视到冰箱和空调,几千种在研发,未来如何使这些设备互联互通,如何节约我们有效的社会投资,避免浪费?标准体系是当务之急,科大讯飞已经对人工智能的标准从技术到训练到行业应用以及饮食安全测试,给出了完整的体系,也给国家提交了一系列的标准和规范的要求,我觉得这是对未来产业发展至关重要的工作,今天我们已经开始行动起来。

那么,当然还有,法律法规和道德伦理是今天必须考虑的,刚才说的科学杂志说未来30年之内,今天中国每4个工作在中将有3个以上被机器替代,那么当旧的工作岗位被替代,新的岗位还没有创造出来之前、在人工智能时代到来以后,机器的生产效率代替人工的时候,社会财富将很有可能在相当一段时间内有少数顶尖人工智能公司集中创造,也就是说社会上绝大部分财富可能会由少数的顶尖人工智能公司来创造的时候,社会的财富分配体系,社会的救助体系和法律保障是什么样的?今天就应该考虑。

作为全国人大代表,在今年两会上我给张德江委员长当面汇报的、我们提交的人大议案核心就是跟这个有关,因为这个时代比我们今天在坐很多人在发布会之前想象的还要更快的到来,我们每个人都要为它的到来做好法律上准备。

那么道德伦理的大家都能理解,将来人工智能是服务我们人类美好未来的,不是颠覆和主宰人类,我们的伦理、人文上有一系列要研究的地方,这就是人工智能深圳宣言的几个核心的方面。我在想说的是,今天人工智能绝对跟每一位社会民众,每一个企业,从中央到地方的政府都是密不可分的,因为它已经不仅是一门科学和一个产业,更是一个伟大的历史进程,涉及到了社会方方面面,从技术、产业、法律到伦理和人文。

其实,我们还想跟大家分享的是,今天全球产业都面临着转型升级压力,也是动力和机遇,所以在去年年初,中国专门提出了“中国制造2025”,这是未来中国制造业、中国产业发展非常重要的指南。但是一年之后的今天,我们认为中国制造2025一定要跟人工智能匹配在一起,如果只有中国制造,未来产业的水平较远远跟不上时代的需要。改革开放30年,我们创造了经济上的奇迹,但是,真正在全球产业链上,我们是处于价值链的底端的,未来30年,新的双创时代到来的时候,如果我们抓住了人工智能产业机遇,我们将会在全球的价值链中有更大的话语权和影响力,如果我们丢掉人工智能话语权,我们将继续给全世界打工,这就是我们面临的现状,所以一定要把人工智能和中国制造,提到双能驱动、并驾齐驱的战略高度,要让人工智能上升为真正的国家战略,绝不是一个企业一个行业的事情,事关国家和民族全局的事情。

我今天特别高兴看到,在这里有这么多的伙伴来参加分享。今天人工智能在中国拥有前所未有的良好机遇,有社会各界的高度关注和认同。以科大讯飞和我们的众多合作伙伴为代表,我们在源头核心技术上已经处于全球的顶尖水平,我们还有众多的产业伙伴共同形成的产业生态,所以我相信在人工智能第三次大潮到来之际,我们大家是能够共同携手努力,不仅通过人工智能为中国产业的未来、为社会的进步作出贡献,也可以为全世界的未来做出更大的历史功绩。因此,希望我们能够齐心协力,精诚合作,让我们共同在中国用人工智能改变世界!谢谢大家。

科大讯飞轮值总裁胡郁:人工智能的下一种可能

现场直播时,讯飞听见进行实时语音转写,并以字幕形式呈现。(时长约1小时)

各位嘉宾、女士们、先生们,大家下午好。我不知道大家听到这里紧不紧张,反正我觉得在我们庆峰同志后面发言,我都非常紧张。大家可以看到从庆峰总刚才的发言中,我们已经知道,人工智能在将来的5到10年,就像我们现在的水、电和互联网一样,在我们的生活中成为必需品,我们看到其实人工智能已经要改变我们很多的方面,比如说我们人机交互的方式、人与人之间交流的方式、我们出行的方式、教育、医疗、健康等等。可以毫不夸张的说人工智能是这时代最伟大的魔法师,我想大家今天一定都非常的兴奋,刚才庆峰讲过了,我们有这么多人工智能方面最新的突破,今年,我们给大家带来了什么方面的人工智能的产品和我们讯飞的黑科技呢?

那么下面就让我们来一一呈现。大家都知道在去年12月21号的发布会上,科大讯飞发布了在世界上具有引领作用的AIUI,将我们人和机器的交互方式带入了一个新的时代。但是我觉得在人和机器的交互中最重要的一点是什么?是输入信息,当你们要聊天的时候,你们第一个想到的是要输入。在2010年,讯飞的第一次互联网发布会上,我们就发布了讯飞语音输入法,从此引领了整个中国在手机输入法方面的潮流。那么应该讲在过去的6年过程中,我们可以看到我们的输入法已经超过了4亿的用户,每个月月活超过了一个亿,而且,我们现在也使在手机上输入的速度,达到了一个极致,每分钟400个字。而且最近我们输入的准确成功率已经达到97%,当然了,这不是我说的,这是我们今天在座的一位贵宾,也就是锤子科技的创始人罗永浩同志前段时间给大家亲自展示的。但是,我们将进入一个新的时代,我们进将进入物联网时代,在万物互联的时代中,是不是还是所有的情况下,我们都可以在智能手机上这样输入呢,手机是不是万物互联中间唯一我们接触到的终端呢?

在我们展示的万物互联输入法过程中,我们到底用了哪些的核心技术?首先得益于讯飞在世界上最领先的离线手写输入的引擎,我们现在可以让各种各样的智能设备识别我们手写下的文字

其实,人工智能改变了我们和机器之间的交互,特别是输入,那么机器人工智能,将怎么改变我们人和人之间的交流呢?我相信大家在这场发布会上全程都已经注意到了,自去年12月21号,我们首次在国际上展示了同屏的语音转文字技术以后,应该讲这几年来我们发展非常快。

最新一年,我们又取得了哪些进展呢?可以看到在这个过程中,我们的输入的准确率更高了,反应速度更快了,不知道大家注意到没有,跟前一年相比,我们整个字出现的时间要比原来更快捷。但是我相信这种大会的环境也不是经常都有的,我相信很多人在公司里面做会议记录的时候,不太愿意把我们的公司的会议记录内容上传到网上,所以在这种情况下,我们针对要有隐私性和秘密环境下,专门开发了更安全的单机独立版的系统,并且让这样的系统性能也达到了非常高的水平。原来我们说过在在线的情况下,我们的系统可以达到97%的正确率,那么在离线不联网单独的机器上,现在也能做到95%,应该讲这是一个非常高效的系统。

不仅仅在系统性能上,我们得到了很大的提高,其实我们也可以看到针对不同的环境、不同的行业,医疗,司法,我们做了大量的定制工作。在这个过程中我们可以看到,针对会议系统,我们推出了软、硬件一体化方案,大家在屏幕上看到的一种是可以直接装在您的会议系统机架上的专业的工控机,它不仅仅可以提供会议记录的功能,而且能够对对话角色自动进行分离。另外一种,就是我们在外出办公的时候,比如说采访过程中,我们希望一个便携式笔记本电脑就能完成所有的功能,我们专用的便携式专用听写笔记本电脑也横空出世。那么现在你带着他可以实现会议纪要的及时出稿。利用这样的设备,我们在很多的行业进行了深度的定制,首先举个例子,在公安司法方面,我们跟最高法进行了深度合作,现在的庭审记录用上我们这套系统可以极大地提高庭审效率,把整个庭审的效率提高30%以上。通过远距离的识音和整个针对庭审个性化的处理,原来做一项庭审,完了以后,需要3个小时的时间来处理的庭审结果,现在只需要5分钟,原来一个上午能处理3个案件,现在一个上午能处理5到6个案件,极大的提高了效率。正是因为我们在这方面不断的取得进展,现在包括中央办公厅,国务院办公厅,最高法,最高检和中央宣传部,都采用了我们的讯飞会议听见系统。这种行业的系统,已经越来越多的用在各种的行业应用上。

那么刚才大家也注意到了,今年我们还有一个非常大的变化,所有的听写的结果是为了便于大家之间的交流,那么我们的交流不限于在中国的这些同志之间,我们在国际友人间,也非常需要交流,那么刚才庆峰其实已经展示了我们的多语种的,听写专业一体化的系统。但是有很多的情况下,不一定是在大会的环境下,在我们出国旅游的时候,我们更需要时时的和国际友人进行交流,那么今天我们也带来了科大讯飞的一个真正的黑科技,给你一个小型的设备,你就可以在随时利用科大讯飞的听见便携翻译机,和我们的国际友人进行互译。现在我们已经能够提供中英维语,它随时携带方便快捷。

大家可以看到,虽然刚才我们用了两个设备,但是其实只要用单一的设备,就可以完成两个人之间的实时会议系统,利用这系统,我们可以看到我们真正做到出国和外国友人交流无障碍。现在中国每年的出国人次已经突破一亿四大关,在4月26号,习近平总书记去视察特大讯飞的过程中还专门的鼓励我们要真正能够把语音翻译做到,加强我们国家在一带一路和海上丝绸之路的建设。那么现在我也高兴地告诉大家,作为安徽省援疆项目的一个重点,现在我们的中维翻译系统已经非常好的服务于我们很多援疆干部与现场的维族同胞之间的交流。

现在有非常多的,各种各样的录音信息,怎么来使用呢?告诉大家一个好消息,经过这么多年的发展,我们也推出了讯飞实时的网上服务系统,通过网站和app的形式给大家提供。大家只要把你的各种格式的语音音频文件传输到我们的网站或者app上,你就可以得到精确的文字结果,而且它后面还提供人工服务的功能,对于一些质量确实有很大问题,短时间内机器解决不了的问题,我们也可以用人工众包的服务来帮你解决。

刚才讲了,我们解决了在人际交互,人与人之间传输的问题。大家都知道这两年特别热的一个概念,智能家居。大家想象一下,在智能家居里面最重要的一个设备是什么呢?它很大但是,现在闲置率又很高,因为我们其实跟它的交互很困难。相信大家都能猜的到,就是电视。在这背景之下,我们可以看到,瞄准智能家居,现在讯飞应该已经有超过3000家合作伙伴,利用我们去年推出的AIUI使他们的这种设备更好的与我们进行交互,这3000多家厂商已经推出了1000多种各种各样的产品,从我们的图标上,可以看到他们中间有台灯,有机器人,也有智能家电,有各种各样的设备。在这个过程中,最重要的是电视,可以看到在讯飞推出的讯飞电视助理过程中,现在已经占据了整个市场80%以上的市场份额,所有的著名电视品牌厂商,包括机顶盒厂商,包括运营商和广电,都与我们建立了非常紧密的合作关系。

在这过程中,讯飞不仅仅提供我们的核心技术,而且我们从整个系统集成和用户体验的角度出发,提供了整套的从芯片到后台的本地引擎到后面的云传输、语音服务到整个遥控器的解决方案。不同的解决方案可以对不同的客户形成非常好的支持。大家可以看到,利用自然语音交互方式做成遥控器,可以很好地将语音交互与我们的按键控制结合在一起。

其中融汇了我们多年以来在这个领域深度的积累,我们看到它的识别率已经超过了97%。而且关键是它响应速度,很多人一开始看到这演示的时候,会说整个的识别和处理是不是就在机顶盒上进行,但是我可以非常确定告诉大家,整个过程都是在我们的云端进行处理的。更加神奇的地方,大家可能注意到了,不管是对电影名还是演员,还是其中各种细化的内容,我们的语音都可以进行紧密的结合,这其实给我们揭示了将来语音搜索的一种概念,针对家庭场景的语义,我们做了将近1万种的各种不同的设计,而且它还在不断持续增长过程中。

刚才讲过了,智能家电是我们生活中一个非常必备的,但是,最近最热的是什么,也是我们中国人现在富起来的标志,就是我们的汽车。

有一天,李德毅院士曾经跟我说过,如果有一天,我们的汽车都自动驾驶了,一上去它自动就开了,默无声息,你不会觉得瘆的慌吗?我后来一想确实很有道理。那么,汽车是不是应该跟我们进行交流呢?如果你上一辆自动驾驶汽车,它说hi,今天你要去哪里?也许这样的感觉更好,那么在过去的10年过程中,我们用我们的智能语音技术,和很多的汽车厂商建立了非常紧密的联系,特别是科大讯飞的AIUI发布以后,全世界有30多个国内外厂商和我们建立联系,超过100个车型,现在正在用我们的讯飞语音交互技术。

在这些过程中,最近3年,包括奔驰, BMW,雷克萨斯,大众,通用,他们都在世界上进行了关于中文的语音交互的测试,每一次科大讯飞都能够拔得头筹。在这个基础上瞄准汽车里面的应用,我们最新推出了基于AIUI的飞鱼系统,为什么叫飞鱼系统,我后来想通了,是希望我们能给我们的客户提供像水中一样自由的用户体验,像飞鱼一样的快。但是我非常希望我们这样的系统能够给大家惊艳的展现。下面就请我们的产品经理吕思男,给大家现场展示一款,在今年的热卖车型,也就是奇瑞的艾瑞泽,配上当前世界上最先进的中文语音智能车载助手它的效果。

下面呢我们其实可以看到这中间有很多的新的功能,那么这中间有什么呢?我们可以看到它有4个非常突出的功能。

第一个就是降噪,我们现场没有汽车的噪声,但是,可以看到在已装机的上百万台的车里面,我们都提供了非常高质量的语音识别的效果,那么在刚才的过程中,不知道大家注意到没有,所有的过程都非常的自然。我刚也提示过了,不需要再去按键,在整个过程中,如果你想打断汽车的说话,随时可以,这就让我们有非常自然的用户体验。更加重要的是我们在全场景上进行了深度的整合,相比去年我们的AIUI系统,可以看到今年车载系统,跟系统的深度整合又上了一个新台阶。那么围绕在车载环境下的8项功能,包括智能导航,在线娱乐,故障提醒,车身控制,所有这些功能都进入了深入的调整。针对我们现在整理出来的100多项汽车生活的场景和500多项的汽车业务属性,我们进行了多达5000多种不同参数的语义层面的整合。

大家刚才看到庆峰同志介绍了我们在各个方面包括的知识图谱方面的工作,很好地支撑我们各种业务上的标志性单元,这种概念的融合处理,也标志着我们的深度神经网络用于自然语言处理达到一个非常高的高度。我们的飞鱼助理不仅仅是为了让你体验这种美好地用户感的,更重要的是我们在车里面到底需要什么?

为了让车里的生活更加丰富多彩,我们和中国移动,网易,携程,大众点评,美团,建立了深度的连接,你在车里面可以随时随地用这些服务。我们可以看到飞鱼助理确实就像我们所讲的,通过AIUI,让汽车驾驶,更安全,更智能,也更有趣,当然我觉得最重要的一点,当汽车能够自动驾驶以后你上去不会觉得那么慎得慌,你会觉得这确实是一个聪明、温柔的智能汽车。

应该说刚才在庆峰的报告中也提到了我们的工作正在越来越多的被机器人所代替,这两年我相信一个最热的领域,包括投资界,现在大规模在看的就是机器人领域。机器人分为工业机器人和服务机器人,这里面呢我有一个好消息和一个坏消息,那么好消息是什么呢?科大讯飞不断地用我们的技术,促进了我们在服务机器人在语音交互方面的能力,相信在座的今天来的各个机器人创业公司小伙伴一定非常高兴。

在过去的十几年过程中,我们语音最大的一个应用就是用在客户服务,大家已经感觉到越来越多的银行、电信,他们后台的呼叫中心已经被替换成机器自动服务的查,在过去的十几年过程中,我们可以看到科大讯飞针对1万种的语音自动服务的产品进行了优化。我们现在已经占领了80%以上的市场份额,每日接听电话的数量达到了200万次,并且我们还节省了25%的人力开销,那么利用这种非常先进的客户服务的能力,跟我们刚才讲到的AIUI系统,和各种智能服务机器人的组件进行结合,我们也推出了最新的服务机器人,营业厅服务机器人的标杆就是我们的晓曼机器人,不要看晓曼机器人这个名字里面有个小字,他的名头可挺大的,在4月26号,他也受到了习近平总书记的亲自接见。

大家应该都注意到了刚才在晓曼机器人的业务演示的过程中,也展示了非常多的特点,首先在自然交互方面,因为有AIUI的支持,整个交互过程非常的自然流畅,最重要的是,因为是机器人,所以他能够通过各种各样的视觉身份认证确定你的身份,推荐个性化的服务。更重要的是大家看到了跟银行和运营商很多业务可以深度的打通,那么通过智能的整合,用人机融合的方法来建立服务。刚才大家看到了机器自动的服务可解决80%到90%的问题,还剩下有一些机器没法解决的问题,我们也可以通过人工远程操作的方法覆盖其他所有的业务。经过我们实际测试,用晓曼办理业务效率可以提高70%,把效率又提高了很高的一个程度。经过一段不断时间的研发,其实它将马上迎来正式首发,在明年的3月份。我相信大家将看到越来越多的机器人进入我们的生活。

不仅仅是这样,通过晓曼机器人,其实讯飞打造了一个服务机器人的标杆。它能够跟你进行自由的对话,它能够识别你的身份,在核心技术方面,科大讯飞已经用我们自身的技术力量和整合力量,为所有的服务机器人提供一个很好的交互平台。在渠道方面,因为科大讯飞在银行、运营商、教育领域有非常强的渠道,我们也非常乐意和我们的机器人的合作伙伴一起为各种各样的场景打造不同形态的机器人,在资本层面,科大讯飞也在进行一些战略方面的布局和投资,以及和政府层面上进行联合的战略布局。

去年我们12月21号的发布会上,我们发布了讯飞超脑,认知计算和自动阅卷方面最近一年,我们好讯连连。首先看一下英文作文,我们都知道原来传统英文老师因为作业非常难以批改,一般一个月才布置一次,而且每一次他只能给你一个分数,并不能给你细致的指出英文作文里面有哪些点你做的是不好的,但是利用我们讯飞超脑的自动作文评阅系统,我们现在可以不同的类型的错误都指出来,而且给你一个精确的评分,那么对于中文其实也是一样的。中文的作文,我们也可以把里面详细的内容,都给你指出来。那么对于英文语文和数学,我们可以看到是我们一个各个课程的一个经典代表,下面请我们的工作人员给大家演示一下,我们在数学个性化教学和推荐方面取得的一些最新成果。

科大讯飞人工智能技术在教育领域的应用,是以机器自动阅卷技术为切入点,通过学业数据采集和教学过程性数据分析,实现多维度教学发展性评价和基于知识点的学生个性化学习,能够深度挖掘数据价值,帮助教育管理者高效决策,教师精准教学和学生个性化学习,并实现家校互动,帮助家长实时了解孩子学习情况,真正做到因材施教,个性学习。

谢谢大家!

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2016-11-24

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏程序人生

程序员为什么会忧虑自己的未来?

驰远是青橙科技的 CTO,我很喜欢他的文章,之前已经发表过好几篇,很多同学表示深受启发。这是最新的一篇,和职业规划有关,相信能够对你有所帮助。 从去年开始,我参...

3599
来自专栏数据猿

干货分享 | 2016年人工智能产业发展趋势及融资

2016年9月6日,由上海大数据联盟、数据猿和上海BOT大数据应用大赛联合举办的“人工智能发展趋势论坛”在上海超算中心顺利举办。本次活动是2016上海BOT大数...

44610
来自专栏程序员互动联盟

码农最后有几种归宿?

经常听到周围的人说,程序员吃的是青春饭,过了30就不行了,身体机能下降,后面的年轻人也会呼呼的赶上来,到30就该考虑出路了。真是这个样子让80后的程序员该如何是...

3076
来自专栏AI科技评论

自然语言处理的下一个十年将在哪里?CCF-GAIR 2018将给你答案

不管学界还是业界,对自然语言处理的谈论越来越多,更有甚者,自然语言处理被上升到战略层面。

1013
来自专栏机器人网

机器人博士亲述:在日本研究机器人是怎样的一种经历?

日本可以说是机器人技术最发达的国家之一,日本在机器人方面的强大是有其深厚工业基础的,控制机器人精密动作的伺服电机主要被日本、德国、美国所垄断,其中包括了被大众熟...

3687
来自专栏人工智能快报

美国国家经济研究局发布报告“人工智能与现代生产力悖论:期望与统计的冲突”

美国国家经济研究局发布报告“人工智能与现代生产力悖论:期望与统计的冲突”。该报告由麻省理工学院斯隆管理学院Erik Brynjolfsson教授、Daniel ...

3123
来自专栏钱塘大数据

钱塘号丨未来人工智能将带动金融服务如何发展?

导读:人工智能日趋普及,并在金融服务领域产生巨大影响。本文作者 Nikolas Badminton 向我们介绍了人工智能在金融服务领域的发展动向,并对其发展趋势...

3708
来自专栏大数据文摘

牛津大学人类未来研究所:万字长文谈AI新职场方向-政策研究

1533
来自专栏人称T客

烧光 1000 万,我得到了哪些教训?

T客汇官网:tikehui.com 原文作者:Matt Munson 编译:徐婧欣 ? 起步良好的 Twenty20,在短时间内就烧光了 1000 万资金,这家...

3507
来自专栏新智元

IDG 资本 2016 投资趋势详解:人工智能、消费升级、泛娱乐

作者:杜暮雨 ? 3月27日,IDG 资本在其主办的 “2016「IDGVIEW·思享前行」投资趋发布大会上,提出了他们看好的三个方向:人工智能、消费升级、泛...

3588

扫码关注云+社区