【新智元导读】德勤数据研究院 3 月快讯,分析中国在人工智能领域飞速发展:尽管在人工智能领域美国仍处于世界领先的地位,但在过去的几年中,中国已经取得了巨大的进步,大有在人工智能创新应用上超越美国的潜力。
中国在人工智能领域的飞速发展
▶ 开创性科学技术领域美国仍占据着主导地位,但是以中国为代表的其他国家,也在几年间追赶上来,并不断地推动着人工智能技术的革新。得益于中央政府的一系列鼓舞地方政府发掘并投资新兴企业政策的刺激,中国在人工智能领域取得了突飞猛进的发展。在过去的十年间,政府用于研究的投资一直以两位数在不断增长。去年三月份公布的第十三个五年计划显示,科技研究仍然是主要的投资发展对象。
▶ 大多数中国公司都对自动化及工业机器人技术较为熟悉。同时他们也在逐步地引入深度学习、语言交互技术和图像处理能力。由于研究、发展和生产三者密不可分的联系,作为世界上最重要的工厂,中国正处在一个利用人工智能带来的飞跃的特殊位置。这些使得快速机器学习,实时人工智能应用,到大规模数据的模型侦测,变为现实。
▶ 近几年来,中国与美国科技公司间研究开发能力的差距正在不断缩小。中国的三大互联网公司 "BAT"(百度、阿里巴巴和腾讯),已经投入了数以十亿计的美元用于人工智能的研究,在数据可用性和计算能力上进行了进一步的探索。我们有理由相信"BAT"三巨头能充分的挖掘数据中隐藏的宝藏并且利用前沿的机器学习的算法来提升他们的服务。微信和中国香港科技大学通过成立联合人工智能实验室来增强微信提供智能服务的能力就是一个很好的例证。
▶ 作为中国顶尖的搜索引擎,百度去年在科研技术上投入超过 15 亿元,其中大部分都应用于人工智能的研究。目前,百度被认为是亚洲人工智能的领跑者。百度人工智能研发是建立在 92% 中国网络搜索用户使用他们的服务的基础上的,并且,他们也从不曾掩盖他们进军保险、银行和音乐等新领域的打算。在 2013 和 2014 年,百度分别在硅谷(花费 3 亿美元在硅谷的人工智能实验室 [SVAIL])和北京(深度学习研究院)分别建立了人工智能的实验室,并且聘请了曾经领导“谷歌大脑”,并合作创建了网上学习平台“Coursra”的吴恩达。2017 年,百度新成立了一个拥有55位学者的“增强现实的实验室”,利用其增强现实应用平台 DuSee 进行人工智能在市场、医疗和教育的研究。在 2016 年 9/10 月份,百度在人工智能/增强现实领域中投资两亿美元,并宣布了 30 亿的针对中后期创业公司的投资基金。百度也有一些看似“无足轻重”的尝试,例如趣味照片滤镜,照片滤镜曾经在 2015 年红极一时,百度在人脸识别算法与微软、脸书、和谷歌进行了正面对决,最终因更低地出错率取胜。其他的尝试还包括广告特效,图像检索和帮助盲人指路的图像识别,最佳语音识别和搜索(深度语音识别系统 Deep Speech 和深度语音识别系统 Deep speech 2),语言翻译,一个叫"度秘"的虚拟助理,一个类似沃森的解决问题的机器人程序,街景 3D 模拟,无人驾驶,防病毒过滤,服务器集群硬盘故障预测,组织内制度化的深度学习(其他部门的工程师也可以使用一个叫 Paddle 的平台,研究与业务相结合)。
▶ 在百度的带领下,腾讯(旗下有微信[8.46亿用户]、QQ[8.77亿用户],并入股京东)在16年12月建立了他自己的人工智能实验室,包含30个研究人员并计划迅速壮大,以在2017年发布原创成果。它在私人新闻推荐和搜索上应用机器学习,并且也有创造新产品的打算。阿里巴巴在 2016 年 8 月发布了一个在阿里云下的包括从语音转录、视频识别到金融风险分析和路况预测的一系列服务的全新的人工智能组件,并封其为 ET。它现在拥有一个带有 600 个分析模型的人工智能程序,每秒可可处理一亿个数据块,可以浏览淘宝平台上的100万个产品清单来寻找造假的商家。超过800个造假者因为它的分析在16年被送进了监狱。阿里巴巴旗下的蚂蚁金服也是创业服务平台“36氪”的投资者。滴滴打车和搜狗也开始了他们自己的 AI 研究。同时,我们不能忽视像微软和谷歌那样的公司也有中国本土的AI实验室。
▶ 根据毕马威最近的研究显示,今年在中国的风险投资从 15 年的大数据转向了人工智能。中国的风险投资总体上年同比增长 19% 达到了 310 亿,并且更偏向于人工智能、认知学习和机器人技术。具体的中国的人工智能研究的数量不断的变化,但是一篇报道指出 2015 年在人工智能研究的投资为 26 亿美元(包括合作研究),另一篇报道则称中国前半年的人工智能的明确的投资与 2015 年同期相比激增了 43% 到了 6 亿美元。这是一个相当大并且不断增长的市场。已经被认可的新兴企业包括碳云智能科技(关于医疗数据的机器学习来优化产出)、科大讯飞股份有限公司(语音和语言识别)和驭势科技(无人驾驶汽车)。
▶ 在当今中国企业企图获取技术带回世界第二大经济体的背景下,中国的对外风险投资预计仍将保持稳定的速度增长。美国很可能继续得到大部分的中国对外投资,与此同时,加拿大、德国和以色列也将在资金和收购上获得中国投资者的青睐。最近的一个实例就是中国预期收购库卡系统,一个德国的工业机器人生产者。
▶ 中国的研究人员已经变得对人工智能至关重要以至于美国人工智能协会2017年会甚至因为中国新年调整了时间。会议上采用的来自中国的论文数几乎与来自美国的相等。2016年 10 月,美国政府关于人工智能的战略计划指出美国在人工智能当下非常热门的一个分支深度学习方面的期刊论文数量落后于中国。中国在这方面的专利申请也比美国本土的专利数量增长更快,(尽管在总量上中国仍然是美国的一半)2010年到2014年间中国的增长率势186%而同期美国的增长速率是26%。
引用期刊中提到“深度学习”或者“深度神经网络”的数量(按国家)
德勤的分析和见解
▶ 中国企业致力于成为真正的技术领导者而不是创新的模仿者,中国正在以有序的步伐前进着。在美国的研究人员仍然负责处理很多基础的开创性工作,但是很快这也将发生改变,而且我们目前已经开始了一些引人注目的研究,例如中国大脑认知计算项目。中国学者更擅长的是吸收一个想法比如机器学习,并快速应用。由于市场的激烈竞争,中国的企业擅长塑造传递其独有的特色。如百度的吴恩达曾说“中国研究发展速度已经超过了硅谷中的大多数企业。”随着中国最近研发成功的世界最快的超级计算机“神威太湖之光”,中国不仅仅在软件上而且在与人工智能有关的硬件上也有优异的表现。
▶ 一些有利于中国学者的因素:
▪ 学习和语言的不对称:中国学者通常讲英语所以他们具有能理解所有用英文传播和发表的作品。相反,英文的社区则不太可能接触中文人工智能社区的一些的研究。吴恩达曾说“中国对英语世界中正在发生的事情有着同样深刻的理解,但反之则不然。”
▪ 跨国信息获取:中国在获取跨国信息流上制定了严格的限制。这就意味着中国公司在收集本国市场个人信息上有着垄断的优势,同时我们又能获取到来自美国和欧洲的数据。这些都使得中国公司具有全球的数据观并且在涉及大规模的行为数据集的研究中处于一个有力的位置。
▪ 中国在个人信息上宽松的管理:中国在转移和销售个人数据上的规定相较于美国和欧洲更为松懈。这就代表着中国企业能花费更少的成本来获取大量的“灰市”上的数据。
▪ 语言是新竞争者进入中国的壁垒:由于语言和配套技术的困难,非中国的人工智能公司包括德勤的全球合作伙伴例如 IBM 沃森,IPSoft 和 KIRA 都在艰难奋斗着以取得中国部分市场份额。相应的,中国公司在英语国家也处于劣势,因为有更多的英语数据供机器学习算法训练。
▪ 招聘人才的能力:腾讯副总裁姚星相信中国公司可能会在招聘人工智能人才上有一定优势——关系到公司进行最前沿研究的关键。根据姚所述,“由于许多研究机器学习的学者都是中国人,中国公司确实有机会用相对低的报酬招到人才。
(本文来自德勤数据研究学院 3 月快讯《中国在人工智能领域的飞速发展》)