首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >重磅 | 奖金200万,千万数据规模,创新工场搜狗今日头条联合发起迄今国内最大AI挑战赛(附详细赛事说明)

重磅 | 奖金200万,千万数据规模,创新工场搜狗今日头条联合发起迄今国内最大AI挑战赛(附详细赛事说明)

作者头像
AI科技大本营
发布2018-04-26 15:27:27
1.8K0
发布2018-04-26 15:27:27
举报

文/周翔

编辑/鸽子

上月,举办了八届的 ImageNet 挑战赛由创始人之一李飞飞博士正式宣布退出历史舞台。虽然 ImageNet 走了,但是今日下午(8 月 14 日),创新工场、搜狗和今日头条联合宣布共同发起“AI Challenger 全球 AI 挑战赛”。其中,CSDN 作为选手社区,为大赛提供支持。

为了 AI Challenger 比赛,三方联合开放了多个领域的数据集,包括最大规模的人体骨骼关键点数据集(用于无人驾驶、安防、体感游戏等场景)、最大规模的图像中文描述数据集(用于图像和视频内容理解、图像标题自动生成等各类应用)、最大规模的口语领域英中翻译数据集(用于同声传译等自然语言处理的各类应用)等。

据现场介绍,大赛第一年启动将开放超过 1000 万条中英文翻译数据、70 万个人体动作分析标注数据、30 万张图片场景标注和语义描述数据,是国内迄今公开的规模最大的科研数据集,是国内迄今公开的规模最大的科研数据集。

首届“AI Challenger 全球 AI 挑战赛”将于 9 月 4 日正式拉开帷幕,各路高手展开为期三个月的比拼,并于 12 月中旬进行总决赛巅峰对决。获奖团队将分享合计超过 200 万人民币的奖金。

2017 年竞赛将区分为五个竞赛任务,分别是英中机器童声传译、英中机器文本翻译、场景分类、人体骨骼关键点检测、图像中文描述,设有共计 200 万元人民币的奖金池。

9 月 4 日起,AI Challenger 将开放参赛队伍线上进行数据集下载,竞赛为期 3 个月,将持续直到 12 月份。参赛的优秀选手还可获得进入三家主办方工作、实习或获得投资的机会,并有机会在国际顶级学术会议上分享获奖心得,得到如上海科技大学教授马毅、旷视科技首席科学家孙剑、前 Google 研究院高级管理科学家林德康等十余位人工智能领域顶级专家评委的指导和评价。

未来,“AI Challenger·全球AI挑战赛”将持续投入,建设和发布更大规模的AI前沿领域高质量数据集,扩大涵盖自动驾驶、智慧医疗、智慧金融、机器人等行业应用中的核心AI需求。

据赛事主办方透露,本次挑战赛有三大特点:

  1. 偏重为前沿科研,并将逐步涵盖计算机视觉、 自然语言处理、 自动驾驶、 智慧医疗、 智慧金融等核心AI领域。
  2. 超大规模的高质量数据。首度公开的人体⻣骼关键点检测、 图像描述和口语类机器翻译数据集, 均为国内迄今规模最大。
  3. 打造开放的世界级平台。

比赛详情

以下为赛事2017首届“AI Challenger全球AI挑战赛”赛事说明

一、赛程安排

2017年9月4日-2017年9月24日:

平台会在9月4日10:00开放训练数据集以及验证数据集,参赛选手可以自行下载数据,在本地进行算法设计、模型训练及评估。

2017年9月25日-2017年12月3日:

(1)平台会在9月25日10:00开放测试数据集A集,参赛选手可自行下载数据,在本地使用先前训练的模型进行预测,生成预测结果并提交至平台。结果提交后,系统会按照评测指标实时反馈分数,并更新榜单排名。

(2)每队每周最多可提交2次(不同比赛提交次数会有调整)。

(3) 榜单以所有参赛队伍的历史最优成绩进行排名。当有团队提交新的预测结果之后,榜单将实时更新。最终的成绩排名以12月3日23:59:59的排名为准。

双周赛:

从9月25日至11月20日期间,组委会将举办4次双周赛。10月9日将公布第一次双周赛排名前三的队伍,颁发奖金及证书。之后每两周公布一次排名前三的队伍名单,一共颁发四次双周奖。双周赛的排名将以10月8日、10月22日、11月5日、以及11月19日当晚23:59:59的成绩榜单排名为准。

测试数据集B集:

最终榜单公布前,公布测试数据集B集,具体开放时间待定。B集开放之后,成绩榜单将采用选手模型在测试数据集的B集上的预测结果表现,作为排名依据。

2017年12月3日:

预测结果提交截止。最终的榜单成绩排名以12月3日23:59:59的排名为准。本次榜单决定场景分类竞赛年度的获奖队伍,其他竞赛将进入到下一轮的答辩环节。

2017年12月16日(暂定):

(1)人体骨骼关键点检测、图像中文描述、英中机器文本翻译、英中机器同声传译四个竞赛系统最后一次榜单成绩排名前五的队伍将在当天受邀来到现场进行答辩,特殊情况可以远程答辩,具体安排另行通知。

(2)参赛队伍应提前准备答辩材料,包括PPT、算法代码等。

(3)榜单成绩和答辩成绩的加权总成绩将决出这四个竞赛最终的大奖。同时,五个竞赛的冠亚季军及获得优胜奖的队伍将受邀来到现场参加颁奖典礼。

评分规则

本次大赛将以最终榜单排名结合答辩表现,加权计算总成绩,决出最终的大奖。

竞赛的测试数据将分为A、B集两部分。A集部分将在9月25日开放下载,在B集部分开放之前,榜单将采用选手模型在测试数据集的A集上的预测结果,作为排名依据。

B集部分预计在11月下旬开放,具体开放时间待定。B集开放之后,榜单将采用选手模型在测试数据集的B集上的预测结果,作为排名依据。最终的榜单成绩排名以12月3日23:59:59的排名为准。

报名方式

(1) 报名时间:即日起至10月31日。竞赛报名以及组队队员变更截止时间为10月31日23:59:59。

(2) 参赛队伍可1-3人组队参赛,确保报名信息准确有效。每名选手在大赛平台只能拥有一个账号,否则会被取消参赛资格及激励。

(3) 实名认证:为保证大赛公平性,所有选手必须完成个人信息实名认证。认证过程在个人中心的实名认证区域完成。

(4) 报名方式:登入challenger.ai官网,完成个人信息注册,即可报名参赛。

(5) 参赛队员必须遵守并签署《竞赛选手报名协议》。

组队规则

参赛队伍可1-3人组队参赛,竞赛报名以及组队队员变更截止时间为10月31日23:59:59。在10月31日前,参赛选手可自行选择退出原队伍或加入新队伍,但队员原先成绩不带入新加入队伍,以新加入队伍的成绩为准。

二、参赛对象

大赛面向全社会开放,个人、高等院校、科研单位、互联网企业、创客团队等人员均可报名参赛。创新工场、搜狗、今日头条现任全职及兼职员工,数据集建立及维护过程中能接触到数据的人员不得参赛。

三、奖金池设置

总奖金池超过200万元人民币,具体分配比例见各竞赛详细说明。

四、各竞赛及数据集详细说明

(一)计算机视觉赛道

1、人体骨骼关键点检测竞赛

  • 赛题介绍

人体骨骼关节点对于描述人体姿态、预测人体行为至关重要,是诸多计算机视觉任务和人工智能应用的基础。本次竞赛邀请参赛者设计算法与模型,对自然图像中可见的人体骨骼关节点进行检测。

组委会将通过计算参赛者提交的检测结果与真实标注之间的相似性(OKS),并结合答辩表现,综合评估参赛者的算法模型。

本次竞赛的研究成果可以被直接应用于动作分类和识别,动作捕捉,图像和视频内容理解,人机交互,自动驾驶(行人动作和意图识别),安防(异常行为检测),无人零售(消费者行为理解)等领域。

  • 数据集特色

作为人物动作理解的基础数据集,此次发布的人体骨骼关键点数据集是目前规模最大,场景、人物动作及身体遮挡情况最复杂的数据集。此数据集标注了共30万张图片,包含了超过100种复杂生活场景内的实际人物动作与姿态,标注人物个数达到70万量级,远超过MSCOCO的10万人,以及MPII的4万人量级。该数据集将挑战现有主流算法的鲁棒性。

  • 奖励
    • 冠军队伍将获得30万元人民币的奖金
    • 亚军队伍将获得3万元人民币的奖金
    • 季军队伍将获得1.5万元人民币的奖金

另有若干奖项如优秀奖及双周奖等,详见网站对应竞赛页面的详细说明。

2、图像中文描述竞赛

  • 赛题介绍

图像中文描述问题融合了计算机视觉与自然语言处理两个方向,是用人工智能算法解决多模式、跨领域问题的典型代表。参赛者需要对给定的每一张测试图片输出一句话的描述。描述句子要求符合自然语言习惯,点明图像中的重要信息,涵盖主要人物、场景、动作等内容。此次发布的图像描述数据集以中文描述语句为主,与同类科研任务常见的英文数据集相比,中文描述通常在句法、词法上灵活度较大,算法实现的挑战也较大。

组委会将通过客观指标(BLEU, METEOR, ROUGE-L和CIDEr)并结合答辩表现,综合评估参赛者的算法模型。

本次竞赛的研究成果可以被直接应用于图像与视频语义理解、图像与视频自动标注、图像与视频内容检索、人工智能辅助教育、机器人视觉、盲人辅助等人工智能相关领域。

  • 数据集特色

图像中文描述数据集,是计算机视觉与自然语言处理两个学科的交叉结晶。该数据集是目前规模最大、场景和语言使用最丰富的图片中文描述数据集,使用了超过100种复杂生活场景的含有人物的图片,其场景复杂度、人物动作复杂度、身体遮挡情况都高于现有的其他数据集;而且,此数据集的语言描述标注更符合中文语言使用习惯。

相对于MSCOCO和Flickr8k-CN,在完整描述图片主体事件的基础之上,该数据集创新性的引入了形容词和中文成语,用以修饰图片中的主要人物及背景事件,大大提升了描述语句的丰富度。同时,本数据集的30万图片标注量将远远大于Flickr8k-CN(8000张图)。巨大的数据量和复杂的图片场景将直接挑战现有算法的可用性。

  • 奖励
    • 冠军队伍将获得30万元人民币的奖金
    • 亚军队伍将获得3万元人民币的奖金
    • 季军队伍将获得1.5万元人民币的奖金

另有若干奖项如优秀奖及双周奖等,详见网站对应竞赛页面的详细说明。

3、场景分类竞赛

  • 赛题介绍

本次场景分类竞赛从400万张互联网图片上精选出10万张图片,分属于80个日常场景类别。每个场景类别包含大约1000张图片。要求参赛选手根据图片场景数据集建立算法,预测每张图片所属的场景类别,组委会将通过计算参赛者提交预测值和场景真实值之间的误差确定预测准确率,评估所提交的预测算法。

  • 奖励
    • 冠军队伍将获得10万元人民币的奖金
    • 亚军队伍将获得1万元人民币的奖金
    • 季军队伍将获得0.5万元人民币的奖金

另有若干奖项如优秀奖及双周奖等,详见网站对应竞赛页面的详细说明。

(二)机器翻译赛道

  • 数据集特色

本次公开的机器翻译的训练数据为英中方向的高质量、大规模的口语领域的数据。训练数据全部经过译员检查和矫正,句正确率在97%以上,英中双语句对对照工整、质量高、噪音低。现有中英机器翻译评测比赛采用有效数据从30万(例如,The International Workshop on Spoken Language Translation)到900万(例如,Chinese Workshop on Machine Translation)不等。而此次采用的训练数据量达到1000万句对,是最大规模的口语领域英中比赛数据集。训练数据领域性强,面向口语领域。

1、英中机器文本翻译竞赛

  • 赛题介绍

英中机器翻译竞赛的目标是评测各家英中文本机器翻译的能力。本次文本机器翻译语言方向为英文到中文。参赛队伍需要根据评测方提供的数据,训练机器翻译系统,并且自由地选择机器翻译技术。例如,基于规则的翻译技术、基于实例的翻译技术、统计机器翻译及神经网络机器翻译技术等。

本次竞赛将利用机器翻译的客观考核指标(BLEU、NIST score、TER)进行评分,BLEU得分会作为主要的机器评价指标。组委会将通过客观指标,并结合答辩表现,综合评估参赛者的算法模型。

本次竞赛的研究成果可以被直接应用于机器翻译尤其是口语机器翻译等领域。

  • 奖励
    • 冠军队伍将获得30万元人民币的奖金
    • 亚军队伍将获得3万元人民币的奖金
    • 季军队伍将获得1.5万元人民币的奖金

另有若干奖项如优秀奖及双周奖等,详见网站对应竞赛页面的详细说明。

2、英中机器同声传译竞赛

  • 赛题介绍

本次英中机器竞赛主要任务为集中优化语音识别后处理和机器翻译模块,解决机器同声传译中的技术问题。语言翻译方向为英文到中文。

相对于传统的机器文本翻译系统,机器同声传译的输入文本,暨语音识别模块的输出信息具有无标点、无断句、文本口语化以及夹杂语气词等特点。这一系列特点将为基于书面风格的传统翻译系统带来极大干扰和挑战,因此选手首先需要设计多种策略,制作语音识别后处理模块,将语音识别后的文本,处理为可用于翻译的文本。随后,调用自己训练的机器翻译系统,将识别后处理的文本翻译成目标语言。评测方将提供数据用以训练机器翻译系统,选手可以自由地选择机器翻译技术。

本次竞赛将利用机器翻译的指标(BLEU、NIST score、TER)进行评分,BLEU得分会作为主要的机器评价指标,同时结合答辩表现,综合评估参赛者的算法模型。

本次竞赛的研究成果可以被直接应用于机器翻译特别是同声传译类应用。

  • 奖励
    • 冠军队伍将获得40万元人民币的奖金
    • 亚军队伍将获得4万元人民币的奖金
    • 季军队伍将获得2万元人民币的奖金

另有若干奖项如优秀奖及双周奖等,详见网站对应竞赛页面的详细说明。

AI Challenger赛事官网:https://challenger.ai/

Panel环节

在今天的启动仪式中,CSDN 创始人兼董事长,AI100 创始人,极客帮创投创始合伙人蒋涛作为全程主持人,突出介绍了此次比赛的重大意义。而在随后的Panel环节,更是与创新工场创始人李开复,今日头条顾问张宏江,搜狗公司CEO王小川妙语连珠,展开对话。AI科技大本营简单截取部分摘要:

蒋涛:是什么机缘让三家走到了一起?

李开复:我之前去美国见到了很多美国顶尖的教授,他们都在感叹自己已经追不上美国互联网巨头了,虽然这些教授能力绝对不比谷歌的工程师差,但是他们没有数据、没有大的计算力,于是我就想到国内是不是也有类似的机会和挑战,回来以后就跟王小川、张宏江、一鸣聊了下。

王小川:我们因为之前跟清华做 9 年的联合研究,不断把数据输送给一个机构,当时我们意识到时代不是我们一起跟清华一起,把数据公开更多,我还思考给中国高校提供数据,跟李开复老师聊可以更大,全球的开放,觉得李开复老师很有号召力能做的更好,就愿意一起来做。

张宏江:我是觉得我们三个人走在一起是对于数据共同的认识,对于人工智能进展最核心的因素,我们能够开放出来,让更多人加入进来,让他们算法研发上进展更快。

蒋涛:比赛叫全球AI挑战赛是什么样的难度,包括我们开放这样数据是怎么样选择的?为什么选5类数据集,选择标准是什么?第二个是什么样的难度?

李开复:一开始合作三方都有想法贡献,我代表创新工场来描述一下,我们是感觉到AIChallenger已经一年比一年参与的人越来越少,人气越来越小,数据不够。一方面我们非常认可李教授当年做的事情,也认为他帮助视觉走了很长的路,包括我们的投资的首席科学家孙剑也做了很多工作。

现在数据已经远远不够了,所以我们从创新工场作为投资者角度,觉得创业者太可怜了,数据集不够,怎么样尽快速度做一些数据集,请孙建出来帮助他们领域的内容,孙建是张宏江培养出来的会比较密切。

蒋涛:现在大量AI人才都是研究院,打比赛也很强,您怎么看我们提出的数据集难度,对这些挑战?

张宏江:李开复刚才说的比较多,在过去两年不是那么让人激动人心了,并不意味着这个问题就解决了。其实当一个问题大面上解决的时候,我们应该认识到更加深入的,我们今年发布的数据更细分的领域,包括人体骨骼,包括其他的。我们希望这些数据能够把我们AI算法研究既带到下一个高度,能够分的更细。

蒋涛:这些问题对于这些问题很有挑战的。

张宏江:今日头条之所以跟王小川、李开复一起走到一起,我们希望看到更多的学校,通过这些数据集能够把更好的问题提出来,开发出更好的算法,我们也从中间受益,在学校能有新的解决方案。

王小川:我们有两个期待,一个是清华在用,一个我们自己在用,我们希望开放全球,尤其高校使用时,是否高校使用数据时,能像企业一样做出很好的研究性成果,有些企业思维惯性,有你自己路径,有可能学校用到数据有不同的方法,有比企业做的更好、更深的,这是一个期待。

第二个期待,在数据里面发挥真实作用,我们的数据来自于我们自己的问题,给大家一点启发。也许有更大的发挥,我认为难度说我们给他们的是真实的数据,企业在里面做的工作,有些对标,怎么能做出不同的算法,产生不同的价值,这是我认为比赛会有难度地方。

蒋涛:对于参赛的选手有什么样的期待或者是希望有什么样的人参加比赛,他们从中间获得数据以外,还能获得什么?

王小川:跟学校学生接触非常的可爱 的,真的很用心的做好学术成果,但是缺乏条件,真的希望他们在参赛过程中,也许在一些局部里面做成出成果,甚至超过我们的工程师,反过来能对我们产生刺激。如果他们有想法,有动力,能够比做出差异化或者更好,这就是非常有价值的。

张宏江:当我们企业自己做业务的时候,我们更聚焦于我们目前的业务,怎么来服务我们的用户,当我们把数据开放出来以后,给更多的人,包括学校,学生,另外希望更多创业公司,无论做算法、应用的,能够看到数据以后对他们也有所帮助,从而对他们提出更新的算法、应用。

李开复:我希望全国每一个教AI老师和学生都参加这个比赛,前一阵我见了一个老师跟我讲找课题多么难,人脸识别没法做,只能通过眼神进行揣测。我就鼓励他们,做AI研究还是要做主流的,他们说没有数据,也没有足够的机器,这次我们也希望在AIChallenger能够彻底解决,而且长期解决这个问题,如果真要做主流AI研究,无论做到最好,至少知道自己能做到什么程度,这样的数据集一定要尝试的,真的希望在座每位记者,尤其是高校老师会读你们写的文章,一定要鼓励他们参加,要提升中国整个AI水平,一定要让每位老师他们研究组知道他们现在位置在什么地方,有多大成长空间,如果基础知识不够可以学习,如果数据集不够我们可以提供数据集等等,真的希望每一位老师、每一位学生都考虑参加。可能有的学生说看起来很难我不会做怎么办?待会也有介绍,每个领域都会提供基础的算法,你不需要从无到有打造完整口语翻译引擎,是在我们基础之上。

蒋涛:大公司都有自己的数据标注、数据集,我们现在这样的小公司或者是小的科研团队,他们的竞争力,在这样的比赛也好,出来的成果也好是有竞争力吗?

李开复:我觉得这次提供的5个比赛,有些还是基于比较基础的,还是有竞争力的,如果你做过百度、搜索引擎,如果超过人脸识别可能会有难度,我们这次5个还是有空间的。

蒋涛:你不是自己就在做翻译吗?你推出语料,你希望这些选手有所突破吗?

王小川:如果做完整的产品,我们专注的地方还是有信心,但是毕竟我们专注领域之外,我觉得可以说是能够培养人也好,发布局部细分。比如说专注口语,日常200句,他们会有更多发挥,如果数据集在比赛之前可以发挥到很多应用里面去。

蒋涛:一般公司会有自己的主研方向,但是还有很多新的场景可以挖掘是吗?

张宏江:是,尤其当一个小公司开始考虑某一个方向时,很快用数据验证或者是看到数据会产生新的创意、新的应用场景。

蒋涛:前面也跟主办方交流了,比赛是一个非盈利性的竞赛项目,创新工场举办比赛,包括人工智能研究院整个目标是什么?

李开复:我觉得这次提供这么大数据集和竞赛,跟搜狗、今日头条合作,希望更多人进入AI领域。第二个推动全国AI专业水平,还是有机会来提升的,如果说对创新工场我们可以得到一些利益的,当然也是有,如果有某一个团队好的话我们也可以投资。

蒋涛:创新工场和人工智能研究院研究方向能分享吗?

李开复:我们整体看好的方向还是基于大数据的AI,不用搜集更多信息,已有数据就可以产生价值,这些领域在互联网的电商、广告、金融、保险、贷款或者是信用卡、券商、量化交易这些领域是最快能够看到效益的,因为数据已经存在的,长期的话还是认可无人驾驶作为重要行业发动引擎,让他里面的技术辐射到机器人领域。我们最近看了一些美国的公司,中国还欠缺一点公司,有点像IBM的Watson,针对企业需求开发数据,比如说在医疗、零售、教育等等都会产生价值。

蒋涛:头条是AI驱动的公司,您对AI人才,包括比赛怎么看,中国的工程、研究方面。

张宏江:刚才问到我们为什么要做大数据、做比赛,对我本人有什么意义,就是一个水涨船高的事,当你有更多数据让更多人用数据,就能提高他们的水平,就能培养更多的学生。一个月前我到斯坦福和伯克利花了一点时间,就像20年前读博士一样跟那边的学生、老师,让他们每个人讲讲他们做些什么。我整体感觉还是非常非常受启发的,他们博士平均的水平和他们对问题的把握,做出研究的领先性或者是创造性跟我们整体国内比起来的话,还是平均值要高很多。国内的清华小川他们合作的团队做的非常棒,在往外看的话整体水平跟美国还是有差距的,人才还是有差距的。

尤其在怎么从乱向中间看出问题,你看到很多数据认为可以做一些什么样的问题,比如说都谈大数据的问题,我们能不能从小样本里面学习,一系列的,精度学习等等很多很多学习,除了深度学习之外,新的架构出来,我认为新的问题把握,提出把握和解决上我们还是有很多很大空间去改善。从整体人才数据,刚才提到2周前在像夏威夷开的人工识别、视觉识别大会华人做的超过50%,真正获奖的2篇文章,你会觉得提出有意义的,在比赛当中争论的,大会讨论的不一定了,就不是50%了。从这一点上来讲,我是觉得我记得在以色列3月份去做过一个讲座,以色列人才最好跟中国合作,AI就像移动互联网一样,中国和美国双赢。回过头想想其实想想我有点心虚,中国有人,中国有市场,在人才方面还是有事情要做,我希望我们今天做这件事促进中国在这方面的发展。

蒋涛:就公司比较而言呢,大公司之间工程师、AI这方面的能力?

张宏江:两个礼拜前夏威夷的会,如果公司去的人做的是谷歌,去了小100人,微软、Facebook这都是几十个去的,苹果拿了一篇最佳论文奖,第一次去就拿奖了,还有很多小公司,中国也去了不少,吸引了不少来访者。

我想在提大问题上,有探索的问题上,我认为美国公司居多,中国有例外,像孙剑在深度学习算法上,图像算法上有非常多的想法。今日头条在移动互联网数据使用上,在视频检索、视频行为分配上我觉得是做的非常非常出色的,因为这是我本人的领域。我专门跟今日头条做视频同事聊了一下,今天在视频分类事情上,70%工作可以在计算机上解决。我从1992年被新加坡政府内容管理局找我去帮他们做分类,那个时候告诉他们,这个事情可能50年才能做,很高兴20年以后,70%不用人来做。

蒋涛:王小川你们的AI战略是什么?

王小川:上次的会我们好像也去了,我们有团队参加,包括翻译的东西、语言的东西。两年前我们在讨论一个事,讲中国AI时代会不会落后?我当时有一个担忧,2年前的数据互训前10大公司里面中国已经有4家了,5年之后可能一半甚至超过5家都是中国公司。中国公司在互联网公司,AI走出去我们是处于领先位置。一旦说高校,前100所学校只有只有2家,而且不在TOP50里面,高校里面相对落后。

蒋涛:计算机系前100名。

王小川:就会落后,背后人才的储备,不像谷歌这样的,AI的人满地爬,我们能够捞几个,国外引几个是很幸福的事情,有赖于中国高校基础人才供给上有差距的,刚才讲头两家清华、北大好一点,总体上有巨大缺陷的。我挺担心从互联网时代走向AI时代是会掉队的,今天看起来我觉得还是有希望,中国公司跑的真的很快,现在公司都在反哺,输出出去,输出资金让高校的群体小创业公司能够有起步,这件事情是有非常大意义的,中国在AI里面就可能继续推动,5年后就会把美国压在下面,如果做不到我们好不容易建起来的唯一全球领先领域又掉回去了。

刚才说到我们战略来讲,我内心有一个东西,今天随着深度学习的发展,语音和图像得到了跨越性的发展,语音图像在深度学习时很快就达到一个新的高度。在中间的话文字难度大一点,深度学习对文字解决非常有限,我们经常在电视上看到人机对话,看是很流畅的,都是人在后面,不可能做到一个机器在开放领域跟人做交谈,语音解决了,语音还是很难的事情。语言背后承载抽象的东西,把知识和推理放在后面的。语言的内涵更丰富,就像今天做交流里面比手势有限的,还是靠语音交流,我们语音识别做了很多,用户量最大,我始终认为我们专注点在语言上。就像我们之前做搜索、输入法都是以语言为核心的,比如说你说李开复老师跟文字讲不能带来革命性区别,还是对知识深度理解才能带来突破,我们核心发力点是语言为核心,翻译在语言里面最简单,之后还有对话问题、问答问题。所以我们说翻译切入,我们背后做的是对话的机器和问答的机器,这是我们在AI里面所干的活。

张宏江:我非常同意王小川说的,我们今天看AI的话,在识别人脸、识别人的行为、识别图像接近人的精度,在语言这块差的很远,翻译这件事已经让我们觉得很头疼了,真正理解文本、理解对话,从简单的几句对话中间推演整体上下文的意义,这需要有更多的研究、更多公司来做的,这也是今日头条一个重点,大家认为今日头条是一个内容推荐引擎,不光是内容推荐引擎更重要的是创作的平台。今天你写了一篇文章可以通过今日头条来给你审一下,有没有语法错误、前后归置,如果都没有问题的话,给你建议哪个题目比较合适,帮你找一下哪个图文比较合适。这中间涉及到很深层语音理解,我们也希望跟同行一起,不光是把产品做好,而是AI上的研究。

蒋涛:咱们叫全球AI挑战赛,我们是在中国办这个事情,策略是什么?我们针对全球的策略是什么?

李开复:我们一开始希望针对全球,因为我们要让它快速启动,是对全球开放的,很多里面大部分参与者是来自中国,我们在美国没有看到类似的活动,如果我们能够作为抛砖引玉第一期活动,第二期希望有更多公司贡献更多数据,我们大家拿出更多资源、金钱和标注,让它成为真正改变全世界的数据库。

在美国很多的领域,因为之后就没有然后,语音、语料方面也就是到了一个极限,很多自然语言都说英文。我觉得有中国的元素让大家知道世界最重要语言之一是需要使用的,真正愿意让资源拿出来让全世界参与这是我们的目标。会看到下一期、下下下期更好的项目。

蒋涛:会有更好的数据集发布是吗?

李开复:我们已经在收集更多更有意思的数据。

蒋涛:在开放数据方面会走到世界前面,国务院发布了一个人工智能战略,也是全球政府第一个是吧。

王小川:我觉得之前是非常落后的,怎么样在科研精神、论文、数据分享上远远走在美国的后面,所以这个事情是需要改变的,国家提倡,企业不仅响应,也非常踊跃做出自己的贡献。真正让数据分享走在前面之后,中国科研才有一个超越。现在看起来研究问题都是希望关心的问题,研究语音拿英语做实验,研究语言也拿英语做实验,我们国内写论文,优先为他们转,我们拉回来,中国人用自己的数据为我们做贡献,把研究能力提上去。

张宏江:在开源这件事情希望已经做了很多年了,在开源社区的话,各个公司、非盈利机构、盈利机构、大学、个人贡献大家已经形成一套规律,我们希望通过我们这次数据分享也能够引领更多中国企业、中国的个人、中国学校参与进来,把开源的想法能够真正的变成我们的实践,投入到我们日常工作中去。

李开复:我们在AI领域有独特优势的,很多传统生物、化学领域,一个实验不太容易复制的,实验的过程、数据集不够、医学临床的问题,你发表一篇文章不是我看完了第二就能复制。如果我们数据是标准的,用什么算法,用这个数据做成为了什么结果,理论上另外一个团队应该可以在比较长时间你复制结果,这样推动分享、推动进步,别的领域很难做到。

蒋涛:就更有意义了,带动了整个行业水涨船高。因为时间的原因,后面还有介绍竞赛详细细节,我们就请每位给我们来个期望,一个目标,我们期望挑战赛或者是对参加选手给一个寄予都可以。

李开复:中国AI人才大家参与AIChallenger我们一起改变世界。

张宏江:我希望越来越多人参与进来,给大家带来惊喜。

王小川:我希望中国的企业成为世界AI贡献者,我们选手也成为世界性人才。

蒋涛:我们的对话就到这里,谢谢3位。接下来进行下一个环节,有请创新工场人工智能研究院副院长王咏刚给我们介绍挑战赛怎么进行。

群访环节

问:AIChallenger是一个全球性的挑战赛,刚刚介绍了Challenger内容,针对中文的语言环境,你们主要工作是国内做还是国外有些亮点在做这样的工作?

李开复:我们希望全世界AI从业者都考虑参加这个比赛,第一次比赛参加中国的比较多,回过头来说里面有很多英文的内容,我觉得中文、英文都是世界很大语言,中国人能参加美国竞赛用英文参加,也欢迎外国团队参加我们有中文的比赛。

张宏江:也欢迎海外参赛者、海外公司为我们贡献更多的数据集。

我刚才看到关于场景描述的图,虽然是作为场景描述一句话描述的,我觉得下面可以作为一个新的竞赛,用中文描述英文描述,可以用视觉做机器翻译。

问:我的问题是主要是跟AI、大数据相关,终极人工智能是无监督学习,中间不需要这么多数据,人工智能发展分几个层次吗?

李开复:我们都可以想象科幻电影里的,也可以想象不需要数据集举一反三,有情绪、有意识的科幻片,我们还要务实到人工智能在未来5到10年,最重要的是要把已经达到产品化科研推到应用,把一些技术能够做更多延伸,我觉得绝对没有足够的大数据,我们大部分应用领域都有足够的数据,我们必须要把这个问题解决了,才有资格思考未来没有大数据的AI。当然也有很多学术界做迁移学习、更快速的学习,但是我觉得主流的以基于大数据的AI,我们还是希望能把这个推动起来,能达到最好结果,让参赛的人每个人有成就感,还是希望标准化的过程,还有很多未知的地方,还有很多巨头拥有数据,大部分没有所谓贫富差距,当务之急一定要解决这个问题。

如果划分未来可以分几个阶段,这个阶段已有数据全部应用起来,下一个阶段创造新的数据,再下一个阶段应用场景里面有几个巨大问题能不能化解。在往下划还是有今天所谓强AI能不能跟人一样思考这种方向。但是我觉得作为竞赛的话还是按部就班把第一步做好。我可以想象50个不同类似这样的比赛,我希望把这50个做好,才去思考未来没有解决方案的。

问:你刚才提大数据还是在大公司,数据会越来越封闭吗?会交换吗?

李开复:我希望还是强者越强,希望能够号召手中有大数据拿来分享。也注意到这次比赛没有拿出隐私数据、暴露个人行为啊,都是非常通用的数据,在这个竞赛范围内只会用通用数据,每个公司还是有机会打造自己的闭环创造自己的商业价值,今天能看到的语音、视觉,还是希望能出来分享,不要输在起跑线上。

如果我有一个完整闭环,知道用户习惯可以很好推送,赚到更多钱,我们今天做的还是公益性的,不要输在起跑线的,我们今天的比赛跟闭环是无关的。

问:刚才咏刚老师下一个最先突破是中英文互译,您是否同意他的看法?您对这个问题怎么看?5条赛道个人认为哪个最先出来飞跃式的进步或者是成果?

李开复:我同意咏刚的看法,我觉得机器翻译很快速达到很重要的成果,我们看到搜狗也好,一些其他公司也好,最近都推出了这方面的产品。我觉得还有更多机会,AI领域我真的认为技术成熟到至少100个领域有价值的产品和创新出来,我也认为在金融界会带来可能甚至比不需要那么多突破就可以达到巨大的成果,我觉得思考什么突破最快,我认为已有数据用上,不需要搜集新的数据就能产生价值的,金融领域应该就是这样的领域,互联网领域是第一个,金融是第二个。咏刚刚刚说创造一些让人跌破眼镜,不知道机器也能创造这样的,他说的是这个。整个大金融行业会快一些。

张宏江:如果我们看一下过去5年AI突破的话,很重要的在于移动互联网的普及带来很多高质量的大数据,李开复刚才强调金融,金融数据一直在积累。我们看到今天在医疗、图像的理解这块都有很多突破。我想也许未来还会有像机器翻译这样,我同意咏刚的判断,在交叉的地方,像视频理解这块,过去我们以为视频理解很困难,有声音、语音、人物不同动作,像过去没有用交叉的时候高维的信息很难预测,我们通过学习的方式能把视频抓出来。这次人体关节检测是对人体第一步。

问:刚才李开复老师提到一个高质量、大规模的数据集,行业之间不同的学术机构也好、业界机构也好苹果跟苹果的对比。除了基础之外,另外一个是标准,我们竞赛当中需要用到多维统一标准,你们从测评标准选取和应用上会不会有一些计划。

李开复:我觉得这次评测标准一个是你真正的解答是什么,所以有一些比如说人的骨骼的检测,我们知道正确答案是什么,靠人标注的。在机器翻译的话,理论是可以人来评估,这样耗太大资源,如果有一万个参赛者,如果每个靠人评估的话我们支撑不了。为了近似没有误差,我们增加两部分一个是相对主观评估,初期有自动标注,在加上主观判断,我们还有答辩过程,确保团队技术水平符合技术结果。

王咏刚:我们这次组织数据集比赛,不会在评测标准上做创新,使用业界工人的评测标准,5个赛道评测标准正在由专家委员会做审议。像图像描述使客观+主观+详细信息,这个我们9月4号会同步公布到网上,希望大家给我们提意见。

问:我想问下规则的问题,报名针对个人还是团队?咱们这样的报名以后,参赛的时候会不会完全原创的还是可以借助他人的知识成果,比如说翻译,过去传统翻译都从语法角度翻译的,现在AI人工智能翻译已经是一种模式的创新,完全跟语意、语调各方面来,大数据概率论进行翻译,但这个成果像新华网有创新,还接触了语言合成、文章合成,展示几个视频以后输入几个关键词就可以生成文章,是不是可以借助其他人成果?以后提供数据库是比较原始的,数据量比较大,清洗过程中主办方提供清洗过数据,因为用的时候需要进一步深化处理,能不能根据使用者提出一些要求?

王咏刚:第一个问题关于报名参赛标准,只要是全球范围内科研工作者或者是技术工作者都可以报名,报名以组队为标准,是可以一个人组队的,最少一名。

第二个问题关于竞赛采取算法能不能基于前人的研究成果,一个所有的算法都可以基于前人的成果,但是整个科研界学术成果的,比如说别人的专利、版权声明,比如说有说某一个代码不能用于竞赛的使用就不能用,所以为什么会增加评审答辩环节,除了审阅参赛选手技术水平以外,还要审阅参赛代码是否符合规范。

第三个数据集清洗问题,已经经过我们清洗和标注过的,是可以使用的数据集,不会不同人要求不同的处理,我们以后只会公开更多的数据集。

蒋涛:用数据集不做竞赛用于别的事可以吗?

王咏刚:我们网站上都有数据集协议,可以查阅一下。

问:我有两个问题要问,AIChallenger比赛,有图像通道这块,AIChallenger怎么样尽量延长自己的生命周期?第二个问题刚才听王咏刚老师说AIChallenger要做一个平台,什么平台?

李开复:我觉得未来还有很多空间跟我们合作伙伴策划,对于ImageNet要绝对认可历史价值和地位,但是有它局限性,整个数据量是非常小的,现在不足够形成创业者需求,因为你的数据比较小,所以真的为了百分之零点几比赛团队,最后识别一条狗是金毛还是哈士奇做的工作都有可能的。

但我们希望把每个问题想的很深,数据集做的很大,一方面商业价值很多,另外一方面你的数据如果非常局限、非常小,可能要很多调整,才可以让你在比赛中胜出。有人问到中国这么多人脸识别公司,为什么没有囊括人脸识别冠军。我们希望我们做的AIChallenger是有生命力的,我们数据集是巨大的,无论创业还是学术界参与者都会不断的有帮助,当他们有帮助的我们就会把赛道平了,做一个更大更有生命力的赛道。

张宏江:如果你看ImageNet的话,有几个图像什么样的猫,什么的车,整个目的是做图像标注这块,经过10年的话,对于整个图像识别推动是非常非常大的。如果我们今天发布的数据,其中一个跑道图像描述,你标注图像,标几个关键字比较容易的,用一句话标注往下走了一层,这是我们看到的世界第一个图像描述大量的数据库,它往前走了一步,数据集非常非常大,这是非常有利的,我们不需要把两个分裂开,ImageNet是过去10年非常非常重要的基础,很多视觉算法提出得到验证、改正,我们希望提出下一阶段的这个跑道上看到更多的团队、算法出来。

问:在人工智能发展几十年里面,人工智能发展最快的时间段是哪个?在这个时间段里面中国和美国各自扮演什么样的角色?人工智能发展模式有什么样的特点?

李开复:这个问题很有意思,我觉得在过去5年中几乎可以说任何当下那一年就是有史以来发展最快的一点,速度非常快的,回顾过去仅仅一年,很多无人驾驶上路的,比如说每一个中国顶尖互联网公司,美国的也是都在用AI技术在背后,我觉得过去短短一年时间应该是最重要的时候,如果多说一点过去3年,5年,10年。因为AI这个领域不断摸索的,当我开始做AI时候,我在我的微博发过申请博士时1983年写的作文,内容就是我要做AI,我要研究人脑是怎么工作的,那就是1983年对人脑的认知,做了一段时间发现做不成,机器能达到非常有价值的创造,并不需要我们了解人脑,也跟人脑没有太大关系。

AI在过去30年中做了非常大变化,从原来跟心理学,人的认知,怎么样用机器做预测,怎么创造商业价值,做过去认为需要所谓智力来做的事情,完全没有重复或者是取代我们的人脑。这个认知是过去10多年来强化,而且做的转移。对今天是特别重要的,我们今天看人工智能,我们主要看所谓的弱人工智能,人工智能在某一个领域做的比人厉害,在大数据支撑之下,仅仅这一类就会取代很多人工作,包括升级很多工作等等。应该是深度学习在过去5年影响是特别巨大的,过去5年又是过去这1年突破最多,在过3年在问这个问题应该是那个时候最多的。

评估中美差别刚才已经讨论比较多了,学术有巨大的差距,这个需要我们想办法推进。虽然我们说华人论文数已经不少了,如果看美国顶尖学府毕业的博士和论文质量还是有很大差距,根据AI报告来说真的要从教育方面着手解决这个问题。如果看业界的话好很多,但是也有差距,包括BAT、搜狗、今日头条等等,但是还是有差距。如果说简单的回答你的问题,行业界在不断拉近、不断的进步感谢我们数据的推动,在学术界差距还是特别巨大,这一次我们推出这样一个竞赛,在学术界的帮助应该可能更大。如果说第二个帮助在创业界,大公司已经进步很快,因为有自我提供的流量和数据,创业界还是需要帮助的。

张宏江:如果我们看过去AI的几次发展,前面有过2次浪潮,56年人们提出浪潮中国人没有参与,第二次是82年神经网络,一个是专家系统,中国刚刚开始在这方面做研究,做博士论文。这一拨浪潮,从第一天开始就加入了,核心看的话标致性深度学习技术,2006年出来的,经过10年发展,中国在过去5年跟的非常快,产业界跟的更快,好在AI领域很多东西能用数据描述的,思维方法正在中国学生的强项,看到为什么这么多中国学生在AI领域获奖。今天我们数据发布会,未来希望更多数据出来,更多企业,不光数据贡献出来,问题也贡献出来,这样可以推动我们学术界更快速、更高质量的发展。

问:刚才提到英中机器同传,请问一下人工智能领域发展速度如此之快,我们也大力推动人工智能发展,人工智能发展目的是取代人类,还是作为辅助,如果人工智能取代人类的话,未来是否有风险?

李开复:每个人有不同的看法,我分享一下我自己的看法,我的看法人工智能最终取代了我们哪些重复性较高的工作,无论是取代了出纳员、会计、分析师、翻译、比较简单的记者各自、白领、蓝领流水线工人等等这一类工作相对重复性工作比较多。其实人工智能是在做几件很好的事情,第一这些重复性工作帮我们做了能够创造很大财富,让人类终于有可能接近脱贫的问题,在创造这些价值工作中会创造巨大财富,我们做机器的比如说同声翻译非常贵,可能一个小时要上千的,我们机器做不会累,几乎文本生意,这些是创造社会巨大价值,让我们把这个钱用在帮助人类获得更有尊严的生活。第二个人类存在这个社会就不是做这些重复性工作的,如果你很爱记者、传媒应该写很有深度的文章,如果你真的很喜欢做投资工作,你应该做非常棒的投行的一个专家或者是天使投资人。

另外一个层面上来说,这些AI发生是推动人类做更有深度、更有价值、人类存在更本质的理由。这里面可能分成两种,我觉得AI在我们看来,我认为几十年、100年内不能做的工作一个是真正有创造性的事情,另外一个是很有感情,人与人之间沟通的事情,我认为人的存在应该往这两个方面发展,而不是做重复性工作。一定程度工业革命是带给人类的洗脑,1000多年前没有这个思维,我们从200年开始,工业革命推动企业家每个人都有思维,如果有重复性工作的人,经过我的勤奋努力能赚些钱,终有一天能买房买车就有价值了。我认为工业革命和当时工业推动让人有了这种思维,AI让我们清洗这个错误思维,找到人类意义的重要技术。

张宏江:其实这个在历史上发生过几次,200年前发生了工业革命,100年前消灭90%的农业人口,50年前IT革命又替代了很多办公室,在过去50年中间我们也看到了这种改变。未来AI一定会带来一次新的改变,这种改变是人们工作的迁移,希望能带来更多创造工作的机会。但是有一点我们应该很清晰的,AI是一种能力,就像汽车比人跑的快,飞机比人跑的快一样,因为人类不能飞。未来这些重复性脑力劳动被机器取代是板上钉钉的事,我们的努力也希望能够使这种进化来的更快一些。

问:我想问下这次比赛是不是有意挖掘有创业的团队和个人?有分析说基于压力创业已经销声匿迹了。有些人不太看好AI的创业,之前看到国家发布AI的规划,也强调一些基础理论研究,关于创业也不是特别多,现在中小公司做AI创业是不是真的有机会?

李开复:我们没有在这个竞赛里有任何直接投资的计划,也不会看到我们投资经理到处一个一个找投资,我们认为AI创业靠补,我们创新工场过去3个月投的案子超过过去3年的案子,也许你跟我们公关团队联系一下,我们做另外一个采访谈一下我们投了什么很棒的案子。

张宏江:刚才提的问题从某种意义上反应出来大家对我们这次竞赛意义不到位,如果看到这次公布数据的话,未来不断增加数据的话,对创业公司的话他们以前想拿到数据是非常非常难的事,他们今天拿到数据第一会打消不切实际的想法。第二个能做想做的事情,比如说深度系统,可以帮助记者挑一个很好的图片,在别的地方拍的很好照片以后可以写非常好的文章。这个你如果没有经过比赛,没有经过这些过程的话想不到,现在想到了,可以激发更多深度学习的想法。

至于AI有没有机会,未来AI机会非常非常多,我们希望看到更多人理解这种能力,掌握了这种能力,从而在我们今天看到的各种各样的应用层面能够找到更好的切入点,5年前大家不会想到今日头条作为一个所谓新闻推荐引擎,实际使AI有这么大机会。今天看到有超过1亿日活量这样巨大的商业的成功。

李开复:有关创业的环境我们对比一下今天和7年前,7年前我曾经做过演讲,我们一起办的活动移动互联网时代来了,创业成本达到历史先低,一个产品经理带着两个工程师自己在房间里面不花任何钱,做了APP丢到网上就OK了。但是今天在AI时代创业成本挺高的,不能两三个人,你的数据哪里来的,今天数据清洗过了自己拿一套500万,我们一个无人驾驶团队一个月差不多700万。通过我们让潜在创业者试试,虽然你不能经过一次比赛就能创业了,可能你想中想的某个应用,通过你对算法理解能够激发你去创业,应该是让我们更有希望,有更多产品产生。如果你报道学术界落差最大的,我们今天对数据集落差能够快速补充的作用,我觉得这样的报道也挺OK的。

问:刚才两位提到美国跟中国在AI方面有很大差距,美国方面对中国AI发展也是产生极大威胁,有美国译员提出限制中国去美国收购AI公司,我们中国在AI领域跟美国相比优势在哪里?有看到报道说中国有个优势因为人多,产生数据多,产生数据多对AI发展是非常有利的因素,不知道如何看?

李开复:AI技术发展不要太分国界的,任何一个AI研究者、爱好者应该跳进来不要变成超级大国竞争的讨论。但是如果你要问学术界有很大劣势是在创业中、在互联网中做都是错的在削减,还有几个机会。

第一个中国数据量大,这个会帮助推动更多公司走向这个领域,不光是互联网公司,如果你是中国银行、中国保险公司、中国运营商手中都有很多巨大价值数据帮助推动你业务,帮你找一个AI创业公司合作用他的产品。

第二个优势中国年轻人很适合进入AI领域,如果只评估20到25岁的我觉得中国可能没有太大的劣势,我觉得中国的教育是怎理工跟数学相对做的很好的,而且有大量人才进入这个领域,又看到AI的机会。平均美国年轻人来说想做自己理想做的事情,更多中国年轻人看到一个巨大机会会跳进去,会产生大量未来潜在AI工作者,也许是工程师、调参数专家等等。

第三个中国传统行业用非AI时代做的不如美国好,如果考虑到中国银行软件、保险软件,在美国AI或者说深度学习时代来临时做的很好。第四个美国对于AI的约束会比较强,不止是来自于法律,而且来自各种不同的包括媒体、道德等等的监督,这些本身是好事,如果做的过多的话,可能会有害于行业发展。比如说美国讨论的一辆无人驾驶前面有5个人,岔路有1个人,你必须要压死一些人,你是刻意转弯压死一个人,还是压死5个人,哪个正确等等。我觉得这些方面顾虑会超过中国,那这些方面发展也会是中国的一个机会,因为AI第一个版本能不能做的足够安全、有价值这是一个问题。毫无疑问AI第二、第三版本一定会做的更好。

问:我想问下张宏江,您刚才说到关于人才培养的感受,第一个对于头条创业公司来讲,在AI人才需求、缺口在哪里?什么样的人才需要这样的需求?对于挑战赛团队有没有根据或者是培养的计划?第二个问题,现在有一些说法,由于AI泡沫推进了一个百万年薪人才的泡沫。

张宏江:我们在一个浪潮来的时候,我们在产业界发现的是人才不够,不光是AI上,以前别的技术革命到来时都会感觉到这个问题。人才缺乏不是绝对的缺乏实际上是相对缺乏,目前所有企业都需要这样的人力,刚才我们前前后后讲了几次AI是一种能力,不是创业公司需要,而是现有各个产业都需要,需要用AI改善生产效率,用AI做机器人取代装备线上工人,用AI做大数据分析,防止欺诈。当整个产业认识到一个新的技术能够使产业往上升级的时候,自然看到人才普遍缺乏,这是不管你怎么准备都会,因为革命来的速度太快,浪潮来的太快都会有这种感觉,不要觉得我们好像回顾、责备为什么没有培养那么多人才,不光中国缺,美国更缺,所以说出现泡沫,出现所谓百万的,这个事情应该高兴,我们快速的弥补人才的缺乏,这不是一件怀事。

当然有些人对自己能力不切实认知,这样的人到哪都不会做好,不会给他100万,今日头条不会是这样的人,这样的人大家很容易判断出来。你要是真正能够为一个公司带来很大价值,这个公司一定愿意出跟你带来价值相匹配的薪酬,也许100万不够,也许更多,这个问题我们不需要太过于担心或者是炒。

同样我们谈到人才的事情,我认为在AI这块我们竞争并不小,我们前面说过竞争力并不小,今日头条来看我们发展速度如此之块,今日头条人工智能实验室今年一月份成立,现在50人,我们希望年底200个人,6个月内怎么招150人,这本身是非常大的问题,不像当初李开复回中国办研究院时,我什么时候招到多少就是多少人,因为我是做基础研究的我不着急,今天对于产业来说需要应对业务快速发展,我们需要非常多的人才,自然感觉人才不够,非常庆幸李开复成立研究院,为中国培养了一批又一批的人才,今日头条在宣布成立一个月之后就能找到人才,像马博士AI领域20年非常有成就的人加入今日头条。

另外今日头条过去5年发展中间,我们已经吸引了很多在工程能力非常强的AI人员,你说够不够?不够,我相信不光是我们,创新工场也碰到同样的问题,小川也遇到培养的问题,在机器翻译上、语意理解上、AI下一步发展同样。这种缺乏不是我们对过去的检讨或者是怎么样,这是一件好事,我们产业发展非常快,任何一个技术革命都会有泡沫,但是那个泡沫对于李开复来说,对于今日头条来说我们应该识别哪些是泡沫,李开复来说怎么把钱投到不是泡沫公司,对于我们来说泛滥的今天我们能站稳我们脚跟,不被干扰。我们不会因为需要招那么多就会降低我们自己的标准,好在回过头来说,中国人才基数足够大,我们对于年底招到200个做AI研究人员还是非常有信心的。

蒋涛:我代大家提我们最担心的是什么,办这场比赛,我们有期望,我们最担心的是什么?

李开复:没有担心,充满信心,一定做的最好。

蒋涛:今天我们AIChallenger全球挑战赛启动仪式到此结束,但是我们的挑战赛今天刚刚开始,期待后续更多的关注我们的比赛的进行。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-08-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
机器翻译
机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档