独家 | 5大冠军出炉!李开复的AI挑战赛,冠军们聊到了这么些感受

参与 | 鸽子,Donna

刘强东的猪脸大赛刚刚结束, 李开复联合王小川、张宏江的AI Challenger-全球AI挑战赛决赛也紧跟着来了。

早在大赛宣布举办之初,李开复就向CSDN的总裁蒋涛先生阐明了举办这个大赛的初衷。一方面,李开复发现,由于数据和机器的缺乏,目前的AI教育很难大规模展开。所以,他希望联合搜狗和今日头条,提供丰富的数据集。

另一方面,由于李飞飞教授的ImageNet已经在今年宣布成为“历史”,开复希望“AI Challenger”可以接棒ImageNet,甚至做的比ImageNet更深更大。

那么,“超级网红”开复同学打造中国版ImageNet的梦想到底实现了多少呢?以下是营长带来的最新信息。

李开复在现场演讲中,多次提到“数据是燃料”这一观点。据内部人士透露,创新工场独资成立的人工智能工程院,未来2B的一块已经启动的业务也是大数据。

本次AI Challenger 大赛采用AB双测试集赛制,共有图像中文描述、人体骨骼关键点检测、场景分类、英中机器文本翻译、英中机器同声传译五场比赛。

比赛历时三个多月,共有来自65个国家的共计10579名选手组成的8892支团队参赛。其中,7898支团队是来自中国高校、巨头企业或者新锐企业,另外994支为海外团队。

过去的三个月中,这些团队分别在五个赛道分别进行了线上比赛,产生了线上排名。其中,场景分类的线上排名就是最后的名次,另外四个赛道中,线上排名占80%,另外20%取决于评委的现场打分。

本次比赛的评委,分别为旷视科技首席科学家孙剑;微软亚洲院的资深研究员梅涛;哈尔滨工业大学的赵铁军教授;南京大学的黄书剑副教授;厦门大学的史晓东教授;中科院自动化所的王亮老师;以及创新工场人工智能工程院的副院长王咏刚先生;搜狗机器翻译赛道与技术相关负责人王宇光;奇点机智联合创始人,原谷歌研究院高级管理科学家、ACL Fellow林德康;清华大学副教授,国家优秀青年基金得主刘洋。

经过比拼,五个赛道的冠军名单已经诞生,以下为详细信息。AI科技大本营对冠军团队的第一时间采访。采访,希望他们的经验对你有所帮助。

冠军团队名单

图像中文描述组:KaKa团队

清华大学计算机系副教授胡晓林博士带领清华计算机系余年革和北大计算机系程惠阁两位选。该赛道的冠军奖励金额是30万人民币。

采访:

1.感觉你参加的这一场同声传译得比赛难不难?难在哪里?

难,难在把模型的效果做到极致。

2.你觉得能得冠军,最关键的因素是你们哪个地方做得比较好?

我觉得,我们引入主题模型做了样本均衡,主题信息作为模型的输入。

3.参加完,有哪些心得可以跟其他选手学习和分享呢?

需要找到一个自己感兴趣的任务,全力投入。

4.有参加过其他比赛吗?感觉有什么不同呢?

没有。

5.团队现在已经接到哪些公司的offer了呢?

创业公司和大公司都有。

人体骨骼关键点检测组:Firefly团队

来自商汤科技的李全全和来自北京航空航天大学计算机学院的王昌宝和王宇杰三位选手。该赛道的冠军奖励金额为30万人民币。

关键PPT展示:

场景分类识别组: 电子科技大学^_^ 团队 (是的,你没有看错!)

电子科大信号与信息处理专业的帅靖文、张顺丰和蒋尚达。该赛道的冠军奖励金额是10万人民币。

英中机器文本翻译组: 猎豹移动

首席科学家闵可锐带领宋洪伟和李晓普两位选手。该赛道的冠军奖励金额为30万人民币。

采访:

1.感觉你参加的这一场同声传译得比赛难不难?难在哪里?

我们参加了文本翻译和同声传译两个项目,问题还是比较有挑战,这次组委会公布的数据是千万量级的,需要反复迭代改进模型,而模型训练时间会比较长。

2.你觉得能得冠军,最关键的因素是你们哪个地方做得比较好?

首先是在算法大框架上的确立。另外我们做了很多的尝试和优化,包括前处理,后处理,模型融合,增强学习,解码策略改进等。

3.参加完,有哪些心得可以跟其他选手学习和分享呢?

细节的处理非常重要,模型融合也对结果很有帮助。

4.有参加过其他比赛吗?感觉有什么不同呢?

之前参加过NLP分词和百度的实体搜索等比赛,也取得了不错的成绩。不过总规模来讲,这次AI比赛是最大的,也很高兴能跟各位高手同场竞技。

英中机器同声传译组:中科院自动化所

指导老师徐波所长带领自然语言处理专业的张晓伟、王峰和董倩倩三位选手。该赛道的冠军奖励金额为40万人民币。

采访:

1. 感觉你参加的这一场同声传译得比赛难不难?难在哪里?

比赛有一定难度,一方面训练集与测试集存在较强的不一致性,另一方面测试集上性能波动较大,对一些方法的性能验证存在难度。

2. 你觉得能得冠军,最关键的因素是你们哪个地方做得比较好?

能获得冠军,我觉得最重要的是各个方面都要做到最好,每个环节都要进行充分的优化。我们用精心设计的CNN模模型进行标点处理,并对语料做了标准化处理,在目前效果最好的翻译模型之上进行改进,并使用了多种优化方法。这些都是我们能获得冠军的重要因素。而跟进各个任务目前最好的结果,我们认为是最关键的因素。

3. 参加完,有哪些心得可以跟其他选手学习和分享呢?

首先是要端正自己的比赛态度,明确自己参赛的目的。然后是要坚持,比赛是一个长期的过程,需要一颗持之以恒的心态。团队合作是极其重要的,一个好的团队氛围对整个最终比赛结果有至关重要的影响。比赛过程中要记录每一个细节,要有足够的细心,当然也需要大胆尝试,勇于创新。

4.有参加过其他比赛吗?感觉有什么不同呢?

之前没有参加其他比赛

5. 团队现在已经接到哪些公司的offer了呢?

阿里,搜狗,滴滴,今日头条,科大讯飞和快手

总结与展望

比赛结束后,创新工场人工智能工程院王咏刚对这个比赛做了总结。

本次比赛中,场景分类参赛团队最多,共有2004个团队参加。其他四个赛道的参赛团队数分别是人体骨骼关键点检测-1735个团队;图像中文描述-1479个团队;机器翻译-1204个团队;以及同声传译-675个团队。

本次比赛的三大特点分别是紧贴前沿科研任务需要;超大规模的高质量数据;打造开放的世界级平台。而创新工场目前对数据集建设的初步规划涉及了目前最贴近行业的视觉领域;自动驾驶领域;自然语言处理领域;金融、零售、交通物流和基础建设领域。

王咏刚

在今年的“AI Challenger”成功落下帷幕后,王咏刚还透露了2018年大赛的年度目标:

  • 吸引更多国际、国内的高水平参赛队伍
  • 建立算法、代码、论文、数据、比赛的分享和交流平台
  • 建设更多、更贴近前沿科技需要的数据集
  • 设计更高水准、更加多样化的比赛形式
  • 围绕数据集和竞赛平台开展算法和技术培训
  • 参加或主办相关的学术会议和技术论坛
  • 加强多方合作,欢迎政府、企业和研究机构等积极参与

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2017-12-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

AI 影响因子 10 月大盘点,腾讯 AI Lab 又夺第一

「AI 影响因子」是雷锋网学术频道 AI 科技评论旗下数据库项目,旨在呈现国内企业研究院学术&开发实力,为高校学生及从业者提供在会议/期刊论文、数据集比赛及开发...

9010
来自专栏云计算D1net

在 SaaS 行业,隐藏在定价背后的经济理念是什么?

编者按:在消费市场中,供求关系不断变化。红点创投著名投资人 Tomasz Tunguz 针对非常规的市场需求与价格波动,隐藏在定价背后的经济观点。 创业公司之...

36050
来自专栏TEG云端专业号的专栏

当AI被“蒙蔽”,犯罪分子能做些什么?

我曾见过你们人类绝对无法置信的事物; 我看见战舰在猎户星座边缘被击中,燃起熊熊火光; 我看见C射线划过天国之门,闪耀在无边的幽暗中; 然而所有片段,所有瞬间,都...

30380
来自专栏大数据文摘

CapOne:一直在做随机试验

26690
来自专栏大数据文摘

分析1300万起案件 洛杉矶警局如何用算法预测犯罪

53410
来自专栏机器之心

尊重女性:全球顶级AI学术会议NIPS现在要改名了(你也来投一票)

每个了解 AI 的人都知道 NIPS 的大名。自 1987 年诞生起,这一学术会议已经走过了 30 余年的历史。作为人工智能和机器学习领域最重要的盛会之一,每年...

6720
来自专栏大数据文摘

多位院士撰写《中国科学院院刊》专题:脑科学与类脑研究概述(附下载)

23170
来自专栏DT数据侠

股票、基金买啥啥跌?大数据来给你支招!

说到基金股票,不仅仅是金融小白会一头雾水,就连资深股民都难逃买啥啥就跌的痛苦。近期数据侠实验室,DT君邀请到了Merkle高级数据分析师周秀丽、秦溱,自称金融小...

13900
来自专栏大数据文摘

业界 | 福布斯:2018年机器学习试点及实施数量将翻倍

18230
来自专栏腾讯研究院的专栏

人工智能:道德外包与“黑箱”中的算法歧视

曹建峰 腾讯研究院研究员 今天,基于算法的自主决策系统日益被广泛应用在教育、就业、信用、贷款、保险、广告、医疗、治安、刑事司法程序等诸多领域,认为算法...

52490

扫码关注云+社区

领取腾讯云代金券