专栏首页量子位中国最好的AI竞赛落幕,我们整理了一份夺宝攻略

中国最好的AI竞赛落幕,我们整理了一份夺宝攻略

安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI

昨天,第二届AI Challenger 2018全球AI挑战赛(后称“AIC”)收官。

相比第一届,今年比赛发布了10个全新赛道,并且在创新工场、搜狗、美团点评,美图公司等主办方推动下,涉足领域更广、数据规模更大,丰富性也更高,10个数据集均在业内首屈一指。

即便AIC还“很年轻”,但无论从数据集规模质量,还是竞赛影响力来看,确已是国内最好的AI竞赛。

今年,他们掀起了更大的风暴。

最终,获奖团队从来自全球81个国家,1000多个大学和公司的过万支参赛团队中脱颖而出,每个赛道各有5组团队获奖。也就是他们,共同瓜分了300万元的奖池

千军万马中,获奖的为什么是他们?

量子位采访了几位名次奖金双丰收的获奖选手,手把手教你AI竞赛的通关秘籍

获奖选手在颁奖典礼上合影

获奖攻略

1、时间准备:只睡4小时是常态

报名一个AI比赛前,需要提前为自己预留出多少时间?

可能是业余生活的全部

张礼是新加坡Agoda(安可达)的一名数据科学从业者,这次取得了细粒度用户评论情感分析赛道的第四名。

和大多数参赛团队略有不同,张礼单枪匹马选择一人参加竞赛,压力和任务也比多人团战来得更猛烈一些。

张礼表示,从8月底到12月,几乎所有业余时间都花在了这次比赛上。朝九晚六的工作后回到家,每天为竞赛忙到凌晨两三点是常事,每天几乎只睡4个小时。

短视频实时分类赛道的冠军团队Against的选手于佳弘说,团队三个人都来自网易AI Lab,每天还需要正常工作,3人只能牺牲周末的休息时间来准备比赛了。

2、比赛报名:单枪匹马还是人多力大?

在这次AIC比赛中,三人团是最常见的参赛队组成,但也有一些“一个选手的团队”。

四川大学机器智能实验室的博士生胡俊杰是眼底水肿病变区域自动分割赛道的亚军,他觉得单枪匹马与团队参赛各有优劣,自己一个人完成项目反而让他精力更集中。

但一人团也并不代表需要孤军奋战。

细粒度赛道的张礼表示,比赛后期会遇到瓶颈时,经常和AIC的选手群中的其他选手交流,这种类似“社区”概念的微信群,承载了各个选手的思维火花,和同赛道其他团队的交流给了他很大帮助。

3、比赛前期:数据集筛选是法宝

拿到数据集的第一步,应该立马就开始搭建模型吗?

错了,英中文本机器翻译赛道的冠军团队的第一步,是理解数据集。

团队成员郭馨泽现在是金山软件AI Lab中的一名算法工程师,他表示对于机器翻译这一赛道,后期各个团队模型和框架相差已经不大,自己团队脱颖而出和理解数据集较为透彻有关。

郭馨泽认为,首先需要对翻译赛道的1300万个语句对进行抽样检查。对于翻译错的数据,先对其进行剔除,再进行下一步处理,透彻理解数据本身是他们的经验。

4、比赛中期:通读行业论文化解了瓶颈

前期的三分钟热情过去后,瓶颈通常伴随着冷静赶来,此时怎么办?

细粒度赛道的张礼认为,NLP领域推陈出新速度快,要想在AI竞赛中拿到好成绩,一定要时刻关注前沿技术。

张礼几乎看遍了所在领域近两年的所有创新突破论文,想将最这些新方法用到自己的模型里。

在此次比赛中,他将词嵌入技术领域的最新模型ELMo模型应用进去,成绩开始稳定提升。

5、比赛后期:优化代码胜过创新型的模型

和实验室的研究不同,本次AIC的落脚点在“用AI解决真实世界的问题”,所以,对工程实践具体情况的理解也是致胜法宝之一。

中科院自动化所的博士生赵旭所在的SeeLess团队获得了无人驾驶视觉感知的冠军,赵旭表示,自动驾驶方向的赛题评判标准有两部分,一是准确度,二是在实验室研究中很容易忽略的速度。

在测试和实际运行时,能否实现实时性的检测是很多选手比赛前未考虑过的,这次比赛也让团队认识到基础研究更要考虑工程实践的具体情况。

南京理工大学的李剑所在的Amadeus队是本次比赛自动驾驶赛道的第二名。

李剑表示,AIC特别注意培养参赛者的工程能力,一定要做好反复修改的心理准备,学术界的创造能力固然重要,但代码的优化在比赛中更为看重,李剑表示。

6、比赛答辩:多用图表就对了

万千努力,都在最后的答辩环节集中呈现。这十几分钟的表现怎样,就变得尤为重要。

针对最后的答辩环节,南京理工大学的李剑认为答辩时应该特别注意呈现对比实验和对比数据,多用图表的形式展示在基准之上的量化改变。

一句话总结:用数据说话,胜过千言万语。

大咖总结:应用才是机会

主办方介绍,从今年大赛的参赛情况来看,中国AI热度正在快速攀升,随着各项AI技术的不断成熟以及各类应用场景的落地,越来越多的人选择拥抱AI热潮。

本届AI Challenger在全球共有10000多支团队参赛,其中美团点评NLP中心提出的”细粒度用户情感分析”赛道最受欢迎,参赛队伍数量最多。

截至目前,AI Challenger平台用户超过30000名,覆盖国家增至81个,覆盖高校1100所,覆盖公司990家。2018年AI Challenger平台用户增长了170%。

其中,北京、上海、深圳是中国参赛人数最多的TOP 3城市,国际参赛TOP 3城市分别是美国、日本、新加坡。

答辩暨颁奖典礼现场,创新工场董事长兼CEO李开复表示,现阶段高校AI研究的最大限制,往往就是数据不够。

李开复认为,AI研究对数据的需求越多越好,本着开放、透明的原则做研究,才能站在巨人的肩膀上看得更远,这也是AIC设立的初衷。

李开复

李开复也讲了讲赛题设计的考量,即科研固然重要,但应用才是最大的机会,所以这次竞赛的评分体系看重最终结果如何。

搜狗CEO王小川认为,在本次AIC中发现一些AI解决中国特有问题的实例。就如翻译赛道,对于中国人来说,和全世界沟通有量全球讲英文或者全球讲中文,二者都不太现实。AI的机会就在于此,对中国有特别的意义。

王小川

王小川表示,做好“体制内”和“体制外”研究的连接是中国特有的优势,这次比赛的气象局的数据,也能帮体制内探索新的路径,对中国AI的发展也有促进作用。

王小川认为,这也是AIC的意义之一。

One More Thing

最后,附上本次大赛获奖团队完整名单:

创新工场人工智能工程院执行院长王咏刚表示,明年的AIC已经开始筹备了。

我们明年见。

作者系网易新闻·网易号“各有态度”签约作者

本文分享自微信公众号 - 量子位(QbitAI)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-12-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 黄仁勋:AI正在吃掉软件行业,未来每家房子都有深度学习能力

    若朴 李林 编译整理 量子位 报道 | 公众号 QbitAI ? 很少有CEO可以领导同一家公司超过20年,黄仁勋做到了。1993年,30岁的黄仁勋和伙伴一起创...

    量子位
  • 替换一下同义词,AI就把句子意思弄反了|华人研究者揭示NLP模型脆弱性

    麻省理工和香港大学的研究生们开发了一个算法,让AI在文本分类和推理问题上的正确率从80%下降到10%。

    量子位
  • MIT人工智能独立设系!拆分EECS为EE、CS、AI+决策三部分,直接归学院管理

    在麻省理工学院(MIT),和电子电气、计算机相关的研究内容此前都是在电气工程和计算机科学系(EECS)进行的。

    量子位
  • 【机器人面试官】想拿百万年薪,可能要机器人说了算

    【新智元导读】本文讨论了AI工具在招聘领域的应用,面对每年需要招聘大量员工的企业,例如每年招聘8万员工的Nike,AI工具无疑能够大大提高效率。如果AI招聘提高...

    新智元
  • kafka线上滚动升级方案记录

    一、修改unclean.leader.election.enabled默认值 Kafka社区终于下定决心要把这个参数的默认值改成false,即不再允许出现unc...

    小勇DW3
  • 老旧黑白片修复机——使用卷积神经网络图像自动着色实战(原文附PyTorch代码)

    人工智能和深度学习技术逐渐在各行各业中发挥着作用,尤其是在计算机视觉领域,深度学习就像继承了某些上帝的功能,无所不能,令人叹为观止。照片承载了很多人在某个时刻的...

    用户3578099
  • 人脸识别:理论、建模、应用

    面部是人体的独特标识,每个人都有着独特的面部特征。通过一个人的面部可以识别出其身份,不过双胞胎可能有点困难。那么什么是面部识别系统?简单来说,面部识别系统是一种...

    深度学习与Python
  • 【NLP】ALBERT:更轻更快的NLP预训练模型

    目前在NLP领域,出彩的预训练模型的新工作,几乎都是基于BERT的改进,前面我们就介绍了XLNET。今天我来介绍一个更新的工作,相比于BERT,它更轻量,效果也...

    用户1508658
  • python读取leveldb数据

    py3study
  • 使用CATransformLayer制作3D图像和动画

    之前我们讲过可以用CALayer搭配CATransform3D来实现将View做3D旋转, 今天我们再看一个3D的新东西

    周希

扫码关注云+社区

领取腾讯云代金券