前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >仅用10个月!中国高中生拿下Kaggle Master,怎么做到的?

仅用10个月!中国高中生拿下Kaggle Master,怎么做到的?

作者头像
CDA数据分析师
发布2019-07-19 16:04:39
1.1K0
发布2019-07-19 16:04:39
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师

作者:刘静

编辑:李尔客

图灵联邦编辑部出品

踏实低调、痴迷科研,还有点00后的小调皮和小叛逆,这是不到18岁的杨乐涵同学给我们的印象。

今年6月份,他拿到了自己的第一块Kaggle金牌,同时也成功晋级到了Kaggle Master。

此时,距离他第一次知道Kaggle仅仅10个月,距他第一次正式接触机器学习也才不过一年的时间。

杨乐涵的Kaggle主页

作为一名高中生,他身上有着国内00后的典型成长缩影,但更亮眼的是他不平凡的学习之路以及个人性格特点。

接触杨乐涵源于一次偶然的机会,一位朋友向我们介绍了他:"高中生"、"Kaggle金牌"、"CV方向"、"发过不错的Paper",这些关键词堆叠在一起,很容易让人联想到两个字:天才。

"天才是别人的恭维"

杨乐涵有着这个年龄少有的低调和清醒,当问道是不是经常有人拿"天才"形容他时,他酷酷地回道"夸天才不都是恭维的话嘛"。

他对自己的描述是"成都实验外国语学校的一名学渣高中生。"

目前他已经离校,专心在华科做Intern,马上要去澳洲读CS。

"之前在校的时候我也就是那种下课就跑到B班去搞电脑的那种学生(我们学校英语课分AB班,大多数时候B班就是空着的),下课或是晚饭时间就去听听网课,然后时间多的话就再打打Kaggle(不过一般我还是在周末才碰kaggle的)。这还是要感谢我第一个班主任允许我带电脑来学校,当然第二个班主任比较凶我还是偷偷带了的。然后上个寒假的时候我就在华科第一次系统地做了做科研,在CCFAI发了我的第一篇paper,然后就导致了我寒假作业一个字没写哈哈哈哈。"

图:杨乐涵同学

叛逆坚持,终遇伯乐

对于机器学习,他其实是一年前才开始正式接触的。

从小学三年级开始,杨乐涵就一直在学校的科技小组做一些电子类的东西,四年级参加机器人比赛接触到编程,初中之后在成都科协的推荐下加入了一个创客空间,在家人的反对下"摸爬滚打"了几年。

他说,自己曾经偷偷买了总共十多个手机来学习和练习编程,但最终都被爸妈没收了。

高一结束后的暑假他参加了创新工场的DeeCamp(笔试刚好考到最低面试线),才正式开始接触机器学习。

杨乐涵表示自己最大的机遇就是DeeCamp。"开营的第一个晚上我被邀请到和主办方在一张桌子就餐,然后就认识了我现在的何老师,当时我也没有任何学术的造诣,甚至都还没怎么入门,但何老师主动地告诉我她可以带我做科研,于是才有了后面的故事。"

他口中的何老师,指的是华中科技大学计算机学院的何琨教授。(她是中国计算机学会的高级会员,主要研究领域为NP难度问题的现实求解 ,数据挖掘与高维数据 。)

"我觉得对我影响最大的就是何老师,她把我带进科研,又给我引路,能愿意指导高中生的教授真的不多。然后就是世界各地参加Kaggle的一群朋友,在每次比赛中真的可以从他们的身上学到很多,Kaggle真是一个提升自我的好地方。"

十个月,拿下Kaggle Master

"我是十个月前才知道Kaggle的,当时是看着那么多奖金才想去参加的(虽然后面发现能拿块牌就不错了还想什么奖金)。认真参加的kaggle可能就那么三四场吧,我主要是做CV,然后前段时间也做了一个audio的比赛。因为自己比较懒,我一般是看到有人发布一个比较好的baseline我才会去参加这个比赛,然后就从各个方面去找solution,最后再融合,步骤虽然简单,但是要花费大量的时间和脑细胞。"

金牌比赛截图

他说最早自己组团才开始打Kaggle的时候就是在leaderboard上一个一个发邮件去抱大腿,后面就认识了现在组队次数最多的队友Iafoss和Khoi。

"我最近成为Master之后才加入了华人Master社区,相信以后会有很多机会和这个社区内的大佬们合作。同龄人的话有一些但是不多,比如AL大佬就是目前kaggle高中生中排名最靠前的(他马上去CMU了)"

当问到"遇到问题一般怎么解决?有没有一些通用的思维可以分享?"时,他表示问题肯定会经常遇到。

"以前刚入门的时候代码经常跑不通,那就不睡觉嘛,跑通就完事儿,硬着头皮死磕。现在代码不存在什么问题了就是会遇到一些思路问题,比如做Kaggle的时候经常什么招都用尽了分还是提不了,那就真的别做了,自己做下去也没用。。。。多去询问下套套瓷或者再找个队友加入几个人的思路一汇合就开阔了。"

Kaggle Discussion页面

"Kaggle上的Discussion和Public Kernel这两个功能是在赛中非常实用,从discussion里面获取最新信息和方向以及一些小tips,kernel也是一样的,可以看到别人分享出来的解决方案。Kaggle的免费计算资源也真是一大福利,可持续运行9小时免费的P100显卡和cpu可以基本完成小项目小模型的训练。"

相较于写paper,杨乐涵说打Kaggle最大的收获就是经验,因为有实战才能真正深入这个领域。虽然都有研究性质,但Kaggle会在每次submit之后给到分数和名次的反馈,会比做paper的实验更兴奋,就像游戏一样让你上瘾~

不爱看书,钟爱科研

问:最喜欢的一本书?为什么?

杨乐涵:不喜欢看书.

他表示自己的知识主要还是靠自学,每天早上起床会刷刷Twitter、看看公众号来关注业内动态。

谈到未来的打算时他说"还在考虑去USYD还是UTS,两个学校都有很强的教授。以后的领域当忽不会变,但方向我应该会偏向更理论一些。"

"未来工作我主要还是想留在高校做学术,如果是非要选择公司的话当然是Google啦(小时候的梦想)。工作方向的话便research,不太愿意去做工程。"

问:生活中有哪些爱好?怎么平衡爱好与学习?

杨乐涵:高中的时候爱好就是计算机,但计算机成为专业之后貌似还真没什么其他爱好了。

最后他表示"自己在数学比较不足,没经过系统的数学学习,科研的时候经常被数学限制,所以我也在考虑本科专业我是选Maths还是Statistics或者CS。"

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-07-16,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档