首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Kaggle 冰山图像分类大赛近日落幕,看冠军团队方案有何亮点

据 Kaggle 官网介绍,这次冰川图像分类大赛 Kaggle 上最火图像分类竞赛——拥有史上最多参赛队伍。而在所有数据竞赛中,本次比赛热度位列第 7。...图 1:Kaggle 冰山分类挑战赛任务目标建立一个图像分类器,将输入卫星图像划分为冰山或者船 问:你好,David,十分感谢你能接受我采访,也恭喜你们在冰山图像分类挑战赛中取得第一名好成绩。...不到一年前,我开始参加 Kaggle 竞赛,这是提升技能一种方式,本次比赛我第三次参加 Kaggle 竞赛。 ? 图 2:冰山 问:能再谈谈冰山分类挑战赛吗?是什么驱使你参加了本次比赛?...人类用肉眼完全不可能看出来哪些图像是船,哪些图像是冰山。 ? 图 3:人眼很难准确判断输入图片「冰山」还是「船」 要让人类仅凭肉眼准确地区分图片类别十分困难。...然而我们却没有真正想清楚这些算法是不是这一任务最佳选择,或者没有想清楚在训练之前或之后是否需要对数据进行一些适当处理工作。 ?

97820

半年5战5金:Kaggle史上最快GrandMaster如何炼成

截至目前共斩获 9 金 3 银,kaggle 最高排名全球第 10。 ? 以下本期活动问答集锦: Q1:如何搭建 kaggle data pipeline?...Q4:新出 3d object 比赛是不是一种趋势,请问涛神对 computer vision 发展有什么观察和展望?...A4:cv 的话 3d 绝对一个趋势,包括学术界和工业界;sensor 成本越来越低,性能也越来越好;就人脸识别来说,用 3d 来说安全性和可靠性就更高了。...如果该怎么做? A6:cv 最好一点可以看图,非常直观。举个例子:比如之前鲸鱼竞赛,baseline 模型 bad case 大多是一些姿态较大,分辨率较差图像。...有的话一种怎样方式呢? A14:会看,但是很少会跑。因为一直忙着做新比赛。其实应该仔细去研究下。 Q15:分类比赛中最后 sub 阈值应该根据什么来选取呢,有什么选取技巧呢?

72610
您找到你想要的搜索结果了吗?
是的
没有找到

数据竞赛专题 | 从赛题理解到竞赛入门基础

我们需要做熟悉指标的数学性质,以及指标的区别,你是否真的理解logloss和auc区别,同样分类指标,为什么有的比赛选择logloss,而有的选择auc。...为什么mse对异常敏感,mae会损失掉部分异常。面对F1指标,有什么好策略来选择阈值。这些都应该是竞赛第一步中所考虑问题。...1)赛题理解究竟是理解什么: 理解赛题是不是把一道赛题背景介绍读一遍就OK了呢?...这时在一个宏观大体下分析,有助于摸清整个题思路脉络,以及后续分析方向。 3)赛题理解-评价指标: 为什么要把这部分单独拿出来呢,因为这部分会涉及后续模型预测中两个很重要问题: 1....,特征,模型以及后续处理,也有些会对于特征构建或者选择模型上有很大益处,反过来如果在模型预测效果不好,其实有时也要反过来思考,是不是赛题背景有没有哪方面理解不清晰或者什么其中问题没考虑到。

1.1K20

关注数据而不是模型:我如何赢得吴恩达首届 Data-centric AI 竞赛

这场竞赛真正独特之处在于,与传统 AI 竞赛不同,它严格关注如何改进数据而不是模型,从我个人经验来看,这通常是改进人工智能系统最佳方式。...这项技术动机以及如何将它推广到不同应用程序 1 大赛概述 在本次竞赛中,每个参与者手里有大小约为 3K 图像,这些图像是从 1 到 10 手写罗马数字,我们任务优化模型在罗马数字分类方面的性能...我最初使用这个电子表格来识别标记错误图像和明显不是罗马数字 1-10 图像(例如,在原始训练集中就有一个心脏图像)。 现在我们来看看“数据增强”技术。...-我从训练集中生成了大约 1M 随机增强图像作为候选来源。 -数据评估电子表格用于跟踪不准确(错误分类图像)并注释数据。...最后,特别感谢传奇人物吴恩达发起本次竞赛

64940

【ImageNet最后冠军】颜水成:像素级标注数据集将引领计算机视觉下一个时代

技术上看,目前有三种方式降低边缘计算量:第一种内功—就是特别网络结构;第二种武器—低精度表示方法;第三种暗器—巧妙用低功耗网络先确定那部分不需要计算网络。...以下颜水成采访实录,由编辑整理,有删减和调整。 ImageNet确实可以终结了,计算机视觉未来属于多标签、像素级、语义级 “图像竞赛还是像素级别的分类更好。...如果像素级分割做好了,无论做任何类型图像理解或语义理解问题都好办了。” 新智元:今年之后ImageNetILSVRC挑战赛“退出江湖”,是不是表明分类检测任务已经取得相对完善表现?...竞赛就是比武场:如果你能贡献Insight,为什么不“刷榜”?...大家都希望最终能落地,一种2B,一种2C,2B量暂时不是特别大。 你想每年移动终端例如手机量有多少,要人工智能落地的话,最好在手机上。

1.5K40

如何赢得吴恩达首届 Data-centric AI 竞赛

这场竞赛真正独特之处在于,与传统 AI 竞赛不同,它严格关注如何改进数据而不是模型,从我个人经验来看,这通常是改进人工智能系统最佳方式。...这项技术动机以及如何将它推广到不同应用程序 1大赛概述 在本次竞赛中,每个参与者手里有大小约为 3K 图像,这些图像是从 1 到 10 手写罗马数字,我们任务优化模型在罗马数字分类方面的性能...我最初使用这个电子表格来识别标记错误图像和明显不是罗马数字 1-10 图像(例如,在原始训练集中就有一个心脏图像)。 现在我们来看看“数据增强”技术。...-我从训练集中生成了大约 1M 随机增强图像作为候选来源。 -数据评估电子表格用于跟踪不准确(错误分类图像)并注释数据。...最后,特别感谢传奇人物吴恩达发起本次竞赛

73110

用它们做简历C位可能个错误!

因为这个平台目的就是建立一个巨大反馈机制,我们能够不断地从发布信息公司那里得到反馈——不仅知道他们是否想要面试或雇佣候选人,还可以知道他们为什么选择面试或雇佣候选人。...为什么它对你工作申请起负面作用 在招聘过程中会有一些特定偏见。公司希望能够说他们只雇佣“非常特别的人”,或者“最优秀1%申请者”,等等。...别小看这件事,因为:1)让你看起来更独特,2)你可以在面试中展示和讨论一些更复杂的话题3)表明你有很强自学能力。 例外 这条规则一个例外你在MOOC完成一些独特课程项目。...MNIST dataset上手写数字分类 使用iris dataset对花卉分类 为什么它对你工作申请起负面作用 简历篇幅有限。求职者和招聘人员都知道这一点。...但请记住,大多数招聘人员都是不懂技术,而且他们通常只通过关键字来来查找,所以你必须非常清楚,你MNIST项目不仅仅是简单数字分类任务。 3.

78400

基于 Keras 对深度学习模型进行微调全面指南 Part 2

为什么选择 Keras ? Keras 建立在 Theano 或 TensorFlow 之上一个极简神经网络库。该库允许开发人员快速地将想法原型化。...该模型特点使用了Inception模块,它是由不同维度内核生产特征映射串联。 27 层 Inception-V1 模型示意图(类似于 V3 想法): ?...网络微调操作 如果你深度学习或者计算机视觉从业人员,很可能你已经尝试过微调预训练网络来解决自己分类问题。...对我来说,我遇到了有趣 Kaggle 比赛,要求候选人通过分析车载摄像头图像来识别注意力不集中驾驶员。这是我尝试使用基于 Keras 微调好机会。...按照上面列出微调方法,结合数据预处理、数据增强和模型集成,我们团队在竞赛中获得了前 4% 名次。 本文详细介绍了我们使用方法和经验。 如果你有任何问题或想法,请随时留下评论。

1.7K30

良心忠告:想成为数据科学家,这 4 个坑千万别踩

因为这个平台基于一个庞大反馈机制而建立,我们不断地从发布信息公司那里得到反馈——不仅是关于他们是否想要面试或雇佣候选人,还有关于他们为什么选择面试或雇佣那些人。...如果你对此有些疑问,如下这些项目就会成为你减分项: 基于泰坦尼克数据集对幸存者分类 基于 MNIST 数据集进行手写数字分类 基于虹膜数据进行花卉种类分类 为什么这些会成为减分项 候选人和招聘人员都清楚...但是请记住,大多数招聘人员都不是技术人员,他们通常只是通过寻找简历中关键字来工作,因此您必须明确注明您 MNIST 项目不仅涉及简单数字分类任务。 2....由于现在通过在线课程认证候选人特别多,因而你很难从中脱颖而出。...这很重要,因为它: 1)让你看起来更与众不同,2)给你在面试中展示和讨论前沿工作机会,3)表明你有进行独立学习和工作能力。

46720

重磅 | 奖金200万,千万数据规模,创新工场搜狗今日头条联合发起迄今国内最大AI挑战赛(附详细赛事说明)

B集开放之后,榜单将采用选手模型在测试数据集B集上预测结果,作为排名依据。最终榜单成绩排名以12月3日23:59:59排名为准。 报名方式 (1) 报名时间:即日起至10月31日。...3、场景分类竞赛 赛题介绍 本次场景分类竞赛从400万张互联网图片上精选出10万张图片,分属于80个日常场景类别。每个场景类别包含大约1000张图片。...蒋涛:比赛叫全球AI挑战赛是什么样难度,包括我们开放这样数据怎么样选择为什么选5类数据集,选择标准是什么?第二个是什么样难度?...应该是深度学习在过去5年影响特别巨大,过去5年又是过去这1年突破最多,在过3年在问这个问题应该是那个时候最多。 评估中美差别刚才已经讨论比较多了,学术有巨大差距,这个需要我们想办法推进。...有些人不太看好AI创业,之前看到国家发布AI规划,也强调一些基础理论研究,关于创业也不是特别多,现在中小公司做AI创业是不是真的有机会?

1.8K60

针对计算机视觉一些问题分析

模型将图像分类错误率比前一年最佳精度降低了近 4%。Clarifai 基本上一个为视觉识别任务提供 API AI 公司,如图像和视频标签。Clarifai 在这里有一个示例。...上图来自 Google 图片 并且,世界各地通常会举办许多图像分类竞赛。Kaggle 一个去找到这种比赛一个非常好平台。其中最著名竞赛之一 ImageNet 挑战赛。...ImageNet 挑战或者说大规模视觉识别挑战(LSVRC)一年一度竞赛,它有各种子类挑战,例如对象分类,对象检测和对象定位。...而且,看看最新结果,微软 ResNet 实现了 3.57% 错误率,谷歌 Inception-v3 则达到了 3.46% 错误率,而 Inception-v4 已经在此方面走得更远了。 ?...以同样方式,在强化学习中,agent 执行随机动作,并且每个动作都具有相关奖励。agent 从奖励中获知它为动作获得动作,即 agent 以这样方式选择动作,使得它获得总未来奖励最大化。

59030

深入理解卷积层,全连接层作用意义「建议收藏」

理解2: 从卷积网络谈起,卷积网络在形式上有一点点像咱们正在召开“人民代表大会制度”。卷积核个数相当于候选人图像中不同特征会激活不同候选人”(卷积核)。...所有被各个区域选出代表,对最终结果进行“投票”,全连接保证了receiptive field 整个图像,既图像中各个部分(所谓所有代表),都有对最终结果影响权利。...当你找到一片小面包之后,你不知道你找到是不是全部小面包,所以你们全部蚂蚁开了个会,把所有的小面包都拿出来分享了。...全连接层就是这个蚂蚁大会~ 理解4: 例如经过卷积,relu后得到3x3x5输出。 那它是怎么样把3x3x5输出,转换成1×4096形式? 很简单,可以理解为在中间做了一个卷积。...layer就可以很好地解决非线性问题了 我们都知道,全连接层之前作用是提取特征 全理解层作用是分类 我们现在任务去区别一图片是不是猫 假设这个神经网络模型已经训练完了 全连接层已经知道 当我们得到以上特征

1.6K21

如何看待「算法模板」

如果你本身有很突出技能和经验,完全可以和面试官说「不要考我做题」,把我们优势展示出来,面试双向选择(这一条大家懂得我意思就好,不展开了,不是建议照做哦)。...是不是需要自己整理算法模板呢 如果只是应对算法笔试、面试,整理代码模板几乎用不上。...关于「算法模板」,大家可以参考一下我算法启蒙老师 liuyubobobo 老师在公众号「是不是很酷」里写「模板不重要」,我说模板不重要可能没什么分量,大家看看资深竞赛选手咋说吧。...刘老师公众号里有很多好玩、有趣事情,欢迎大家前往阅读。 公众号「是不是很酷」 关于如何学习算法,这里再啰嗦几句:反复做一些经典问题,然后经常练习。...不会有人整理知识点特别符合每一个人需求,但是一定要有自己思考,搞清楚「为什么」更重要。到底需要掌握哪些算法知识点、因人而异。 「力扣」精选题单 这就是今天分享,感谢大家收看!

68430

干货|专访ImageNet冠军颜水成团队,如何将比赛成果在企业中落地?

在 ImageNet-1k 分类任务中,DPN 网络不仅提高了准确率,还将 200 层 ResNet 计算量降低了 57%,将最好 ResNeXt (64x4d) 计算量降低了 25%。...这地方有一个有趣问题,有人在问我们,ResNet 既然 DenseNet 一种特例,那么现在把这两种网络特性融合在一起了,那么新网络是不是一个新 DenseNet?这个问题很有意思。...我和我学生陈云鹏,想了一个晚上,最后总结,得到网络不能解释成 DenseNet。虽然把两个网络融合在一起得到一个新网络,这个网络融合在一起,为什么不是 DenseNet?...ImageNet 竞赛,现在也要进入收官之战一个主要原因,是因为它分类数据集每张图像上只有一个主要物体,跟真实图片状况有很大差距。...一般拍照片不只是一个主要物体,应该是有很多 label,多标签图像理解。那么 ImageNet 之所以没有弄成非常大,多标签图像分类一个主要原因,是因为标注量会有大幅提升。

1.5K20

面试沟通时 3 个注意事项

如果候选人对面试官问题都能对答如流,面试官可能会选择更有深度问题进行追问,直到问对方答不上来为止,看起来好像是在为难人,其实只是想知道候选人深度,对候选人来说是好事,所以在某一个深度上答不上来符合预期...滴,我也碰到过这样候选人特别是校招时候,很多候选人不是很明确自己职业规划,所以会在好几个岗位中犹豫,等面试测试岗时,就会突击下测试岗相关理论知识。 对于这个问题,我分两种情况看待。...3、表达时自信但不自负 有一次和一个面试官交流经验,他告诉我说碰到一个候选人,他出了一道题「圆珠笔怎么测?」...列测试用例挺全,但是分类有点不清晰,所以面试官尝试引导下看看他是否有分类意识,不知道候选人意识到自己没有分类而去辩解,还是其他原因,他立刻反驳说不分类也没关系,自己能力保证不会遗漏用例。...碰到这样候选人也是很无奈,能力好当然优势,但是能力不能得到充分发挥和成长的话,只能潜力有限了。 我们招不是只能干活的人,我们招可以一起成长伙伴。

27130

参加数据挖掘类竞赛一种什么样体验?

随着天池穿衣搭配推荐比赛结束,我也该暂且退出竞赛江湖,一心一意搞科研了。今年共参加了3场公开比赛,成绩虽不是特别好,但也还说过去,在搞比赛上面花费了不少时间和精力,耽误了不少事。...人时间有限,你在这里花时间多了,做别的事就少了。 以上都是概括性东西,各位看官也许就一笑而过,下面就来点详细经验吧。 我会总结3场比赛经验,每场收获都或多或少有些不一样。 1....IJCAI比赛分两个赛季,第一赛季名次不是很靠前,只排第15. 前50名可以进入第二赛季。 第二赛季换了个平台,很幸运第二名,拿了奖金去阿根廷玩了一把。 为什么说很幸运呢?...写到这,各位读者是不是觉得做比赛确实很费时间和体力呢?...小结一下这个比赛: 1。 内容很吸引人,但是做法却很简单粗暴。 图像什么完全没有效果(不知道冠军队有没有用)。 2.

1.1K80

数据分析秘籍在这里:Kaggle 六大比赛最全面解析(下)

AI 研习社按,在数据分析秘籍在这里:Kaggle 六大比赛最全面解析(上)一文中,AI 研习社介绍了结构化数据和 NLP 数据处理方式,其中包括对 Titanic,房价预测,恶意评论分类,恐怖小说家身份识别四个比赛详细分析...树叶分类 竞赛中提供数据集包括 1584 个按品种分类被标记树叶图像,参赛者需要建立一个对标记之外树叶图像分类模型。...处理这一问题常见方法将完整数据集重新取样到确定等向性分辨率(isotropic resolution)中,如果我们选择将所有的数据重新采样到 1mm*1mm*1mm 像素中,这样就可以使用 3D...之后,Guido 在 EDA 中合并了多个 DICOM 图像完成检测部位三维图: ? 在另一个版本中,去除周围空气以减少内存: ? 3D图像 点评 这次竞赛我所见过最与众不同。...图像数据集 图像竞赛中,在分析和特征工程方面表现出了极大多样化。我所看到图像竞赛主要是针对有一定积累参赛者,而且在一些特定领域,这可能会产生更超前多样性。

54120

从零开始深度学习(十):激活函数

一些选择激活函数经验法则:如果输出0、1值(二分类问题),则输出层选择 sigmoid 函数,然后其它所有单元都选择 Relu 函数。...很多人在编写神经网络时候,经常遇到一个问题,有很多个选择:隐藏层单元个数、激活函数种类、初始化权值方式、等等……这些选择想得到一个比较好指导原则是挺困难,所以其实更多经验,这也是深度学习被人称为经验主义学科和被人诟病地方...,更像是一种炼丹术,是不是?...但是,你神经网络结构,以及需要解决问题特殊性,很难提前知道选择哪些效果更好,或者没办法确定别人经验和结论是不是对你同样有效。...因为: (1) (2) 将式子(1)代入式子(2)中,则得到: (3) 然后简化多项式,你可以发现两个括号里式子都可以简化,可得: (4) 小结:如果使用 线性激活函数 或者叫 恒等激励函数,

94020

Kaggle前1%参赛者经验:ML竞赛中常被忽视特征工程技术

放在竞赛实践中,这种经验在特征工程上表现得尤为明显。所谓特征工程,指就是从数据中抽取包含大量信息特征,方便模型易于学习过程。 为什么特征工程如此重要?...我们把恶意文件字节文档看成黑白图像,其中每个字节像素强度在0-255之间。然而,标准图像处理技术与n-gram等其他特征不兼容。所以之后,我们从asm文件而不是字节文件中提取黑白图像。...虽然他们表示并不知道为什么这么做会奏效,因为单独使用这个特征并不会给分类器性能带来明显变化,但当它和其他n-gram特征一起使用时,性能提升效果就很显著了。 把原始数据转换成图像,并把像素作为特征。...同理,对于Tver标签—— m=Tver标签下真实目标数量=3 n=Tver标签下目标总数=4 相应,Tver编码就是m/n=3/4=0.75(约等于0.8) 问:为什么均值编码优于其他编码方法?...而如果使用one-hot编码,随着特征不断增加,数据集维数也在不断增加,这会阻碍编码。 因此,这时均值编码最好选择之一。

1.3K20

程序员跳槽时,如何高效地准备面试?

空窗期 对于有些候选人选择了裸辞,辞职之后不论选择去旅行来放松自己还是处理家务事都是没问题。但是你也要理解HR从他视角中看到这些事需要询问清楚。...或者有些候选人选择辞职目的为了转行,自己在家闭门修炼啃书带训练花了 3 个月时间甚至更多。HR 也不是苛刻要死,非要你每段经历都 100% 无缝衔接上,那么这段时间空白期为什么没有衔接上?...其实 HR 对你创业经历更有兴趣询问你当时为什么想创业,是不是有好想法还会辞职去创业,你稳定性如何,你能在我们这里做多久,你会热爱我们这份工作吗?...另外还有类问题: “你之前和老大和同事关系都不错,公司福利待遇也不错,那你为什么要走呢?是不是你觉得钱太少了”这是 HR 通过动机和压力结合型问法。他们想确认什么?...对于面试官来说,不在于你哪一种类型,更重要看你是不是聪明。 2.责任心。 3.沟通能力,你能不能听懂面试官要说的话,你能不能表达出想说的话。

92230
领券