数据竞赛那点事-完备篇
qrfaction
一个很巧合的机会看到qrfaction同学出了写了一篇博文《数据竞赛那点事-完备篇》,看了非常精彩,对于信息利用的思考,和特征工程及深度学习的认识见解独到,而且非常高屋建瓴,特邀请来qrfaction分享本文。标题党一下《数据竞赛方法论看这一篇就够了》
摘要:比赛trick、深度学习与特征工程、信息利用、从FE到DL、图片文本id无监督的套路
评注:套路千千万,大家都掌握套路的情况下,如何能用方法论覆盖所有套路?这就是本文的重点,会给你思考问题方式的启发。
主要还是面向监督学习的预测问题。
DL在某些问题上对于特征工程的降维打击,可以参照SIFT算子的下场。
信息定义123基本涵盖了所有的特征套路
神经网络的弱点:对于全局信息把控能力的下降。
基本上这些特征种类涵盖了大部分的问题。
representaion(embedding)方法千千万,如何统一思考。
注:本资料所有权利归qrfaction。赞赏也会转发给qrfaction同学。
领取专属 10元无门槛券
私享最新 技术干货