Day039 CNN Architectures（2）

文章来源：企鹅号 - PhD日记

昨天介绍的都是一些经典的模型，平时见得多了也用过不少，很多深度学习架构里面都有Model Zoo，有那些模型的代码实现。

之前我用ResNet50和DenseNet训练参加Kaggle上面的猫狗分类器，效果并不是很好。最近我才突然意识到大概是因为没有用pre-train model进行迁移学习，以及多训练几个模型进行ensemble。打算这周用这两个方法再试试看。另外，如果想要自己构建一个新模型，最好是在ImageNet这样的大数据集上进行pre-train，然后再用到比赛的数据集中去。

对于简单的分类问题，可能主要目标在提升CNN算法上；但如果是复杂问题，更多的还是应该在结构上入手（比如如何更高效的在object detection中做region proposal），而作为特征提取部分的CNN，就直接用当下表现最好的模型即可。

然后是关于今天介绍的几个模型，算是那些主流模型的一些提升，有机会还是每篇文章都细看一下，写篇论文笔记。读论文的时候关注以下几个问题：

他们训练用的benchmark是什么？我想训练的话如何导入和使用这些数据集？

为什么这样改进？这样改进的优缺点是什么？如果是我，可以尝试哪个方向上的改进，深度、宽度还是不同结构的拼接？

这些模型没有pre-train模型，他们是如何跟那些已有模型的正确率进行比较的？是基于多少个epoch后比较的？如果我想做个新模型，如何进行测试比较？

发表于: 2018-03-122018-03-12 20:19:37
原文链接：http://kuaibao.qq.com/s/20180312G1HRFH00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

Day039 CNN Architectures（2）

相关快讯

扫码

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐