专栏首页相约机器人谷歌EfficientNet缩放模型,PyTorch实现出炉,登上GitHub热榜丨Demo可用

谷歌EfficientNet缩放模型,PyTorch实现出炉,登上GitHub热榜丨Demo可用

郭一璞 发自 凹非寺 量子位 报道

谷歌上个月底提出的EfficientNet开源缩放模型,在ImageNet的准确率达到了84.1%,超过Gpipe,已经是当前的state-of-the-art了。

出炉没几天,官方TensorFlow版本在GitHub上就有了1300+星。

现在,哈佛数学系小哥哥Luke Melas-Kyriazi开源了自己的PyTorch实现,包含与训练模型和Demo。

帖子一出,就收到了众多PyTorch用户的欢迎,在Reddit上拿到了超过170个点赞,不少用户都准备上手尝试了:

等不及想把它merge到torchvision里!

在GitHub上也登上了热榜。

甚至,这个PyTorch实现还在隔壁岛国的收到了热烈欢迎。

啥是EfficientNet

EfficientNets是一种新的模型缩放方法,准确率比之前最好的Gpipe提高了0.1%,但是模型更小更快,参数的数量和FLOPS都大大减少,效率提升了10倍。

复合缩放(compound scaling)的方法,与缩放神经网络的传统方法不同,用一组固定的缩放系数统一缩放每个维度。

实现复合缩放的首先是执行网格搜索,以在固定资源约束下找到基线网络(baseline model)的不同缩放维度之间的关系,确定每个维度的缩放比例系数。然后将这些系数将应用于基线网络,扩展到所需的目标模型大小或计算力。

模型缩放的有效性也在很大程度上依赖于基线网络。因此,为了进一步提高性能,谷歌还使用AutoML MNAS框架优化了模型的准确率和效率,执行神经架构搜索来开发新的基线网络。

安装使用方式

可以使用pip安装

1pip install efficientnet_pytorch

或者用源代码安装

1git clone https://github.com/lukemelas/EfficientNet-PyTorch
2cd EfficientNet-Pytorch
3pip install -e .

加载EfficientNet

1from efficientnet_pytorch import EfficientNet
2model = EfficientNet.from_name(‘efficientnet-b0’)

加载预训练模型

1from efficientnet_pytorch import EfficientNet
2model = EfficientNet.from_pretrained(‘efficientnet-b0’)

模型具体详情:

有Demo

Luke还准备了一份Colab笔记本Demo。

示例中,先悄咪咪的扔一只胖达。

嘿,果然认出来是胖达。

传送门

GitHub https://github.com/lukemelas/EfficientNet-PyTorch

Google原论文 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks Mingxing Tan, Quoc V. Le https://arxiv.org/abs/1905.11946

Colab Demo https://colab.research.google.com/drive/1Jw28xZ1NJq4Cja4jLe6tJ6_F5lCzElb4

本文分享自微信公众号 - 相约机器人(xiangyuejiqiren)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-06-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 在几分钟内构建强大的可用于生产的深度学习视觉模型

    得益于更快的计算,更好的存储和易于使用的软件,基于深度学习的解决方案绝对可以看到从概念验证隧道进入现实世界的曙光!看到深度学习模型已广泛应用于该行业的各个领域,...

    代码医生工作室
  • 精炼鉴黄师背后的故事

    用AI来鉴别黄色图片,已经不是什么新鲜的事情。然而能够训练出一个可用的图像识别模型,其中所需要的细节知识还是值得学习的。

    代码医生工作室
  • 现代机器学习中的模型可解释性概述

    模型可解释性是当今机器学习中最重要的问题之一。通常某些“黑匣子”模型(例如深度神经网络)已部署到生产中,并且正在运行从工作场所安全摄像头到智能手机的所有关键系统...

    代码医生工作室
  • 谷歌EfficientNet缩放模型,PyTorch实现登热榜

    谷歌上个月底提出的EfficientNet开源缩放模型,在ImageNet的准确率达到了84.1%,超过Gpipe,已经是当前的state-of-the-art...

    昱良
  • 备受期待的原子交换,将如何对中心化交易所构成威胁?

    2009年比特币网络的推出预示着全新的金融时代的开始。这个全新的金融时代由完全透明和去中心化的价值存储和交换所驱动。

    区块链大本营
  • 每日一题 | 召唤兽问题

    题目出自codeforces,链接:https://codeforces.com/gym/102625/problem/C

    TechFlow-承志
  • 如何在泰国电商市场掘金

    撰稿/章梦婕 你知道在东南亚哪个国家的移动互联网发展最快吗? 答案就是泰国。 那么泰国除了旅游业蒸蒸日上之外,电子商务市场居然发展得也很快。 让我们从市场规模、...

    企鹅号小编
  • ElasticSearch 集群监控

    最近在做 ElasticSearch 的信息(集群和节点)监控,特此稍微整理下学到的东西。这篇文章主要介绍集群的监控。 要监控哪些 ElasticSearch ...

    zhisheng
  • 英国拨款8400万英镑资助AI研究与智能能源创新

    英国商业、能源和产业战略部部长克莱尔·佩里(Claire Perry)宣布将投资8400万英镑支持英国的人工智能(AI)与机器人技术研究,以及智能能源创新。 产...

    人工智能快报
  • 设计模式(1)—— MVC

    MVC(Model-View-Controller,模型-视图-控制器)是软件工程中的一种软件架构模式,它把软件系统分为三个基本部分:模型(Model)、视图(...

    阳光岛主

扫码关注云+社区

领取腾讯云代金券