专栏首页AI研习社Github 项目推荐 | 用 Pytorch 实现的 Capsule Network

Github 项目推荐 | 用 Pytorch 实现的 Capsule Network

本库用 Pytorch 实现的 Capsule Network 基于以下论文:
  • Dynamic Routing Between Capsules by Sara Sabour, Nicholas Frosst and Geoffrey Hinton
  • https://arxiv.org/abs/1710.09829

官方用 TensorFlow 实现的 Capsule Network 的论文地址如下:

  • https://arxiv.org/abs/1710.09829

运行

要获取关于该项目的详细信息,请运行:

python main.py --hel

重构的图像与原始图像对比:

安装需求

  • PyTorch (http://www.pytorch.org)
  • NumPy (http://www.numpy.org/)
  • GPU

默认的超参数(和论文的类似)

  • Per-GPU batch_size = 128
  • Initial learning_rate = 0.001
  • Exponential lr_decay = 0.96
  • Number of routing iteration (num_routing) = 3

损失函数超参数(请参阅 loss.py)

  • Lambda for Margin Loss = 0.5
  • Scaling factor for reconstruction loss = 0.0005

GPU Speed benchmarks

  • 单个 GeForce GTX 1080Ti - 35.6s per epoch
  • 两个 GeForce GTX 1080Ti - 35.8s per epoch(twice the batch size -> half the iteration)

Github 地址

https://github.com/danielhavir/capsule-network

本文分享自微信公众号 - AI研习社(okweiwu)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-08

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 业界 | 谷歌开源大规模神经网络模型高效训练库 GPipe

    AI 科技评论按:谷歌前日在博客中宣布开源大规模神经网络模型高效训练库 GPipe,这是一款分布式机器学习库,可以让研究员在不调整超参数的情况下,部署更多的加速...

    AI研习社
  • 如何使用高大上的方法调参数

    本文主要介绍作者与 Elad Hazan, Adam Klivans 合作的最新论文: Hyperparameter Optimization: A Spec...

    AI研习社
  • 百度 Deep Voice 实现文本到语音的实时转换;迄今最强核弹 GTX 1080 TI | 开发者头条

    ▲ 内容预览: 百度实现文本到语音的实时转换 Facebook 发布支持 90 种语言的预训练词向量 英伟达发布迄今为止最强核弹 GTX 1080 TI 每日...

    AI研习社
  • XGBoost参数调优完全指南(附Python代码)

    作者 | Aarshay Jain 简介 如果你的预测模型表现得有些不尽如人意,那就用XGBoost吧。XGBoost算法现在已经成为很多数据工程师的重要武器。...

    AI科技大本营
  • Thrift 服务模型和序列化机制深入学习

    http://www.liuqianfei.com/article/065b0f1ee59a4cf0b94a84c4e33af127

    bear_fish
  • HTML基础知识总结

    几个工具: IETester:多版本IE测试 Expression Web DreamWeaver 美工页面 XHTML:符合XML标准的HTML。 标签...

    CSDN技术头条
  • xgboost初识

    XGBoost使用 原始数据 数据介绍 鸢尾花数据集是由杰出的统计学家R.A.Fisher在20世纪30年代中期创建的,它被公认为用于数据挖掘的最著名的数据集。...

    听城
  • 测试神器Swagger的相关使用

    ​ swagge是一个易于使用的API团队协作开发的工作,能用于查看API的生命周期,设计文档和测试开发.因此我们在前后端分离的项目用到Swagge测试和参...

    Dream城堡
  • Power Pivot信息函数中的判断

    比较显著的逻辑判断函数我们这里就省略了,例如IsBlank,IsText,IsError等。 我们先来看下其他不怎么常用的逻辑判断函数

    逍遥之
  • 最大综合教学视频数据集发布,道路标记线会扰乱自动驾驶稳定性 | AI一周学术

    呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!

    大数据文摘

扫码关注云+社区

领取腾讯云代金券