如何在训练阶段获得PyCaffe上的Top-k准确率？ - 腾讯云开发者社区

选自arXiv 作者：林宇鋆、韩松等机器之心编译参与：刘晓坤来自清华大学和斯坦福大学的研究者们发现，分布式随机梯度下降训练中 99.9% 的梯度交换都是冗余的——通过他们提出的深度梯度压缩（DGC）方法，神经网络训练可以大幅降低通信带宽需求。在多个基准模型上的对比实验表明，该方法可以在不降低准确率的情况下达到 270 倍到 600 倍的梯度压缩率，使得小带宽甚至移动设备上的大规模分布式训练变为可能。作者简介林宇鋆是清华大学电子工程系 NICS 实验室 2014 级本科生，于 2017 年暑假在斯坦

MLSys 2020 提前看：多面了解机器学习系统标准、加速方法和应用场景

机器学习本质上是一系列的数值计算。当需要计算的数据量很大或者计算模型很大时，就需要设计一个合适的平台来进行这种计算。机器学习系统就是针对此方面的研究，目的在于开发一类特殊的系统，用于支持和部署机器学习模型。MLSys 会议正是来解决机器学习和计算机系统之间的交叉问题。首届会议于 2018 年在斯坦福举办，吸引了学界和业界的广泛关注，会议主要研究（1）设计支持机器学习的软件系统；（2）设计硬件系统；（3）设计系统以满足精度以外的其他需求，诸如隐私，安全，公平性等。

您找到你想要的搜索结果了吗？

是的

没有找到

利用LSTM思想来做CNN剪枝，北大提出Gate Decorator

CenterNet：Corner-Center三元关键点，检测性能全面提升 | ICCV 2019

论文: CenterNet: Keypoint Triplets for Object Detection

KDD 2020 | 详解语义Embedding检索技术在Facebook搜索中的应用实战

导读：今天分享一下Facebook发表在KDD 2020的一篇关于社交网络搜索中的embedding检索问题的工作，干货很多，推荐一读。

简单的特征值梯度剪枝，CPU和ARM上带来4-5倍的训练加速 | ECCV 2020

**论文: Accelerating CNN Training by Pruning

OWOD：开放世界目标检测，更贴近现实的检测场景 | CVPR 2021 Oral

NeurIPS| 利用条件图逻辑网络进行逆合成预测

今天给大家介绍的是Google Research和蚂蚁金服等团队在NeurlPS发表的一篇名为“Retrosynthesis Prediction withConditional Graph Logic Network”的文章。逆合成分析属于有机化学中的基本问题，在机器学习领域也引起广泛关注。文章中，作者把逆合成的任务描述为“在确定的分子空间中寻找可以用来合成产物分子的反应物分子集合”这一问题。大多数现有的方法依赖于子图匹配规则的基于模板的模型，但是化学反应是否可以进行并不是严格由决策规则定义的。在文章中，作者提出了一种使用条件图逻辑网络来完成这项任务的新方法，它可以学习何时应该应用反应模板中的规则，隐式地考虑所产生的反应是否具有化学可行性和策略性。作者还提出了一种有效的分层抽样来减少计算成本。在基准数据集上，与当时最先进的方法相比，作者的模型实现了8.1%的显著改进，同时还提供了对预测的解释。

技巧只能源码找？李沐带你纵览卷积网络实战中的惊艳技艺

作者：Tong He、Zhi Zhang、Hang Zhang、Zhongyue Zhang、Junyuan Xie、Mu Li

使用Faster-Rcnn进行目标检测(实践篇)

本文介绍了如何基于PyTorch实现自定义数据集，并使用该数据集进行Faster R-CNN目标检测。主要包括四个步骤：数据集制作、模型训练、模型验证和测试。在模型训练阶段，使用自定义数据集和预训练的VGG16模型进行训练，并采用随机数据增强和叠加训练方法。在模型验证和测试阶段，使用自定义数据集对Faster R-CNN模型进行微调，并使用测试集对模型进行测试。实验结果表明，该方法能够有效提高目标检测的准确率。

无需额外数据，首次实现ImageNet 87.1% 精度，颜水成团队开源VOLO

机器之心专栏 Sea AI Lab (SAIL) 团队 VOLO 是第一个在 ImageNet 上无需额外数据达到 87.1% top-1 准确率的模型，进一步拉近了视觉 Transformer 与最顶级 CNN 模型的性能距离。近十年来，计算机视觉识别任务一直由卷积神经网络 (CNN) 主导。尽管最近流行的视觉 Transformer 在基于 self-attention 的模型中显示出巨大的潜力，但是在没有提供额外数据的情况下，比如在 ImageNet 上的分类任务，它们的性能仍然不如最新的 SOTA

KDD 2022 | 美团技术团队精选论文解读

总第529篇 2022年第046篇今年，美团技术团队有多篇论文被KDD 2022收录，这些论文涵盖了图谱预训练、选择算法、意图自动发现、效果建模、策略学习、概率预测、奖励框架等多个技术领域。本文精选了7篇论文做简要介绍（附下载链接，论文排名不分先后），希望能对从事相关研究方向的同学有所帮助或启发。论文01：Mask and Reason: Pre-Training Knowledge Graph Transformers for Complex Logical Queries（支持知识推理的图谱预训

BIB重磅综述 | 深度学习下的逆合成设计

今天给大家介绍的是近期发表在Briefings in Bioinformatics上有关逆合成的一篇综述。近些年，人工智能驱动的药物合成给社会带来极大的便利。逆合成设计在合成化学中占有重要的地位，因而受到了研究人员广泛的关注。本文详细介绍了深度学习背景下逆合成设计的发展历程，包括数据集、模型及常用工具，并且提出了目前深度逆合成设计面临的挑战。

目标检测ssd算法实践教程_目标检测算法有哪些

基于“Proposal + Classification”的目标检测方法中，R-CNN 系列（R-CNN、 SPPnet、

检测模型改进—OHEM与Focal-Loss算法总结[通俗易懂]

论文名称：Training Region-based Object Detectors with Online Hard Example Mining 代码地址：OHEM OHEM（online hard example miniing）算法的核心思想是：根据输入样本的损失进行筛选，筛选出hard example，表示对分类和检测影响较大的样本，然后将筛选得到的这些样本应用在随机梯度下降中训练。

Chem Sci | 用机器学习策略对逆合成途径进行评估和聚类

2021年10月23日，浙江大学化学工程与生物工程学院的莫一鸣等人在Chemical Science杂志发表文章，介绍了对逆合成途径进行评估和聚类的机器学习策略。

亚马逊：用CNN进行图像分类的Tricks

自 2012 年 AlexNet 大展神威以来，研究者已经提出了各种卷积架构，包括 VGG、NiN、Inception、ResNet、DenseNet 和 NASNet 等，我们会发现模型的准确率正稳定提升。

提升12倍！中国香港浸会大学与MassGrid发布低带宽高效AI训练新算法

2018年，香港浸会大学异构计算实验室与MassGrid合作，通过研究提出一种可用于低带宽网络的全局Top-k稀疏化的分布式同步SGD算法，并通过实验论证出在低带宽网络下也能高效进行AI训练。目前实验结果及相关论文已被ICDCS workshop收录。

全新ViT Backbone | 混合卷积与Attention设计的SMT更快、更小也更强

本文首发于【集智书童】，白名单账号转载请自觉植入本公众号名片并注明来源，非白名单账号请先申请权限，违者必究。

用蛋白语言模型改进蛋白复合物预测

今天要为大家介绍的是清华大学唐杰教授课题组发表在 bioRxiv 上的文章 Improve the Protein Complex Prediction with Protein Language Models。本文提出了 ColAttn 方法，该方法利用蛋白质语言模型识别复合物的间相互作用，并进一步结合多序列比对方法来提升结构预测准确性。

图视觉模型崛起 | MobileViG同等精度比MobileNetv2快4倍，同等速度精度高4%！

人工智能（AI）和机器学习（ML）在过去十年中取得了爆炸式的增长。在计算机视觉中，这种增长背后的关键驱动力是神经网络的重新出现，尤其是卷积神经网络（CNNs）和最近的视觉Transformer。尽管通过反向传播训练的神经网络是在20世纪80年代发明的，但它们被用于更小规模的任务，如字符识别。直到AlexNet被引入ImageNet竞赛，神经网络reshape人工智能领域的潜力才得以充分实现。

2048块GPU再次加速SGD：富士通74.7秒完成ResNet-50 训练

这一次，来自富士通的研究人员用上了 2048 块 GPU，以 81,920 的批量大小用 74.7 秒完成了 ResNet-50 训练。

微调︱caffe中fine-tuning模型三重天（函数详解、框架简述）+微调技巧

本文介绍了如何通过修改全连接层来改变CNN模型的行为，包括用于风格转换，风格迁移，人脸检测等。作者主要介绍了两种方法：1）使用预训练网络，通过冻结训练网络并微调它以适应新任务；2）使用自编码器进行无监督学习。

全新SOTA骨干网络HIRI-ViT | 大力出奇迹，高分辨率+双路径设计，让Backbone卖力生产精度

受到自然语言处理（NLP）[1]中占主导地位的Transformer结构的启发，计算机视觉（CV）领域见证了Vision Transformer（ViT）在视觉 Backbone 设计上的崛起。这一趋势在图像/动作识别[2, 3, 4, 5]和密集预测任务（如目标检测[6]）中表现得最为明显。这些成功中的许多都可以归因于通过传统Transformer块中的自注意力机制对输入视觉token之间的长距离交互的灵活建模。最近，几项并行研究[7, 8, 9, 10, 11]指出，直接在视觉token序列上应用纯Transformer块是次优的。这种设计不可避免地缺乏对2D区域结构建模的正确感应偏差。为了缓解这一限制，它们引领了将卷积神经网络（CNN）的2D感应偏差注入ViT的新浪潮，产生了CNN+ViT混合 Backbone 。

北大美女学霸力压大神何恺明新作MAE！怒摘12个SOTA，灵感竟来自16年前CVPR论文

【新智元导读】近日，北大校友、约翰·霍普金斯大学博士生提出了一种新的方法：MaskFeat，力压大神何恺明的新作MAE，摘下12个SOTA！

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐