深度学习技术前沿

154 篇文章
64K 次阅读
38 人订阅

全部文章

深度学习技术前沿公众号博主

TensorRT重磅更新!10亿参数大模型实时运行,GPT推理加速21倍

12月2日,英伟达发布了最新的TensorRT 8.2版本,对10亿级参数的NLP模型进行了优化,其中就包括用于翻译和文本生成的T5和GPT-2。

800
深度学习技术前沿公众号博主

MobileViT: 一种更小,更快,高精度的轻量级Transformer端侧网络架构(附代码实现)

【导读】之前详细介绍了轻量级网络架构的开源项目,详情请看深度学习中的轻量级网络架构总结与代码实现,今天将正式开启Transormer轻量级网络架构新篇章,本文将...

2930
深度学习技术前沿公众号博主

ESPNet系列:自动驾驶领域轻量级分割模型

ESPNet: Efficient Spatial Pyramid of Dilated Convolutions for Semantic Segmentat...

6630
深度学习技术前沿公众号博主

【移动端最强架构】LCNet吊打现有主流轻量型网络(附代码实现)

【导读】之前详细介绍了轻量级网络架构的开源项目,详情请看深度学习中的轻量级网络架构总结与代码实现,本项目主要提供一个移动端网络架构的基础性工具,避免大家重复造轮...

8120
深度学习技术前沿公众号博主

深度学习中的轻量级网络架构总结与代码实现

目前在深度学习领域主要分为两类,一派为学院派(Researcher),研究强大、复杂的模型网络和实验方法,旨在追求更高的性能;另一派为工程派(Engineer)...

6821
深度学习技术前沿公众号博主

2015年的ResNet潜力都挖掘出来了吗?新研究:不用蒸馏、无额外数据,性能还能涨一波

在计算机视觉领域,何恺明等人 2015 年提出的 ResNet(deep residual network,深度残差网络)一直被视为经典架构,它解决了深度 CN...

7410
深度学习技术前沿公众号博主

可以装在手机里的3D姿态估计,模型尺寸减少七倍 | CPVR 2021

而刚刚被CPVR 2021接受的论文中所提出的模型,MobileHumanPose却可以同时做到又小又好。

7020
深度学习技术前沿公众号博主

地表最强VLP模型!谷歌大脑和CMU提出极简弱监督模型

近年来,视觉-语言预训练(vision-language pretraining, VLP)取得了快速进展。

10130
深度学习技术前沿公众号博主

自动检索、修复Python代码bug,微软推出DeepDebug

本地化 Bug 并修复程序是软件开发过程中的重要任务。在本篇论文中,来自微软 Cloud+AI 部门的研究者介绍了 DeepDebug,一种使用大型预训练模型 ...

9620
深度学习技术前沿公众号博主

MLP进军下游视觉任务!目标检测与分割领域最新MLP架构研究进展!

【导读】随着ResMLP、MLP-Mixer等文章的提出,基于MLP的backbone重新回到了CV领域。在图像识别方面,基于MLP的结构具有较少的induct...

9120
深度学习技术前沿公众号博主

32岁封神!苏炳添博士重磅论文:我怎么跑这么快?

暨南大学体育学院副教授、北京体育大学2019级体能训练学院博士研究生、暨南大学2013级经济学院国际贸易专业研究生。

15830
深度学习技术前沿公众号博主

每年颁发两个图灵奖?

自 1966 年设立以来,图灵奖一般每年仅授予一名计算机科学家,奖励对计算机事业作出重要贡献的个人。当然,获奖的人数有时会是两位或者三位,比如 2018 年图灵...

12320
深度学习技术前沿公众号博主

归纳偏置多余了?靠“数据堆砌”火拼Transformer,MLP架构可有胜算?

起因是,谷歌在《MLP-Mixer: An all-MLP Architecture for Vision》论文中提出,无需卷积模块和注意力机制,纯MLP架构也...

8410
深度学习技术前沿公众号博主

不用亲手搭建型了!华人博士提出few-shot NAS,效率提升10倍

神经网络模型经常被研究人员戏称为「堆积木」,通过将各个基础模型堆成更大的模型,更多的数据来取得更好的效果。

9820
深度学习技术前沿公众号博主

Nature:希望你在读博士之初就能知道的 20 件事

有些学校不光要求在某顶级期刊里发表一些论文,还需要你时刻待命为「老板」解决一些问题。

11520
深度学习技术前沿公众号博主

AI都会写灵魂Rap了?Transformer跨界说唱,节奏、流畅度都不在话下

只需要给定一句输入,AI 就能生成整首歌词。从押韵、流畅度、节奏方面,基本不逊于人类 Rapper。

9830
深度学习技术前沿公众号博主

2021年,作为算法工程师的你们会在CV业务落地上用Transformer吗?

【导读】众所周知,Transformer 已经日常在CV学术领域“杀疯了”,那么在工业领域情况如何呢?

14920
深度学习技术前沿公众号博主

年轻的LeCun、吴恩达长啥样?升级版StyleGAN告诉你

英伟达提出的风格迁移模型 StyleGAN 系列,一直是人们用来进行各类脑洞画图实验的流行工具。从生成二次元「老婆」,照片修图,到人物的卡通化,最近几年基于这种...

11120
深度学习技术前沿公众号博主

商汤、港中文&南洋理工提出K-Net:图像分割通用框架来啦!

【导读】一直以来,尽管语义分割、实例分割以及全景分割任务之间都有某种潜在的联系,但它们通常采用不同的网络框架来解决。本文首次探讨了语义分割中的卷积核概念是否同样...

20040
深度学习技术前沿公众号博主

Swin Transformer为主干,清华等提出MoBY自监督学习方法,代码已开源

近两年来,计算机视觉领域经历了两次重大转变,第一次是由 MoCo(Momentum Contrast)开创的自监督视觉表征学习,其预训练模型经过微调可以迁移到不...

15330

扫码关注云+社区

领取腾讯云代金券