首页
学习
活动
专区
工具
TVP
发布

AI科技大本营的专栏

专栏作者
3088
文章
3123285
阅读量
201
订阅数
GPT-3模型为何难以复现?这也许是分布式AI框架的最优设计
2020 年,最轰动的 AI 新闻莫过于 OpenAI 发布的 GPT-3 了。它的1750亿参数量及其在众多NLP任务上超过人类的出众表现让大家坚信:大模型才是未来。但与之带来的问题是,训练超大模型所需的算力、存储已不再是单机就能搞定的了(之前的 BERT 还是可以用 DGX-1/2 这样的超级服务器训练)。
AI科技大本营
2021-06-08
3.7K0
使用大batch优化深度学习:训练BERT仅需76分钟 | ICLR 2020
在海量数据集上训练大型深度神经网络,是非常具有挑战性的。最近,有许多研究均使用大batch随机优化方法来解决此问题。在该研究领域中,目前最杰出的算法是LARS,它通过采用分层自适应学习率,可以在几分钟内在ImageNet上训练ResNet。但是,对于像BERT这样的注意力模型,LARS的表现很差,这说明它的性能提升在不同任务之间并不一致。在本文中,作者首先研究了一种有原则性的分层适应策略,这样就可以使用大的mini-batch来加速深度神经网络的训练。
AI科技大本营
2020-04-14
1.2K0
PyTorch踩过的12坑 | CSDN博文精选
1. nn.Module.cuda() 和 Tensor.cuda() 的作用效果差异
AI科技大本营
2019-11-14
1.8K0
Google图嵌入工业界最新大招,高效解决训练大规模深度图卷积神经网络问题
导读:本文主要介绍Google发表在KDD 2019的图嵌入工业界最新论文,提出Cluster-GCN,高效解决工业界训练大规模深度图卷积神经网络问题,性能大幅提升基础上依靠可训练更深层网络达到SOTA效果,并开源了源代码。
AI科技大本营
2019-10-15
1.2K0
掌握这些步骤,机器学习模型问题药到病除
众所周知,调试机器学习代码非常困难。即使对于简单的前馈神经网络也是这样,你经常会在网络体系结构做出一些决定,重初始化和网络优化——所有这些会都导致在你的机器学习代码中出现bug。
AI科技大本营
2019-09-25
3550
Dropout、梯度消失/爆炸、Adam优化算法,神经网络优化算法看这一篇就够了
对于机器学习模型在训练数据集和测试数据集上的表现。如果你改变过实验中的模型结构或者超参数,你也许发现了:当模型在训练数据集上更准确时,它在测试数据集上却不⼀定更准确。这是为什么呢?
AI科技大本营
2019-09-03
8530
如何用RNN生成莎士比亚风格的句子?(文末赠书)
作者 | 李理,环信人工智能研发中心vp,十多年自然语言处理和人工智能研发经验。主持研发过多款智能硬件的问答和对话系统,负责环信中文语义分析开放平台和环信智能机器人的设计与研发。
AI科技大本营
2019-08-12
8500
五分钟搭建BERT服务,实现1000+QPS​,这个Service-Streamer做到了
简介:刘欣,Meteorix,毕业于华中科技大学,前网易游戏技术总监,现任香侬科技算法架构负责人。之前专注游戏引擎工具架构和自动化领域,2018年在GDC和GoogleIO开源Airtest自动化框架,广泛应用于Unity3d/Cocos2dx游戏和网易、暴雪、SE等公司。目前负责香侬NLP领域工程化、算法平台架构。
AI科技大本营
2019-08-12
2.1K0
新一届最强预训练模型上榜,出于BERT而胜于BERT
【导读】预训练方法设计有不同的训练目标,包括语言建模、机器翻译以及遮蔽语言建模等。最近发表的许多论文都使用了微调模型,并预先训练了一些遮蔽语言模型的变体。然而,还有一些较新的方法是通过对多任务微调提高性能,结合实体嵌入,跨度预测和自回归预训练的多种变体。它们通常在更大数据上训练更大的模型来提高性能。本文的目标是通过复制、简化和更好地微调训练BERT,以作为更好理解上述方法的相对性能的参考值。
AI科技大本营
2019-08-06
8400
掌声送给TensorFlow 2.0!用Keras搭建一个CNN | 入门教程
2019 年 3 月 6 日,谷歌在 TensorFlow 开发者年度峰会上发布了最新版的 TensorFlow 框架 TensorFlow2.0 。新版本对 TensorFlow 的使用方式进行了重大改进,使其更加灵活和更具人性化。具体的改变和新增内容可以从 TensorFlow 的官网找到,本文将介绍如何使用 TensorFlow2.0 构建和部署端到端的图像分类器,以及新版本中的新增内容,包括:
AI科技大本营
2019-05-22
1.3K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档