腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
AI科技大本营的专栏
专栏作者
举报
3088
文章
3123285
阅读量
201
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
人工智能(999+)
深度学习(688)
机器学习(567)
神经网络(562)
编程算法(461)
其他(417)
python(275)
https(213)
网络安全(180)
NLP 服务(164)
开源(152)
自动驾驶(126)
机器人(126)
模型(126)
数据(97)
大数据(91)
github(90)
无人驾驶(84)
图像处理(82)
tensorflow(76)
git(67)
强化学习(67)
安全(67)
游戏(63)
图像识别(60)
数据库(56)
人脸识别(54)
卷积神经网络(49)
企业(48)
java(41)
数据分析(41)
监督学习(40)
sql(37)
api(37)
微信(36)
物联网(36)
chatgpt(36)
推荐系统(34)
pytorch(34)
系统(34)
硬件开发(33)
分布式(31)
开发者(30)
算法(30)
http(29)
工作(28)
ide(27)
语音识别(23)
go(23)
自动化(23)
数据挖掘(22)
html(22)
知识图谱(22)
产品(22)
程序员(22)
缓存(21)
数据处理(21)
腾讯云测试服务(20)
网站(20)
numpy(20)
论文(20)
javascript(19)
linux(19)
存储(19)
keras(19)
迁移学习(19)
云计算(19)
工具(19)
开发(19)
科技(19)
机器翻译(18)
数据结构(18)
基础(18)
学习方法(17)
网络(17)
windows(16)
编程(16)
研发(16)
ios(15)
搜索引擎(15)
爬虫(15)
函数(15)
框架(15)
性能(15)
c++(14)
测试(14)
架构(14)
android(13)
tcp/ip(13)
nat(13)
gpt(13)
视频(13)
区块链(12)
iphone(12)
文件存储(12)
openai(12)
服务(12)
c 语言(11)
node.js(11)
opencv(11)
决策树(11)
线性回归(11)
无监督学习(11)
汽车(11)
批量计算(10)
软件(10)
设计(10)
芯片(10)
matlab(9)
运维(9)
黑客(9)
google(9)
华为(9)
腾讯(9)
比特币(8)
打包(8)
短视频(8)
spark(8)
gui(8)
工程师(8)
实践(8)
搜索(8)
数据可视化(7)
架构设计(7)
百度(7)
对象(7)
行业(7)
可视化(7)
软件工程(7)
php(6)
arm(6)
金融(6)
小程序(6)
fpga(6)
计算机(6)
优化(6)
费用中心(5)
.net(5)
jquery(5)
json(5)
嵌入式(5)
unix(5)
ubuntu(5)
mapreduce(5)
文字识别(5)
语音合成(5)
医疗(5)
特征工程(5)
迁移(5)
编程语言(5)
操作系统(5)
创业(5)
低代码(5)
量子计算(5)
面试(5)
苹果(5)
图表(5)
效率(5)
语音(5)
原理(5)
mac os(4)
swift(4)
r 语言(4)
oracle(4)
云数据库 Redis(4)
django(4)
apache(4)
spring(4)
日志服务(4)
云直播(4)
高性能计算(4)
数据安全(4)
容器(4)
hadoop(4)
面向对象编程(4)
unity(4)
5g(4)
联邦学习(4)
model(4)
self(4)
twitter(4)
部署(4)
程序(4)
二维码(4)
互联网(4)
前端(4)
事件(4)
手机(4)
objective-c(3)
ruby(3)
scala(3)
xml(3)
css(3)
nosql(3)
windows server(3)
nginx(3)
访问管理(3)
渲染(3)
出行(3)
shell(3)
erp(3)
dubbo(3)
ddos(3)
scikit-learn(3)
微服务(3)
分类算法(3)
智能推荐平台(3)
教育(3)
aigc(3)
com(3)
it(3)
mask(3)
nlp(3)
youtube(3)
编码(3)
插件(3)
地图(3)
服务器(3)
高性能(3)
技巧(3)
计算机视觉(3)
架构师(3)
教程(3)
入门(3)
数据科学(3)
数学(3)
对象存储(2)
数字货币(2)
perl(2)
erlang(2)
opengl(2)
qt(2)
单片机(2)
postgresql(2)
容器镜像服务(2)
腾讯云可观测平台(2)
命令行工具(2)
TDSQL MySQL 版(2)
智能鉴黄(2)
内容理解(2)
视频处理(2)
mongodb(2)
DevOps 解决方案(2)
智能交通(2)
微信生态上云方案(2)
express(2)
互联网金融(2)
互联网医疗(2)
ssh(2)
正则表达式(2)
ftp(2)
cdn(2)
selenium(2)
iis(2)
模式识别(2)
uml(2)
安全漏洞(2)
系统架构(2)
腾讯云开发者社区(2)
processing(2)
智能教育(2)
sdn(2)
flutter(2)
云开发(2)
模型测试(2)
腾讯云图数据可视化(2)
验证码(2)
Elasticsearch Service(2)
图像分析(2)
智能客服机器人(2)
智能监考(2)
智能制造(2)
腾讯云(2)
action(2)
app(2)
epoch(2)
facebook(2)
gpu(2)
image(2)
layer(2)
meta(2)
microsoft(2)
mysql(2)
pandas(2)
policy(2)
redis(2)
rtc(2)
state(2)
变量(2)
博客(2)
布局(2)
队列(2)
翻译(2)
计算机科学(2)
解决方案(2)
金融科技(2)
连接(2)
浏览器(2)
流量(2)
内存(2)
排序(2)
软件开发(2)
摄像头(2)
索引(2)
通信(2)
音频(2)
硬件(2)
云原生(2)
字符串(2)
云点播(1)
私有网络(1)
数据万象(1)
云 API(1)
负载均衡(1)
渠道代理(1)
c#(1)
lua(1)
vue.js(1)
react(1)
memcached(1)
access(1)
flask(1)
ruby on rails(1)
jar(1)
maven(1)
中文分词(1)
全文检索(1)
负载均衡缓存(1)
apt-get(1)
黑石物理服务器(1)
云数据库 MongoDB(1)
消息队列 CMQ 版(1)
API 网关(1)
检测工具(1)
数据加密服务(1)
人脸核身(1)
人脸融合(1)
声纹识别(1)
智能投顾(1)
大数据处理套件 TBDS(1)
云推荐引擎(1)
数据库解决方案(1)
数据备份(1)
互动课堂(1)
电商(1)
通用教育(1)
在线旅游(1)
政务云专区(1)
智慧零售(1)
工业物联(1)
eslint(1)
svg(1)
yarn(1)
babel.js(1)
云+未来(1)
serverless(1)
kubernetes(1)
devops(1)
html5(1)
jvm(1)
hive(1)
openstack(1)
asp(1)
npm(1)
seo(1)
kotlin(1)
二叉树(1)
单元测试(1)
markdown(1)
敏捷开发(1)
kernel(1)
gcc(1)
anaconda(1)
powershell(1)
nest(1)
webgl(1)
信息流(1)
机器学习平台(1)
内容安全(1)
聚类算法(1)
angel(1)
ascii(1)
腾讯会议(1)
sdk(1)
rust(1)
性能测试(1)
es(1)
ghost(1)
微搭低代码(1)
数据库管理(1)
智能识别(1)
应用安全开发(1)
数据集成(1)
隐私计算(1)
人体分析(1)
通用文字识别(1)
未成年人保护(1)
数据湖(1)
手机行业(1)
add(1)
adobe(1)
alpha(1)
amazon(1)
apple(1)
aws(1)
block(1)
buffer(1)
bug(1)
center(1)
ci(1)
cto(1)
decorator(1)
detection(1)
emacs(1)
embedding(1)
excel(1)
folium(1)
func(1)
gan(1)
get(1)
gif(1)
gitlab(1)
graph(1)
hibernate(1)
im(1)
julia(1)
knn(1)
logic(1)
macbook(1)
map(1)
matplotlib(1)
max(1)
nancy(1)
native(1)
netty(1)
network(1)
nvidia(1)
office(1)
output(1)
paypal(1)
pdf(1)
performance(1)
permutation(1)
pip(1)
point(1)
prediction(1)
process(1)
prompt(1)
ps(1)
robotics(1)
rpa(1)
shared(1)
space(1)
sprite(1)
stream(1)
surface(1)
t4(1)
task(1)
token(1)
translate(1)
txt(1)
unity3d(1)
verilog(1)
vr(1)
watch(1)
百度飞桨(1)
编程思想(1)
编译(1)
表单(1)
表格(1)
代理(1)
动画(1)
多线程(1)
分布式系统(1)
高并发(1)
工业互联网(1)
公众号(1)
管理(1)
后端(1)
后台(1)
继承(1)
集群(1)
监控(1)
脚本(1)
交换机(1)
接口(1)
镜像(1)
垃圾回收(1)
量化(1)
内核(1)
区块链开发(1)
上传图片(1)
数据结构与算法(1)
数据中心(1)
数组(1)
调试(1)
统计(1)
图形学(1)
线程池(1)
小游戏(1)
协议(1)
信息安全(1)
虚拟现实(1)
压缩(1)
异常(1)
音视频(1)
隐私(1)
游戏开发(1)
语法(1)
域名(1)
源码(1)
原型(1)
元宇宙(1)
云安全(1)
云平台(1)
装饰器(1)
搜索文章
搜索
搜索
关闭
GPT-3模型为何难以复现?这也许是分布式AI框架的最优设计
分布式
pytorch
批量计算
javascript
mapreduce
2020 年,最轰动的 AI 新闻莫过于 OpenAI 发布的 GPT-3 了。它的1750亿参数量及其在众多NLP任务上超过人类的出众表现让大家坚信:大模型才是未来。但与之带来的问题是,训练超大模型所需的算力、存储已不再是单机就能搞定的了(之前的 BERT 还是可以用 DGX-1/2 这样的超级服务器训练)。
AI科技大本营
2021-06-08
3.7K
0
使用大batch优化深度学习:训练BERT仅需76分钟 | ICLR 2020
批量计算
编程算法
深度学习
神经网络
在海量数据集上训练大型深度神经网络,是非常具有挑战性的。最近,有许多研究均使用大batch随机优化方法来解决此问题。在该研究领域中,目前最杰出的算法是LARS,它通过采用分层自适应学习率,可以在几分钟内在ImageNet上训练ResNet。但是,对于像BERT这样的注意力模型,LARS的表现很差,这说明它的性能提升在不同任务之间并不一致。在本文中,作者首先研究了一种有原则性的分层适应策略,这样就可以使用大的mini-batch来加速深度神经网络的训练。
AI科技大本营
2020-04-14
1.2K
0
PyTorch踩过的12坑 | CSDN博文精选
pytorch
python
批量计算
1. nn.Module.cuda() 和 Tensor.cuda() 的作用效果差异
AI科技大本营
2019-11-14
1.8K
0
Google图嵌入工业界最新大招,高效解决训练大规模深度图卷积神经网络问题
编程算法
批量计算
导读:本文主要介绍Google发表在KDD 2019的图嵌入工业界最新论文,提出Cluster-GCN,高效解决工业界训练大规模深度图卷积神经网络问题,性能大幅提升基础上依靠可训练更深层网络达到SOTA效果,并开源了源代码。
AI科技大本营
2019-10-15
1.2K
0
掌握这些步骤,机器学习模型问题药到病除
机器学习
深度学习
人工智能
批量计算
神经网络
众所周知,调试机器学习代码非常困难。即使对于简单的前馈神经网络也是这样,你经常会在网络体系结构做出一些决定,重初始化和网络优化——所有这些会都导致在你的机器学习代码中出现bug。
AI科技大本营
2019-09-25
355
0
Dropout、梯度消失/爆炸、Adam优化算法,神经网络优化算法看这一篇就够了
编程算法
监督学习
批量计算
机器学习
深度学习
对于机器学习模型在训练数据集和测试数据集上的表现。如果你改变过实验中的模型结构或者超参数,你也许发现了:当模型在训练数据集上更准确时,它在测试数据集上却不⼀定更准确。这是为什么呢?
AI科技大本营
2019-09-03
853
0
如何用RNN生成莎士比亚风格的句子?(文末赠书)
机器学习
神经网络
深度学习
人工智能
批量计算
作者 | 李理,环信人工智能研发中心vp,十多年自然语言处理和人工智能研发经验。主持研发过多款智能硬件的问答和对话系统,负责环信中文语义分析开放平台和环信智能机器人的设计与研发。
AI科技大本营
2019-08-12
850
0
五分钟搭建BERT服务,实现1000+QPS,这个Service-Streamer做到了
网站
批量计算
api
分布式
python
简介:刘欣,Meteorix,毕业于华中科技大学,前网易游戏技术总监,现任香侬科技算法架构负责人。之前专注游戏引擎工具架构和自动化领域,2018年在GDC和GoogleIO开源Airtest自动化框架,广泛应用于Unity3d/Cocos2dx游戏和网易、暴雪、SE等公司。目前负责香侬NLP领域工程化、算法平台架构。
AI科技大本营
2019-08-12
2.1K
0
新一届最强预训练模型上榜,出于BERT而胜于BERT
NLP 服务
批量计算
【导读】预训练方法设计有不同的训练目标,包括语言建模、机器翻译以及遮蔽语言建模等。最近发表的许多论文都使用了微调模型,并预先训练了一些遮蔽语言模型的变体。然而,还有一些较新的方法是通过对多任务微调提高性能,结合实体嵌入,跨度预测和自回归预训练的多种变体。它们通常在更大数据上训练更大的模型来提高性能。本文的目标是通过复制、简化和更好地微调训练BERT,以作为更好理解上述方法的相对性能的参考值。
AI科技大本营
2019-08-06
840
0
掌声送给TensorFlow 2.0!用Keras搭建一个CNN | 入门教程
tensorflow
批量计算
api
2019 年 3 月 6 日,谷歌在 TensorFlow 开发者年度峰会上发布了最新版的 TensorFlow 框架 TensorFlow2.0 。新版本对 TensorFlow 的使用方式进行了重大改进,使其更加灵活和更具人性化。具体的改变和新增内容可以从 TensorFlow 的官网找到,本文将介绍如何使用 TensorFlow2.0 构建和部署端到端的图像分类器,以及新版本中的新增内容,包括:
AI科技大本营
2019-05-22
1.3K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档