腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
PaddlePaddle
专栏作者
举报
573
文章
574223
阅读量
73
订阅数
订阅专栏
申请加入专栏
全部文章(573)
深度学习(352)
人工智能(325)
神经网络(309)
https(129)
编程算法(94)
网络安全(93)
机器学习(62)
开源(61)
NLP 服务(54)
图像识别(43)
其他(36)
python(28)
api(26)
github(23)
文字识别(19)
卷积神经网络(19)
人脸识别(16)
图像处理(13)
分布式(12)
tensorflow(11)
强化学习(10)
大数据(10)
批量计算(9)
文件存储(8)
自动驾驶(7)
c++(7)
android(7)
硬件开发(7)
打包(7)
git(7)
机器人(7)
容器镜像服务(6)
机器翻译(6)
企业(6)
游戏(6)
推荐系统(6)
数据分析(6)
html(5)
linux(5)
kernel(5)
微信(5)
数据处理(5)
windows(5)
arm(4)
数据库(4)
网站(4)
无人驾驶(4)
pytorch(4)
迁移学习(4)
javascript(3)
bash(3)
.net(3)
css(3)
sql(3)
ide(3)
腾讯云测试服务(3)
http(3)
存储(3)
自动化(3)
安全(3)
数据结构(3)
学习方法(3)
智能识别(3)
手势识别(3)
语音识别(2)
数据挖掘(2)
ios(2)
android studio(2)
搜索引擎(2)
bash 指令(2)
SSL 证书(2)
声纹识别(2)
知识图谱(2)
金融(2)
金融风控(2)
出行(2)
容器(2)
opencv(2)
监督学习(2)
小程序(2)
云计算(2)
智能制造(2)
embedding(2)
gpu(2)
对象存储(1)
认证考试(1)
cocoa(1)
ruby(1)
jquery ui(1)
xml(1)
jquery(1)
typescript(1)
qt(1)
单片机(1)
django(1)
unix(1)
ubuntu(1)
nginx(1)
mapreduce(1)
云直播(1)
短视频(1)
访问管理(1)
命令行工具(1)
数据库一体机 TData(1)
移动应用安全(1)
视频处理(1)
双螺旋(1)
高性能计算(1)
医疗(1)
渲染(1)
智能交通(1)
缓存(1)
正则表达式(1)
gui(1)
面向对象编程(1)
线性回归(1)
asp(1)
ftp(1)
tcp/ip(1)
单元测试(1)
rpc(1)
rabbitmq(1)
uml(1)
数据可视化(1)
fpga(1)
网站建设(1)
nat(1)
腾讯云开发者社区(1)
信息流(1)
视频分析(1)
flutter(1)
对话机器人(1)
特征工程(1)
迁移(1)
raft(1)
实时监控(1)
智能创作(1)
智能推荐平台(1)
大模型视频创作引擎(1)
device(1)
hidden(1)
layer(1)
min(1)
model(1)
profile(1)
prompt(1)
size(1)
slice(1)
url(1)
word(1)
百度(1)
终端(1)
搜索文章
搜索
搜索
关闭
流水线并行技术与飞桨优化实现详解
批量计算
编程算法
分布式
神经网络
深度学习
实践证明,更大的模型在不少场景取得了更好的效果。但随着参数规模的扩大,AI加速卡存储(如GPU显存)容量问题和卡的协同计算问题成为了训练超大模型的瓶颈。流水线并行从模型切分和调度执行两个角度解决了这些问题。本文将从流水线并行介绍、主流实现方式以及一般调优技巧三方面从浅到深讲解流水线并行,希望能帮助您更好地理解和使用流水线并行功能。
用户1386409
2022-08-31
893
0
详解Swin Transformer核心实现,经典模型也能快速调优
批量计算
2020年,基于自注意力机制的Vision Transformer将用于NLP领域的Transformer模型成功地应用到了CV领域的图像分类上,并在ImageNet数据集上得到88.55%的精度。
用户1386409
2022-03-31
894
0
大模型应用新范式:统一特征表示优化(UFO)
批量计算
大数据
从深度学习技术被提出以来,一直践行着“think big”的理念。特别是当预训练技术被广泛应用之后,更多的数据结合更大的模型参数量会持续带来模型性能的提升,这条定律不断被近期发布的各种大模型所验证。在刚刚过去的2021年,百度文心大模型中的ERNIE3.0、微软和英伟达联合推出的MT-NLP以及谷歌的Switch Transformer等等,参数量可达千亿甚至万亿。
用户1386409
2022-03-31
409
0
数据并行:提升训练吞吐的高效方法 |深度学习分布式训练专题
批量计算
深度学习
数据并行是大规模深度学习训练中非常成熟和常用的并行模式。本文将介绍数据并行的原理和主流实现方案,使用数据并行加速训练过程中需要注意的问题,以及如何优化数据并行进一步提高训练速度。希望能帮助用户更好的理解和使用数据并行策略。
用户1386409
2022-01-17
1.6K
0
听六小桨讲AI | 第3期:优化器及其三种形式BGD、SGD以及MBGD
批量计算
机器学习
深度学习
神经网络
人工智能
大家好,我是助教唐僧。在上期中,主桨人见见为大家讲解了卷积的批量计算以及应用案例,后续还有详解卷积变体的课程,见见老师还在努力开发中,希望大家期待一下。
用户1386409
2021-05-07
665
0
十行代码让你的单机“影分身”,分布式训练速度快到飞起
分布式
批量计算
:“哥啊,那我可就说了,我是真的苦啊,现在一个模型动辄好几亿参数,数据集也是大的吓人,兄弟我内存都快被掏空了,实在训练不动了呀。”
用户1386409
2020-04-07
354
0
无人车车道线检测挑战赛心得分享
批量计算
编程算法
神经网络
深度学习
人工智能
在今年3月份结束的AI Studio无人车车道线检测挑战赛中,参赛选手王林华取得了总决赛第二名的好成绩。赛后选手积极投稿,分享了从备赛到参赛过程中的宝贵经验,获得了额外1000元京东卡的稿费奖励。
用户1386409
2019-07-16
1.4K
0
更快更简单|飞桨PaddlePaddle显存分配与优化最佳实践
编程算法
神经网络
人工智能
http
批量计算
飞桨(PaddlePaddle)为用户提供技术领先、简单易用、兼顾显存回收与复用的显存优化策略,在Transformer、BERT、DeepLabV3+上Max Batch Size性能优于对标开源框架,在YOLOv3、Mask-RCNN模型上显存性能与对标开源框架持平,有兴趣的同学可以试一下,上一组数据先睹为快。
用户1386409
2019-07-16
977
0
飞桨万能转换小工具X2Paddle,教你玩转模型迁移
神经网络
深度学习
人工智能
api
批量计算
百度推出飞桨(PaddlePaddle)后,不少开发者开始转向国内的深度学习框架。但是从代码的转移谈何容易,之前的工作重写一遍不太现实,成千上万行代码的手工转换等于是在做一次二次开发。
用户1386409
2019-07-02
868
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档