腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
美团技术团队
我们信仰耐心和坚持的力量,愿意持续去做一些正确、有积累、可能表面看上去不那么重要实则非常关键的事情
专栏成员
举报
524
文章
770779
阅读量
349
订阅数
订阅专栏
申请加入专栏
全部文章(524)
编程算法(81)
数据库(44)
深度学习(42)
其他(40)
android(40)
机器学习(33)
java(33)
系统架构(31)
人工智能(28)
神经网络(25)
ios(24)
sql(24)
缓存(24)
ide(23)
存储(23)
分布式(22)
网站(19)
javascript(17)
node.js(17)
打包(17)
linux(17)
开源(17)
自动化(17)
运维(17)
数据结构(17)
实践(17)
api(16)
大数据(16)
安全(15)
容器(14)
模型(14)
网络安全(13)
微服务(13)
NLP 服务(12)
数据分析(12)
数据处理(12)
数据(12)
腾讯云测试服务(11)
jvm(11)
微信(11)
sdk(11)
云数据库 SQL Server(10)
spark(10)
react(8)
html(8)
容器镜像服务(8)
知识图谱(8)
推荐系统(8)
自动化测试(8)
https(8)
c++(7)
图像识别(7)
tensorflow(6)
http(6)
kubernetes(6)
小程序(6)
kafka(6)
特征工程(6)
框架(6)
优化(6)
json(5)
云数据库 Redis(5)
搜索引擎(5)
spring(5)
webpack(5)
hive(5)
spring boot(5)
jenkins(5)
安全漏洞(5)
腾讯云开发者社区(5)
flutter(5)
系统(5)
go(4)
css(4)
渲染(4)
数据安全(4)
hadoop(4)
rpc(4)
数据可视化(4)
测试(4)
搜索(4)
算法(4)
异常(4)
objective-c(3)
cocoa(3)
python(3)
vue.js(3)
jquery ui(3)
xml(3)
webview(3)
github(3)
jar(3)
apache(3)
日志服务(3)
图像处理(3)
日志数据(3)
监督学习(3)
cdn(3)
tcp/ip(3)
kernel(3)
uml(3)
架构设计(3)
腾讯会议(3)
迁移(3)
dart(3)
性能测试(3)
流量(3)
论文(3)
设计(3)
性能(3)
研发(3)
云镜(主机安全)(2)
自动驾驶(2)
数据挖掘(2)
swift(2)
xcode(2)
ajax(2)
opengl(2)
批量计算(2)
文件存储(2)
TDSQL MySQL 版(2)
serverless(2)
数据迁移(2)
无人驾驶(2)
jdk(2)
卷积神经网络(2)
强化学习(2)
mybatis(2)
面向对象编程(2)
hashmap(2)
openstack(2)
npm(2)
aop(2)
单元测试(2)
gradle(2)
processing(2)
任务调度(2)
flink(2)
学习方法(2)
数据集成(2)
智能客服机器人(2)
app(2)
ddd(2)
mysql(2)
服务(2)
工作(2)
架构(2)
接口(2)
领域驱动设计(2)
内存(2)
内核(2)
排序(2)
前端(2)
视频(2)
索引(2)
网络(2)
原理(2)
费用中心(1)
内容分发网络 CDN(1)
云点播(1)
对象存储(1)
维纳斯(1)
弹性伸缩(1)
人脸识别(1)
iphone(1)
jquery(1)
typescript(1)
android studio(1)
arm(1)
硬件开发(1)
access(1)
mvc(1)
git(1)
analyzer(1)
unix(1)
centos(1)
mapreduce(1)
GPU 云服务器(1)
容器服务(1)
短视频(1)
腾讯云可观测平台(1)
访问管理(1)
消息队列 CMQ 版(1)
cci 持续集成(1)
智能鉴黄(1)
图片标签(1)
文字识别(1)
人脸融合(1)
内容理解(1)
es 2(1)
视频处理(1)
高性能计算(1)
企业(1)
o2o(1)
url 安全(1)
express(1)
reactnative(1)
yarn(1)
压力测试(1)
html5(1)
正则表达式(1)
dns(1)
opencv(1)
zookeeper(1)
二叉树(1)
rabbitmq(1)
gcc(1)
迁移学习(1)
kerberos(1)
机器人(1)
windows(1)
物联网(1)
网站建设(1)
企业组织(1)
信息流(1)
云计算(1)
机器学习平台(1)
安全治理(1)
迁移服务(1)
groovy(1)
功能测试(1)
白盒测试(1)
黑盒测试(1)
模型测试(1)
etcd(1)
raft(1)
es(1)
智能审核(1)
应急响应服务(1)
Elasticsearch Service(1)
大数据存储(1)
数据湖(1)
设计云(1)
action(1)
aiops(1)
amp(1)
behavior(1)
click(1)
com(1)
db(1)
embedding(1)
field(1)
filter(1)
gpu(1)
gradient(1)
network(1)
prediction(1)
time(1)
tree(1)
ui(1)
vr(1)
代理(1)
地图(1)
公众号(1)
工作流(1)
管理(1)
基础(1)
集群(1)
监控(1)
解决方案(1)
进程(1)
开发(1)
可视化(1)
量化(1)
配置(1)
事件(1)
统计(1)
效率(1)
压缩(1)
终端(1)
数据库集群(1)
容灾(1)
搜索文章
搜索
搜索
关闭
TensorFlow在美团外卖推荐场景的GPU训练优化实践
GPU 云服务器
tensorflow
kernel
编程算法
总第497篇 2022年 第014篇 美团机器学习平台基于内部深度定制的TensorFlow研发了Booster GPU训练架构。该架构在整体设计上充分考虑了算法、架构、新硬件的特性,从数据、计算、通信等多个角度进行了深度的优化,最终其性价比达到CPU任务的2~4倍。本文主要讲述Booster架构的设计实现、性能优化及业务落地工作,希望能对从事相关开发的同学有所帮助或者启发。 1 背景 2 GPU训练优化挑战 3 系统设计与实现 3.1 参数规模的合理化 3.2 系统架构 3.3 关键实现 4 系统性能优
美团技术团队
2022-03-25
1.1K
0
GPU在外卖场景精排模型预估中的应用实践
node.js
tensorflow
https
网络安全
深度学习
总第492篇 2022年 第009篇 GPU等专用芯片以较低的成本提供海量算力,已经成为机器学习领域的核心利器,在人工智能时代发挥着越来越重要的作用。如何利用GPU这一利器赋能业务场景,是很多技术研发者都要面临的问题。本文分享了美团外卖搜索/推荐业务中模型预估的GPU架构设计及落地的过程,希望能对从事相关应用研发的同学有所帮助或启发。 1 前言 2 背景 3 外卖搜推场景下的精排模型 4 模型服务架构概览 5 GPU优化实践 5.1 系统优化 5.2 计算优化 5.3 基于DL编译器的自动优化 6 性能表
美团技术团队
2022-03-04
823
0
TensorFlow在推荐系统中的分布式训练优化实践
https
网络安全
tensorflow
分布式
美团内部深度定制的TensorFlow版本,基于原生TensorFlow 1.x架构与接口,从大规模稀疏参数的支持、训练模式、分布式通信优化、流水线优化、算子优化融合等多维度进行了深度优化。在推荐系统场景中,分布式扩展性提升10倍以上,单位算力性能也有显著提升,并在美团内部业务中大量使用,本文介绍了相关的优化与实践工作。
美团技术团队
2021-12-13
1K
0
新一代CTR预测服务的GPU优化实践
模型测试
深度学习
批量计算
kernel
tensorflow
CTR模型在互联网的搜索、推荐、广告等场景有着广泛的应用。近年来,随着深度神经网络的引入,CTR模型的推理对硬件算力的要求逐渐增加。本文介绍了美团在CTR模型优化的实践。通过分析模型结构特点,结合GPU硬件架构,我们设计了一系列流程对模型进行定制优化,达到了降低延迟、提高吞吐、节省成本的目标。
美团技术团队
2021-09-18
695
0
基于TensorFlow Serving的深度学习在线预估
tensorflow
打包
ide
深度学习
api
随着深度学习在图像、语言、广告点击率预估等各个领域不断发展,很多团队开始探索深度学习技术在业务层面的实践与应用。而在广告CTR预估方面,新模型也是层出不穷: Wide and Deep[1]、DeepCross Network[2]、DeepFM[3]、xDeepFM[4],美团很多篇深度学习博客也做了详细的介绍。但是,当离线模型需要上线时,就会遇见各种新的问题: 离线模型性能能否满足线上要求、模型预估如何镶入到原有工程系统等等。只有准确的理解深度学习框架,才能更好地将深度学习部署到线上,从而兼容原工程系统、满足线上性能要求。
美团技术团队
2019-04-04
1.5K
1
美团深度学习系统的工程实践
编程算法
深度学习
批量计算
tensorflow
深度学习作为AI时代的核心技术,已经被应用于众多场景。在系统设计层面,由于它具有计算密集的特性,所以与传统的机器学习算法在工程实践过程中存在诸多的不同。本文将介绍美团平台在应用深度学习技术的过程中,相关系统设计的一些经验。
美团技术团队
2019-03-22
791
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档