腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

媒矿工厂

专栏作者

881

文章

1033934

阅读量

235

订阅数

Parrot：用于文本到图像生成的帕累托最优多奖励强化学习框架

模型网络优化强化学习框架

最近的工作表明，使用具有质量奖励的强化学习（RL）可以提高文本到图像（T2I）生成中生成图像的质量。然而，多个奖励的简单聚合可能会导致某些指标的过度优化和其他指标的退化，并且手动找到最佳权重具有挑战性。所以非常需要一种有效的策略来联合优化 RL 中的多种奖励以生成 T2I。

2024-03-26

1340

ICCV 2023 | DIMOS: 在 3D 室内场景中合成多样化人物运动

强化学习框架模型设计网络

图 1：我们提出了一种在真实世界的复杂场景中生成自然的人物-场景交互事件序列的方法。如图所示，人物首先走到凳子旁坐下（黄色到红色），然后走到另一张椅子旁坐下（红色到洋红色），最后走到沙发旁躺下（洋红色到蓝色）。

2023-10-24

3270

Loki: 通过融合基于规则的模型提高基于学习的实时视频自适应的长尾性能

gcc 学习方法深度学习强化学习监督学习

最大化实时视频的体验质量(QoE)是一个长期存在的挑战。传统的视频传输协议以少量确定性规则为代表，难以适应异构、高度动态的现代互联网。新兴的基于学习的算法已经显示出应对这一挑战的潜力。然而，我们的测量研究揭示了一个令人担忧的长尾性能问题: 由于内置的探索机制，这些算法往往会受到偶尔发生的灾难性事件的瓶颈。在这项工作中，我们提出了 Loki，它通过将学习模型与基于规则的算法相结合，提高了学习模型的鲁棒性。为了能够在特征层次上进行集成，我们首先将基于规则的算法逆向工程为一个等效的“黑盒”神经网络。然后，我们设计一个双注意特征融合机制，将其与一个强化学习模型融合。我们通过在线学习在一个商业实时视频系统中训练 Loki，并对它进行了超过1.01亿次的视频会话评估，与最先进的基于规则和基于学习的解决方案进行了比较。结果表明，Loki 不仅提高了系统的平均吞吐量，而且显著提高了系统的尾部性能(95% 时，系统的卡顿率降低了26.30% ~ 44.24% ，视频吞吐量提高了1.76% ~ 2.17%)。

2022-11-07

1.6K0

深度卷积神经网络压缩

文件存储神经网络强化学习深度学习分布式

本文是来自Stanford Compression Workshop 2019的演讲，作者是来自MIT的助理教授韩松。本次演讲的主要内容是深度卷积神经网络压缩。深度学习的一个挑战是模型太大，对计算资源的消耗极大，很难在手机等嵌入式设备上进行部署，同时也很难以在网络上实时下载；另一个挑战就是深度学习模型对能源的消耗极大，比如AlphaGo每场比赛需要消耗3000美元的电费，而韩松的工作就是使AI更高效：低延迟、高吞吐量、低耗、自动设计和鲁棒。在演讲中，韩松从三个方面讲解了模型压缩：神经网络的内存带宽、工程师的人力资本、分布式网络训练消耗的带宽。

2019-11-19

6120

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态