腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

大数据文摘

专栏作者

5572

文章

4009342

阅读量

253

订阅数

从语言模型到ChatGPT，大模型调教全攻略

强化学习 chatgpt 模型数据优化

大数据文摘授权转载自夕小瑶的卖萌屋作者：python 你是否想过，为什么ChatGPT能够如此火爆呢？我认为这主要是因为ChatGPT提供了好玩、有用的对话式交互功能，能够为用户提供帮助，而不仅仅是依靠“大”模型的魅力。毕竟，GPT-3在2020年就已经推出了，拥有175B的参数规模，但除了最初的热度之外，它并没有引起社会太多的关注。那么，究竟是什么让ChatGPT能够生成相对客观且富有信息量的回答呢？研究者们基于预训练好的大规模语言模型，采用了多种调教手段，主要包括指令调整和基于人类反馈的对齐调整。这

大数据文摘

2023-04-21

4760

强化学习，商业化之路宣告死亡了吗？

游戏强化学习推荐系统行业模型

大数据文摘授权转载自夕小瑶的卖萌屋作者：Shona 继DeepMind推出AlphaGo已过去7年，强化学习在游戏行业有了不少应用，例如游戏陪玩、AI托管等。在这过程中，越来越多的公司 / 研究院所为强化学习的研究投入了大量的资源与精力。随之而来的，也有不少质疑，不少人对强化学习的印象还仅仅停留在游戏层面，认为它落地到其他行业是非常之困难的。到目前为止，我们回顾自热潮掀起，再到质疑声频出，强化学习是否真的挺进各行各业？它创造商业价值了吗？换句话说，强化学习的商业化之路，是否已宣告死亡？前不久，这件

大数据文摘

2023-04-10

2000

DeepMind VS Meta：实现纳什均衡理性最优解，还是多人非零和博弈算法更强大？

游戏强化学习 meta 模型算法

大数据文摘转载自AI科技大本营编译 & 整理：杨阳记得豆瓣高分电影《美丽心灵》中的约翰·纳什吗？作为获得诺贝尔经济学奖的数学家，纳什在博弈论、微分几何学，以及偏微分方程等各个领域都作出卓越贡献。为表彰他在非合作博弈理论中对均衡（纳什均衡）的开创性分析，1994年瑞典中央银行授予纳什诺贝尔经济学奖。纳什均衡在社科中的应用可谓成功，而在科技领域中，也经常引用博弈论的逻辑来进行技术实现，比如，通过密码学和博弈论的结合实现大数据安全。当下，这一逻辑也开始应用在AI的算法上。 DeepNash——Deep

大数据文摘

2023-04-10

3060

可解释机器学习最新综述：应用于实时场景中的机遇与挑战

编程算法强化学习机器学习神经网络深度学习

大数据文摘授权转载自将门创投作者：Guanchu Wang 论文链接： https://arxiv.org/abs/2302.03225 代码链接： https://github.com/ynchuang/awesome-efficient-xai 什么是可解释机器学习？深度模型（神经网络）的推理过程是黑盒化的、不可解释的。机器学习发展至今仍然无法完全打开这个黑盒子。可解释机器学习的研究内容就是为深度模型的推理结果提供人类可以理解的解释（原因）。这在有道德约束下的应用场景中是极其重要的。例如，某银行利

大数据文摘

2023-02-28

4120

DeepMind 发布强化学习通用算法 DreamerV3，AI 成精自学捡钻石

编程算法强化学习游戏 https 网络安全

大数据文摘转载自HyperAI超神经北京时间 1 月 12 日，DeepMind 官方推特发文，正式官宣 DreamerV3，这是首个能在游戏「我的世界」(Minecraft) 中不参考人类数据，就能从头开始收集钻石的通用算法，解决了 AI 领域中的又一重要挑战。 DeepMind 在推特官宣 DreamerV3 强化学习扩展成问题，发展还需通用算法强化学习使得计算机可以通过互动解决某一任务，如 AlphaGo 在围棋比赛中战胜人类，OpenAI Five 在 Dota 2 中战胜业余人类玩家。

大数据文摘

2023-02-23

2470

Richard Sutton 直言卷积反向传播已经落后，AI 突破要有新思路：持续反向传播

强化学习编程算法深度学习学习方法神经网络

大数据文摘转载自AI科技评论作者：Richard Sutton 编译：bluemin 编辑：陈彩娴 “可塑性损失”（Loss of Plasticity）是深度神经网络最常被诟病的一个缺点，这也是基于深度学习的 AI 系统被认为无法持续学习的原因之一。对于人脑而言，“可塑性”是指产生新神经元和神经元之间新连接的能力，是人进行持续学习的重要基础。随着年龄的增长，作为巩固已学到知识的代价，大脑的可塑性会逐渐下降。神经网络也是类似。一个形象的例子是，2020 年热启动式（warm-starting）训练被证

大数据文摘

2022-09-28

3180

借助电子标签，这款机器人能帮你找到藏在脏衣服下的钥匙！MIT研发，成功率96%

机器人强化学习智能家居

这样的情况是不是已经发生太多次了，不知道有多少人和文摘菌一样，这时候只想给那些找不到的东西打通电话，最好它们能发个定位，或者乖乖回到我手里。

大数据文摘

2021-10-12

3190

AI全自动钓鱼，原神游戏沦陷！

图像识别神经网络深度学习人工智能强化学习

就在今年 9 月，这款从开放公测起便屡次登顶国内外讨论热度和手游吸金榜第一的开放世界冒险游戏更新了版本，添加 / 丰富了地图，并且上线了一款小游戏——钓鱼。游戏中多个水域都有钓鱼点，不同的位置可以钓不同的鱼。

大数据文摘

2021-10-12

1.1K0

这5个数学猜想最早在30年前提出，如今AI证明它们都错了

编程算法神经网络强化学习

近日，以色列特拉维夫大学研究团队在预印论文库提交了一篇名为“Constructions in combinatorics via neural networks“的论文，在这篇论文中，研究人员通过机器学习算法证伪了图论（Graph Theory）领域的5个数学猜想。

大数据文摘

2021-07-06

3190

AI模型可预测人们在打字时如何移动眼睛和手指

深度学习神经网络人工智能强化学习

由于无法感觉到按键，我们依靠视觉将手指移至正确的位置并检查错误，这是我们无法在同一时间进行一系列动作。

大数据文摘

2021-05-27

5760

Michael Jordan：人工智能研究的目标变了，不再是构建单个智能

编程算法 r 语言推荐系统机器学习强化学习

【专栏：研究思路】我们认为，人工智能进入了新的拐点。在一个后深度学习时代，不同的学者对未来智能发展道路的理解逐渐清晰，当然也逐渐开始分化，由此导致了开展布局完全不同的研究工作。智源社区将系统分析全球范围内知名学者对未来研究布局的「研究思路」，以帮助大家思考人工智能的未来。

大数据文摘

2021-04-29

3680

从自动驾驶汽车开始，机器学习开始与物理世界交互

自动驾驶无人驾驶强化学习图像处理机器学习

智能体向我们通过电子商务网站向我们推荐产品，通过社交媒体为我们推荐新闻，通过交友应用向我们推荐朋友，实时为商品和服务定价等等。

大数据文摘

2021-04-14

3020

算法工程师到底是做什么的？

编程算法监督学习无监督学习强化学习机器学习

前者如实现一个功能、搭建一个服务、实现一种展现交互方式等。更关注的是如何实现功能，如何对于各种复杂甚至小众的场景都不出错。互联网中典型的后端、前端、平台、网络工程师的主要工作是这一类。

大数据文摘

2021-02-08

1.6K0

数字货币引发数字化市场与算法边界探讨

编程算法大数据强化学习神经网络深度学习

马云在10月24日，在中国金融四十人论坛（CF40）联合各组委会成员机构举办的第二届外滩金融峰会上提到数字货币，发表了非常高远的观点：“拿数字货币来说，如果用未来的眼光打造30年后世界所需的金融体系，数字货币可能是非常重要的核心。... 这个数字货币不是从历史上去找，不应该从监管角度去找，不应该从研究机构去找，而是从市场去找，从需求去找，从未来去找...因为数字货币体系是一个技术问题，但又不仅仅是技术问题，更是一个解决未来问题的方案，数字货币可能会重新定义货币，尽管货币的主要功能仍然在，但是一定会重新定义货币。”

大数据文摘

2020-10-30

3870

人类偏好的“可塑性”，从博弈说起

机器人强化学习编程算法

经济学家通过为人类受试者提供选择来套取他们的偏好。该技术广泛应用于产品设计、营销和交互式电子商务系统中。

大数据文摘

2020-10-30

4060

一周AI论文 | FB发布商业化图像识别系统，多任务学习还能这样用

https 网络安全编程算法强化学习机器学习

呜啦啦啦啦啦啦啦大家好，本周的AI Scholar Weekly栏目又和大家见面啦！

大数据文摘

2020-07-09

6310

智能体也“囚徒困境”？DeepMind设置强迫机制要求AI合作

游戏强化学习神经网络深度学习人工智能

最近DeepMind提出了一种新的强化学习技术，这种技术以一种全新方式来模拟人类行为。它可能会比之前发布的人工智能决策系统更强大，这对希望通过自动化提高生产率的企业来说可能是个福音。

大数据文摘

2020-03-18

4380

你一笑，AI就变聪明了！微软最新研究提出“微笑训练法”

强化学习机器学习神经网络深度学习

我们生活在一个人工智能爆炸发展的年代——每隔一小段时间，研究人员们就会想出新奇的人工智能训练方式。

大数据文摘

2020-02-21

5020

深度学习十年发展回顾：里程碑论文汇编

卷积神经网络深度学习神经网络强化学习机器学习

这篇文章概述了过去十年来最有影响力的一些论文。我希望通过简洁明了的摘要来提供深度学习领域不同方向的起点，并且提供了相当多的参考资料。

大数据文摘

2020-02-12

7050

变大、变大、再变大：长此以往，AI研究是死路一条？

深度学习人工智能神经网络强化学习

通过强大的云计算平台，人工智能研究人员已经能够在较短的时间训练更复杂的神经网络，这使得AI能够在计算机视觉、语音识别和自然语言处理等许多领域取得进展。

大数据文摘

2019-12-18

5250

点击加载更多

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态