腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
腾讯云TVP
专栏成员
举报
452
文章
641111
阅读量
425
订阅数
订阅专栏
申请加入专栏
全部文章(452)
企业(93)
腾讯云(84)
腾讯云开发者社区(45)
行业(41)
云计算(39)
模型(32)
数据(32)
开发者(31)
腾讯(31)
devops(29)
数据库(28)
大数据(28)
腾讯云 tvp(28)
人工智能(26)
科技(25)
开源(21)
架构(21)
视频(21)
运维(20)
微服务(20)
互联网(20)
产品(19)
系统(19)
工作(17)
管理(17)
程序员(15)
实践(15)
DeepSeek(15)
云直播(13)
数据分析(13)
服务(13)
研发(13)
微信(12)
架构师(12)
工具(11)
区块链(10)
sql(10)
深度学习(10)
网络安全(10)
腾讯云架构师技术同盟(10)
金融(9)
工业物联(9)
serverless(9)
编程算法(9)
二维码(9)
效率(9)
大模型知识引擎(9)
容器(8)
物联网(8)
aigc(8)
软件(8)
数据万象(7)
分布式(7)
小程序(7)
开发(7)
LLM(7)
自动驾驶(6)
神经网络(6)
kubernetes(6)
云函数(5)
腾讯云区块链服务平台 TBaaS(5)
网站(5)
无人驾驶(5)
机器人(5)
https(5)
汽车(5)
小程序·云开发(5)
cto(5)
创业(5)
官方文档(4)
云数据库 Redis®(4)
api(4)
数字营销(4)
智慧零售(4)
数据安全(4)
存储(4)
游戏(4)
安全(4)
系统架构(4)
架构设计(4)
教育(4)
智能制造(4)
程序(4)
设计(4)
音视频(4)
云原生(4)
重构(4)
云镜(主机安全)(3)
NLP 服务(3)
java(3)
python(3)
.net(3)
html(3)
ide(3)
容器镜像服务(3)
cdn 边缘计算(3)
出行(3)
http(3)
面向对象编程(3)
数据处理(3)
安全治理(3)
云开发(3)
CODING DevOps(3)
即时通信 IM(3)
连接(3)
网络(3)
云服务(3)
云服务器(2)
负载均衡(2)
javascript(2)
c#(2)
nosql(2)
linux(2)
unix(2)
spring(2)
实时音视频(2)
音视频点播加速(2)
消息队列 CKafka 版(2)
企业邮箱(2)
tencent hub(2)
TAPD 敏捷项目管理(2)
腾讯云测试服务(2)
图像处理(2)
腾讯乐享(2)
DevOps 解决方案(2)
游戏解决方案(2)
电商(2)
医疗(2)
自动化(2)
缓存(2)
html5(2)
推荐系统(2)
智能教育(2)
腾讯会议(2)
迁移(2)
智能推荐平台(2)
huggingface-transformers(2)
边缘计算(2)
低代码(2)
高可用(2)
工业互联网(2)
公有云(2)
基础(2)
计算机(2)
计算机视觉(2)
解决方案(2)
流量(2)
内核(2)
同步(2)
性能(2)
优化(2)
最佳实践(2)
自动推理(2)
第四期热点征文-大模型技术(2)
对象存储(1)
语音识别(1)
人脸识别(1)
创业扶持(1)
腾讯云学堂(1)
比特币(1)
数据挖掘(1)
机器学习(1)
ios(1)
go(1)
node.js(1)
oracle(1)
打包(1)
git(1)
github(1)
负载均衡缓存(1)
apache(1)
GPU 云服务器(1)
容器服务(1)
移动直播(1)
腾讯云可观测平台(1)
访问管理(1)
云数据库 MongoDB(1)
TDSQL MySQL 版(1)
devmaster(1)
cci 持续集成(1)
腾讯企点(1)
物联网通信(1)
视频处理(1)
mongodb(1)
高性能计算(1)
微服务与微计算(1)
互动课堂(1)
智慧市政(1)
微信生态上云方案(1)
互联网金融(1)
压力测试(1)
jvm(1)
强化学习(1)
unity(1)
自动化测试(1)
二叉树(1)
敏捷开发(1)
jenkins(1)
kernel(1)
spring cloud(1)
数据可视化(1)
企业组织(1)
游戏联机对战引擎mgobe(1)
对话机器人(1)
数据安全治理中心(1)
云开发静态网站托管(1)
sdk(1)
腾讯微服务观测平台 tsw(1)
实时数据集成(1)
服务网格(1)
微搭低代码(1)
智能创作(1)
腾讯云智绘(1)
数据集成(1)
项目管理(1)
持续集成(1)
产业互联网学堂(1)
chatgpt(1)
cloud(1)
it(1)
olap(1)
saas(1)
scaling(1)
soa(1)
vr(1)
笔记(1)
编译(1)
编译器(1)
表格(1)
布局(1)
部署(1)
大数据处理(1)
登录(1)
二进制(1)
分布式系统(1)
服务器(1)
工程师(1)
公众号(1)
工作流(1)
函数(1)
后台(1)
技巧(1)
集群(1)
架构模式(1)
监控(1)
教程(1)
进程(1)
开发环境(1)
开源软件(1)
框架(1)
蓝牙(1)
领域驱动设计(1)
浏览器(1)
敏捷(1)
软件开发(1)
生命周期(1)
事件(1)
事务(1)
时序数据库(1)
数据仓库(1)
数据管理(1)
通信(1)
图数据库(1)
团队管理(1)
性能优化(1)
虚拟机(1)
异步(1)
音频(1)
硬件(1)
有赞(1)
语音(1)
原理(1)
元宇宙(1)
终端(1)
组件化(1)
私有云(1)
云架构(1)
云函数(1)
OLTP(1)
深度学习框架(1)
脑机接口(1)
向量数据库(1)
腾讯混元大模型(1)
腾讯云TVP读书会(1)
幻兽帕鲁(1)
大模型部署(1)
搜索文章
搜索
搜索
关闭
The Three-Stage Scaling Laws Large Language Models
LLM
Mr. Huang's background features three S-curves, illustrating the scaling relay race across three stages of large language models, demonstrating a persistent spirit akin to the Chinese fable of the legendary Old Man Who Moved Mountains.
立委
2025-03-03
32
0
大模型三阶段的 scaling laws 接力赛
大模型知识引擎
LLM
黄教主背后是三个S曲线,illustrate 的是大模型三个阶段的“做大做强”的 scaling 接力赛,颇显挖山不止的愚公移山精神。
立委
2025-03-03
40
0
深度学习的局限性研究综述
深度学习
深度学习模型本质上是高维概率密度估计器,它的核心目标是通过参数θ找到条件概率分布P(y|x;θ)的最佳近似。模型通过学习大量的训练数据,试图捕捉数据中的大大小小的统计规律,并将其泛化到未知数据。然而,这种统计学习范式决定了一个根本性问题:模型学习的是P(y|x)而非P(x→y),即统计相关性而非因果关系。
立委
2025-03-03
47
0
左脚踩右脚可以飞吗,谈交替使用监督微调和强化学习的后训练
LLM
大模型知识引擎
在大模型后训练中,像deepseek R1那样交替使用监督微调(SFT)和强化学习(RL),而非单一依赖 RL 或蒸馏,背后的核心逻辑如下。
立委
2025-02-28
74
0
o3 Deep Research: DeepSeek R1 多阶段训练流程问答解析
大模型知识引擎
LLM
A: DeepSeek R1 采用了四阶段的训练流程,包括两个强化学习(RL)阶段和两个监督微调(SFT)阶段 (DeepSeek-R1的四个训练阶段 - 蝈蝈俊 - 博客园)。这一多阶段策略旨在先通过少量数据稳定模型输出格式,然后大规模提升推理能力,接着扩展通用能力,最后对齐人类偏好,逐步打造出既擅长推理又安全实用的模型 (DeepSeek-R1的四个训练阶段 - 蝈蝈俊 - 博客园) (DeepSeek-R1的四个训练阶段 - 蝈蝈俊 - 博客园)。具体来说:
立委
2025-02-28
200
0
关注专栏作者,随时接收最新技术干货
TVP官方团队
腾讯 | 产品经理
关注
eygle
云和恩墨信息技术有限公司 | 首席架构师
关注
立委
关注
朱峰
上海斐鸿网络科技有限公司 | 技术经理
关注
RPA 赛道与大模型Co-pilots早期创业者的困局
大模型知识引擎
- 传统 RPA:依赖工程师编写脚本或流程图(如 UiPath 的拖拽式设计器),需精准定义每一步操作逻辑,如同教机器人跳格子,容错率低。 - LLM Agent:直接理解人类意图("把邮件里的发票信息录入系统"),自主拆解任务链条,动态调整执行路径。 - 典型案例:ChatGPT 插件系统已能调用 API 完成订机票、查数据等操作,而传统 RPA 实现同等功能需低代码脚本。
立委
2025-02-27
68
0
DeepSeek 技术跃迁:AI 应用的下一站在哪?
开发者
实践
视频
同步
DeepSeek
2025 年,DeepSeek 以颠覆性技术突破重构全球 AI 竞争格局,其创新的多模态架构与超大规模推理能力,不仅激起了 AGI 技术的进化浪花,更在产业实践的深水区掀起了一场智能化落地的应用热潮。
TVP官方团队
2025-02-27
155
0
Linguists Should Find Self-Attention Intuitively Familiar
huggingface-transformers
LLM
For linguists bewildered by large language models (LLMs), the confusion often stems from terminology and implementation details obscuring shared foundational principles. Let’s cut through the noise and focus on self-attention — the beating heart of the Transformer architecture.
立委
2025-02-25
50
0
语言学家应该很容易理解自注意力机制
深度学习
深度学习框架
如果语言学家以前觉得大模型烧脑和不解,那是因为窗户纸没有捅破,存在不同体系下的术语与机制细节的理解障碍,但底层逻辑并不乏不少共同的东西。本篇聚焦在大模型Transformer架构中的核心注意力机制的理解。
立委
2025-02-24
113
0
符号主义被打入冷宫太久了,难道神经是AI的终结者吗?
人工智能
深度学习
虽然没人可以预测未来,虽然抛弃两条路线的一条感觉政治不正确,但的确不能排除这种单极主义的可能性。
立委
2025-02-24
59
0
立委科普:如何理解自注意力机制中的QKV分工?
深度学习
大模型知识引擎
为了学习序列上下文的依赖关系,为什么序列中的每一个 token 都要派生出三个分工角色:Q(Query),K(Key),V(Value)?
立委
2025-02-21
196
0
Transformer 和注意力机制简介
huggingface-transformers
大模型知识引擎
基础大模型通过原始大数据的“自监督学习”(self-srupervised learning),利用多层神经网络,获得数据相关的知识。自监督学习是一种特别的监督学习,它利用“掩码”获得监督信号。我们知道监督学习的训练数据是标注了输出目标作为监督信号的学习,但自监督无需人类标注,而是在数据中遮盖了部分数据点,让系统学习预测它(“填空”或“接龙”),以被遮盖的数据点作为标准答案和监督信号。主流的GPT大模型的掩码就是遮盖住下一个词,让系统仅仅根据上文来预测它(叫 next token prediction),这是当前生成式AI的主流模型。
立委
2025-02-21
149
0
DeepSeek重新定义未来应用场景,如何拿到新船票?
模型
实践
视频
DeepSeek
二维码
2025 年开年,技术圈迎来了“AI 领域的史普尼克时刻”。当全球 AI 竞赛进入深水区,DeepSeek 凭借其创新的架构设计与开源生态的双向突破,不仅掀起新一轮 AI 创新热潮,更引发业内对应用场景的广泛探索,国民级应用微信接入 R1 上线「AI 搜索」,各大厂商纷纷将 DeepSeek 嵌入业务。
TVP官方团队
2025-02-20
135
0
True Story Behind DeepSeek: Learning to Think Slowly Without Human Supervision
DeepSeek
InfoQ: "DeepSeek adheres to a pure reinforcement learning approach, but the industry often refers to RL as 'alchemy' - how did they make this process controllable and accessible? What's innovative about their reasoning paradigm?"
立委
2025-02-16
53
0
Does the New Reasoning Paradigm (Query+CoT+Answer) Support a New Scaling Law?
DeepSeek
— Reflections on LLM Scaling Laws and DeepSeek's R1
立委
2025-02-14
43
0
Technical Deep Dive: Understanding DeepSeek R1's Reasoning Mechanism
DeepSeek
A detailed analysis of how DeepSeek R1's inference mechanism works in production, and how it differs from training-time reinforcement learning.
立委
2025-02-14
66
0
DeepSeek 大爆发,带来了哪些新希望?
产品
开发者
系统
DeepSeek
腾讯云
2025 开年,DeepSeek 率先引爆技术圈,一篇篇解读文章与一个个充满戏剧性的故事,不断地挑动着每一个关注国内大模型发展的技术人。但与之相伴的,众多质疑也纷至沓来。DeepSeek 的技术与意义被不断分析、重构,被反复赋予新的解读。
TVP官方团队
2025-02-14
159
0
高可用架构:你努力打地基,别人只看高楼
研发
高可用
架构
架构师
系统
7月,全球多地的Windows操作系统出现蓝屏现象,导致全球航空公司、银行、医院等多个行业的业务系统受到影响。12月,OpenAI的Kubernetes集群发生故障,导致ChatGPT、API等服务出现严重性能下降或完全不可用。
TVP官方团队
2025-02-14
41
0
做ToB,太难了!
腾讯云
视频
腾讯
企业
云计算
有人说,我们现在正处于一个乌卡时代(VUCA):易变性(Volatility)、不确定性(Uncertainty)、复杂性(Complexity)和模糊性(Ambiguity)充斥其间,没有人能对未来做出精准的预言,也没有人能找到永远赚钱的路径。
TVP官方团队
2025-02-14
63
0
DeepSeek 笔记:推理新范式 query+cot+answer 支持新的 scaling law 吗?
scaling
自动推理
DeepSeek
老友张俊林《从Deepseek R1看Scaling Law的未来》一文,引起老友热议。
立委
2025-02-14
140
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档