第四期热点征文-大模型技术 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签第四期热点征文-大模型技术

#第四期热点征文-大模型技术

大模型输出安全体系：风控检测、敏感熔断、内容降级与合规策略机制实践.167

未闻花名 2小时前2026-07-16 10:33:31

大模型输出风控，是针对大模型生成的文本内容，在模型推理生成后、用户展示前，进行全方位安全检测、违规判定、风险拦截的一套技术体系。大模型具备强大的自然语言生成能力...

100

大模型内容安全实时防护：恶意Prompt注入拦截、越权阻断与熔断机制方案.166

未闻花名 1天前2026-07-15 10:51:41

现在不管是内部知识库问答、办公AI助手，还是面向用户的对话产品，基本都离不开大模型能力加持。但很多业务在落地时，只看重模型能不能回答问题、能不能生成内容，却很容...

4220

大模型服务熔断限流计费联动：异常流量风控拦截与超限自动降配架构实践.165

未闻花名 1天前2026-07-14 16:45:47

服务熔断是分布式架构与大模型推理服务中必备的故障隔离机制，类比电路中的保险丝设计逻辑。当底层大模型推理接口出现连续报错、响应超时、GPU显存溢出、服务进程卡死等...

6510

大模型服务隔离与舱壁模式：构建防过载、防独占高可用架构应用实践解析.164

未闻花名 2天前2026-07-13 14:44:58

大模型服务隔离是将大模型服务的计算资源、请求链路、内存、GPU 显存、网络连接、请求等待队列等核心软硬件资源，进行物理层面或逻辑层面的拆分与划分，让不同用户群体...

11400

构建高可用大模型应用架构：大模型服务进程保活 + 全自动故障自愈实践.163

未闻花名 3天前2026-07-12 16:11:11

指通过技术手段持续监控大模型运行进程，确保模型服务不意外退出、不被系统杀死、不静默挂起，核心目标是维持模型服务的持续在线状态，是大模型提供稳定推理、训练服务的基...

14220

SSE流式传输稳定性进阶：心跳保活、断连重连、分片处理与双端容错实战.162

未闻花名 5天前2026-07-11 08:42:14

SSE，全称Server-Sent Events，即服务器推送事件，是基于HTTP长连接的单向流式传输协议，核心能力是服务器持续向客户端推送数据，无需客户端反复...

20710

大模型超时控制与异常重试机制：分级超时、幂等重试、退避策略与雪崩防护.161

未闻花名 6天前2026-07-10 10:32:15

大模型超时控制，是部署在客户端、应用服务层、网关层、模型推理服务层的多层级资源管控机制。指系统为单次大模型推理请求、会话连接、流式数据分片传输设定最大允许运行时...

10800

GGUF quantizer 独立指认 Transformer 三段式深度结构

山野大叔 6天前2026-07-09 17:15:22

我们刚刚完成了老旧 V100 上 bs=1 decode 的收官优化——Qwen3-8B TPOT 34.53 → 22.39 ms（1.54×），追回 lla...

7200

大模型应用：避免大模型服务雪崩：深入解析AI场景下熔断机制设计与应用实践.160

未闻花名 6天前2026-07-09 14:27:33

随着各种大模型AI服务深度接入业务系统，AI调用已成为各类应用的核心链路，相较于传统后端接口、数据库、缓存等基础服务，大模型推理服务具备独有且不可忽视的运行特性...

25310

大模型API连续对话交互：上下文持久化、会话状态管理与轻量化Token节流实践.159

未闻花名 7天前2026-07-08 17:30:36

在大模型应用实际落地场景中，单次独立问答已经无法满足实际业务需求。无论是办公协同智能体、行业咨询机器人、专属业务问答系统，还是私有化部署的大模型应用，都需要支撑...

16211

隐私保护新范式：基于混元大模型生成无效内容，数据脱敏、测试数据填充、隐私保护.158

未闻花名 9天前2026-07-07 08:43:00

当下大模型的主流应用，大多聚焦于有效内容生产，例如文案创作、代码编写、逻辑推理、知识问答、业务方案输出等。行业内普遍追求模型输出内容的准确性、逻辑性、实用性与业...

19521

KV Cache优化实战：分层量化、动态淘汰、全局共享，攻克长上下文显存难题.157

未闻花名 10天前2026-07-06 08:28:06

在大模型的推理过程中，KV Cache 是专门为Transformer注意力机制设计的中间结果缓存技术。我们先回归Transformer 的核心：自注意力机制（...

29610

大模型多租户隔离：资源隔离、权限管控、性能互不干扰，SaaS落地场景实战.156

未闻花名 11天前2026-07-05 11:55:13

在SaaS软件即服务模式中，多租户指的是：一套大模型服务集群，同时为多个独立的租户（企业、用户、团队）提供服务，租户之间逻辑上完全独立、物理上共享基础设施；而多...

20310

深入解析Token节流机制：用户维度 + 场景维度 + 频率限制的大模型降本方案.155

未闻花名 12天前2026-07-04 11:40:34

Token作为大模型计费、上下文窗口限制、推理性能评估的核心计量单位，直接关联企业采购费用、接口调用配额、服务稳定性三大关键指标。多数企业初期落地大模型应用时，...

23812

大模型去智能化实践：从复杂到极简：剥离复杂能力与低端设备、隐私场景适配.154

未闻花名 13天前2026-07-03 06:59:32

大模型去智能化，并非消除模型的智能推理能力，而是对主流模型做定向能力裁剪、结构精简、参数压缩、计算简化，剥离非必要的复杂能力，如多轮长对话、多模态理解、超长文本...

14020

大模型对抗性训练：防御Prompt攻击与恶意生成生成攻击，提升模型安全性.153

未闻花名 14天前2026-07-02 08:22:31

当前主流大模型基于Transformer架构，通过海量文本数据进行预训练，具备理解自然语言、生成文本、逻辑推理、对话交互等核心能力。我们日常使用的智能对话、文案...

23410

大模型反向优化传统算法：用大模型学习传统算法的缺陷，反向迭代算法逻辑.152

未闻花名 15天前2026-07-01 09:13:52

大模型反向优化传统算法，是以大模型为智能中枢，先精准识别传统算法在特定场景下的固有缺陷、性能瓶颈、逻辑漏洞，再通过大模型的泛化学习、逻辑推理、参数优化能力，反向...

13610

企业AI大模型应用基础设施演进四阶段：从能用、好用，到智能与最优

用户10219765 15天前2026-06-30 15:12:06

其实，企业AI基础设施的演进是有规律的，大致可以分为四个阶段。今天我们就来聊聊这四个阶段的演进逻辑，以及为什么智能调度（阶段4）是当前企业AI架构的必然选择。

13710

#第四期热点征文-大模型技术

大模型输出安全体系：风控检测、敏感熔断、内容降级与合规策略机制实践.167

大模型内容安全实时防护：恶意Prompt注入拦截、越权阻断与熔断机制方案.166

大模型服务熔断限流计费联动：异常流量风控拦截与超限自动降配架构实践.165

大模型服务隔离与舱壁模式：构建防过载、防独占高可用架构应用实践解析.164

构建高可用大模型应用架构：大模型服务进程保活 + 全自动故障自愈实践.163

SSE流式传输稳定性进阶：心跳保活、断连重连、分片处理与双端容错实战.162

大模型超时控制与异常重试机制：分级超时、幂等重试、退避策略与雪崩防护.161

GGUF quantizer 独立指认 Transformer 三段式深度结构

大模型应用：避免大模型服务雪崩：深入解析AI场景下熔断机制设计与应用实践.160

大模型API连续对话交互：上下文持久化、会话状态管理与轻量化Token节流实践.159

隐私保护新范式：基于混元大模型生成无效内容，数据脱敏、测试数据填充、隐私保护.158

KV Cache优化实战：分层量化、动态淘汰、全局共享，攻克长上下文显存难题.157

大模型多租户隔离：资源隔离、权限管控、性能互不干扰，SaaS落地场景实战.156

深入解析Token节流机制：用户维度 + 场景维度 + 频率限制的大模型降本方案.155

大模型去智能化实践：从复杂到极简：剥离复杂能力与低端设备、隐私场景适配.154

大模型对抗性训练：防御Prompt攻击与恶意生成生成攻击，提升模型安全性.153

大模型反向优化传统算法：用大模型学习传统算法的缺陷，反向迭代算法逻辑.152

企业AI大模型应用基础设施演进四阶段：从能用、好用，到智能与最优

热门专栏

腾讯云开发者社区头条

玩转全栈

腾讯云TVP

三掌柜的技术空间

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐