fragment-shader - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签fragment-shader

#fragment-shader

为什么大模型总会“胡说八道“？一文彻底搞懂 RAG 知识库原理！

Lorin 洛林 2天前2026-07-25 20:29:27

随着大模型技术的发展，越来越多的企业开始尝试将大语言模型应用到实际业务场景中，例如企业知识问答、客服机器人、技术文档助手等。然而在实际落地过程中，人们很快发现一...

5210

RAG 工程里的上下文剪枝：如何减少 68% 的上下文

七牛开发者 12天前2026-07-15 14:30:00

做 RAG 时，我们会关注“如何召回更多内容”。去研究怎么切 chunk、怎么做 embedding、怎么混合关键词和向量检索、怎么做 rerank，让尽可能多...

8610

Elastic与Red Hat AI集成NVIDIA GPU加速技术

用户11764306 2026-05-072026-05-07 10:21:13

成功的企业AI部署需要从PB级的非结构化专有公司数据中检索上下文。这些RAG管道的核心是向量搜索。然而，随着数据量增长，构建这些向量索引往往成为瓶颈，阻碍部署并...

16910

RAG 是什么？16 种 RAG 方案一次讲清！AI 应用开发必学

曾高飞 2026-04-292026-04-29 20:12:28

最近这两年，只要你接触过 AI 编程，大概率听过一个词，RAG（Retrieval-Augmented Generation）。

1.1K10

LumberChunker：长叙事文档语义分割

用户11764306 2026-04-222026-04-22 18:10:44

作者：André V. Duarte, João Marques, Miguel Graça, Miguel Freire, Lei Li, Arlindo O...

20110

RAG技术驱动视频生成工作流

用户11764306 2026-04-212026-04-21 17:31:42

生成高质量的自定义视频仍然是一个重大挑战，因为视频生成模型受限于其预训练知识。这一限制影响了广告、媒体制作、教育和游戏等行业，这些行业中视频生成的定制化和控制至...

16410

使用Nemotron构建文档处理RAG管道

用户11764306 2026-04-212026-04-21 11:26:51

如果AI智能体能够即时解析复杂的PDF，提取嵌套表格，并像读取文本文件一样“看到”图表中的数据，会怎样？借助某机构的Nemotron RAG，您可以构建一个高吞...

19410

多智能体仓库AI指挥层技术架构

用户11764306 2026-04-052026-04-05 06:17:46

尽管仓库的自动化和数据丰富程度已达历史新高，但多数站点仍然依赖一套难以跟上节奏的系统：仓库管理系统（WMS）、少量仪表盘和分散的岗位知识。主管们需要管理12类以...

31510

RAG系统进阶：四大工程层根治AI幻觉

用户11764306 2026-03-272026-03-27 20:12:23

如果你仍在用2022年的方式构建检索增强生成系统，那你就已经落后了。那时，公式很简单：将文本切块、转为向量，然后输入给大语言模型。

28010

基于分布式搜索与AI的统一数据架构加速OODA决策循环

用户11764306 2026-03-272026-03-27 06:17:19

现代国防挑战的核心，往往不在于信息匮乏，而在于如何从海量信息中快速提取有效洞察。这对于关键任务国防行动中的高效决策至关重要。英国国防部已将数据驱动行动作为战略重...

25510

使用LlamaIndex与OpenAI构建具备自我评估能力的智能体AI系统

用户11764306 2026-01-302026-01-30 12:30:27

在本教程中，将构建一个使用LlamaIndex和OpenAI模型的高级智能体AI工作流。重点关注设计一个可靠的检索增强生成（RAG）智能体，使其能够基于证据进行...

27810

RAG性能调优实战入门：从延迟高、回答飘到响应快、答案准

用户5778262 2026-01-242026-01-24 17:58:10

在大模型（LLM）应用落地的浪潮中，检索增强生成（Retrieval-Augmented Generation, RAG）因其无需微调、知识可更新、成本可控等优...

1.3K10

基于企业数据构建可扩展AI：Nemotron RAG与SQL Server 2025整合架构解析

用户11764306 2026-01-152026-01-15 12:31:24

在某中心Ignite 2025大会上，某中心SQL Server 2025的发布标志着企业级AI就绪数据库愿景的实现，为开发者提供了内置向量搜索和用于调用外部A...

31510

从理解到记忆再到回答：Embedding→向量数据库→RAG 的完整链路

闫同学 2025-12-032025-12-03 19:17:34

在AI大模型技术爆火之前，"向量"、"相似度"、"召回"这些词还只是少数算法工程师的专业术语。但自从以ChatGPT为代表的LLM技术爆火、RAG 爆发以及团...

2.2K93

LLM&RAG快速应用小册-极客时间

jhhghj 2025-11-212025-11-21 10:18:11

随着人工智能技术的飞速发展，大语言模型（LLM）已成为教育领域的重要辅助工具。然而，传统大模型在知识更新、事实准确性以及个性化内容生成方面仍存在局限。在此背景下...

28210

学习向量数据库与 RAG 架构

用户5806226 2025-10-242025-10-24 18:26:12

- **定义**：将文本、图像、音频等非结构化数据转换为高维数值数组（向量），捕捉数据的语义或特征。例如，“猫”和“狗”的向量距离比“猫”和“汽车”更近。

1.3K10

基于某中心的自动化智能RAG管道构建指南

用户11764306 2025-09-232025-09-23 18:24:04

检索增强生成（RAG）是将大语言模型与企业知识库连接的关键技术。然而构建可靠的RAG管道需要反复测试不同配置（分块策略、嵌入模型、检索技术等），传统手动管理方式...

33710

优化大语言模型性能与输出质量实用指南

用户11764306 2025-09-172025-09-17 11:18:57

大语言模型具有巨大潜力，但远非完美。最突出的痛点在于输出结果的不一致性——由于模型本质是概率性而非确定性的，即使输入完全相同也可能产生截然不同的输出。另一个众所...

38810