RAG(检索增强生成)是解决大模型幻觉、私有知识接入的核心技术。结合智能体即服务(AaaS),企业可以构建7x24小时在线的知识库问答系统。
本文介绍使用 Dify(开源智能体编排平台) + 腾讯云向量数据库 搭建企业级RAG知识库。
text
企业文档(PDF/Word/网页)
↓
文档解析(Dify)
↓
向量化(混元Embedding)
↓
腾讯云向量数据库(存储)
↓
用户提问 → 向量检索 → 召回相关文档
↓
大模型(混元/DeepSeek)生成回答
↓
返回答案 + 引用来源推荐使用腾讯云轻量应用服务器一键部署Dify:
bash
# 在轻量服务器上运行
docker run -d --name dify \
-p 80:80 \
-v dify_data:/app/data \
langgenius/dify或者使用腾讯云容器服务TKE部署生产级Dify。
在Dify的.env配置文件中:
bash
# 向量数据库配置
VECTOR_STORE=tencent
TENCENT_VECTOR_DB_URL=your-instance-url
TENCENT_VECTOR_DB_API_KEY=your-api-key
TENCENT_VECTOR_DB_DATABASE=dify_db重启Dify容器。
在Dify控制台:
在Dify中创建工作流:
yaml
nodes:
- id: start
type: input
- id: knowledge_retrieval
type: knowledge_retrieval
config:
knowledge_base_id: "company_docs"
top_k: 5
- id: llm_generate
type: llm
config:
model: "hunyuan-lite" # 腾讯混元模型
prompt: |
你是企业客服助手。根据以下资料回答用户问题。
资料:{{knowledge_retrieval.output}}
问题:{{start.query}}
要求:如果资料中没有答案,请说“暂时无法回答”。
- id: output
type: outputDify支持将工作流发布为API:
bash
curl -X POST https://your-dify/api/v1/workflows/run \
-H "Authorization: Bearer your-api-key" \
-d '{"inputs": {"query": "公司年假多少天"}}'也可以发布到企业微信机器人,员工直接在群里@机器人提问。
组件 | 规格 | 月成本 |
|---|---|---|
腾讯云向量数据库 | 入门型1核2GB | 约200元 |
轻量应用服务器 | 2核4GB | 约100元 |
混元API调用 | 按token | 约50元/万次 |
总计 | 约350元/月 |
企业级RAG系统,每月几百元即可运行。
OPC中国倡导的一人公司,可以利用这套方案为企业客户提供:
互动: 你尝试过哪种RAG方案?欢迎对比选型经验。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。