首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >RAG-全链路问答系统:从零到容器化部署的终极指南

RAG-全链路问答系统:从零到容器化部署的终极指南

作者头像
Lethehong
修改2025-12-14 21:39:13
修改2025-12-14 21:39:13
4711
举报
概述
本指南帮你把一个本地 RAG(Retrieval-Augmented Generation)示例工程整理成可直接构建与运行的 Git 项目,并提供在 cnb.cool(CNB)上自动化构建的
文章被收录于专栏:DockerDocker

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
  • 第一步:把项目准备成 Git 仓库(本地目录与关键文件)
    • 1️⃣添加必要文件
    • 2️⃣运行容器
    • 3️⃣验证接口(关键验证)
  • 第二步:向 RAG 系统“喂知识”(/ingest)
    • 1️⃣ 执行 ingest 请求
    • 2️⃣正确返回结果
  • 第三步:发起问题(/query,不用 OpenAI)
    • 1️⃣ 执行 query 请求
    • 2️⃣ 正确返回示例
  • 第四步(可选):开启真正的 LLM(OpenAI)
    • 1️⃣ 启动容器时注入 API Key
    • 2️⃣ 使用 LLM 查询
    • 3️⃣ 你会看到更自然的回答(由大模型生成)
  • 第五步:向量持久化
    • 1️⃣优化 app/retriever.py(支持持久化)
    • 2️⃣正确的 Docker run(持久化)
    • 3️⃣此时我们在重新测接口
  • 第六步:把项目在 CNB 上自动化
  • 总结
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档