前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >能将大模型RAG流程可视化的开源工具—RAGxplorer

能将大模型RAG流程可视化的开源工具—RAGxplorer

作者头像
山行AI
发布2024-01-29 14:40:38
5510
发布2024-01-29 14:40:38
举报
文章被收录于专栏:山行AI山行AI

RAGxplorer 🦙🦺

RAGxplorer是一个交互式的streamlit工具,用于支持构建基于检索增强生成(Retrieval Augmented Generation, RAG)的应用程序,通过可视化文档块和嵌入空间中的查询来实现。

演示 🔎

Streamlit应用程序

⚠️由于基础设施限制,这个免费托管的演示可能偶尔会停机。最佳体验是克隆这个仓库,并在本地运行。

特点 ✨

文档上传:用户可以上传PDF文档。•块配置:配置块大小和重叠的选项。•嵌入模型选择all-MiniLM-L6-v2text-embedding-ada-002。•向量数据库创建:使用Chroma构建向量数据库。•查询扩展:生成子问题和假设答案,以增强检索过程。•交互式可视化:使用Plotly来可视化块。

本地安装 ⚙️

要运行RAGxplorer,请确保已安装Python,然后安装必要的依赖项:

代码语言:javascript
复制
pip install -r requirements-local-deployment.txt

提示

⚠️ 不要使用requirements.txt。那是为了免费的streamlit部署能够运行。该文件包括额外的pysqlite3-binary依赖。

⚠️ 如果对故障排除有帮助,该应用程序是使用Python 3.11构建的。

使用 🏎️

1.设置OPENAI_API_KEY(必需)和NYSCALE_API_KEY(如果您需要anyscale)。复制.streamlit/secrets.example.toml文件到.streamlit/secrets.toml并填写值。

2.要启动应用程序,请运行:

代码语言:javascript
复制
streamlit run app.py

3.您可能需要注释掉/移除app.py中的第5-7行。

代码语言:javascript
复制
import('pysqlite3')
import sys
sys.modules['sqlite3'] = sys.modules.pop('pysqlite3')

注意

这个仓库目前链接到streamlit演示,并且这些行是由于免费streamlit部署环境中的运行时添加的。参见这里[1].

引用

更多信息请参考:https://github.com/gabrielchua/RAGxplorer

References

[1] https://github.com/gabrielchua/RAGxplorer

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2024-01-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 山行AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • RAGxplorer 🦙🦺
    • 演示 🔎
      • 特点 ✨
        • 本地安装 ⚙️
          • 提示
        • 使用 🏎️
          • 注意
        • 引用
          • References
      相关产品与服务
      向量数据库
      腾讯云向量数据库(Tencent Cloud VectorDB)是一款全托管的自研企业级分布式数据库服务,专用于存储、检索、分析多维向量数据。该数据库支持多种索引类型和相似度计算方法,单索引支持千亿级向量规模,可支持百万级 QPS 及毫秒级查询延迟。腾讯云向量数据库不仅能为大模型提供外部知识库,提高大模型回答的准确性,还可广泛应用于推荐系统、自然语言处理等 AI 领域。
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档