前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >工程落地实践|基于 ChatGLM2-6B + LangChain 搭建专属知识库初步完成

工程落地实践|基于 ChatGLM2-6B + LangChain 搭建专属知识库初步完成

作者头像
技术人生黄勇
发布2024-07-19 18:29:17
620
发布2024-07-19 18:29:17
举报
文章被收录于专栏:技术人生黄勇

经过前期的探索和准备,我们终于迈出了第一步:使用 ChatGPT 和 LangChain这些强大的工具,初步完成了专属知识库的搭建。

01

继昨天部署 ChatGLM2-6B 成功后,工程落地实践|国产大模型 ChatGLM2-6B 阿里云上部署成功,今天继续向“专属知识库”的目标前进。‍‍

在成功部署 ChatGPT 模型的基础上,用咱们国产的大模型 ChatGLM ,以及 LangChain 开源框架搭建“个人专属知识库”。

LangChain:是现在最流行围绕大语言模型构建的框架,可用于聊天机器人、生成式问答 (GQA)、摘要等。‍‍‍‍

朋友们可以上传自己感兴趣的文章、资料到这个知识库中。之后,大模型就可以根据这些个人资料,利用其强大的推理能力,回答朋友们提出的相关问题。

‍‍‍

例如:收集某位喜欢的公众号或博主的文章,上传到自己的知识库。当您对这些内容有任何疑问时,知识库就可以为您提供解答。这就像拥有一个私人的、基于自身兴趣的问答专家。

因为之前经历过一次次踩坑填坑的过程,这次搭建过程还算顺利,没过多久,Web 界面就成功启动了。‍‍

02

  1. 系统支持直接和大模型聊天对话,和知识库对话。
  2. 支持切换后面支持的大模型:ChatGLM,Chatyuan,Vicuna,Bloom,Baichuan,Ggml,FastChat,OpenAI-ChatGPT。
  3. 和知识库对话需要新建知识库(不支持中文名字知识库名),再上传知识文件/文件夹,等待后台将知识文件的内容向量化后,就可以向知识库提问。 ‍

您已进入知识库测试模式,您输入的任何对话内容都将用于进行知识库查询,并仅输出知识库匹配出的内容及相似度分值和及输入的文本源路径,查询的内容并不会进入模型查询。

知识相关度 Score 经测试,建议设置为 500 或更低,具体设置情况请结合实际使用调整。3. 使用"添加单条数据"添加文本至知识库时,内容如未分段,则内容越多越会稀释各查询内容与之关联的score阈值。

单条内容长度建议设置在100-150左右。

用一个问题试试知识库:

往期热门文章推荐:

又一家顶级的大模型开源商用了!Meta(Facebook)的 Llama 2 搅动大模型混战的格局

Claude 2 解读 ChatGPT 4 的技术秘密:细节:参数数量、架构、基础设施、训练数据集、成本

AI人工智能大模型失守!ChatGPT、BARD、BING、Claude 相继被"提示攻击"攻陷!

为什么对ChatGPT、ChatGLM这样的大语言模型说“你是某某领域专家”,它的回答会有效得多?(二)

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-07-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 技术人生黄勇 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云服务器利旧
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档