前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >关于语言模型私有化部署的讨论 | AIGC实践

关于语言模型私有化部署的讨论 | AIGC实践

作者头像
睿齐
发布2024-02-26 15:02:42
1950
发布2024-02-26 15:02:42
举报
文章被收录于专栏:见睿思齐见睿思齐

上周在与TC同行关于AIGC实践的线上交流中,大家普遍比较关心的一个实践切入点是:语言模型的私有化部署——简单来说,就是在企业内部,部署一个属于自己的“ChatGPT”,对于本行业/专业知识,以及企业独有的产品和技术信息有充分的了解,并且提供用户接口,通过自然语言交流,解答内外部用户的问题。

其实,在此前/此后的多次单点交流中,也有不同行业的朋友向我咨询相同问题。可见,任何人在体验过ChatGPT超强的语言能力后,都不难意识到,这种交互方式必将会成为未来非常重要的应用场景。

这段时间,我花了不少时间做调研;并且,由于我司主营AI计算设备及软件,也刚好具备相关技术背景,于是便近水楼台地与研发Lead和产品经理分别进行交流,看看是否有机会率先实施并落地一个内部应用。

在此梳理一下相关脉络,做一个简单的分享,希望可以给到有相同问题的朋友一点启发。

主题图Prompt:Privatization Deployment of Large Language Models. technological style. --ar 16:9

基本分析

语言模型私有化部署的应用场景,可谓显而易见。

典型场景包括:

  • 内部知识库:提供企业内部的知识共享平台。
  • 智能客服机器人:提供获取产品/技术信息的用户接口。
  • 专家咨询机器人:提供医疗、律师等专业领域的咨询服务。

应用范围非常广泛,几乎可以涵盖所有专业咨询行业,以及所有对外输出产品和服务的企业。应用价值就更不必说了:

  • 技术革新,全面推进AI化进程。所谓的“第四次工业革命”,具有划时代意义;
  • 降本增效。既然AI可以又快又好地完成任务,自然也就不需要付出人工成本。

实现部署的相关资源包括:

  • 硬件:LLM对算力有比较高的要求。
  • 模型:可采用免费的开源模型。
  • 语料库:包括但不限于行业/专业信息;以及企业的产品/技术信息。
  • 算法:需要比较专业的算法工程师参与进行模型训练/微调。

研发观点

从研发的角度来看,实现语言模型私有化部署,还是非常有希望的。

实现语言模型私有化部署的系统架构,主要包括:

  • LLM:语言模型;
  • KB:知识库;
  • 框架:将LLM和KB建立联系;
  • UI:用户界面。

其中,LLM可采用2种方式实现:

  • 使用公共模型:通过调用API接口使用OpenAI GPT-3.5
  • 使用开源模型:使用开源模型ChatGLM,但开源不能商用。参考: https://github.com/imClumsyPanda/langchain-ChatGLM

部署逻辑分别为:

使用公共模型部署逻辑

使用开源模型部署逻辑

KB的输入是语料库,然后经过一系列处理,成为可被LLM调取的知识。

语料库的准备比较简单,只需要保证:内容是以TXT或者Markdown等格式存储的纯文本信息(不包含样式)。

也就是说,如果采用xml类型的内容系统,应该可以比较容易做系统集成;如果采用Word类型的文档,需要转换成不包含样式的纯文本信息,并做必要的数据清洗,避免在转换后出现异常。

产品观点

产品经理的意见,与研发Lead有很大不同,会比较偏向于相对悲观的观点。在他看来:

现有ChatGPT和文心一言采用的语言模型,具有巨大数量的权重参数,并且在语料库上投入了巨大的开发成本——这绝对是开源模型和数据集,无法比拟的。

即便如此,ChatGPT与文心一言在回答问题时,表现出的实际效果,也不完全令人满意;何况是企业基于开源模型自行开发的应用。

第三,语料库的开发也会牵扯到比较大的投入成本,切不说是行业内的专业信息,即便是聚焦在企业产品和技术上的信息,也可能需要投入非常大的工作量。

所以,投入成本与实现效果决定了,可能不太值得去做这样的尝试。

未来,企业比较有希望实现落地的方式是,当文心一言或其他类似应用,最终达到了一个比较好的输出效果后,可能会对外输出toB业务支持,当然,是需要付费的。对于普通企业而言,这可能是相对比较经济的方式。

总结

以上内容基于本人有限的眼界和理解,仅供参考。如果你的企业找到了低成本、高收益的解决方案,实施并落地了应用,也非常期待听到你的分享。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-06-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 见睿思齐 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
对话机器人
对话机器人(Conversation Robot,ICR),是基于人工智能技术,面向企业场景的 AI 服务,可应用于智能客服、服务咨询、业务办理等场景。本产品旨在帮助企业快速构建,满足自身业务诉求的对话机器人,从而减少企业人力成本或解决服务不及时问题。用户可通过对话机器人用户端引擎,实现高准确率的对话服务。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档