Pulumi推出GenAI堆栈模板: 首批支持Pinecone和LangChain

云云众生s

发布于 2024-03-28 15:16:57

1060

发布于 2024-03-28 15:16:57

文章被收录于专栏：云云众生s

缺乏运维经验的AI专业人员，可以用Python或其他编程语言来定义和编排ML堆栈。

译自 Pulumi Templates for GenAI Stacks: Pinecone， LangChain First，作者 Joab Jackson。Joab Jackson 是 The New Stack 的高级编辑，负责报道云原生计算和系统操作。他报道 IT 基础设施和开发 25 年以上，包括在 IDG 和 Government Computer News 任职。

要搭建一个生成式 AI 应用程序，通常需要至少两个起步组件，一个大型语言模型(LLM)和一个向量数据存储。您可能还需要一些前端组件，例如聊天机器人。

进入 GenAI 领域的组织现在面临着 GenAI 的编排挑战。他们发现将这些组件从开发人员的笔记本电脑移动到生产环境中可能会导致错误并且时间消耗巨大。

为了简化部署，基础设施即代码(IaC)软件提供商 Pulumi 引入了两个基本 GenAI 工具的“提供程序”或模板，即 Pinecone 向量数据库和用于构建 LLM 的 LangChain 框架。

“我们发现很多像 LangChain 这样的工具对于本地开发来说非常棒。但是当您想投入生产时，它仍然是一个 DIY 练习，”Pulumi 的首席执行官兼联合创始人 Joe Duffy 在接受 TNS 采访时说。“这非常具有挑战性，因为您希望对无限规模进行架构，以便随着对应用程序的成功，您能够扩展以满足需求。这并不容易做到。”

具体来说，Pulumi 支持 AWS 上在 1 月份发布的 Pinecone 的无服务器版本，LangChain 的支持是通过在 Amazon ECS 集群上设置 LangServe 作为服务来实现的。”

这两个模板加入了一个组合，该组合涵盖了 150 多个云和 SaaS 服务提供商，包括 GenAI 空间中使用的许多其他服务，如用于前端的 Vercel Next.js 和 Apache Spark。

除了模板本身之外，Pulumi还制定了一组使用Pinecone和LangChain的参考架构。