首页
学习
活动
专区
圈层
工具
发布

#LLM

云端 Agent 架构实战:三大模型 Function Calling 能力横评与生产部署方案

用户12330412

在云原生 Agent 架构中,Function Calling 是连接大模型与后端微服务的核心桥梁。模型能否准确、稳定地生成工具调用指令,直接决定了 AI 应用...

1400

使用 json-repair 修复 llm 生成的 json 格式错误

Michael阿明

当大模型生成json格式的输出时,有时候可能会出现缺少引号,单引号等问题,json-repair 可以很好的解决这个问题

1500

基于 MCP 协议的 LLM 工具调用

Michael阿明

文章主要讲解了如何使用 MCP(Model Context Protocol)与大型语言模型(LLM)结合来实现工具调用,以及如何搭建一个简单的应用来展示这一过...

1000

使用 Nginx 对 LLM 服务进行负载均衡实践

Michael阿明

需要将请求分发到不同的节点进行处理,让每个节点的负载在合适的水平,这就是负载均衡。

1000

triton+tensorrt-llm后端部署LLM服务

Michael阿明

TensorRT-LLM 是 NVIDIA 推出的一个开源库,旨在利用 TensorRT 深度学习编译器优化和加速大型语言模型(LLMs)的推理性能。它专为开发...

1700

Attention Residuals: 革新 LLM 残差连接的注意力机制

安全风信子

摘要: Attention Residuals (AttnRes) 提出了一种全新的残差连接方法,通过使用注意力机制替代固定权重的累加,解决了传统 PreNor...

4100

【转】我的 Claude Code 最佳实践

保持热爱奔赴山海

分享我用 Claude Code 写代码的心得:10条核心技巧、斜杠命令详解、自定义命令配置,助你提升 AI 编程效率

3100

大型语言模型应用十大安全风险

mixlab

4010

一文搞懂 AI、LLM、Prompt、MCP、AIGC 是什么,有什么区别?

民工哥

在 ChatGPT、文心一言、通义千问等这些 AI 工具爆火的时代,你可能经常听到这些词如:AI、LLM、Prompt、MCP、AIGC。

7510

什么是Self-RAG?如何让模型自主判断是否需要检索?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

5910

RAG系统中如何处理多跳问答(Multi-hop QA)?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

4110

GLM技术复盘:21篇论文深度解读智谱模型家族

AI-Frontiers

原文: https://mp.weixin.qq.com/s/2KMaZPnLernKGLq2aLN_dQ欢迎关注公zh: AI-Frontiers

18810

Token 中文新译名正式提议:「符元」——一文讲清 Token 的本质定义

王子健

尤其是当“智元”这个词横空出世,在王小川等大佬和一众学术大咖的背书下,迅速形成了一种“共识幻觉”。很多人觉得:就是它了,这多有逼格,这多符合 AI 时代!

1.7K00

CC Switch中防止覆盖claude配置的处理方法

保持热爱奔赴山海

在使用Claude中,因为网络或者价格的原因,我们通常会使用到国内LLM的模型,为了便于管理模型provider,通常还会搭配 CC Switch一起使用。

34910

CC Switch中防止覆盖claude配置的处理方法

保持热爱奔赴山海

在使用Claude中,因为网络或者价格的原因,我们通常会使用到国内LLM的模型,为了便于管理模型provider,通常还会搭配 CC Switch一起使用。

34910

tokscale 跟踪多个 AI 编码代理间的使用情况和成本

保持热爱奔赴山海

一个高性能的 CLI 工具和可视化仪表盘,用于跟踪多个 AI 编码代理间的令牌使用情况和成本。

8710

tokscale 跟踪多个 AI 编码代理间的使用情况和成本

保持热爱奔赴山海

一个高性能的 CLI 工具和可视化仪表盘,用于跟踪多个 AI 编码代理间的令牌使用情况和成本。

8710

57:AI虚拟死神伴侣:LLM生成戏剧性事件反馈的提示工程

安全风信子

摘要: 在《死亡笔记》中,Ryuk作为死神伴侣为基拉提供了独特的视角和反馈。本文探讨如何利用LLM技术构建AI虚拟死神伴侣,通过精心设计的提示工程,生成符合死亡...

12310

什么是自动Prompt优化?为什么需要算法来寻找最佳提示词?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

12010
领券