首页
学习
活动
专区
圈层
工具
发布

#LLM

如何用Spring AI开发一个支持Text-To-SQL的MCP

HELLO程序员

MCP 客户端是 MCP 架构中的关键组件,主要负责和 MCP 服务器建立连接并进行通信。它能自动匹配服务器的协议版本,确认可用功能,并负责数据传输和 JSON...

500

从LangChain到企业级LLM服务:技术选型与实践指南(文末送书)

鲲志说

➡【好看的皮囊千篇一律,有趣的鲲志一百六七!】- 欢迎认识我~~ 作者:鲲志说 (公众号、B站同名,视频号:鲲志说996) 科技博主:极星会...

500

在GiteeAI上免费体验满血版本的DeepSeek结合NL2Sql效果如何?

HELLO程序员

之前我们开源了SuperSQL,我们经过最多的测试的大模型版本是Azure 的GPT-4o版本。当DeepSeek大火后,我们也尝试了利用本地部署的方式利用de...

2500

北大/阶跃星辰/曦智InfiniteHBD:基于硅光OCS收发器构建LLM训练数据中心级高带宽域

光芯

本文来自于北京大学、阶跃星辰以及曦智科技发表在ACM SIGCOMM 2025上发表的论文《InfiniteHBD: Building Datace...

8410

deepseek+MCP简单实践

用户9546848

目前市场上的各种LLM模型已经十分丰富,一直在考虑如何在本地搭建数据库和训练一个自己的专属模型。在探索过程中发现了一个比较有趣的方向,就是Model Conte...

9110

LangGraph多智能体:复杂任务处理的终极解决方案

聚客AI

在大模型应用开发的实践中,你们可能会遇到这样一个问题,无论单个智能体(Agent)的能力多么强大,其“独行侠”式的作业模式在应对复杂任务时往往显得力不从心。这好...

24010

利用flask构建自己的LLM系统

顾翔

LangSmith 是一个用于构建生产级 LLM 应用程序的平台。它能让您密切监控和评估您的应用程序,从而帮助您快速、自信地交付产品。

10410

GPT-5 Pro 来了,但你的代码真的“接得住”吗?

超级神性造梦机器

OpenAI 刚刚扔下一颗重磅炸弹:GPT-5 Pro API 上线,40万 Token 上下文窗口,还宣布要把 ChatGPT 打造成“AI 操作系统”。消息...

8510

提示词工程到多轮RAG:NLU技术迭代背后的踩坑与突破​

聚客AI

作为多数AI智能体初期的默认方案,初级方案A通过精细化提示词设计,在单一LLM节点中同时实现意图识别与槽位抽取,无需额外算法或架构改造,门槛极低。

37920

产品月报|SRE 数字分身能力增强,APM 支持 LLM 应用观测

腾讯云可观测平台

腾讯云可观测平台(Tencent Cloud Observability Platform,TCOP)是集指标、链路、日志于一体的全栈智能观测平台。结合强大的可...

10010

告别提示工程!上下文工程如何重新定义AI Agent的效率边界?​

聚客AI

简单来说,上下文工程是将正确的信息以正确的格式在正确的时间传递给LLM的艺术和科学。 这是安德烈·卡帕西关于上下文工程的名言...

34931

LLM推理提速:写在UCM将开源之际

数据存储前沿技术

大型语言模型(LLM)的爆发式增长,正将“AI工厂”推向工业化深水区。然而,在这条高效的智能生产线上,一个看似不起眼的“内存墙”问题——KV Cache的急剧膨...

22810

多模型时代的 AI 工程困境:我们如何用统一 API 架构实现成本下降 60%?

超级神性造梦机器

一、上线即 “踩雷”:当 GPT-4o 成了 “成本黑洞” 1. 我们的产品上线首月,API 账单飙升至预期的 3 倍。复盘发现:60% 的请求只是 “提取关键...

11010

【大模型】一文彻底搞懂大模型是怎么“想”出答案的!

云帆沧海

最后一层给出的是“原始分数”logits,维度 = 词表大小(5 万~15 万)。

26110

概率论:从赌场算法到菲尔兹奖的奇妙旅程

math chen

引言: 我将新开一个系列的文章叫做《数学科普系列》,旨在回答“我们学了这么多数学课有什么用?”的问题。本篇将以我最擅长的概率论讲起,先分享我的学习经历,再探讨概...

22510
领券