首页
学习
活动
专区
圈层
工具
发布

#路由

RAG模式到底有8种?还是9种?还是25种?

jeffery_jcm

首先一句话通俗解释什么是RAG? 全称: Retrieval-Augmented Generation (检索增强生成) :RAG是一种结合信息检索与大语言模型...

300

vLLM的语义路由框架:把"改策略"从工程问题变成配置问题

唐国梁Tommy

这篇来自 vLLM 开源社区的工作不是在刷榜,而是在解决一个实际的系统工程问题:当企业同时运行十几个来自不同提供商的语言模型,一条请求进来,谁来决定路由给哪个模...

2810

KAIST最新研究:一文读懂UniversalRAG如何实现多模态、多粒度的高效检索

唐国梁Tommy

今天,我们要深入探讨一个最新框架——UniversalRAG。这篇来自KAIST与DeepAuto.ai的最新研究,不仅仅是对现有RAG技术的简单升级,更是一次...

2500

22M 小模型搞定 Tool 路由一份蒸馏训练方案从架构到部署

javpower

最开始我让 GPT-4o / Qwen 直接判断 "该调哪些 tool",效果不差,但生产上有三个硬伤:

3100

用 SDD 方法开发一个 AI Gateway

用户5602664

企业用大模型,四个问题绕不开:谁在调模型?敏感数据有没有出内网?花了多少钱?出事怎么查?AI Gateway 做的就是在客户端和上游模型之间插一层治理层,把这四...

2600

ECCV 2026 | GeoSR:让VLM真正用上几何信息,静态/动态空间推理均达SOTA!

Amusi

过去几年,VLM 在图像理解、视频问答、多模态对话上进展很快。它们可以识别物体、描述场景、总结事件,甚至完成不少复杂问答。但空间推理并不是简单的语义识别。

8410

Kali Linux部署Codex 开发学习两不误

逍遥子大表哥

接下来,我们在Kali中安装Codex,因为Nodex等环境在Kali中已经默认安装,因此只需执行一条命令即可。

3310

Agent Skills 体系是怎么跑起来的?

臻成AI大模型

解耦之后的架构,大致分成这几层:用户发起请求,Agent 做决策,然后经过路由层找到对应技能,技能中心负责加载和调度,最终由具体的能力体调用底层工具完成执行。

4710

10 个 AI 工程师必须掌握的 LangChain & LangGraph 概念

deephub

但是应用需要检索文档、调用工具、处理故障、路由请求、记住历史操作,还要在关键决策节点引入人工审核。这时这个聊天机器人已经变成了一套工作流。

6900

1300人收藏的元 skill 创建技能,X 上的大佬都在推荐它!

开源星探

一个真正可以在团队里长期使用的 Skill,需要解决路由识别、质量评估、版本治理、跨平台兼容等一系列工程问题。

11210

智能路由与业务连续性保障:AI 网关如何让大模型稳定跑在生产链路上

腾讯云中间件团队

因此 AI 网关提供多种智能路由机制,满足用户多场景、可灰度、高性能、高可用的诉求,包括:权重路由、模型名字路由、语义路由、延迟路由、Token 长度路由等。

12710

AI外包!把Dynamic Workflows成本从6.2万美元狂砍到129美元的秘密

用户11563501

下面很酷的视频是一个开发者把300个Kimi K2.6智能代理同时运行的状态。屏幕上每一条跳动的线都是实时传递的信号,像大脑神经元同步激活,双向传输。这不是概念...

12010

大模型之争已过时,真正的价值在在哪里?

用户11563501

最近,Openrouter越来越火,在大家都在争论哪个AI模型会胜出时,各大厂,包括孙宇晨在内,纷纷押注api中转站搞起token运营,这里面的逻辑是什么?ka...

7810

搞AI接口代理这一年,我踩过的坑比代码还多

用户12493922

9710

GPT-5.1 突然发布,用户实测:更像 4o,情商大幅提升

用户11563501

GPT-5.1 Instant比早期的聊天模型更具对话性,指令遵循能力有所提升。它具备一种自适应的推理能力,可以自行判断何时应该先“思考”再回应。GPT-5.1...

9310

GPT-5的魔幻现实主义:当技术神话撞上用户预期

用户11563501

奥特曼宣传了几个月的「博士级专家」AI,上线24小时就被用户骂惨了。用户实测后发现连基础数学都会算错,拼写也出问题。

11310

Arch Gateway: AI Gateway的前瞻选择

用户11563501

这时候,应用已不再是单一功能的玩具,开发者也从快速实现一个原型产品的兴奋感陷入到维护混乱Pipeline,处理各种与业务关系不大的脏活累活的沮丧中,比如配置管理...

6910

零外部依赖的前端开发:用纯原生 JavaScript 打造高性能页面

佛系豪豪吖

> 你真的需要 React、Vue、Bootstrap 吗?本文分享如何用纯 HTML + CSS + JavaScript 开发企业级管理后台,零 npm、零...

8710

智能体多轮意图识别与人机交互的思考总结

Wangzy

另外,笔者所在的运维领域,如果涉及到让智能体执行生产环境的变更动作,就一定需要人工审批或确认,不论是主动交互还是被动询问,肯定会用到智能体的人机交互功能。

8910

基于LangGraph搭建故障根因分析平台思考及总结

Wangzy

在 LangGraph 中,我们不在节点内部写 if/else 来决定下一步去哪里,而是使用 条件边 (Conditional Edges)。这实现了逻辑(路由...

10910
领券