首页
学习
活动
专区
圈层
工具
发布

#LLM

什么是RAG中的幻觉问题?引用溯源如何实现?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

300

"工程返璞归真":LLM 的原生语言,其实是 50 年前的 Unix 命令行

随机比特

腾讯 | 高级前端工程师 (已认证)

第三,LLM 在装自己不熟的东西。你设计的 JSON Schema 是新的,LLM 没见过,每次调用都要靠提示词来"教"它。但它在训练数据里见过海量的 Unix...

1400

Dual Batch Overlap

aaronwjzhao

MoE 模型里,专家路由会带来 稀疏 all-to-all 通信(dispatch / combine)。这类通信如果和前后计算 串行,GPU 会在等网络上空转...

2200

帮你追新闻热点的 agent,有后续进展直接推送

月小水长

去搜,搜出来一屏幕营销号,标题都差不多,翻了五六条也没搞明白事情到底走到哪一步了。

4700

【转】Claude Code 安装后必做的 9 项设置

保持热爱奔赴山海

问题:默认的 Default 风格极度精简——改完代码只告诉你”done”,不解释为什么这样改、用了什么模式。对于熟悉新项目或理解复杂改动,这种风格信息量不够。

10410

【转】如何使用 Spec Kit 工具进行规范驱动开发

保持热爱奔赴山海

在传统软件开发流程中,规范只是编码前的临时脚手架,开发者一旦进入编码阶段,便将规范束之高阁。而进入 AI 时代,「规范驱动开发」想彻底改变这一现状,即让规范贯穿...

20910

[转载] 分享10个你可能不知道的Claude Code隐藏命令

保持热爱奔赴山海

原文地址 https://mp.weixin.qq.com/s/XopaISgwzSgoqZctym_Ajg

21010

vLLM Disaggregated Prefilling源码学习

aaronwjzhao

vLLM相关的源码实现:https://github.com/vllm-project/vllm/tree/main/vllm/distributed/kv_t...

13310

Google 迎来「DeepSeek 时刻」:TurboQuant算法实现3bit无损、8×加速、6×压缩、零预处理

AI-Frontiers

原文: https://mp.weixin.qq.com/s/zI2GQhGkzWXPueg93_z5MA欢迎关注公zh: AI-Frontiers

36000

知识工程和知识图谱有什么区别?如何构建完整的知识体系?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

22210

TransE、DistMult、ComplEx有什么区别?知识图谱嵌入方法如何选择?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

9410

TurboQuant压缩算法是什么

jack.yang

TurboQuant是谷歌研究院(Google Research)在 2026 年初正式发布的新型向量压缩算法,该技术旨在显著降低大语言模型(LLM)和向量搜索...

86120

Rust构建AI代理可组合安全与性能层

用户11764306

这正是我们着手解决的问题。我们开发了AutoAgents,一个用Rust编写的开源AI代理框架。其最新功能“LLM管道”引入了用于LLM推理的可组合中间件层,这...

10810

什么是知识图谱补全?如何预测缺失的关系?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

8910

什么是知识图谱?实体、关系、属性分别是什么?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

11110

云端 Agent 架构实战:三大模型 Function Calling 能力横评与生产部署方案

用户12330412

在云原生 Agent 架构中,Function Calling 是连接大模型与后端微服务的核心桥梁。模型能否准确、稳定地生成工具调用指令,直接决定了 AI 应用...

16910

使用 json-repair 修复 llm 生成的 json 格式错误

Michael阿明

当大模型生成json格式的输出时,有时候可能会出现缺少引号,单引号等问题,json-repair 可以很好的解决这个问题

15810

基于 MCP 协议的 LLM 工具调用

Michael阿明

文章主要讲解了如何使用 MCP(Model Context Protocol)与大型语言模型(LLM)结合来实现工具调用,以及如何搭建一个简单的应用来展示这一过...

14010

使用 Nginx 对 LLM 服务进行负载均衡实践

Michael阿明

需要将请求分发到不同的节点进行处理,让每个节点的负载在合适的水平,这就是负载均衡。

10710

triton+tensorrt-llm后端部署LLM服务

Michael阿明

TensorRT-LLM 是 NVIDIA 推出的一个开源库,旨在利用 TensorRT 深度学习编译器优化和加速大型语言模型(LLMs)的推理性能。它专为开发...

28610
领券