首页
学习
活动
专区
圈层
工具
发布

#LLM

GLM技术复盘:21篇论文深度解读智谱模型家族

AI-Frontiers

原文: https://mp.weixin.qq.com/s/2KMaZPnLernKGLq2aLN_dQ欢迎关注公zh: AI-Frontiers

2400

Token 中文新译名正式提议:「符元」——一文讲清 Token 的本质定义

王子健

尤其是当“智元”这个词横空出世,在王小川等大佬和一众学术大咖的背书下,迅速形成了一种“共识幻觉”。很多人觉得:就是它了,这多有逼格,这多符合 AI 时代!

7600

CC Switch中防止覆盖claude配置的处理方法

保持热爱奔赴山海

在使用Claude中,因为网络或者价格的原因,我们通常会使用到国内LLM的模型,为了便于管理模型provider,通常还会搭配 CC Switch一起使用。

14510

tokscale 跟踪多个 AI 编码代理间的使用情况和成本

保持热爱奔赴山海

一个高性能的 CLI 工具和可视化仪表盘,用于跟踪多个 AI 编码代理间的令牌使用情况和成本。

4410

57:AI虚拟死神伴侣:LLM生成戏剧性事件反馈的提示工程

安全风信子

摘要: 在《死亡笔记》中,Ryuk作为死神伴侣为基拉提供了独特的视角和反馈。本文探讨如何利用LLM技术构建AI虚拟死神伴侣,通过精心设计的提示工程,生成符合死亡...

7910

什么是自动Prompt优化?为什么需要算法来寻找最佳提示词?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

10010

什么是Prompt注入攻击?为什么恶意输入能操控AI行为?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

11410

39:超级智能决策核心:LLM+强化学习混合系统架构

安全风信子

作者: HOS(安全风信子) 日期: 2026-03-15 主要来源平台: GitHub 摘要: 本文深入探讨LLM与强化学习相结合的混合系统架构,从系统...

9710

和AI一起搞事情#2:边剥龙虾&边做个中医方剂技能

风雨中的小七

春节前,科技圈被一只“龙虾(OpenClaw)”突袭了。朋友圈里的各类标题党简直不忍直视:“AGI降临!”“打工人的终结者!”

45044

什么是Prompt模板?为什么标准化的格式能提高稳定性?

ETL 小当家

🚀 本文收录于Github:AI-From-Zero 项目 —— 一个从零开始系统学习 AI 的知识库。如果觉得有帮助,欢迎 ⭐ Star 支持!

13710

AIOS --LLM Agent Operating System

用户9732312

为适配不同LLM实例,我们为每个实例构建专属封装层,并在该层内设计统一的LLM推理系统调用。通过将LLM实例抽象为核心并实现标准化系统调用,AIOS凭借LLM核...

12810

从0开始训练自己的LLM(6)

golangLeetcode

训练完后的模型如何给业务用呢?需要把模型的参数保存下来,给业务用,下次加载出来就可以了。同时前面定义的模型是输出最匹配的结果,但是每次输出结果...

9910

从0开始训练自己的LLM(5)

golangLeetcode

准备完模型和训练数据后,我们可以开始计算损失函数,并开始训练。先使用Softmax 归一化‌,将模型输出的 logits 转换为概率分布(自动处...

8310

从0开始训练自己的LLM(4)

golangLeetcode

前面我们介绍了构建LLM的完整流程,现在我们将所有流程串接起来,并开始训练整个模型。依次定义各个核心组件,首先是MultiHeadAttention

7410

从0开始训练自己的LLM(3)

golangLeetcode

Transformer架构核心是输入输出编码器、多头注意力机制和前馈神经网络,前面介绍了编码器和注意力机制,本文通过前馈神经网络,将两者串联起来...

8910

从0开始训练自己的LLM(2)

golangLeetcode

Transformer架构是深度学习领域的革命性设计,由谷歌大脑团队在2017年提出,通过自注意力机制彻底改变了序列建模方式。其核心优势在于并行...

8810

golang源码分析:langchaingo(9)

golangLeetcode

前面介绍了单独的匹配,如果把这个匹配过程接入到LLM,就是完整的RAG,即检索增强生成。我们先看看上一个例子还没介绍的最后几行代码

4810

Cline交互协议(2):LLM交互流程

golangLeetcode

在介绍完Cline和MCP server的详细交互流程后Cline交互协议(1):MCP交互流程,我们看下最重要的和LLM的交互协议。同样我们在中间加一层代理,...

7410

golang实现langchain使用deepseek

golangLeetcode

LangChain 是一个 LLM 编程框架,提供模块化组件(如 Chains、Agents、Memory 等),帮助开发者通过代码灵活编排大语...

11210
领券