首席架构师

喔家ArchiSelf

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

打开任何一家技术媒体，满屏都是Agent、Loop Engineering、Harness Engineering。黄仁勋说“现在根本没有人写Prompt了”，Claude Code之父Boris Cherny宣称自己“已经不给Claude写提示词了，工作变成了写循环”。一时间，“Prompt已死”的论调甚嚣尘上。仿佛谁还在谈论提示词，谁就落后了一个时代。

提示工程已死？

随着大模型技术的普及，催生了“面向提示词的编程”。那么，如何自动生成这些提示词呢？答案可能是“元提示”——一种能自动生成提示词的工具或方法，帮助开发者更高效地与大模型交互，简化编程流程。

元提示浅析

如果 ChatGPT 的横空出世让世界第一次意识到 AI 的“语言天赋”，那么近年来的 Agentic RL（智能体强化学习）正在让 AI 学会的第二件事，名叫“行动”。

Agentic RL 正在重新定义 AI 的下限

2026年的现在，大模型应用来到了我们的身边：政务系统用它做政策答疑，金融公司用它做理赔审核，电商平台用它做智能客服，甚至很多企业的内部知识库、代码辅助工具都接入了大模型。但很多人不知道的是：你信任的AI助手，可能正在被“三言两语”骗走机密数据，甚至按照攻击者的要求输出有害内容。

老码农眼中的提示词注入攻防——13种拆解

对于MCP，简单而已，它就是让 AI Agent 能连上你们公司各种系统（Salesforce、GitHub、Jira 这些）的一套标准。各大厂商都在推，每个 AI 平台也都在支持。

MCP过时了么？你可能面对的MCP 反模式

很多团队目前的评估现状是：“人工肉眼试用、凭主观感受打分”。运行顺畅就是“神级应用”，偶尔出错就是“能力不足”，效果不好就盲目去微调大模型。这种“盲人摸象”式的粗放评估，存在极大的随机性和片面性。它既无法精准定位Agent的短板在哪里（是规划出错？工具调用失败？还是上下文理解偏差？），也无法量化每次迭代的真实效果，更不可能支撑智能体走向规模化商业落地。

如何评估一个AI Agent？

在与LLM交互时，提问的方式——也就是我们所说的“提示词”——对最终输出的质量有着至关重要的影响。因此，设计既包含定制化静态提示词，又能根据上下文变化的动态提示词，显得尤为关键。

提示工程的6种实践体会

很长一段时间里，行业里弥漫着一种“暴力美学”：很多人理所当然地以为，想让 AI 变得更聪明、更能干，唯一的路径就是造出更大的模型。于是，我们见证了参数量的狂飙，从百亿到千亿，再到万亿，仿佛只要把“大脑”的容量撑得足够大，它自然就能无所不能。

从超参到Harness，大模型应用演进的温故知新

从大型数据集中检索信息是具有挑战性的，尤其是当共享的概念跨越多个来源而没有明确的链接的时候。假设有一堆想要查询的文档，并且需要可靠的的软件来从这些文档中检索相关数据。然而，随着所拥有的文档数量大大增加，以至于我们不知道如何引导大模型找到那些包含答案的文档。

利用层次聚类来提升知识检索的性能

当下的AI时代，现成的AI解决方案遍地都是，很多人觉得搭建一个AI系统不过是“拼拼组件、调调参数”的小事。但事实真的如此吗？看似简单的AI开发，背后藏着无数坑：数据乱成一锅粥拖垮整个项目，模型改一版牵一发而动全身，系统上线后漏洞百出……

AI工程的11个实践指南

作为产品经理，我们每天都在和数据打交道——从用户行为分析到功能效果验证，从决策依据推导到业务增长预测，而统计学正是读懂数据、用对数据的核心工具。它不是复杂的公式堆砌，而是一套能帮我们把“数字”转化为“有效决策”的思维和方法。

面向AI产品经理的统计学基础

人工智能安全领域一直在以惊人的速度发展，研究人员发现新漏洞的速度比打补丁的速度还要快，例如MCP 的安全性问题。

大模型应用的10种攻击方式

随着大模型的发展，为了避免或缓解幻觉和过时知识的推理缺陷，出现了检索增强生成 (RAG)、知识增强生成 (KAG) 和缓存增强生成 (CAG) 等应用框架。每个框架都以独特的方式处理这些挑战，将外部知识与生成能力结合起来。本文将尝试分析它们的机制、优点、缺点和理想用例。

RAG、KAG 与CAG的一知半解

这里讨论的OpenSPG—KAG是知识增强生成的一个特例，是一个基于 OpenSPG 引擎和大型语言模型的逻辑推理和问答框架，用于为垂直领域知识库构建逻辑推理和问答解决方案。KAG 能有效克服传统 RAG 矢量相似度计算的模糊性和 GraphRAG 的噪声问题，支持逻辑推理和多跳事实问答等，明显优于目前的RAG方法。

从RAG 到KAG

KV缓存是现代大模型服务方式的基础实现细节，在KV缓存中，各个注意力层的键和值被保存，有效地保存了整个模型的中间表示，以便可以用于进一步的自回归生成传递。

从RAG到CAG，面向性能的提升

在本地运行LLM，为我们提供了一种既能充分利用 AI 能力，又能有效保护数据隐私的理想方式。相比依赖云端服务的使用模式，本地部署让我们在享受无限访问 AI 的自由的同时，避免了将敏感信息上传到外部服务器所带来的潜在风险。

如何在只有CPU的个人电脑上运行大模型服务？

当启动 Ollama 时，它会自动启动侦听端口 11434 的REST API。这个REST API允许您从任何支持 HTTP 请求的编程语言或环境与 Ollama 进行交互。我们可以使用它来执行各种任务，例如查询模型、管理配置或将 Ollama 集成到应用程序中。你可参考 Ollama 有关如何使用 API 的文档（Ollama/docs/api.md）。

雕虫小技：Ollama的使用技巧

【引】“你永远无法精通一种编程语言，除非两种！” 或许，对于智能体之间的通信协议如MCP 和A2A 也是如此。

A2A 的Java 实现

从 GPT 这样的模型开始，大语言模型领域近年来取得了显著的进展。然而，即使这些模型变得越来越强大，它们在回答用户查询时的准确性也往往达不到预期。为了解决这个问题，人们已经开发了各种各样的策略，例如提示工程、RAG和系统提示等，这里讨论另一个重要的手段—— 指令微调。

揭开指令微调的神秘面纱

别慌！PyTorch作为深度学习界的传奇，有一整套性能优化的方法。从瓶颈诊断到内存精打细算，从分布式加速到部署黑科技，这10个技巧不仅能让你的模型“跑得更快”，还能帮你省下硬件成本、减少训练时间——效率直接翻倍！

PyTorch性能优化10个技巧：效率翻倍的实战雕虫！

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了喔家ArchiSelf专栏，为你提供了喔家ArchiSelf的相关文章，致力于帮助开发者快速成长与发展。

喔家ArchiSelf

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐