首页
学习
活动
专区
圈层
工具
发布
为你推荐
OpenClaw专区NEW
腾讯专区
云计算
人工智能
前端
后端
编程语言
数据库
大数据
音视频
安全
物联网
硬件
运维
测试
网络与通信
架构设计
开发工具
操作系统
职业发展
算法

管理

AI幻觉不是"胡说",而是"在错误的坐标系里说了正确的话"
上周,我让某个大模型帮我总结一篇论文的核心观点。它给出的回答逻辑清晰、结构完整,甚至补充了几个我都没注意到的角度。但当我核对原文时,发现其中一个"补充角度"根本不存在——模型"脑补"了一段作者从未说过的论证。
GimaCode
2026-06-03
1534
标签:
Skills 热潮过去后,我重新理解了 AI Agent 的方向
今年一二月的时候,Skills很火,但是我当时没有写文章来讲。那段时间,AI 圈几乎都在讨论它。
IvanCodes
2026-06-03
1860
标签:
Flask + Cloudflare Tunnel非程序员三天上线在线考试系统全记录
我在一家大型快递物流企业的安全管理部门工作。今年 5 月,2026 年安全月来临前夕,领导找到我说:"搞一个线上安全知识竞赛,让全区员工扫码就能答题,答对了还能抽奖。下周一上线。"当时是周四下午。我既不是程序员,也不会写后端——我的本职工作是对接各网点、搞安全检查、写整改报告。但安全月的活动不能掉链子。所以我做了一件这个时代每个非程序员都应该做的事:找 AI Agent 帮忙。三天后,一套完整的在线考试系统上线了。双站点运行,支持数百人同时扫码答题,自动判分,自动抽奖,至今零故障。这篇文章,我会把从零到一的全过程拆开来讲——包括代码怎么写、域名怎么配、坑怎么踩。哪怕你一行代码都不会写,照着做也能跑起来。
厌遇
2026-06-03
1350
标签:
从微服务到 AI-Native:真正变的只有一件事,但它最难
三年前我接手过一个客服系统的 AI 改造。需求很简单:把原来的关键词匹配换成大模型问答。我们花两周接上了模型,上线第一天就翻车——用户平均等待从不到一秒涨到六七秒,咨询放弃率肉眼可见地往上走。
技术方舟
2026-06-03
810
标签:
Elasticsearch 实战 | 陪了搜索十几年的 BM25,也该有个伴了
在搜索领域,BM25 一直是文本相关性打分的默认选择。它简单、稳定、可解释,用 ES 做搜索的团队基本都在用。但只要业务跑得久一点,几乎都会碰到同一个尴尬的问题:搜出来的十条结果一眼看过去都还算相关,可用户心里真正想要的那一条,偏偏卡在第二页第三条。
岳涛
2026-06-03
2000
标签:
进阶篇:从工具人到Chief of Staff,给Agent装上记忆和审计
这是「从 Demo 到生产:老张的 Agent 进阶之路」系列的第二篇。上一篇,老张用两小时做了一个竞品研究 Agent,通过了老板的演示验收。这一篇,他要解决一个更难的问题:让 Agent 从「能用」变成「可靠」。
阿特拉斯
2026-06-02
1120
标签:
一份给市长看的报告,为什么架构师才读得懂?
你打开一份政策报告,满眼“赋能”“体系化”“高质量发展”——本能告诉你,这不是给技术人看的。
IT蜗壳-Tango
2026-06-02
1490
标签:
【DeepSeek实战】驾驭千亿参数:DeepSeek V4 Prompt 工程最佳实践
图1:Grafana 面板显示 Prompt 优化前后的 Code Review 准确率对比
行者全栈架构师
2026-06-02
1560
标签:
AI 怎么才能"动手干活"?——工具调用(Tool Use)全解析
本文是「AI 基础设施科普」系列第 7 篇。上一篇我们聊了 RAG——让 AI 先搜资料再回答,减少瞎编。但搜完资料之后呢?AI 还是只能"说话",不能"做事"。今天我们聊一个让 AI 真正能干活的关键能力——工具调用。
GoodTime
2026-06-02
1891
标签:
如何构建可落地的 LLM 测试评估体系
构建 LLM 评估体系之前,有一个问题必须先回答清楚:你的系统输出,是确定性的还是概率性的?
AI智享空间
2026-06-02
890
标签:
为你推荐
OpenClaw专区NEW
腾讯专区
订阅及关注
云计算
人工智能
前端
后端
编程语言
数据库
大数据
音视频
安全
物联网
硬件
运维
测试
网络与通信
架构设计
开发工具
操作系统
职业发展
算法
AI幻觉不是"胡说",而是"在错误的坐标系里说了正确的话"
上周,我让某个大模型帮我总结一篇论文的核心观点。它给出的回答逻辑清晰、结构完整,甚至补充了几个我都没注意到的角度。但当我核对原文时,发现其中一个"补充角度"根本不存在——模型"脑补"了一段作者从未说过的论证。
GimaCode
2026-06-03
1534
标签:
腾讯云开发者社区
腾讯云架构师技术同盟
AI时代的架构师
Skills 热潮过去后,我重新理解了 AI Agent 的方向
今年一二月的时候,Skills很火,但是我当时没有写文章来讲。那段时间,AI 圈几乎都在讨论它。
IvanCodes
2026-06-03
1860
标签:
腾讯技术创作特训营S18
Flask + Cloudflare Tunnel非程序员三天上线在线考试系统全记录
我在一家大型快递物流企业的安全管理部门工作。今年 5 月,2026 年安全月来临前夕,领导找到我说:"搞一个线上安全知识竞赛,让全区员工扫码就能答题,答对了还能抽奖。下周一上线。"当时是周四下午。我既不是程序员,也不会写后端——我的本职工作是对接各网点、搞安全检查、写整改报告。但安全月的活动不能掉链子。所以我做了一件这个时代每个非程序员都应该做的事:找 AI Agent 帮忙。三天后,一套完整的在线考试系统上线了。双站点运行,支持数百人同时扫码答题,自动判分,自动抽奖,至今零故障。这篇文章,我会把从零到一的全过程拆开来讲——包括代码怎么写、域名怎么配、坑怎么踩。哪怕你一行代码都不会写,照着做也能跑起来。
厌遇
2026-06-03
1350
标签:
python
腾讯技术创作特训营S18
cloudflare
flask
WorkBuddy
从微服务到 AI-Native:真正变的只有一件事,但它最难
三年前我接手过一个客服系统的 AI 改造。需求很简单:把原来的关键词匹配换成大模型问答。我们花两周接上了模型,上线第一天就翻车——用户平均等待从不到一秒涨到六七秒,咨询放弃率肉眼可见地往上走。
技术方舟
2026-06-03
810
标签:
合肥同盟
Elasticsearch 实战 | 陪了搜索十几年的 BM25,也该有个伴了
在搜索领域,BM25 一直是文本相关性打分的默认选择。它简单、稳定、可解释,用 ES 做搜索的团队基本都在用。但只要业务跑得久一点,几乎都会碰到同一个尴尬的问题:搜出来的十条结果一眼看过去都还算相关,可用户心里真正想要的那一条,偏偏卡在第二页第三条。
岳涛
2026-06-03
2000
标签:
xgboost
大数据
Elasticsearch Service
机器学习
模型
进阶篇:从工具人到Chief of Staff,给Agent装上记忆和审计
这是「从 Demo 到生产:老张的 Agent 进阶之路」系列的第二篇。上一篇,老张用两小时做了一个竞品研究 Agent,通过了老板的演示验收。这一篇,他要解决一个更难的问题:让 Agent 从「能用」变成「可靠」。
阿特拉斯
2026-06-02
1120
标签:
agent
Agent 记忆服务
一份给市长看的报告,为什么架构师才读得懂?
你打开一份政策报告,满眼“赋能”“体系化”“高质量发展”——本能告诉你,这不是给技术人看的。
IT蜗壳-Tango
2026-06-02
1490
标签:
架构师
【DeepSeek实战】驾驭千亿参数:DeepSeek V4 Prompt 工程最佳实践
图1:Grafana 面板显示 Prompt 优化前后的 Code Review 准确率对比
行者全栈架构师
2026-06-02
1560
标签:
最佳实践
DeepSeek
prompt
模型
优化
AI 怎么才能"动手干活"?——工具调用(Tool Use)全解析
本文是「AI 基础设施科普」系列第 7 篇。上一篇我们聊了 RAG——让 AI 先搜资料再回答,减少瞎编。但搜完资料之后呢?AI 还是只能"说话",不能"做事"。今天我们聊一个让 AI 真正能干活的关键能力——工具调用。
GoodTime
2026-06-02
1891
标签:
腾讯技术创作特训营S18
腾讯云架构师技术同盟
如何构建可落地的 LLM 测试评估体系
构建 LLM 评估体系之前,有一个问题必须先回答清楚:你的系统输出,是确定性的还是概率性的?
AI智享空间
2026-06-02
890
标签:
模型
设计
系统
LLM
测试

凌晨好!

欢迎来到腾讯云开发者社区

沙龙日历
全部 >
加入讨论
的问答专区 >
    最具价值作者榜
    更多 >
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
    领券