暂无搜索历史
去年5月DeepMind把AlphaEvolve那篇博客挂出来的时候,引起了不小轰动。一个用Gemini驱动的进化式编码agent,把Strassen 1969...
前天上海下了点雨,2026 IEEE ISCAS的会场里何庭波站在讲台上,一张PPT切到正中间,τ这个希腊字母占了大半个屏幕。朋友圈里一票做芯片的,连夜在群里转...
大语言模型(LLM)推理服务正从“模型精度的竞赛”转向“系统效率的比拼”。当模型能力趋同,推理延迟与吞吐量的优化成为大模型规模化落地的关键瓶颈。然而,传统负载均...
苏剑林在回忆录里写得很坦诚:“‘Depth Attention’或者说‘Layer Attention’是一个毫无新意的想法,但如何将它用于足够大的模型,作为R...
最近跟一些做产品的朋友聊天,发现大家的焦虑出奇地集中:AI 什么都能干了,那我该干什么?设计师该不该写代码?PM 要不要自己做原型?角色边界越来越模糊,到底往哪...
技能(Skills)正在成为支架工程中连接大语言模型智能体与结构化领域知识的关键抽象。不同于松散的提示词和原子化的工具调用,技能将复杂的多步操作固化为可组合、可...
支架工程(Harness Engineering)是一门新兴的架构学科,其核心目标是围绕 AI 智能体(Agent)构建一套结构化的运行环境——“支架”——通过...
Anthropic 最近发了份报告,调研了 81,000 个 Claude 用户,想搞清楚一件事:那些后台数据里被 AI 渗透最深的职业,从业者自己怎么想。
论文:Trace2Skill: Distill Trajectory-Local Lessons into Transferable Agent Skills ...
在当前企业级智能体的演进路径中,我们正见证一场从“经验驱动”向“知识驱动”的本质变革。
最近业界对 Harness的关注异常高涨。问题是,Harness 至今基本靠手工调参——工程师盯着 bad case,改几行 Prompt,跑一遍测试,不行再改...
AI “agents”(智能代理)正引领人类与组织应用人工智能的重大变革——数年前,AI模型仍以聊天机器人为主要应用形态,仅能完成基础问答交互;当前,借助Cla...
最近圈子里都在聊Karpathy的LLM Wiki,不少人把它和RAG搞混,甚至觉得这只是个“花里胡哨的笔记技巧”——说实话,这是没get到核心。
但2026年,风向变了。一批十亿参数级别的小模型,开始在特定任务上吊打千亿巨兽。它们有个共同的名字:SLM。
Vibe Coding XR 是一种快速原型开发工作流,它将开源 XR Blocks 框架与 Gemini Canvas 相结合,能够将用户提示直接转化为具备完...
至今为止,多数科研人员使用AI智能体时,仍局限于对话式交互模式,需人工全程管控每一个操作步骤,效率低下且依赖专业经验,说白了仍然是个摆设、鸡肋。
你让AI“帮我订下周二去上海的高铁票,靠窗”,它回你一串步骤:“1.打开12306;2.输入出发地;3.选择日期;4.勾选靠窗……”
最近这阵子,OpenCLI真的悄悄火出圈了——没有花里胡哨的UI,不用复杂操作,一行命令就能拿捏连Cursor IDE、Notion这些桌面应用,甚至B站、知乎...
参与的是Raphael Shad,前Kron联合创始人,那个卖给了Notion的日历工具就是他做的。他对设计这件事出了名的较真,属于那种一个像素不对能跟你掰扯半...
AI 系统经常接收来自多个渠道的指令。系统消息中的安全策略、开发者的产品指南、用户请求,以及从互联网获取的信息。
暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址