GSK(中国) | 全栈架构师 (已认证)
OpenViking 没有采用传统 RAG "解析→切片→Embedding→入库" 的扁平套路,而是设计了一套文件系统范式 + 三级向量索引 + 层级递归检索...
各位代码界的卷王、AI圈的探险家们! 👋 今天咱们要聊聊 OpenViking 里那个让 AI Agent 终于能“记住你是谁”的神奇系统!
在 2024 年之前,检索增强生成(RAG)还是个 Python 专属的 "俱乐部"。
咱用 SerperAPI 做网页搜索(谷歌搜索),免费额度有 2500 次网页搜索 API 调用,1-2 秒就能返回谷歌搜索结果。
每周五回答几个从搜索数据里看到的真实问题。这些问题不是我想出来的——是你在搜索引擎里一个一个字打出来的。
很多人在第二个月看到搜索词报告里出现了一个高搜索量的竞品词——「这个月1万人在搜,我得写一篇!」
当老婆第三次因为对比五款儿童保温杯的测评笔记而错过睡前故事时间时,我决定把 “小红书攻略筛选” 这件事拆解成可执行的技术方案。最终搭建的 AI 工作流不仅帮她把...
摘要 从SkillHub安装技能后,需在AI平台中正确配置才能调用。本文介绍WorkBuddy、QClaw、ima等平台的技能安装路径、识别机制和常见问题的排查...
SEO 公司 Graphite 最近扔了个大瓜:到 2025 年 5 月,互联网上 52% 的书面内容是 AI 写的,咱们人类写的只剩 48% 了。
上个月,谷歌悄悄地移除了 num=100 这个搜索参数。Google 本身不提供公开的网页搜索API。
过去二十年,SEO 的核心问题很清楚:如何让网页被搜索引擎发现、理解、索引,并在用户搜索某个关键词时排到更靠前的位置。这个逻辑建立在一个稳定的搜索界面之上:用户...
传统的 Composer 框架用 Bayesian Optimization + 增量层搜索来探索原语组合。AIRA 做的事,是把"搜索"和"评估"这两步从规则...
第三刀:自主搜索。这是 FutureSim 反差最大的一组消融。在解题前一天给 agent 完整语境、让它自主多轮搜索,准确率 31.2%;如果只用问题原文去做...
检索类包括 TextSearch(带页面阅读和 LLM 摘要的网页搜索)和 ImageSearch(反向图像搜索)。这是常规操作。
在 AI 研究界,一直有一个令人沮丧的“魔咒”:很多号称能自主做实验、写代码、打 Kaggle 比赛的 AI Agent(智能体),在算力堆到一定程度后,性能往...
训练工具使用模型时,12k 条高多样性数据能否胜过 48k 条低多样性数据?DIVE 的实验给出了明确答案:可以,而且在分布外(OOD)任务上一致性地更好。这个...
第一条是免训练的贪心搜索。若简单进行均匀间隔跳层,模型会在特定关键层因索引漂移而导致性能崩塌。该算法通过在校准集上最小化语言建模损失 ,迭代剥离对索引变化最不敏...
默认 7:3 的权重配比,让语义理解主导搜索方向,同时保留精确匹配的锚定能力。当用户搜索专有名词或特定代码片段时,BM25 的权重会自然发挥更大作用;而面对模糊...
今天,我们要深入探讨一篇来自清华大学等机构的最新研究——SSRL (Self-Search Reinforcement Learning)。这篇论文聚焦于一个非...