首页
学习
活动
专区
圈层
工具
发布

#搜索

你的文件上传后,到底经历了什么?—— OpenViking 向量化全链路硬核拆解

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

OpenViking 没有采用传统 RAG "解析→切片→Embedding→入库" 的扁平套路,而是设计了一套文件系统范式 + 三级向量索引 + 层级递归检索...

8200

告别 AI “金鱼记忆”!OpenViking 如何让你的 Agent 过目不忘?

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

各位代码界的卷王、AI圈的探险家们! 👋 今天咱们要聊聊 OpenViking 里那个让 AI Agent 终于能“记住你是谁”的神奇系统!

6400

告别 Python 依赖!Spring AI RAG 核心依赖配置指南

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

在 2024 年之前,检索增强生成(RAG)还是个 Python 专属的 "俱乐部"。

10110

Agentic RAG:给传统 RAG 装个 "智能导航",专治各种 "超纲提问

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

咱用 SerperAPI 做网页搜索(谷歌搜索),免费额度有 2500 次网页搜索 API 调用,1-2 秒就能返回谷歌搜索结果。

8400

读者搜索问答:域名怎么买、知识库怎么选、收款怎么搞

袁锐钦

每周五回答几个从搜索数据里看到的真实问题。这些问题不是我想出来的——是你在搜索引擎里一个一个字打出来的。

5500

从0到规模化MAU:工具站6个月增长曲线的关键节点

袁锐钦

很多人在第二个月看到搜索词报告里出现了一个高搜索量的竞品词——「这个月1万人在搜,我得写一篇!」

5310

我用coze搭了一个小红书AI工作流,终结了我老婆的选择困难症

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

当老婆第三次因为对比五款儿童保温杯的测评笔记而错过睡前故事时间时,我决定把 “小红书攻略筛选” 这件事拆解成可执行的技术方案。最终搭建的 AI 工作流不仅帮她把...

10600

SkillHub 安装后找不到技能怎么办?路径配置与排查完整指南

hollyx

摘要 从SkillHub安装技能后,需在AI平台中正确配置才能调用。本文介绍WorkBuddy、QClaw、ima等平台的技能安装路径、识别机制和常见问题的排查...

11010

52% 反超 48%!AI 接管内容,人类创作者要慌了?

PikeTalk

SEO 公司 Graphite 最近扔了个大瓜:到 2025 年 5 月,互联网上 52% 的书面内容是 AI 写的,咱们人类写的只剩 48% 了。

5600

谷歌一个看似微小,实则影响巨大的变动

PikeTalk

上个月,谷歌悄悄地移除了 num=100 这个搜索参数。Google 本身不提供公开的网页搜索API。

5800

AI 搜索时代的网站可见性机制变化

用户12583401

过去二十年,SEO 的核心问题很清楚:如何让网页被搜索引擎发现、理解、索引,并在用户搜索某个关键词时排到更靠前的位置。这个逻辑建立在一个稳定的搜索界面之上:用户...

7700

RSI 递归自我改进:让 LLM 自己来设计下一代的 LLM

唐国梁Tommy

传统的 Composer 框架用 Bayesian Optimization + 增量层搜索来探索原语组合。AIRA 做的事,是把"搜索"和"评估"这两步从规则...

12310

把真实世界重放一遍,看 Agent 还能不能跟得上

唐国梁Tommy

第三刀:自主搜索。这是 FutureSim 反差最大的一组消融。在解题前一天给 agent 完整语境、让它自主多轮搜索,准确率 31.2%;如果只用问题原文去做...

10200

OpenSearch-VL:一份能跑起来的多模态搜索 Agent 配方

唐国梁Tommy

检索类包括 TextSearch(带页面阅读和 LLM 摘要的网页搜索)和 ImageSearch(反向图像搜索)。这是常规操作。

7100

Meta 新作 AIRA² 告诉你:一套强悍的 Agent Harness 才是自动化科研的基石

唐国梁Tommy

在 AI 研究界,一直有一个令人沮丧的“魔咒”:很多号称能自主做实验、写代码、打 Kaggle 比赛的 AI Agent(智能体),在算力堆到一定程度后,性能往...

9210

从搜索循环到 373 种工具:扩展多样性如何重塑智能体训练

唐国梁Tommy

训练工具使用模型时,12k 条高多样性数据能否胜过 48k 条低多样性数据?DIVE 的实验给出了明确答案:可以,而且在分布外(OOD)任务上一致性地更好。这个...

11710

清华&智谱 — IndexCache:跨层复用Top-k索引加速稀疏注意力

唐国梁Tommy

第一条是免训练的贪心搜索。若简单进行均匀间隔跳层,模型会在特定关键层因索引漂移而导致性能崩塌。该算法通过在校准集上最小化语言建模损失 ,迭代剥离对索引变化最不敏...

9510

OpenClaw 记忆系统:AI Agent 如何拥有持久记忆

唐国梁Tommy

默认 7:3 的权重配比,让语义理解主导搜索方向,同时保留精确匹配的锚定能力。当用户搜索专有名词或特定代码片段时,BM25 的权重会自然发挥更大作用;而面对模糊...

12710

SSRL:Agent如何自我检索,告别外部工具依赖?

唐国梁Tommy

今天,我们要深入探讨一篇来自清华大学等机构的最新研究——SSRL (Self-Search Reinforcement Learning)。这篇论文聚焦于一个非...

11100
领券