谷歌一个看似微小,实则影响巨大的变动
上个月,谷歌悄悄地移除了 num=100 这个搜索参数。Google 本身不提供公开的网页搜索API。
GCP平台上的 Custom Search API 是谷歌官方的另一个服务,其返回内容和排序与 Google.com 主站搜索并不一致。
这意味着,你再也不能一次性查看 100 条搜索结果了。现在,默认的上限是 10 条。
这事儿为什么这么重要?
1、市面上绝大多数的大语言模型 (LLM),比如 OpenAI 的模型和 Perplexity,它们获取信息都(直接或间接地)依赖谷歌索引好的搜索结果,即便它们自己也有网络爬虫。
虽然主流 Chatbot/Agent(包括 ChatGPT、Claude 等)获取实时信息,使用的是 Bing、Brave 等提供的第一方搜索API。
市面上所谓的“Google Search API”,本质是 SERP (搜索引擎结果页) 服务,通过模拟浏览器抓取实现。这些第三方 API 主要被一些小型 Agent 或 SEO 工具使用。
2、谷歌这一改,等于一夜之间把它们访问互联网“长尾”信息 (指那些不太热门、但数量庞大的搜索结果) 的能力砍掉了 90%。
连锁反应来了
根据《搜索引擎之地》(Search Engine Land)的报道,高达 88% 的网站发现自己的页面曝光量出现了下降。
像 Reddit 这样的网站,之前很多内容都排在搜索结果的第 11-100 位,现在被大语言模型引用的次数直线下降。受此影响,其股价下跌了 15%。
Reddit 股价下跌,直接原因是用户活跃度数据不佳与 ChatGPT 对其内容引用比例下跌。前者影响广告收入预期,后者则打击了其作为AI训练数据源的核心价值。
num 参数失效虽并不能直接导致后者,但它通过重创第三方数据抓取生态,间接动摇了市场对Reddit“长尾”数据价值的信心。
对创业公司来说,这简直是当头一棒。想在网上被用户发现,变得难上加难。
对于 Reddit 这类网站来说,它们作为 AI 引擎优化 (AEO) (一种专门针对 AI 模型搜索进行优化的策略) 的一部分,其整个游戏规则都改变了。
现在,仅仅做出一个好产品已经远远不够了,你必须先搞定推广渠道。
因为如果人们压根发现不了你,他们就永远不会有机会去评估你的产品好坏。
大多数工程师似乎总是忽略这个残酷的现实:一个渠道牛逼的平庸产品,总能打败一个渠道很烂的优秀产品。
正如彼得·蒂尔(Peter Thiel)所说:
“大多数公司连一个有效的推广渠道都做不起来:失败最常见的原因是销售不力,而不是产品不行。只要你能打通一个推广渠道,你的生意就能成了。但如果你想多管齐下,结果却一个都没做精,那你就死定了。 强大的销售和分销本身就可以创造垄断,哪怕产品毫无特色。但反过来就不行了。无论你的产品有多牛——就算它完全符合用户习惯,谁用谁说好——你仍然必须用一个强大的分销计划来支持它。” 结论就是: 渠道 > 产品
这个事件还可以和 Grokipedia 联系在一起。
它彻底暴露了当前AI生态依赖第三方数据源(如Reddit)和分发渠道(如Google/Bing)的脆弱性。
马斯克的解法是垂直整合:用自有数据源(X)训练自有模型(Grok),来打造自有知识库(Grokipedia),试图从根本上掌握数据和信息定义权,不再受制于人。 我们或许真的需要重新思考,什么是搜索引擎?
以及,我们是否还需要一个 one-for-all 的搜索引擎?