纯向量检索的思路是用embedding把文本转成向量,然后在向量空间里找相似的。这种方式在语义理解上有天然优势,但它的问题在于太依赖语义了。
前两天,一个朋友跟我吐槽:"我让AI帮我写文章,光是跟它解释'我喜欢什么样的风格',就花了整整二十分钟。每次对话都得从头说起,烦都烦死了。"
《数据库允许空值(null),往往是悲剧的开始(第15讲)》一文通过explain来分析SQL的执行计划,来分析null对索引命中情况的影响,有不少同学留言,问...
select * from user where id!=1 or id is null;
《调试MySQL死锁必备!(第13讲)》中,举了一个强制类型转换导致死锁的例子,有朋友询问是不是类型转换都不能命中索引,花1分钟细说一下。
set session transaction isolation level repeatable read;
很多小伙伴在工作中,可能只把MySQL当作一个简单的“数据存储箱”,用了它80%的基础功能,却不知道它还有另外20%的、能解决90%复杂问题的“高级用法”。
第一步是文档处理,属于离线的索引阶段。所有文档经过一个 Embedding 模型,转换为向量表示,然后存入向量索引或向量数据库。
典型场景:一个"微调 overlap"的调整,把每夜索引重建从 45 分钟拖到了 2 小时,值班的人开始收到索引延迟告警。
2026-02-09:使库存平衡的最少丢弃次数。用go语言,给定两个整数 w、m 和一个整数数组 arrivals(第 i 项表示第 i 天到达的物品种类,天数...
2026-02-06:碗子数组的数目。用go语言,给定一个元素互不相同的整数数组 nums。把任意一个连续片段 nums[l..r] 记作“碗”,当且仅当满足:
在日常数据库查询中,去除重复数据是最常见的需求之一。面对这种需求,很多开发者习惯随手用 DISTINCT,也有人觉得 GROUP BY 更 “万能”,但很少有人...
前面的章节我们已经写了很多篇幅关于 MySQL 执行计划的解读,今天我们来继续延伸介绍执行计划的链路跟踪功能,也就是 MySQL 的
如果你注意到在 MySQL 中 ORDER BY DESC 查询比 ORDER BY ASC 稍微慢一些,不用担心 —— 这是已知且符合预期的行为。
uC/OS-III 的就绪列表的实现非常精巧,它不像一个简单的待办事项清单,而更像一个配备了高效索引系统和分组管理机制的智能任务池。它由三个核心部分构成:
我没接话,先把用户行为表、商品文本表、图像特征表一股脑倒进 Doris,顺手建了个向量索引:
这是隐藏索引最典型的应用场景。当你不确定删除索引对性能的影响时,可以先将索引设置为隐藏,然后观察系统性能;如果性能无影响,则删除索引;如果有影响,则将索引恢复为...
2026-01-25:跳跃游戏Ⅳ。用go语言,给出一个整数数组 nums。对于任意起点索引 i,你可以按下面的规则多次移动到其他索引:
在当前这个信息爆炸且充满不确定性的时代,一个人最大的限制往往不是技能或资源的匮乏,而是认知的局限。所谓成长,本质上就是认知维度的不断升级。作为一名在IT和架构领...
定期清理无效索引和冗余索引,通过pg_stat_user_indexes视图查看索引使用率,删除未使用的索引。