引言
Weaviate 刚刚发布了v1.30.0版本,带来了一系列重磅更新!无论是动态配置管理、多值向量支持,还是BlockMax WAND 加速的 BM25,这一版本都在性能、灵活性和用户体验上迈出了一大步。如果你是 AI 搜索、RAG(检索增强生成)或向量数据库的开发者,这篇文章将带你深入解析 Weaviate v1.30.0 的核心升级!
核心更新亮点
1.动态配置管理(GA)—— 无需重启,实时调整
Weaviate 现在支持运行时动态调整配置,无需重启服务!这意味着你可以:
• 实时修改AUTOSCHEMA_ENABLED、ASYNC_REPLICATION_DISABLED等关键参数
• 快速实验和优化,避免停机影响业务
• 未来将支持更多动态配置,系统更灵活
2.动态用户管理(GA)—— API 密钥和用户权限实时管理
通过 REST API,现在可以:
•动态创建、更新、吊销用户和 API 密钥
• 支持角色权限管理(RBAC),增强安全性
• 禁止修改 root 用户,防止误操作
• 新增「暂停/激活用户」功能,灵活控制访问
3.动态 RAG 模型选择(GA)—— 按需切换生成模型
在 RAG 场景下,现在可以:
•根据查询复杂度、成本或延迟需求,动态选择生成模型(如 GPT-4、Claude 等)
• 支持多模态(文本+图像)输入,增强生成效果
• 告别固定模型,实现更智能的检索增强生成
4.BlockMax WAND 加速 BM25(GA)—— 关键词搜索性能飙升
BM25 是传统关键词搜索的核心算法,Weaviate 现在采用BlockMax WAND技术,带来:
•更快的查询速度,尤其适合大规模数据集
• 在线迁移工具,无需停机即可升级索引格式
• 保持高相关性,同时大幅提升效率
5.多值向量支持(GA)—— ColBERT 式嵌入正式可用
多值向量(如 ColBERT 的 late interaction 机制)现在正式进入生产环境:
• 支持PQ(Product Quantization)、SQ(Scalar Quantization)等量化技术
• 提升搜索粒度和准确性,适合复杂语义匹配场景
• 所有多向量索引均支持量化,优化存储和计算效率
其他重要改进
•性能优化:HNSW 索引隔离、并发控制提升,减少资源竞争
•安全增强:JWT 库升级至 v4.5.2,修复潜在漏洞
•混合向量支持:允许在已有集合中添加新的命名向量
•中文分词器:新增 GSE 中文分词器,优化中文搜索体验
•API 改进:修复批量操作、租户过滤等关键问题
开发者必看
升级注意事项
•BlockMax WAND 迁移:新索引格式不向后兼容,需按文档迁移
•动态用户管理:需通过DYNAMIC_USERS_ENABLED启用
•多值向量:现支持所有量化选项,可优化存储
推荐场景
RAG 应用:动态切换模型,优化生成效果
电商搜索:BM25 + 多值向量,实现精准商品检索
安全敏感场景:动态用户管理,实时调整权限
结语
Weaviate v1.30.0 不仅提升了性能和灵活性,还让 AI 搜索更智能、更易用!无论是开发者还是企业用户,都能从中受益。
·
欢迎关注“福大大架构师每日一题”,让AI助力您的未来发展。
·
领取专属 10元无门槛券
私享最新 技术干货