首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【行业资讯】Apache Lucene 9.0 发布,Java 全文检索引擎架构

Apache Lucene 9.0 现已发布,Lucene 是完全用 Java 编写的高性能、功能齐全的全文检索引擎架构,提供了完整的查询引擎和索引引擎、部分文本分析引擎。目的是为软件开发人员提供一个简单易用的工具包,以方便地在目标系统中实现全文检索的功能,或者是以此为基础建立起完整的全文检索引擎。

主要更新内容

支持索引高维度的数字向量,以执行最近的邻居搜索,使用分层可导航的小世界图算法

针对塞尔维亚语、尼泊尔语和泰米尔语的新分析器

对日语的 IME 友好的自动建议

Snowball 2,增加了印地语、印度尼西亚语、尼泊尔语、塞尔维亚语、泰米尔语和意第绪语的词干

为瑞典语和挪威语提供了新的规范化/词干功能

分类法分面的速度提高了400%

多维点的索引速度提高 10-15%

对以点为索引的字段的排序速度提高了数倍。这个优化在 8.x 版本后期是一个选择项,现在从 9.0 版本开始也是选择项了

ConcurrentMergeScheduler 现在假定快速 I/O,在启发式方法会错误地检测系统是否有现代 I/O 的情况下,可能会提高索引的速度

发布列表的编码从 FOR-delta 改为 PFOR-delta,以进一步节省磁盘空间

文件格式都从 big-endian 顺序改为 little-endian 顺序

Lucene 9 不再有分支的包。这需要在 lucene-core JAR 之外重新命名一些包,所以你需要相应地调整一些导入

在模块系统中使用 Lucene 9 应该被认为是实验性

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20211210A017QZ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券