首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

iOS微信全文搜索技术优化

这些搜索功能从2014年上线至今,已经多年没有更新底层搜索技术,聊天记录使用的全文搜索引擎还是SQLite FTS3,而现在已经有SQLite FTS5,收藏首页的搜索还是使用简单的Like语句去匹配文本...SQLiteFTS5组件作为最新版本引擎也已经推出超过六年了,在安卓微信上也已经全量应用,所以技术风险是最低的。...在SQLite几个版本的引擎中,FTS5的搜索语法更加完备严谨,提供了很多接口给用户自定义搜索函数,所以搜索能力也相对强一点。...SQLite FTS3和FTS5的大部分性能很接近,FTS5索引的生成耗时比FTS3高一截,这个有优化方法。 综合考虑这些因素,我们选择SQLite FTS5作为iOS微信全文搜索的搜索引擎。...为了减少segment的数量,SQLite FTS5引入了merge机制。

2.2K60
您找到你想要的搜索结果了吗?
是的
没有找到

移动客户端多音字搜索

本文重点讲述微信安卓客户端在SQLite FTS5的基础上,多音字问题的解决方案。...客户端索引方案 ---- 在确定字表方案后,需要在客户端本地使用SQLite FTS5建立索引。因为拼音搜索主要是采用前缀搜索的方式,所以建立索引的内容以及方式需要考虑FTS5前缀搜索的过程 ?...而SQLite FTS5正是通过搜索一个词语来找到对应的DocId,通过TermOffset来定位该词语在Document中的位置。...在SQLite FTS5中,一个词语可以通过一个DocId和一个TermOffset来定位,所以当两个词语拥有同一个DocId和TermOffset时,就可以说这两个词语为同义词了,也就有了如下的索引方案...多音字分词器 ---- SQLite FTS5默认的分词器的分隔符都是固定的,所以,在识别拼音字符时,会当成英文字母来分词。

3.5K210

微信团队分享:微信移动端的全文检索多音字问题解决方案

本文重点讲述微信安卓客户端在SQLite FTS5的基础上,多音字问题的解决方案。...6、客户端索引方案 在确定字表方案后,需要在客户端本地使用SQLite FTS5建立索引。因为拼音搜索主要是采用前缀搜索的方式,所以建立索引的内容以及方式需要考虑FTS5前缀搜索的过程。 ?...而SQLite FTS5正是通过搜索一个词语来找到对应的DocId,通过TermOffset来定位该词语在Document中的位置。 方案优点: 实现较为简单; 可覆盖所有多音字情况。...在SQLite FTS5中,一个词语可以通过一个DocId和一个TermOffset来定位,所以当两个词语拥有同一个DocId和TermOffset时,就可以说这两个词语为同义词了,也就有了如下的索引方案...7、多音字分词器 SQLite FTS5默认的分词器的分隔符都是固定的,所以,在识别拼音字符时,会当成英文字母来分词。

5.3K32

微信全文搜索优化之路

SQLite FTS Extension ---- SQLite FTS Extension是SQLite为全文搜索开发的一个插件,它是内嵌在标准的SQLite分布版本当中,它具有如下的特点: 搜索速度快...:使用倒排索引加速查找过程 稳定性好:目前SQLite在移动端的稳定性比较好,FTS Extension就是SQLite的基础上搭建的 接入简单:Android和IOS平台本身就支持SQLite,并且FTS...FTS5:和FTS4有较大变动,储存格式上有较大改进,最明显就是Instance-List的分段存储,能够支持更大的Instance-List的存储;并且开放ExtensionApi,支持自定义辅助函数...FTS5发布于2015年中。 存储架构 ---- 微信全文搜索在2014 年底上线,最初主要服务于联系人和聊天记录的业务搜索。...在一番研究以后,我发现FTS5支持自定义辅助函数,并且有比较好的API的封装,所以最后使用FTS5自定义辅助函数(MMHighLight)重新实现Offsets函数的功能,并加入优化逻辑。

1.4K20

微信全文搜索优化之路

SQLite FTS Extension SQLite FTS Extension是SQLite为全文搜索开发的一个插件,它是内嵌在标准的SQLite分布版本当中,它具有如下的特点: 搜索速度快:使用倒排索引加速查找过程...稳定性好:目前SQLite在移动端的稳定性比较好,FTS Extension就是SQLite的基础上搭建的 接入简单:Android和IOS平台本身就支持SQLite,并且FTS Extension的使用就和正常使用...SQLite表一样。...FTS5发布于2015年中。 存储架构 微信全文搜索在2014 年底上线,最初主要服务于联系人和聊天记录的业务搜索。...在一番研究以后,我发现FTS5支持自定义辅助函数,并且有比较好的API的封装,所以最后使用FTS5自定义辅助函数(MMHighLight)重新实现Offsets函数的功能,并加入优化逻辑。

8.8K42

微信手机端的本地数据全文检索优化之路

(本文同步发布于:http://www.52im.net/thread-1132-1-1.html) 2、SQLite FTS Extension SQLite FTS Extension是SQLite...:Android和IOS平台本身就支持SQLite,并且FTS Extension的使用就和正常使用SQLite表一样; [4] 兼容性好:受益于SQLite本身兼容性很好,SQLite FTS Extension...FTS5发布于2015年中。 3、存储架构 微信全文搜索在2014 年底上线,最初主要服务于联系人和聊天记录的业务搜索。...在一番研究以后,我发现FTS5支持自定义辅助函数,并且有比较好的API的封装,所以最后使用FTS5自定义辅助函数(MMHighLight)重新实现Offsets函数的功能,并加入优化逻辑。...所以这里关键的实现点在于中间转化函数的实现,微信的中间转化函数MMRank是通过FTS5的辅助函数实现的。 ?

2.5K20

玩转SQLite1:SQLite简介与安装

SQLite官网:https://www.sqlite.org/index.html 1.1 SQLite的特点 SQLite是完全开源免费的 QLite是无服务器的,不需要服务器进程或系统来操作...sqlite/sqlite-c-cpp.html 2.1 Windows系统安装 SQL官网下载地址:https://www.sqlite.org/download.html,下载 sqlite-dll-win32...-*.zip 和sqlite-tools-win32-*.zip 压缩文件 在任意文件夹下解压上面两个压缩文件,如我的是在D:\sqlite,解压得到 sqlite3.def、sqlite3.dll...以及sqlite3.exe、sqldiff.exe和sqlite3_analyzer.exe,将这几个文件放到一个文件夹中,并添加该文件位置到PATH环境变量,便于在任意位置都能使用SQLite。...最后在命令提示符下,使用 sqlite3 命令,将显示如下结果: 2.2 Linux系统安装 Linux系统一般都附带 SQLite,可以使用下面的命令来检查Linux中是否已经安装了 SQLite

2K20

Architecture of SQLite

本文翻译自Architecture of SQLite https://www.sqlite.org/arch.html 介绍 本文档描述了SQLite库的体系结构。...这里的信息对于那些想理解或修改SQLite内部工作的人很有用。 附近的图表显示了SQLite的主要组件以及它们如何进行互操作。 下面的文本解释了各种组件的角色。 ?...sqlite3_get_table()例程在table.c中实现。sqlite3_mprintf()例程在printf.c中找到。sqlite3_complete()接口在complete.c中。...为了避免名称冲突,SQLite库中的所有外部符号都以前缀sqlite3开头。那些用于外部使用的符号(换句话说,那些构成SQLite的API的符号)添加了下划线,因此以sqlite3开头。...vdbeapi.c文件包含到虚拟机的外部接口,如sqlite3_bind_int()和sqlite3_step()。

1.4K30

SQLite 简介

SQLite 简介 本教程帮助您了解什么是SQLite,它与SQL之间的不同,为什么需要它,以及它的应用程序数据库处理方式。...SQLite源代码不受版权限制。 什么是SQLiteSQLite是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。...就像其他数据库,SQLite引擎不是一个独立的进程,可以按应用程序需求进行静态或动态连接。SQLite直接访问其存储文件。 为什么要用SQLite?...SQLite 不需要配置,这意味着不需要安装或管理。 一个完整的 SQLite 数据库是存储在一个单一的跨平台的磁盘文件。...SQLite 事务是完全兼容 ACID 的,允许从多个进程或线程安全访问。 SQLite 支持SQL92(SQL2)标准的大多数查询语言的功能。

1.8K30

sqlite3在数据科学的使用

sqlite3是一种很好的数据科学工程实践中保存数据(包括原始数据和中间结果存储)的方法。相比于csv/tsv、pickle、parquet,sqlite3的使用场景和意义被大量低估了。...Sqlite3数据科学散人的最佳选择 csv存储效率低,基于字符解析,类型识别(特别datetime)还需要额外处理;pickle,parquet跨工具使用不友好;数据库/数据仓库具有强类型、ER...sqlite3一定程度上数据科学散人进行数据探索的最佳选择:0配置,使用方便服务器-客户端一体,文件读取方式操作数据库(对比于常规数据库)强类型,不需要后置处理(相比于CSV)多语言支持:python,...Sqlite3 Tips1) 基础:csv写入sqlite3from sqlite3 import connectimport csvDB_PATH = ".....3 Sqlite3的其他特性 除了上述实践小技巧,笔者还格外关注sqlite3落地应用(主要是端末设备)其他一些特性:sqlite3支持全文检索,fts5加一些扩展还支持中文和拼音,做一些端末应用

88761

SQLite 基础

Plist(NSArray\NSDictionary) Preference(偏好设置\NSUserDefaults) NSCoding(NSKeyedArchiver\NSkeyedUnarchiver) SQLite3...Core Data SQLite 什么是SQLite SQLite是一款轻型的嵌入式数据库 它占用资源非常的低,在嵌入式设备中,可能只需要 几百K的内存就够了 它的处理速度比Mysql...数据库可以分为2大种类 关系型数据库(主流) 对象型数据库 常用关系型数据库 PC端:Oracle、MySQL、SQL Server、Access、DB2、Sybase 嵌入式\移动客户端:SQLite...字段名2 字段类型2, …) ; 示例 create table t_student (id integer, name text, age inetger, score real) ; 七、字段类型 SQLite...将数据划分为以下几种存储类型: integer : 整型值 real : 浮点值 text : 文本字符串 blob : 二进制数据(比如文件) 实际上SQLite是无类型的 就算声明为integer

2K40
领券