js 拼音模糊搜索_js+拼音模糊搜索_js 拼音模糊匹配 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

有赞零售移动端收银商品实践

面对线下收银场景，针对商品收银业务，如何提升商家收银的效率？如何保证即使在弱网或无网条件下商家正常的收银？如何设计大量商品时搜索方案？如何对业务模块进行解耦和各种复杂的业务场景交互？都是在设计零售收银业务时，需要去认真思考的问题。

02

MySQL模糊查询性能优化

根据模糊查找的业务场景，比对一下上面列出的6种条件，如果你的场景是全都要支持，并且是大用户量，接口qps高，海量的数据检索量，那就不要在数据库上做任何挣扎了，你需要的是一个全文检索引擎。可以直接看文章最后面~

您找到你想要的搜索结果了吗？

是的

没有找到

[WPF] 脱机环境实现支持拼音模糊搜索的AutoCompleteBox

AutoCompleteBox是一个常见的提高输入效率的组件，很多WPF的第三方控件库都提供了这个组件，但基本都是字符串的子串匹配，不支持拼音模糊匹配，例如无法通过输入ldh或liudehua匹配到刘德华。要实现拼音模糊搜索功能，通常会采用分词、数据库等技术对待匹配数据集进行预处理。某些场景受制于条件限制，无法对数据进行预处理，本文将介绍在这种情况下如何实现支持拼音模糊搜索的AutoCompleteBox，先来看下实现效果。

01

PostgreSQL给模糊搜索加索引转

PostgrSQL有个模块叫pg_trgm，可以对字符串来进行比较相似度，并通过加GIST或者GIN索引来达到提速的效果。在一般的RDBMS中这种需求都会进行全表扫描的，但是PG如果加了这个模块，在一定场景下就可以使用索引来提速了。一、背景我们有一个需求根据人员的拼音码(或者药品的拼音码)进行搜索，因为拼音码不一定是全的，故通常给的方案是模糊搜索，在拼音码的首尾两端各加一个百分号，但是效率通常很慢，一般情况下也不建议这么做。二、环境 OS：CentOS 6.5 DB：PostgreSQL 9.3 三、步骤 1.因为DB是通过源码编译的，所以创建很简单，只要添加一个扩展

02

Microsoft SQL Server 编写汉字转拼音函数

在搜索应用中，我们一般会提供一个搜索框，输入关健字，点击查询按钮以获取结果数据。大部分情况我们会提供模糊查询的形式以在一个或多个字段进行搜索以获取结果。这样可以简化用户的操作，扩大搜索范围，为提高精度而提供基础范围数据。因此按汉字拼音搜索，即可以进一步简化输入，又可以进一步扩大搜索范围。

01

Java实现将中文转成拼音和ASCII码

最近项目上遇到一个需求：模糊搜索姓名时既可以输入汉字也可以输入拼音进行搜索，这就要求在保存姓名时也要将其拼音保存起来。

05

拼音搜索的简单实现方案

文章时间：2020年5月28日 13:37:18 解决问题：在搜索框搜索某些东西的时候，我们经常输入了拼音，依然也可以显示搜索出的文字。所用插件：ChinesePY.js 投稿人：梦群同学 ChinesePY 嵌入使用方法下载完成后在项目 main.js 中引入使用方法及返回格式手写自己的根据拼音查询公共函数使用 ChinesePY 嵌入使用方法首先在Github下载ChinesePY.js [下载地址] 下载完成后在项目 main.js 中引入 import Pinyin fro

03

达观数据搜索引擎的Query自动纠错技术和架构详解

达观数据搜索引擎 Query自动纠错技术和架构 1 背景如今，搜索引擎是人们的获取信息最重要的方式之一，在搜索页面小小的输入框中，只需输入几个关键字，就能找到你感兴趣问题的相关网页。搜索巨头Google，甚至已经使Google这个创造出来的单词成为动词，有问题Google一下就可以。在国内，百度也同样成为一个动词。除了通用搜索需求外，很多垂直细分领域的搜索需求也很旺盛，比如电商网站的产品搜索，文学网站的小说搜索等。面对这些需求，达观数据(www.datagrand.com)作为国内提供中文云搜索服务的

09

今天介绍一个天文爱好者的网站——观测卫星过境

对于一个从事遥感、地信周边的人，对于卫星的过境应该是足够敏感的。许多遥感卫星主要是太阳静止卫星轨道、要么是地球静止卫星轨道较为常见，主要是因为这两种轨道周期性较强，可以公布其自身的周期，对于环境科学、测绘科学、大气科学等相关学科较为友好。但并不是所有的卫星都会公布自身的轨迹、周期等数据，例如国内的高分系列，特别是4以后的卫星。但这并不能难到所有人，今天我们就要介绍来自天文爱好者建立的网站，能较好的预测这些人造飞行器和非人造飞行物的轨迹、过境时间等信息，他就是heavens-above网站。

03

[工具软件] 文件浏览和搜索增强工具 Listary Pro

1、体积小巧，而且运行快速，即便在低配置的电脑上常驻系统使用也不会察觉有丝毫拖慢速度的现象。

01

分布式搜索ElasticSearch自定义分词

在实际工作中，客户需要使用搜索框对于基金产品或者基金公司信息进行智能化搜索，比如根据基金代码某部分、基金拼音简称等等来搜索符合条件的产品信息，如果使用关系型数据库来进行搜索，那么大概率是采用了全模糊前后%的形式查询，做了全表扫描，那么随着数据量上升，这种方案的代价是很大的，性能和用户体验也是很不好的。

02

ubuntu16 中文输入法_如何在ubuntu中安装中文输入法

最近刚给笔记本装了Ubuntu+win10双系统，但是ubuntu16.04没有自带中文输入法，所以经过网上的一些经验搜索整合，分享一下安装中文输入法的心得。本文主要介绍了谷歌拼音跟ibus中文输入法的安装，由于ibus输入法问题较多，所以目前我用的是谷歌输入法。

03

【迅搜14】搜索技巧（四）搜索日志库及热门、推荐、纠错功能

前面我们已经学习了基本的搜索功能以及非常重要的相关度排序的算法。对于大家日常基本的使用来说，其实有之前的内容就已经非常足够了，但是，一个好的工具，总会有一些意外惊喜的，比如说我们今天要学习的内容。

01

微信小程序的省市选择组件 citySelector分享

:dash::rocket: 微信小程序，一行代码引入的省份/城市/区县定位选择器的库

07

一张24块5的火车票，能带你去哪看看？我用Python爬了一下

我（信誓旦旦状）：等我爬下携程所有票价信息，以后给我一个预算，我就能跟你说你去到哪儿！

03

电商搜索全链路（PART II）Query理解

大家好，我是kaiyuan。电商搜索全链路系列文章们躺在我的草稿箱里已经N久了，上一篇整理还是在上次，错过的小伙伴点击传送门：电商搜索全链路（PART I）Overview

01

微信小程序开发的天气预报源码

开始项目时，还需要启动另一个项目middleware充当中间件请求weather接口

07

【全文检索_01】核心理论

全文检索是 20世纪末产生的一种新的信息检索技术。经过几十年的发展，特别是以计算机技术为代表的新一代信息技术应用，使全文检索从最初的字符串匹配和简单的布尔逻辑检索技术演进到能对超大文本、语音、图像、活动影像等非结构化数据进行综合管理的复合技术。由于内涵和外延的深刻变化，全文检索系统已成为新一代管理系统的代名词，衡量全文检索系统的基本指标和全文检索的内涵也发生巨大变化。

02

用一年的时间，去遇见

白色而透明的屏幕里，像素点时刻变换着颜色。你看不见的黑暗里，只有风扇快速转动，发出微弱的响声。

09

【小程序/工具类】天气预报

开始项目时，还需要启动另一个项目middleware充当中间件请求weather接口

03

资源 | 一网打尽成语歇后语，GitHub新华字典数据库

数据库收录了包括14032条歇后语，16142个汉字，31648个成语。下面文摘菌就简单的介绍一下这个数据库。

00

轻量级Qt键盘-简拼输入

字库加载在QMap<QString, QList<QPair<QString, QString>> >容器中。

02

【愚公系列】2023年02月 .NET CORE工具案例-ToolGood.Words敏感词过滤

敏感词过滤是一种处理网络内容的技术，可以检测和过滤出网络中的敏感词汇。它通过给定的关键字或字符串，判断网络内容是否包含某些敏感信息，从而防止违反法律法规的信息流通。

02

明明都定义好了，怎么还是说我没有声明啊？

闲来无事在家学习，突然有位粉丝发消息来问0这样的问题：明明都定义好了，还是说我没有声明啊？

02

重新思考数据输入

在目前的产品交互中，输入数据然后程序或者产品对数据进行验证是非常常见的需求，而产品进行验证的目的性也很明确，就是为了避免脏数据进入数据库。但是从产品交互本身来讲，产品是为了让用户更加准确的、简单的使用一个功能，而不是在出错或者用户目的很明确的时候告诉他输入错误了。

02

谷歌输入法背后的机器智能

很多人每天花费大量时间使用移动设备键盘：撰写电子邮件，发短信，参与社交媒体等。然而，移动键盘仍然在处理速度方面处于劣势。用户平均在移动设备上的打字速度比在物理键盘上慢35％。为了改变这一点，最近谷歌团队为Gboard for Android提供了许多改进，致力于创建一个智能机制的键盘，能够为用户以任何选择的语言提供建议和纠正错误，从而实现更快更高质量的输入。事实上，移动键盘将触摸输入转换为文本的方式类似于语音识别系统将语音输入转换为文本的方式，雷锋网了解到，该团队将利用语音识别的经验来实现触摸输入

07

学界 | 谷歌输入法背后的机器智能：思你所思，想你所想！

很多人每天花费大量时间使用移动设备键盘：撰写电子邮件，发短信，参与社交媒体等。然而，移动键盘仍然在处理速度方面处于劣势。用户平均在移动设备上的打字速度比在物理键盘上慢35％。为了改变这一点，最近谷歌团队为Gboard for Android提供了许多改进，致力于创建一个智能机制的键盘，能够为用户以任何选择的语言提供建议和纠正错误，从而实现更快更高质量的输入。事实上，移动键盘将触摸输入转换为文本的方式类似于语音识别系统将语音输入转换为文本的方式，雷锋网了解到，该团队将利用语音识别的经验来实现触摸输入

07

基于语义关联的中文查询纠错框架

本文作者：内部搜索平台部推荐中心组长，2009年加入腾讯，从事搜索相关工作，包括社区问答，网页搜索，音乐、视频、应用宝等项目，方向涉及query理解，文本相关性、智能问答等。目前从事天天快报、新闻客户端等资讯个性化，包括用户兴趣、推荐策略、工程架构等。搜索引擎中, 一个好的纠错系统能够将用户输入查询词进行纠错提示, 或者将正确结果直接展示给用户，提高了搜索引擎的智能化。和传统文本纠错相比, 搜索引擎的纠错具有几个难点. 一是搜索引擎的query很短, 由几个独立的key words组成（Chen et

vivo 敏感词匹配系统的设计与实践

谛听系统是vivo的内容审核平台，保障了vivo各互联网产品持续健康的发展。谛听支持审核多种内容类型，但日常主要审核的内容是文本，下图是一个完整的文本审核流程，包括名单匹配、敏感词匹配、AI机器审核、人工审核四个环节。待审核文本需要顺次通过名单匹配、敏感词匹配、AI机器审核三个流程，若结果为嫌疑则需要人工审核，否则将直接给出确定的结果。

01

前端无依赖的模糊搜索工具！轻巧，强大！

这段时间大师兄项目中出现了固定数据池的模糊检索需求，也就是在一大堆几乎不变化的数据中进行模糊检索。同时，这样的检索需求在同模块中也会出现很多次。

03

网站建设步骤及常用建站系统分享

现在很多朋友对于网站建设的概念和步骤都很模糊，下面小熊优化的小编给大家详细讲解一下，网站建设主要分下面几个步骤

03

Python 处理中文的 4 个轮子

这里记录 Python相关的值得分享的内容，每周五发布。由于微信不允许外部链接，点击阅读原文可访问文中的链接。

02

这家老让别人上热搜的公司，靠数据挖掘拿下AI顶会大奖

KDD，全球顶级学术会议，数据挖掘领域国际最高级别会议，每个从事数据挖掘、分析和应用的组织都无法错过的会。

03

Ubuntu 20.04 上安装使用 ibus-rime（超实用）

RIME／中州韵输入法引擎（Rime Input Method Engine），是一个跨平台的输入法算法框架。基于这个算法框架开发的输入法，可以粗暴的称为 Rime 输入法。然而，每个平台都有各自的名称：

01

推荐一款基于.NetCore高性能敏感词检测开源库

这是一款基于.Net开发的、高性能敏感词工具箱，支持繁简互换、全角半角互换，拼音模糊搜索等功能。功能强大、高性能，秒级检测亿级别的文章。

01

Solr搜索引擎 — 两种安装方式

常常在业务开发中会遇到大列表的查询需求或者按照各项条件搜索内容，一般的做法往往都是数据库直接搞定，但是到了一定的程度只有这类需求会带来巨大的开销，一个表格中涉及到了5张表的数据，搜索要求从其中3张表的不同字段做到模糊查询，如果还用传统的方式实现起来就很有难度了逻辑和数据库性能就是一个考验，要是如果在A表一个字段是很长的text需要模糊匹配，在B表需要用简拼音搜索，那就难上加难了，solr恰巧就解决了这些问题。

02

移动客户端多音字搜索

本文重点讲述微信安卓客户端在 SQLite FTS5 的基础上，多音字问题的解决方案。

Wox一款国产开源的快捷启动器辅助工具神器

如果你也不喜欢电脑桌面上满是程序的快捷方式，如果你也喜欢博主这样干干净净的桌面，甚至喜欢高效的键盘操作，那么你需要一款好用的快速启动器软件。

01

《数学之美》与算法

《数学之美》是一本非常好的算法进阶书，它与吴军老师从事的工作领域密切相关，所以工程性很强。半年时间断断续续读完此书，这里做个笔记，也希望能帮助还未读过本书的同学快速了解主要内容。这本书里主要讲述了两个应用场景：

06

前端中文汉字转拼音

这次要推荐一个在前端就能实现汉字转拼音的工具库 —— pinyin-pro 。

02

JavaScript 数据结构：什么是数据结构？

今天我要给大家分享的什么是数据结构，怎么通过JavaScript去理解这个概念，在专业程序员的成长过程中，数据结构的学习至关重要，今天的内容很轻松，就是和大家一起探讨下什么是数据结构。

04

MySQL B+树索引和哈希索引的区别

索引介绍索引是一种特殊的数据库结构，被设计用来快速查询数据库表中的特定记录。索引有多种类型，就像字典有拼音查找和偏旁查找一样都是为了提高检索效率。 MySQL中最常见的索引类型有B+树索引和哈希索引，下面来简单介绍一下这两种索引类型有哪些差别和优劣。 B+树索引 B+树索引是一种多路径的平衡搜索树，具有如下特点： 1.非叶子节点不保存数据，只保存索引值 2.叶子节点保存所有的索引值和数据 3.同级节点通过指针自小而大顺序链接 4.节点内的数据也是自小而大顺序存放 5.叶子节点拥有父节点的所有信息

01

微信团队分享：微信移动端的全文检索多音字问题解决方案

微信的移动客户端全文搜索中的多音字问题一直是搜索体验的痛点之一。微信客户端全文搜索在上线以后，也经常收到用户关于多音字问题的反馈。所以，微信全文搜索中的多音字搜索成了一个迫切需要解决的问题。本文重点讲述微信安卓客户端在SQLite FTS5的基础上，多音字问题的解决方案。

03

Qt编写的项目作品4-输入法V2019

一、功能特点未采用Qt系统层输入法框架，独创输入切换机制。纯QWidget编写，支持任何目标平台（亲测windows、linux、嵌入式linux等），支持任意Qt版本（亲测Qt4.6.0到Qt5.13），支持任意编译器（亲测mingw、gcc、msvc等），支持任意控件输入包括网页中的输入控件。调用极为方便，pri文件调用形式，只要改成文件包含即可，例如pro文件中写 include($$PWD/input2019/input2019.pri)。界面清晰简洁，UI美观友好，高仿IOS输入法，非常适

07

厉害了！竟然有程序员在GitHub上建了一个新华词典数据库

文章整理自：https://github.com/pwxcoo/chinese-xinhua

02

实战：Vue全家桶+SSR+Koa2实现美团网

前端：Nuxt.js/vue-router/ Vuex/ ELement-ui 后端：Node.js/Koa2/Koa-router/Nodemailer/Passport HTTP通讯：Axios 数据支撑：Mongoose/Redis/高德地图web服务api接口

04

中文文本纠错算法走到多远了？

错误检测部分先通过结巴中文分词器切词，由于句子中含有错别字，所以切词结果往往会有切分错误的情况，这样从字粒度和词粒度两方面检测错误，整合这两种粒度的疑似错误结果，形成疑似错误位置候选集；

03

数据结构 | 30行代码，手把手带你实现Trie树

今天是算法和数据结构专题的第28篇文章，我们一起来聊聊一个经典的字符串处理数据结构——Trie。

02

一款功能强大的桌面级插件平台

uTools 是一个极简、插件化的现代桌面软件，通过自由选配丰富的插件，打造得心应手的工具集合。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭