首页标签搜索引擎

#搜索引擎

信息检索系统,旨在协助搜索存储在计算机系统中的信息

如何批量去水印?教你一键批量去水印的方法

用户9308944

在网上保存的图片都会带有水印,如商标,logo,个人账号信息等,但是一张一张去图片水印效率太慢了,浪费时间,那么有什么快速批量去水印的方法吗,答案当然是有的,今...

12330

ES Cache: Page Cache

叫我家宝

从操作系统的角度, page cache也称为disk cache, 是操作系统对硬盘(HDD or SSD)的缓存. OS 使用当前空闲的RAM来保存pag...

14640

修改ES返回字段方式提升性能

叫我家宝

最近我们在公司内尝试用ES替换老旧的Solr, 在性能对比测试的环节, 发现ES竟然比Solr慢了非常多, 响应时间是Solr的两三倍, 然后开始各种排查, 最...

23050

什么是符合搜索引擎友好的网站设计?

良家佐言

如果我们从搜索引擎蜘蛛的角度去看一个网站,在抓取、索引和排名时会出现一系列问题,解决了这些问题的网站设计就是对搜索引擎友好的网站。

8930

【ElasticSearch面试】10道不得不会的ElasticSearch面试题

JavaPub

360企业安全 · 服务端工程师 (已认证)

以下是 ElasticSearch 面试题,相信大家都会有种及眼熟又陌生的感觉、看过可能在短暂的面试后又马上忘记了。**JavaPub**在这里整理这些容易忘记...

7700

SolrCloud分布式搜索源码分析

叫我家宝

SolrCloud是solr对分布式搜索的实现, 分布式搜索主要涉及到两个概念, shard和replica.

5410

Chrome浏览器必备插件推荐

浅羽技术

Chrome浏览器对于我们现在互联网行业已经不可或缺,其实大部分使用Chrome浏览器的人更看重的是它的强大的插件功能,几乎提供的插件无所不能。

15700

基于 Kafka 的实时数仓在搜索的实践应用

2020labs小助手

vivo · 技术编辑 (已认证)

Apache Kafka 发展至今,已经是一个很成熟的消息队列组件了,也是大数据生态圈中不可或缺的一员。Apache Kafka 社区非常的活跃,通过社区成员不...

8220

Lucene范围查询原理(<Lucene6.0)

叫我家宝

之前一直想看一下lucene range查询的底层原理, 先上网找了下相关资料, 发现非常混乱, 主要是因为lucene的范围查询曾经经历过两个不同的阶段:

15550

搜索引擎爬取的要点须知

Oxylabs中文站

企业从搜索引擎收集的最基本信息为与其行业相关的关键词和搜索引擎结果页排名。通过了解提升搜索引擎结果页排名的最佳实践,企业能够大体上判定是否应效仿竞争对手的做法。

19860

ES提交操作与原理

叫我家宝

根据官方文档+看源码+实验总结出来的ES各种提交的作用与原理(对应版本7.2.0).

15740

系统设计:附近人或者地点服务

小诚信驿站

让我们设计一个类似Yelp或者大众点评的服务,用户可以搜索附近的地方,比如餐馆、剧院或购物中心等,还可以添加/查看对地方的评论。类似的服务:邻近服务器。

1.9K105

360搜索引擎站长平台上线算法详解

良家佐言

360搜索引擎站长平台出台的算法不多,但是辐射的区间从网页内容质量、用户体验度、用户需求度以及搜索公正与用户安全展开;与百度搜索平台算法有相似之处,关于搜索安全...

7820

SpanQuery源码学习总结

叫我家宝

SpanScorer中包含一个Spans对象, SpanScorer把iterator()和twoPhraseIterator()方法都委托给了Spans对象....

7920

最全网站日志分析攻略,全面解析百度蜘蛛!

用户9229846

是搜索引擎获得页面内容的一个重要的途径,通过蜘蛛的抓取可以得到一个页面的最主要的内容从而收录百度数据库系统,每次抓取之后都会再与数据库原有的信息进行比对,来确定...

28760

《Elasticsearch 源码解析与优化实战》第17章:Shrink原理分析

HLee

官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/master/indices-shri...

26410

《Elasticsearch 源码解析与优化实战》第16章:ThreadPool模块分析

HLee

每个节点都会创建一系列的线程池来执行任务,许多线程池都有与其相关任务队列,用来允许挂起请求,而不是丢弃它。下面列出目前ES版本中的线程池。

27440

《Elasticsearch 源码解析与优化实战》第15章:Transport模块分析

HLee

传输模块用于集群内节点之间的内部通信。从一个节点到另一个节点的每个调用都使用传输模块。例如,当一个节点处理HTTP GET请求时,实际上是由持有该数据的另一个节...

30930

《Elasticsearch 源码解析与优化实战》第14章:Cluster模块分析

HLee

Cluster模块封装了在集群层面要执行的任务。例如,把分片分配给节点属于集群层面的工作,在节点间迁移分片以保持数据均衡,集群健康、集群级元信息管理,以及节点管...

24510

聊聊搜索引擎背后的故事

程序员鱼皮

软件工程师 · 腾讯 (已认证)

结果让我懵逼,我搜到的第一条内容竟然不是拿来剔牙的工具,而是搜出了一位明星,江湖美誉 “吴牙签”。

32351

扫码关注云+社区

领取腾讯云代金券