首页
学习
活动
专区
工具
TVP
发布

鸿的学习笔记

专栏作者
330
文章
280253
阅读量
49
订阅数
2020 年 DB Weekly 上最佳的六篇文章
DB Weekly 是我每周都要看的一个关于数据库方向的内容推送。这个公众号的一些文章其实就是来源于 DB Weekly。上周是 2020 年 DB Weekly 最后一篇推送,评选了今年最佳的六篇文章,我花了一周时间读了一遍,发现这个评选没啥问题。遂简单翻译如下:
哒呵呵
2020-12-29
4850
不负责任的聊下 Apache Doris
应读者的要求,这篇文章简单聊聊 Apache Doris。说实话,Apache Doris 比前面提到的 Impala 、Presto 这些交互式查询引擎还要不熟。仅仅以自己的经验简单评述下 Apache Doris。
哒呵呵
2020-04-07
8.6K1
谈谈 Spanner 和 NewSQL
关于昨天 Spanner 的文字,有人问 NewSQL 为什么会起名为 New,Spanner 的应用场景又是怎样的?那么这篇就顺着大数据的历史继续聊。
哒呵呵
2020-02-26
8480
分析 Google Cloud Spanner 的架构
在2005、2006年期间,谷歌内部大规模使用了 MySQL 数据库。其中Google Adwords (谷歌广告部门)使用了 90 多个 MySQL Shards(分片)集群方案存储数据,是谷歌内部使用 MySQL 数据库的最大的部门之一。由于系统维护的原因,谷歌广告部门重新规划了 MySQL 集群,整个过程花了 2 年时间。因为谷歌知道它们的数据增长的非常快,再使用 MySQL 这类数据库到未来的某个时刻会非常痛苦。这就是 Spanner 的诞生原因。
哒呵呵
2020-02-19
3.2K0
读会搜索引擎
搜索引擎一般由索引管理器,索引检索器,索引构建器,文档管理器组成。 索引管理器,顾名思义是管理带有索引结构的数据,负责对索引的访问。那么索引是怎么管理的呢?不可能总是放在内存里,索引通常来讲是作为二级存储的二进制文件,二级存储可以理解为 硬盘之类的,二进制文件是除了文本文件以外的文件(文本文件是指由ascii码等方式显示的文件)。 索引检索器,是负责利用索引对全文进行搜索,输入是应用层传输过来的数据,和索引管理器一起协同查询文档,并以某种方式反馈给用户。 索引构建器,从文本中生成索引的组件。通常而言,构建器会将文本解析成一个个单词序列,再将单词序列转换为索引结构。 文档管理器,存储着文档,负责取出与查询结果匹配的文档,如果有需要的话会选取一部分作为摘要。 只要根据ID的来检索数据库就好,至于自己用文件夹存储呢,还是用mysql之类的数据库可以自己考虑。 此外,还会有爬虫和搜索排序系统,最出名的当属pagerank。
哒呵呵
2018-08-06
4710
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档