首页
学习
活动
专区
工具
TVP
发布

小旋锋的大数据专栏

专栏作者
43
文章
59606
阅读量
13
订阅数
Flink 概念
大数据知识脑图:https://github.com/whirlys/bigdata-mind-map
小旋锋
2019-11-06
3560
Flink 1.9 Table API & SQL 知识点脑图
大数据知识脑图:https://github.com/whirlys/bigdata-mind-map
小旋锋
2019-11-06
8640
Flink 1.9 CEP 知识点脑图
大数据知识脑图:https://github.com/whirlys/bigdata-mind-map
小旋锋
2019-11-06
8280
MySQL Binlog 解析工具 Maxwell 详解
Maxwell是一个能实时读取MySQL二进制日志binlog,并生成 JSON 格式的消息,作为生产者发送给 Kafka,Kinesis、RabbitMQ、Redis、Google Cloud Pub/Sub、文件或其它平台的应用程序。它的常见应用场景有ETL、维护缓存、收集表级别的dml指标、增量到搜索引擎、数据分区迁移、切库binlog回滚方案等。官网(http://maxwells-daemon.io)、GitHub(https://github.com/zendesk/maxwell)
小旋锋
2019-03-15
10.8K0
Zookeeper 分布式协调服务介绍
分布式系统的简单定义:分布式系统是一个硬件或软件组件分布在不同的网络计算机上,彼此之间仅仅通过消息传递进行通信和协调的系统。
小旋锋
2019-01-28
7420
利用Zookeeper实现 - Master选举
Zookeeper 是一个高可用的分布式数据管理与协调框架,基于ZAB协议算法的实现,该框架能够很好的保证分布式环境中数据的一致性。Zookeeper的典型应用场景主要有:数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等。
小旋锋
2019-01-28
1.2K0
利用Zookeeper实现 - 数据发布订阅
所谓的数据发布/订阅,意思是发布者将数据发布到Zookeeper上的一个或一系列节点上,通过watcher机制,客户端可以监听(订阅)这些数据节点,当这些节点发生变化时,Zookeeper及时地通知客户端,从而达到动态获取数据的目的。
小旋锋
2019-01-28
1.5K0
设计模式 | 简单工厂模式及典型应用
设计模式(Design Pattern)是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结,使用设计模式是为了可重用代码、让代码更容易被他人理解并且保证代码可靠性。
小旋锋
2019-01-21
1.2K0
Lucene 7.4 初体验
Lucene是目前最流行的Java开源搜索引擎类库,最新版本为7.4.0。Lucene通常用于全文检索,Lucene具有简单高效跨平台等特点,因此有不少搜索引擎都是基于Lucene构建的,例如:Elasticsearch,Solr等等。
小旋锋
2019-01-21
5700
Elasticsearch 6.x Mapping设置
需要注意的是,在索引中定义太多字段可能会导致索引膨胀,出现内存不足和难以恢复的情况,下面有几个设置:
小旋锋
2019-01-21
3K0
设计模式 | 抽象工厂模式及典型应用
抽象工厂模式(Abstract Factory Pattern):提供一个创建一系列相关或相互依赖对象的接口,而无须指定它们具体的类。抽象工厂模式又称为Kit模式,它是一种对象创建型模式。
小旋锋
2019-01-21
8040
Google guava工具类的介绍和使用
工具类就是封装平常用的方法,不需要你重复造轮子,节省开发人员时间,提高工作效率。谷歌作为大公司,当然会从日常的工作中提取中很多高效率的方法出来。所以就诞生了guava。
小旋锋
2019-01-21
3.7K0
elasticsearch倒排索引与分词
单词词典的实现一般用B+树,B+树构造的可视化过程网址: B+ Tree Visualization
小旋锋
2019-01-21
1.4K0
ElasticSearch初体验
构建在开源基础之上, Elastic Stack 让您能够安全可靠地获取任何来源、任何格式的数据,并且能够实时地对数据进行搜索、分析和可视化
小旋锋
2019-01-21
9690
设计模式 | 工厂方法模式及典型应用
工厂方法模式(Factory Method Pattern):定义一个用于创建对象的接口,让子类决定将哪一个类实例化。工厂方法模式让一个类的实例化延迟到其子类。
小旋锋
2019-01-21
1.2K0
设计模式之观察者模式及典型应用
微信公众号有服务号、订阅号和企业号之分。以我的公众号为例,我的公众号类型是订阅号,名称是 "小旋锋",专注于大数据,Java后端类技术分享。目前主要是分享学习笔记为主,尽量做到 "原创"、"高质量"、"成体系"。每当我发布一篇博文推送,订阅的用户都能够在我发布推送之后及时接收到推送,即可方便地在手机端进行阅读。
小旋锋
2019-01-21
1K0
Elasticsearch 6.3.2 启动过程
关于ES调试环境的搭建,可以参考前面的文章 《教你编译调试Elasticsearch 6.3.2源码》
小旋锋
2019-01-21
8950
23个最有用的Elasticseaerch检索技巧(上)
本文主要介绍 Elasticsearch 23种最有用的检索技巧,提供了详尽的源码举例,并配有相应的Java API实现,是不可多得的 Elasticsearch 学习&实战资料
小旋锋
2019-01-21
1.6K0
教你编译调试Elasticsearch 6.3.2源码
想深入理解 Elasticsearch,阅读它的源码是很有必要的,一来可以了解它内部的具体实现,有助于调优,二来可以了解优秀开源项目的代码架构,提高我们的代码架构能力等
小旋锋
2019-01-21
2.1K0
Elasticsearch 中的 Guice
Elasticsearch 源代码中使用了Guice框架进行依赖注入. 为了方便阅读源码, 此处我先通过模仿ES guice的使用方式简单写了一个基本Demo 方便理解, 之后再来理一下ES的Guice使用. 编写的测试类原理图如下:
小旋锋
2019-01-21
1.2K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档