ZHANGHAO

LV1
订阅了专栏

腾讯云技术沙龙

149 文章1.2K 关注者
发表了文章

Spark 中 Kafka Offset 管理

Spark在spark-streaming-kafka-0-10的API中实现了对Kafka Offset提交的API,在Spark消费过消息之后,提交消费过消...

ZHANGHAO
APIsparkKafka
订阅了专栏

腾讯云TVP

91 文章209 关注者
发表了文章

实时MySQL数据源同步中间件-Maxwell

Maxwell是一个读取MySQL binlog并将行更新作为JSON写入Kafka,Kinesis或其他流平台的应用程序。

ZHANGHAO
MySQL数据库SQLKafka
订阅了专栏

Hadoop实操

专注Apache Hadoop,CDH和HDP的实操,如安装部署,安全配置,排障过程,经验分享,性能

834 文章496 关注者
关注了用户

Fayson

834 文章0 回答300 关注者
发表了文章

基于Avro文件和Avro Schema构建Avro Hive表

ZHANGHAO
发表了文章

CCA175 考试总结

今天(2019.01.29)考了CCA175考试,针对考试中一些考点和技巧做出总结

ZHANGHAO
Hive
发表了文章

Spark 设置 Hadoop 的配置文件

当我们在开发Spark应用程序的时候,没有设置Hadoop的配置文件的情况下来读取或者写入HDFS文件,每次都要写上hdfs://host:port/pa...

ZHANGHAO
HadoopsparkXML大数据
发表了文章

Sqoop 压缩

Sqoop 作业的输出可以直接压缩。Sqoop 作业是一个MapReduce作业, 因此通过设置MapReduce压缩编解码器, 可以得到 Sqoop 的输出压...

ZHANGHAO
MapReduce
发表了文章

Scala 操作 HBase2.0 数据库

ZHANGHAO
HBaseScala分布式数据库
发表了文章

Apache Phoenix 的安装与使用

Apache Phoenix 是 HBase 的开源 SQL 皮肤,可以使用标准的JDBC 的APIs去代替常规的HBase 客户端的APIs去创建表,插入数据...

ZHANGHAO
HBaseAPI分布式数据库Bash 指令Java
发表了文章

Spark Streaming中使用HikariCP数据库连接池与MySQL交互

在使用Spark Streaming的应用程序时,我们可能需要将计算结果保存到MySQL中,为了高效的与MySQL进行交互,这里我们使用HikariCP这个高效...

ZHANGHAO
MySQLMavenGradle数据库SQL
订阅了专栏

个人分享

238 文章37 关注者
订阅了专栏

xingoo, 一个梦想做发明家的程序员

797 文章77 关注者
发表了文章

Spark Streaming基于网络的词频统计

ZHANGHAO
spark
发表了文章

Hive 创建自定义函数(UDF)

当Hive中的内置函数不满足我们需求的时候,我们可以自定义我们自己的Hive函数,来满足我们的需求。

ZHANGHAO
HiveJAR
发表了文章

用Kafka消费Flume传来的日志

ZHANGHAO
其他
发表了文章

Hive CLI常用命令

ZHANGHAO
HiveSQL
发表了文章

Hive的数据类型

ZHANGHAO
其他

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券