腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

大数据成神之路

专注大数据领域的一切技术~

专栏作者

635

文章

1274242

阅读量

315

订阅数

Atlas血缘分析在数据仓库中的实战案例

打包 jar xml hive sql

1.1 执行SQL 1.2 手写的数据地图 1.3 atlas血缘分析 1.4 打标签 1.4.1 CLASSIFICATION分类 1.4.2 GLOSSARY词汇表 1.5 字段搜索 1.5.1查看表字段 1.5.2 追踪字段关系

王知无-import_bigdata

2022-03-11

3.1K0

大数据之Hadoop企业级生产调优手册(下)

大数据存储 xml hadoop mapreduce

注：演示纠删码和异构存储需要一共 5台虚拟机。尽量拿另外一套集群。提前准备 5台服务器的集群。

王知无-import_bigdata

2021-10-13

5290

Hive性能调优 | 并行执行/严格模式/JVM重用/推测执行

jvm hadoop hive mapreduce xml

通过设置属性hive.mapred.mode值为默认是非严格模式nonstrict 。开启严格模式需要修改hive.mapred.mode值为strict，开启严格模式可以禁止3种类型的查询。

王知无-import_bigdata

2020-11-06

7130

HDFS读写数据过程原理分析

node.js 编程算法 hadoop 分布式 xml

在学习hadoop hdfs的过程中，有很多人在编程实践这块不知道该其实现的原理是什么，为什么通过几十行小小的代码就可以实现对hdfs的数据的读写。

王知无-import_bigdata

2020-05-20

4480

Hadoop(CDH)分布式环境搭建(简单易懂,绝对有效)

hadoop xml 大数据 yarn node.js

本文是由alice菌发表在：https://blog.csdn.net/weixin_44318830/article/details/102846055

王知无-import_bigdata

2020-05-08

1.4K0

Spark on Hive & Hive on Spark，傻傻分不清楚

hive spark xml shell sql

Spark通过Spark-SQL使用hive 语句,操作hive,底层运行的还是 spark rdd。

王知无-import_bigdata

2020-05-07

10.8K0

Flink Logback日志与邮件报警配置

flink 大数据 javascript xml jar

Flink官方推荐使用Logback替代默认的Log4j作为日志框架。我们之前一直用Log4j，最近切换成了更优秀的Logback，但是配置起来略有点麻烦，本文简述配置过程。

王知无-import_bigdata

2020-03-18

2.3K0

MySQL Binlog同步HDFS的方案

面向对象编程 kafka http xml hadoop

这个问题我想只要是在做数据开发的，有一定数据实时性要求、需要做数据的增量同步的公司都会遇到。

王知无-import_bigdata

2020-02-12

2.2K0

使用canal-kafka实现数据库增量实时更新

面向对象编程 xml spring 云数据库 SQL Server typescript

下载安装包： https://github.com/alibaba/canal/releases canal.kafka-1.1.0.tar.gz

王知无-import_bigdata

2019-10-15

2.6K0

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态