Spark学习技巧

文章/答案/技术大牛

发布

LV1

发表了文章 2024-04-122024-04-12 15:00:45

HiveSQL分析函数实践详解

窗口函数也称为OLAP函数，OLAP 是OnLine Analytical Processing 的简称，意思是对数据库数据进行实时分析处理。例如，市场分析、创...

Spark学习技巧 2024-04-122024-04-12 15:00:45

数据、函数、框架、排序、实践

发表了文章 2024-04-122024-04-12 14:59:44

15张架构图，详解数据中台建设框架！

《DAMA数据管理知识体系指南》对企业的数据管理成熟度定义了6个层级，分别为：0级-无能力、1级-初始或临时级、2级-可重复级、3级-已定义级、4级-已管理级、...

Spark学习技巧 2024-04-122024-04-12 14:59:44

系统、企业、管理、框架、数据

发表了文章 2024-04-122024-04-12 14:59:08

闭包在Scala中的含义，使用场景和各个场景的代码案例

在 Scala 中，闭包是一种函数，它可以捕获并使用其作用域之外定义的变量。闭包由两部分组成：一个函数，以及该函数引用的外部变量的环境。这意味着即使外部变量的作...

Spark学习技巧 2024-04-122024-04-12 14:59:08

异步编程、scala、闭包、变量、函数

发表了文章 2024-04-122024-04-12 14:58:48

JMH + Arthas，性能监控的神器

为了能够让我后面的实例能够贯穿这两个工具的使用，我首先简单描述下我们在开发中遇到的实际的性能问题。然后再引出这两个性能工具的实际使用，看我们如何使用这两个工具成...

Spark学习技巧 2024-04-122024-04-12 14:58:48

测试、程序、日志、性能、性能监控

发表了文章 2024-04-122024-04-12 14:58:46

Kafka 3.3 使用 KRaft 共识协议替代 ZooKeeper

Apache 软件基金会发布了包含许多新特性和改进的 Kafka 3.3.1。这是第一个标志着可以在生产环境中使用KRaft（Kafka Raft）共识协议的版...

Spark学习技巧 2024-04-122024-04-12 14:58:46

zookeeper、kafka、迁移、集群、协议

发表了文章 2024-04-122024-04-12 14:58:20

hive面试必备题

Hive存储的是逻辑上的数据仓库信息，包括表的定义、数据的存储位置（HDFS路径）、分区和表的元数据等。实际的数据文件存储在HDFS上，Hive通过HQL（Hi...

Spark学习技巧 2024-04-122024-04-12 14:58:20

存储、hive、函数、面试、数据

发表了文章 2024-04-122024-04-12 14:57:21

javaer 为什么称redis、rabbitmq这些东西为中间件？

中间件（Middleware）是位于客户端和服务器端之间的软件服务层，它提供了一种通用服务的方式，帮助不同的应用程序、系统组件和服务之间进行交互和数据交换。中间...

Spark学习技巧 2024-04-122024-04-12 14:57:21

中间件、rabbitmq、redis、服务、系统

发表了文章 2024-03-272024-03-27 14:18:14

SeaTunnel 与 DataX 、Sqoop、Flume、Flink CDC 对比

Apache SeaTunnel 是一个非常易用的超高性能分布式数据集成产品，支持海量数据的离线及实时同步。每天可稳定高效同步万亿级数据，已应用于数百家企业生产...

Spark学习技巧 2024-03-272024-03-27 14:18:14

flume、sqoop、数据、同步、flink

发表了文章 2024-03-272024-03-27 14:17:46

为什么 IDEA 建议去掉 StringBuilder，而要使用 “+” 拼接字符串？

虽然有差异，但是差异极小，考虑到执行了100000次，每次耗时的差异就更小了，而且程序执行有各种因素影响执行效率，可以认为耗时差不多。也可以多次执行对比耗时差异...

Spark学习技巧 2024-03-272024-03-27 14:17:46

编译、测试、效率、字符串、stringbuilder

发表了文章 2024-03-262024-03-26 18:27:44

不好意思，ELK 该换了！

最近客户有个新需求，就是想查看网站的访问情况，由于网站没有做google的统计和百度的统计，所以访问情况，只能通过日志查看，通过脚本的形式给客户导出也不太实际，...

Spark学习技巧 2024-03-262024-03-26 18:27:45

日志、网站、elk、request、配置

发表了文章 2024-02-222024-02-22 15:34:02

Flink在涂鸦防护体系中的应用

随着互联网的快速发展，数据量呈爆炸性增长，安全分析领域面临着前所未有的挑战。传统的安全分析方法在处理海量数据时显得力不从心，无法满足实时、高效的需求。为了解决这...

Spark学习技巧 2024-02-222024-02-22 15:34:02

flink、登录、框架、数据、统计

发表了文章 2024-02-012024-02-01 15:46:07

4000字读懂实时数仓的过去现在和未来(建议收藏)

1991年，比尔·恩门（Bill Inmon）出版了他的第一本关于数据仓库的书《Building the Data Warehouse》，标志着数据仓库概念的确...

Spark学习技巧 2024-02-012024-02-01 15:46:07

实时数仓、架构、数据、数据仓库、企业

发表了文章 2024-01-262024-01-26 19:44:02

深入讲解四种数仓建模理论方法

数据仓库的建设的最重要的核心核心之一就是数仓模型的设计和构建，这个决定了数仓的复用和性能，本文将介绍四种建模的理论：维度建模、关系建模、Data Vault建...

Spark学习技巧 2024-01-262024-01-26 19:44:02

数据库、工具、模型、设计、数据

发表了文章 2024-01-222024-01-22 15:22:11

Spark+Celeborn：更快，更稳，更弹性

Apache Spark 是广为流行的大数据处理引擎，它有很多使用场景: Spark SQL、批处理、流处理、MLLIB、GraphX 等。在所有组件下是统一的...

Spark学习技巧 2024-01-222024-01-22 15:22:11

存储、spark、内存、设计、数据

发表了文章 2024-01-152024-01-15 17:35:14

12条SQL不起眼的数仓调优技巧

本文是作者本人做数仓调优时，所经常使用的SQL调优技巧，这些“技巧”也是经过日常不断摸索、问题排查以及网络检索并且经过本人在线上大规模使用过的，对于下面这12条...

Spark学习技巧 2024-01-152024-01-15 17:35:14

数据、sql、技巧、解决方案、排序

发表了文章 2023-12-052023-12-05 18:07:34

FlinkCEP - Flink的复杂事件处理

FlinkCEP是在Flink上层实现的复杂事件处理库。它可以让你在无限事件流中检测出特定的事件模型，有机会掌握数据中重要的那部分。

Spark学习技巧 2023-12-052023-12-05 18:07:38

flink、event、public、监控、事件

发表了文章 2023-12-042023-12-04 19:36:13

万字Spark性能优化宝典（收藏版）

导读：发现一篇好文，分享给大家。全文分为四个部分，基本涵盖了所有Spark优化的点，面试和实际工作中必备。全文较长，建议收藏后PC端查看或工作中问题troubl...

Spark学习技巧 2023-12-042023-12-04 19:36:18

spark、磁盘、内存、数据、性能优化

发表了文章 2023-12-012023-12-01 13:45:11

一文讲透如何做数据分析和指标体系

本文内容基于自己从事支付领域从0到1搭建支付业务数据分析实战经验。如果你对写代码念念不忘，可以看我的历史文章，有很多代码相关的内容。

Spark学习技巧 2023-12-012023-12-01 13:45:13

数据分析、产品、服务、模型、数据

发表了文章 2023-11-132023-11-13 20:25:53

详解数据仓库之拉链表（原理、设计以及在Hive中的实现）

最近发现一本好书，读完感觉讲的非常好，首先安利给大家，国内第一本系统讲解数据血缘的书！点赞！

Spark学习技巧 2023-11-132023-11-13 20:25:54

hive、链表、设计、数据仓库、原理

发表了文章 2023-10-072023-10-07 15:07:37

用户增长常见分析模型

用户增长基本上会涉及生意场上的各行各业，你开个店面希望有更多的客户光顾，你做了个APP希望有更多的用户经常使用，你搭建了个电商平台希望有更多的人下单买东西。

Spark学习技巧 2023-10-072023-10-07 15:07:39

企业、产品、模型、生命周期、数据

12 3 4 5 6 7 8...41 下一页

个人简介

环数科技有限公司 | 数据库开发工程师
公司CTO
java 数据库 sql apache api
家里蹲大学 | 电子信息工程
暂未填写个人网址
广东省 | 深圳市
加入社区时间：2017-11-08

个人成就

获得 2.8K 次赞同
文章被阅读 1.7M 次

关注了：1关注者：340