五分钟学大数据

LV1
举报
发表了文章

Hive参数与性能企业级调优(建议收藏)

Hive作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级数据仓库时使用最多的框架之一。

五分钟学大数据
HiveSQLMapReduce大数据存储
发表了文章

最强 Elastic Stack 保姆级教程(一)

首先我们谈几个公司,如雷贯耳的:百度、谷歌、维基百科;这些公司都有一个相似性就是门户网站,可以提供我们通过关键字搜索,然后快速的检索出我们想要的信息。

五分钟学大数据
ElasticsearchServiceESECMAScriptAPI全文检索
发表了文章

数据仓库架构落地版(PPT)

五分钟学大数据
发表了文章

开源大数据OLAP引擎最佳实践

一、开源OLAP综述 二、开源数仓解决方案 三、ClickHouse介绍 四、StarRocks介绍 五、Trino介绍 六、客户案例

五分钟学大数据
运维EMR数据库SQL开源
发表了文章

我做了一个大数据学习网站!

最近搞了一个大数据学习网站,前几天在朋友圈小范围测试了下,今天正式上线啦,网站的目标就是打造一个体系化的大数据学习平台,所有的内容都是连贯的,系统化的,下面是网...

五分钟学大数据
大数据腾讯云开发者社区网站
发表了文章

Spark SQL底层执行流程详解(好文收藏)

一、Apache Spark 二、Spark SQL发展历程 三、Spark SQL底层执行原理 四、Catalyst 的两大优化

五分钟学大数据
sparkHiveSQL数据库
发表了文章

Spark内存管理详解(好文收藏)

Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色。理解 Spark 内存管理的基本原理,有助于更好地开发 Spark...

五分钟学大数据
文件存储存储JVM缓存spark
发表了文章

最新大厂数据湖面试题,知识点总结(上万字建议收藏)

本文目录: 一、什么是数据湖 二、数据湖的发展 三、数据湖有哪些优势 四、数据湖应该具备哪些能力 五、数据湖的实现遇到了哪些问题 六、数据湖与数据仓库的区别 七...

五分钟学大数据
数据湖数据库数据安全大数据数据处理
发表了文章

Spark的两种核心Shuffle详解(面试常问,工作常用)

在 MapReduce 框架中, Shuffle 阶段是连接 Map 与 Reduce 之间的桥梁, Map 阶段通过 Shuffle 过程将数据输出到 Red...

五分钟学大数据
sparkMapReduce数据结构BashBash 指令
发表了文章

Hive SQL 参数与性能调优

Hive作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级数据仓库时使用最多的框架之一。

五分钟学大数据
HiveLinuxJVMHadoopMapReduce
发表了文章

50000字,数仓建设保姆级教程,离线和实时一网打尽(理论+实战) 下

本文上半部分之前已经发过了,传送门:50000字,数仓建设保姆级教程,离线和实时一网打尽(理论+实战) 上

五分钟学大数据
数据安全大数据数据分析数据处理
发表了文章

万字详解数据仓库、数据湖、数据中台和湖仓一体

数字化转型浪潮卷起各种新老概念满天飞,数据湖、数据仓库、数据中台轮番在朋友圈刷屏,有人说“数据中台算个啥,数据湖才是趋势”,有人说“再见了数据湖、数据仓库,数据...

五分钟学大数据
数据湖数据挖掘数据库SQL实时数仓
发表了文章

2022年最强大数据面试宝典(全文50000字,强烈建议收藏)

一、Hadoop 二、Hive 三、Spark 四、Kafka 五、HBase 六、Flink 七、数仓业务方面 八、算法

五分钟学大数据
Flink数据库数据分析数据结构SQL
发表了文章

20000字详解大厂实时数仓建设(好文收藏)

目前各大公司的产品需求和内部决策对于数据实时性的要求越来越迫切,需要实时数仓的能力来赋能。传统离线数仓的数据时效性是 T+1,调度频率以天为单位,无法支撑实时场...

五分钟学大数据
数据湖分析数据湖数据分析数据处理SQL
发表了文章

3个常考的SQL数据分析题(干货建议收藏)

在数据类岗位招聘过程中,经常会考察求职者的SQL能力,这里整理了3个常考的SQL数据分析题,按照由简单到复杂排序,一起来测试一下你掌握了么?

五分钟学大数据
SQL
发表了文章

Flink面试八股文(上万字面试必备宝典)

Flink是一个面向流处理和批处理的分布式数据计算引擎,能够基于同一个Flink运行,可以提供流处理和批处理两种类型的功能。 在 Flink 的世界观中,一切都...

五分钟学大数据
Flink大数据编程算法文件存储数据处理
发表了文章

Hive SQL优化思路

Hive的优化主要分为:配置优化、SQL语句优化、任务优化等方案。其中在开发过程中主要涉及到的可能是SQL优化这块。

五分钟学大数据
SQLMapReduceHive
发表了文章

最强最全面的大数据SQL面试题和答案(由31位大佬共同协作完成)

本套SQL题的答案是由许多大佬共同贡献,1+1的力量是远远大于2的,有不少题目都采用了非常巧妙的解法,也有不少题目有多种解法。本套大数据SQL题不仅题目丰富多样...

五分钟学大数据
容器SQL数据库
发表了文章

基于Flink+ClickHouse打造轻量级点击流实时数仓

Flink 和 ClickHouse 分别是实时计算和 OLAP 领域的翘楚,也是近些年非常火爆的开源框架,很多大厂都在将两者结合使用来构建各种用途的实时平台,...

五分钟学大数据
Flink大数据数据库云数据库 SQL ServerSQL
发表了文章

50000字,数仓建设保姆级教程,离线和实时一网打尽(理论+实战) 上

我们在谈数仓之前,为了让大家有直观的认识,先来谈数仓架构,“架构”是什么?这个问题从来就没有一个准确的答案。这里我们引用一段话:在软件行业,一种被普遍接受的架构...

五分钟学大数据
数据挖掘数据处理编程算法数据分析

个人简介

个人成就

扫码关注腾讯云开发者

领取腾讯云代金券