暴走大数据

LV0
发表了文章

一份优秀的简历该长成什么样

作为一个面试官,我个人面试过不下百份简历,几个硬伤,我在之前的文章也提到过,大家在写的时候一定要避免:

暴走大数据
Markdown
发表了文章

全网第一 | Flink学习面试灵魂40问答案!

Flink核心是一个流式的数据流执行引擎,其针对数据流的分布式计算提供了数据分布、数据通信以及容错机制等功能。基于流执行引擎,Flink提供了诸多更高抽象层的A...

暴走大数据
https网络安全API文件存储Java
发表了文章

全网第一份 | Flink学习面试灵魂40问,看看你能答上来几个?

暴走大数据
SQL大数据spark分布式
发表了文章

你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(下)

场景描述:今年有个现象,实时数仓的建设突然就被大家所关注。我个人在公众号也写过和转载过几篇关于实时数据仓库建设的文章和方案。

暴走大数据
Hivehttps网络安全sparkHadoop
发表了文章

你需要的不是实时数仓 | 你需要的是一款强大的OLAP数据库(上)

场景描述:今年有个现象,实时数仓的建设突然就被大家所关注。我个人在公众号也写过和转载过几篇关于实时数据仓库建设的文章和方案。

暴走大数据
大数据https网络安全架构设计云计算
发表了文章

为什么我们选择parquet做数据存储格式

来源:https://www.cnblogs.com/piaolingzxh/p/5469964.html

暴走大数据
spark文件存储存储大数据
发表了文章

Flink成为字节跳动流处理唯一标准

场景描述:本文将为大家展示字节跳动公司将 Jstorm 任务迁移到 Apache Flink 上的整个过程以及后续计划。你可以借此了解到字节跳动公司引入 Apa...

暴走大数据
大数据Apache运维YarnXML
发表了文章

基于Flink和Kafka构建批流一体的数据集成平台

暴走大数据
发表了文章

实战经验 | Flume中同时使用Kafka Source和Kafka Sink的Topic覆盖问题

场景描述:如果在一个Flume Agent中同时使用Kafka Source和Kafka Sink来处理events,便会遇到Kafka Topic覆盖问题,具...

暴走大数据
HTMLKafka网络安全大数据
发表了文章

流计算宝藏文章 | 端到端一致性,Spark/Flink/Kafka/DataFlow对比总结

来源:知乎(https://zhuanlan.zhihu.com/p/77677075)

暴走大数据
大数据数据库SQL
发表了文章

干货 | Flink Connector 深度解析

作者介绍:董亭亭,快手大数据架构实时计算引擎团队负责人。目前负责 Flink 引擎在快手内的研发、应用以及周边子系统建设。2013 年毕业于大连理工大学,曾就职...

暴走大数据
Kafka大数据文件存储Socket编程
发表了文章

真实案例 | Flink实时计算处理脏数据问题

场景描述:Flink在处理实时数据时,假如其中一条数据是脏数据,例如格式错误,字段缺少等会报错,这时候该怎么处理呢?

暴走大数据
大数据
发表了文章

高屋建瓴 | 阿里巴巴大数据之路

在阿里巴巴集团内,数据人员面临的现实情况是:集团数据存储已经达到EB级别,部分单张表每天的数据记录数高达几千亿条;在2016年“双11购物狂欢节”的24小时中,...

暴走大数据
数据库数据分析大数据SQL数据处理
发表了文章

Apache Flink 在快手的应用与实践

拿线上作业,使用 Kafka 从最早位置(2 days ago)开始消费。如上图,不限速情况下State 持续增大,最终作业挂掉。使用限速策略后,最开始 Sta...

暴走大数据
大数据
发表了文章

Flink Back Pressure

如果看到任务的背压警告(如 High 级别),这意味着 生成数据的速度比下游算子消费的的速度快。以一个简单的 Source -> Sink 作业为例。如果能看到...

暴走大数据
spark

个人简介

个人成就

  • 获得 185 次赞同
  • 文章被阅读 6.5K 次

扫码关注云+社区

领取腾讯云代金券