腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
皮皮鲁的AI星球
专栏作者
举报
79
文章
179716
阅读量
34
订阅数
订阅专栏
申请加入专栏
全部文章(79)
大数据(29)
编程算法(22)
深度学习(19)
神经网络(18)
机器学习(14)
人工智能(13)
scala(10)
java(8)
python(8)
线性回归(7)
数据处理(7)
打包(6)
unix(6)
网络安全(6)
https(6)
数据库(5)
ide(5)
硬件开发(4)
serverless(4)
spark(4)
processing(4)
tensorflow(3)
c++(3)
linux(3)
mapreduce(3)
文件存储(3)
开源(3)
推荐系统(3)
数据分析(3)
数据结构(3)
kafka(3)
c 语言(2)
sql(2)
git(2)
github(2)
api(2)
apache(2)
批量计算(2)
命令行工具(2)
分布式(2)
缓存(2)
hadoop(2)
numpy(2)
微信(2)
windows(2)
云计算(2)
比特币(1)
NLP 服务(1)
数据挖掘(1)
javascript(1)
css(1)
ajax(1)
typescript(1)
单片机(1)
汇编语言(1)
maven(1)
搜索引擎(1)
ubuntu(1)
centos(1)
GPU 云服务器(1)
日志服务(1)
消息队列 CMQ 版(1)
腾讯云测试服务(1)
图像处理(1)
大数据解决方案(1)
自动化(1)
shell(1)
hive(1)
正则表达式(1)
面向对象编程(1)
pytorch(1)
gcc(1)
数据可视化(1)
fpga(1)
腾讯云开发者社区(1)
信息流(1)
聚类算法(1)
5g(1)
flink(1)
bat(1)
dot(1)
etl(1)
key(1)
nlp(1)
product(1)
scale(1)
创业(1)
团队管理(1)
搜索文章
搜索
搜索
关闭
Flink Checkpoint机制原理剖析与参数配置
大数据
编程算法
分布式
数据处理
在Flink状态管理详解这篇文章中,我们介绍了Flink的状态都是基于本地的,而Flink又是一个部署在多节点的分布式引擎,分布式系统经常出现进程被杀、节点宕机或网络中断等问题,那么本地的状态在遇到故障时如何保证不丢呢?Flink定期保存状态数据到存储上,故障发生后从之前的备份中恢复,整个被称为Checkpoint机制,它为Flink提供了Exactly-Once的投递保障。本文将介绍Flink的Checkpoint机制的原理。本文会使用多个概念:快照(Snapshot)、分布式快照(Distributed Snapshot)、检查点(Checkpoint)等,这些概念均指的是Flink的Checkpoint机制,读者可以将这些概念等同看待。
PP鲁
2020-02-17
1.5K
0
Kafka能做什么?十分钟构建你的实时数据流管道
缓存
数据处理
kafka
消息队列 CMQ 版
本文将对Kafka做一个入门简介,并展示如何使用Kafka构建一个文本数据流管道。通过本文,读者可以了解一个流处理数据管道(Pipeline)的大致结构:数据生产者源源不断地生成数据流,数据流通过消息队列投递,数据消费者异步地对数据流进行处理。
PP鲁
2019-12-26
2.6K
1
Flink笔记02 | 一文读懂流式大数据引擎的基础概念
processing
apache
数据处理
编程算法
大数据
最近我在学习流式计算引擎Flink,正在阅读Flink的官方文档、一些技术博客以及《Streaming Processing with Apache Flink》这本书,并试图将一些知识整理下来,形成一个系列。
PP鲁
2019-12-26
1.4K
1
都在追捧的新一代大数据引擎Flink到底有多牛?
spark
大数据
数据处理
编程算法
云计算
提起大数据处理引擎,很多人会想到Hadoop或Spark,而在2019年,如果你身处大数据行业却没听说过Flink,那你很可能OUT了!Flink是大数据界冉冉升起的新星,是继Hadoop和Spark之后的新一代大数据处理引擎。2019年初,阿里巴巴以1.033亿美元的价格收购了总部位于德国柏林的初创公司Data Artisans,Data Artisans的核心产品是正是Flink。
PP鲁
2019-12-26
967
0
Flink核心概念:系统架构、时间处理、状态与检查点
unix
api
数据处理
数据库
大数据
上图的Flink示例程序对一个数据流做简单处理,整个过程包括了输入(Source)、转换(Transformation)和输出(Sink)。程序由多个DataStream API组成,这些API,又被称为算子 (Operator),共同组成了逻辑视角。在实际执行过程中,逻辑视角会被计算引擎翻译成可并行的物理视角。
PP鲁
2019-12-25
2.1K
0
从Hadoop到Spark、Flink,大数据处理框架十年激荡发展史
spark
hadoop
mapreduce
数据分析
数据处理
当前这个数据时代,各领域各业务场景时时刻刻都有大量的数据产生,如何理解大数据,对这些数据进行有效的处理成为很多企业和研究机构所面临的问题。本文将从大数据的基础特性开始,进而解释分而治之的处理思想,最后介绍一些流行的大数据技术和组件,读者能够通过本文了解大数据的概念、处理方法和流行技术。
PP鲁
2019-12-25
2.2K
0
批处理衰落,流处理兴起,大数据处理平台从Lambda到Kappa的演进
数据处理
数据库
大数据
大数据解决方案
流处理引擎经历了从Storm到Spark Streaming再到Flink的三代的技术迭代,大数据处理也随之经历了从Lambda架构到Kappa架构的演进。本节以电商平台的数据分析为例,来解释大数据处理平台如何支持企业在线服务。电商平台会将用户在APP或网页的搜索、点击和购买行为以日志的形式记录下来,用户的各类行为形成了一个实时数据流,我们称之为用户行为日志。
PP鲁
2019-12-25
1.2K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档