腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
大数据成神之路
专注大数据领域的一切技术~
专栏成员
举报
638
文章
1465788
阅读量
328
订阅数
订阅专栏
申请加入专栏
全部文章(638)
大数据(273)
sql(163)
数据库(129)
kafka(105)
spark(100)
flink(91)
编程算法(83)
apache(72)
存储(60)
hive(59)
java(52)
node.js(52)
api(52)
数据(46)
hadoop(41)
文件存储(39)
缓存(39)
hbase(36)
云数据库 SQL Server(35)
TDSQL MySQL 版(33)
数据处理(31)
分布式(29)
数据结构(28)
scala(25)
云数据库 Redis®(24)
mapreduce(24)
数据分析(21)
javascript(19)
linux(19)
yarn(18)
https(18)
python(17)
网络安全(17)
unix(16)
jvm(16)
windows(16)
zookeeper(14)
开发(14)
打包(13)
消息队列 CMQ 版(13)
批量计算(12)
http(12)
数据湖(12)
bash(11)
面试(11)
数据迁移(10)
云计算(10)
xml(9)
企业(9)
数据安全(9)
Elasticsearch Service(9)
框架(9)
bash 指令(8)
腾讯云测试服务(8)
面向对象编程(8)
架构(8)
优化(8)
jar(7)
运维(7)
processing(7)
机器学习(6)
json(6)
日志数据(6)
开源(6)
hashmap(6)
tcp/ip(6)
rabbitmq(6)
数据可视化(6)
微服务(6)
html(5)
神经网络(5)
深度学习(5)
压力测试(5)
jdbc(5)
rpc(5)
nosql(4)
spring(4)
网站(4)
express(4)
sql server(4)
nest(4)
任务调度(4)
es(4)
数据集成(4)
工具(4)
配置(4)
设计(4)
数据管理(4)
系统(4)
性能(4)
oracle(3)
github(3)
maven(3)
人工智能(3)
vr 视频解决方案(3)
electron(3)
容器(3)
shell(3)
socket编程(3)
kerberos(3)
性能测试(3)
实时数仓(3)
测试(3)
工作(3)
行业(3)
集群(3)
模型(3)
内存(3)
实践(3)
索引(3)
原理(3)
对象存储(2)
官方文档(2)
数据挖掘(2)
css(2)
ajax(2)
android(2)
ide(2)
lucene/solr(2)
nginx(2)
容器镜像服务(2)
海外加速(2)
mongodb(2)
rollup.js(2)
kubernetes(2)
uml(2)
架构设计(2)
5g(2)
迁移(2)
clickhouse(2)
报表(2)
产品(2)
磁盘(2)
函数(2)
后端(2)
基础(2)
监控(2)
解决方案(2)
排序(2)
事件(2)
异常(2)
最佳实践(2)
负载均衡(1)
自动驾驶(1)
ios(1)
iphone(1)
php(1)
go(1)
lua(1)
erlang(1)
regex(1)
react(1)
typescript(1)
postgresql(1)
flask(1)
sqlalchemy(1)
git(1)
搜索引擎(1)
负载均衡缓存(1)
专用宿主机(1)
云数据迁移(1)
日志服务(1)
腾讯云可观测平台(1)
命令行工具(1)
云数据库 MongoDB(1)
es 2(1)
图像处理(1)
数据备份(1)
电商(1)
出行(1)
serverless(1)
游戏(1)
无人驾驶(1)
jdk(1)
推荐系统(1)
markdown(1)
zabbix(1)
微信(1)
机器人(1)
物联网(1)
系统架构(1)
腾讯云开发者社区(1)
安全治理(1)
raft(1)
实时监控(1)
数据库管理(1)
流计算 Oceanus(1)
大数据存储(1)
汽车(1)
腾讯云(1)
bi(1)
bigdata(1)
block(1)
class(1)
code(1)
combine(1)
configuration(1)
csv(1)
data(1)
dp(1)
export(1)
fifo(1)
hash(1)
import(1)
ip(1)
key(1)
memory(1)
mysql(1)
netty(1)
populate(1)
properties(1)
pulsar(1)
queue(1)
rank(1)
root(1)
scheduler(1)
select(1)
state(1)
sum(1)
table(1)
task(1)
time(1)
vi(1)
window(1)
报表工具(1)
登录(1)
队列(1)
服务(1)
高性能(1)
管理(1)
规范化(1)
架构师(1)
接口(1)
连接(1)
日志(1)
入门(1)
实时计算(1)
数据采集(1)
数据同步(1)
算法(1)
微信公众号(1)
线程(1)
效率(1)
协议(1)
研发(1)
语法(1)
中间件(1)
字符串(1)
搜索文章
搜索
搜索
关闭
Apache Paimon要赢了?湖仓一体实时化时代全面开启!
数据分析
数据湖
架构
数据
apache
摘要:本文整理自阿里云开源大数据平台负责人王峰(莫问)老师在5月16日 Streaming Lakehouse Meetup · Online 上的分享,主要介绍在新一代湖仓架构上如何进行实时化大数据分析。内容主要分为以下五个部分:
王知无-import_bigdata
2024-06-17
3.5K
1
面试中的数据模型设计问题该怎么回答?
数据
基础
面试
模型
设计
面试中关于数据模型设计是一个很常见的问题,这个问题很宽泛、看起来很简单,但是想回答好并不容易。
王知无-import_bigdata
2024-05-15
238
0
Apache Paimon毕业,湖仓架构的未来发展趋势!
框架
数据
apache
架构
开发
恭喜Paimon进入一个新的篇章,这篇文章也是我个人结合当前整个湖仓领域的发展和实践写的一个总结性质的文章。
王知无-import_bigdata
2024-05-07
414
0
Flink1.19版本生产环境应用解读!
性能
优化
开发
配置
数据
Flink1.19版本更新了,我们按例对最新版本的Flink中的核心能力进行一下解读。
王知无-import_bigdata
2024-03-21
707
0
Paimon新版本核心特性和生产实践解读
缓存
基础
开发
数据
存储
最近Apche Paimon发布了最新版本0.7.0,在这个版本中,Paimon对一些新特性进行了增强。
王知无-import_bigdata
2024-03-12
439
0
2024年大数据方向的发展趋势
大数据
行业
开发
实时计算
数据
最近事情较多,因为临近年底,在做总结和后续规划,在这一年中,数据开发方向仍然在快速发展,新概念和新技术层出不穷。
王知无-import_bigdata
2024-02-01
1.2K
0
FlinkCDC发展历程和简历中项目描述的思路
数据库
数据集成
工具
框架
数据
前两天,FlinkCDC 3.0版本发布。Flink CDC的定位也发生了变化,从捕获数据变更的Flink数据源正式迈向为以Flink为基础的端到端流式ELT数据集成框架。
王知无-import_bigdata
2023-12-26
371
0
FlinkCDC发展历程和简历中项目描述的思路
数据库
数据集成
工具
框架
数据
前两天,FlinkCDC 3.0版本发布。Flink CDC的定位也发生了变化,从捕获数据变更的Flink数据源正式迈向为以Flink为基础的端到端流式ELT数据集成框架。
王知无-import_bigdata
2023-12-26
299
0
Apache Paimon核心原理和Flink应用进阶
apache
存储
flink
数据
原理
这是一篇较为完整的介绍Apache Paimon和Flink进阶应用的文章,你最好收藏一波。
王知无-import_bigdata
2023-12-12
1.9K
0
Doris在生产环境中的一些最佳实践
数据结构
排序
数据
索引
最佳实践
不同于传统的数据库设计,Doris 不支持在任意列上创建索引。Doris 这类 MPP 架构的 OLAP 数据库,通常都是通过提高并发,来处理大量数据的。
王知无-import_bigdata
2023-12-04
624
0
生产环境面试问题,指标类问题。面试官知识盲区,让他回家等消息!
工作
开发
面试
数据
异常
我们抛开指标开发涉及到的技术点不谈,聊一下更偏重实际业务背景,二面及以上面试官关注的宏观和问题。
王知无-import_bigdata
2023-11-22
245
0
生产环境中的面试问题,实时链路中的Kafka数据发现某字段值错误,怎么办?
kafka
监控
面试
数据
异常
首先,我们在做数据开发的过程中涉及到一些基本要素:时效性保障、质量保障、稳定性保障,此外还有敏捷性、可管理性等其他要素。根据公司业务场景和重要性不同,重点也有所侧重。
王知无-import_bigdata
2023-11-14
360
0
211硕士Java实习全挂!不想卷后端了,大数据方向想快速入门找实习,该怎么做?
java
大数据
后端
开发
入门
今天给大家分享的是一个球友的提问,如果你也正好是应届生再找实习,那么也可以照着这个方向去学习。
王知无-import_bigdata
2023-11-14
360
0
Flink1.18新特性生产环境应用的重点解读!
table
集群
配置
数据
原理
Flink 1.18已经于近期发布了。在这个新版本中新增了很多新的功能和特性。在这些特性中,有一些是生产环境非常重要的能力,大家在使用过程中可以重点参考和了解其中的原理。
王知无-import_bigdata
2023-10-30
1.4K
1
面试官:你有点东西,但是不多。想看你表演,你不知所措...
工作
解决方案
接口
面试
数据
我们在写简历的时候最核心的部分就要说清楚过去的工作经历中遇到的有难度的、值得讨论的问题,让面试官觉得你有足够的知识储备能Cover现在的工作,并且能解决未来可能遇到的难题。
王知无-import_bigdata
2023-10-23
263
0
下次面试官再问ClickHouse的优化手段就知道怎么答了!
clickhouse
数据
索引
性能
优化
OLAP作为一个我们重度依赖的组件,它的优化也是我们在实际工作和面试中经常遇到的问题。
王知无-import_bigdata
2023-10-07
891
0
透过现象看本质,3个面试问题看面试官究竟要问什么?
测试
框架
面试
内存
数据
本篇文章较短,是一个同学的真实面试问题,这些问题看起来很简单,但是并不好回答。我们作为面试者回答这些问题,你的回答会直接影响你的面试评价。我们从这几个简单的问题来看下面试官在问什么?
王知无-import_bigdata
2023-09-26
238
0
字节跳动基于 Apache Hudi 的湖仓一体方案及应用实践
apache
存储
架构
实践
数据
目前主流的数仓架构—— Lambda 架构,能够通过实时和离线两套链路、两套代码同时兼容实时数据与离线数据,做到通过批处理提供全面及准确的数据、通过流处理提供低延迟的数据,达到平衡延迟、吞吐量和容错性的目的。在实际应用中,为满足下游的即席查询,批处理和流处理的结果会进行合并。
王知无-import_bigdata
2023-09-18
710
0
大厂招人五要素
工作
行业
开发
面试
数据
很多同学都想进入大厂或者大的甲方公司,尤其是大数据开发这个方向,岗位也集中在头部的这一批公司。这两年进入大厂的门槛也越来越高,那么进入这些公司有哪些条件?
王知无-import_bigdata
2023-09-06
503
0
StreamingWarehouse的一些思考和未来趋势
存储
实时数仓
开发
框架
数据
以Hudi、Iceberg、Paimon这几个框架为例,它们支持高效的数据流/批读写、数据回溯以及数据更新。具备一些传统的实时和离线数仓不具备的特性,主要有几个方面:
王知无-import_bigdata
2023-09-06
267
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档