首页
学习
活动
专区
工具
TVP
发布

大数据成神之路

专注大数据领域的一切技术~
专栏作者
629
文章
1135383
阅读量
311
订阅数
Doris在生产环境中的一些最佳实践
不同于传统的数据库设计,Doris 不支持在任意列上创建索引。Doris 这类 MPP 架构的 OLAP 数据库,通常都是通过提高并发,来处理大量数据的。
王知无-import_bigdata
2023-12-04
990
生产环境面试问题,指标类问题。面试官知识盲区,让他回家等消息!
我们抛开指标开发涉及到的技术点不谈,聊一下更偏重实际业务背景,二面及以上面试官关注的宏观和问题。
王知无-import_bigdata
2023-11-22
850
生产环境中的面试问题,实时链路中的Kafka数据发现某字段值错误,怎么办?
首先,我们在做数据开发的过程中涉及到一些基本要素:时效性保障、质量保障、稳定性保障,此外还有敏捷性、可管理性等其他要素。根据公司业务场景和重要性不同,重点也有所侧重。
王知无-import_bigdata
2023-11-14
1590
211硕士Java实习全挂!不想卷后端了,大数据方向想快速入门找实习,该怎么做?
今天给大家分享的是一个球友的提问,如果你也正好是应届生再找实习,那么也可以照着这个方向去学习。
王知无-import_bigdata
2023-11-14
1390
Flink1.18新特性生产环境应用的重点解读!
Flink 1.18已经于近期发布了。在这个新版本中新增了很多新的功能和特性。在这些特性中,有一些是生产环境非常重要的能力,大家在使用过程中可以重点参考和了解其中的原理。
王知无-import_bigdata
2023-10-30
3100
面试官:你有点东西,但是不多。想看你表演,你不知所措...
我们在写简历的时候最核心的部分就要说清楚过去的工作经历中遇到的有难度的、值得讨论的问题,让面试官觉得你有足够的知识储备能Cover现在的工作,并且能解决未来可能遇到的难题。
王知无-import_bigdata
2023-10-23
1350
下次面试官再问ClickHouse的优化手段就知道怎么答了!
OLAP作为一个我们重度依赖的组件,它的优化也是我们在实际工作和面试中经常遇到的问题。
王知无-import_bigdata
2023-10-07
2660
透过现象看本质,3个面试问题看面试官究竟要问什么?
本篇文章较短,是一个同学的真实面试问题,这些问题看起来很简单,但是并不好回答。我们作为面试者回答这些问题,你的回答会直接影响你的面试评价。我们从这几个简单的问题来看下面试官在问什么?
王知无-import_bigdata
2023-09-26
1140
字节跳动基于 Apache Hudi 的湖仓一体方案及应用实践
目前主流的数仓架构—— Lambda 架构,能够通过实时和离线两套链路、两套代码同时兼容实时数据与离线数据,做到通过批处理提供全面及准确的数据、通过流处理提供低延迟的数据,达到平衡延迟、吞吐量和容错性的目的。在实际应用中,为满足下游的即席查询,批处理和流处理的结果会进行合并。
王知无-import_bigdata
2023-09-18
2400
大厂招人五要素
很多同学都想进入大厂或者大的甲方公司,尤其是大数据开发这个方向,岗位也集中在头部的这一批公司。这两年进入大厂的门槛也越来越高,那么进入这些公司有哪些条件?
王知无-import_bigdata
2023-09-06
1600
StreamingWarehouse的一些思考和未来趋势
以Hudi、Iceberg、Paimon这几个框架为例,它们支持高效的数据流/批读写、数据回溯以及数据更新。具备一些传统的实时和离线数仓不具备的特性,主要有几个方面:
王知无-import_bigdata
2023-09-06
1210
字节跳动基于DataLeap的DataOps实践
本文根据 ArchSummit 全球架构师峰会(深圳站)来自抖音数据研发负责人王洋的现场分享实录整理而成(有删减),本次分享主要包含字节跳动数据研发的模式与挑战、DataOps理念在字节的具象 、DataOps产品化及落地、最佳实践、未来展望五个部分,分享内容皆来自于字节跳动业务实践经验。
王知无-import_bigdata
2023-09-06
1970
Doris2.0时代的一些机遇和挑战!
上个周五的时候,Doris官宣了2.0版本,除了在性能上的大幅提升,还有一些特性需要大家特别关注。
王知无-import_bigdata
2023-09-06
2610
基于Doris实时数据开发的一些注意事项
最近Doris的发展大家是有目共睹的。例如冷热分离等新特性的持续增加。使得Doris在易用和成本上都有大幅提升。
王知无-import_bigdata
2023-09-06
1740
同学用我的面试题拿了某大厂Offer,我却挂了?
这是一个读者自己整理的面试题问题,同学去面试某大厂,遇到了原题,结果通过了,但是整理面试题的人却挂了?
王知无-import_bigdata
2023-09-06
1270
Hive/Spark/Flink增量查询Hudi最佳实践一网打尽
我们在写数据时,可以配置同步Hive参数,生成对应的Hive表,用来查询Hudi表,具体来说,在写入过程中传递了两个由table name命名的Hive表。例如,如果table name = hudi_tbl,我们得到
王知无-import_bigdata
2023-09-06
3850
ApacheDoris系列|Bucket(分桶)数量设置和自动分桶
问题描述:上线运行一段时间后,随着越来越多的数据增长,集群每次重启后一周左右,读写就会开始变得越来越慢,直到无法正常进行读写。
王知无-import_bigdata
2023-09-06
1970
大数据面试实际场景类问题怎么准备,实在遭不住了!
前几天我发了一个面试总结的文章,实际场景类问题在大数据领域面试的占比越来越多。大家面试开始「务实」,在实际场景问题中,顺便增加对框架原理性内容的考察,这绝对是大数据领域内的一个进步,但是同时对工作经验较浅,平时缺少思考的同学们提出了巨大挑战!
王知无-import_bigdata
2023-08-08
1630
面试完国内5家中大厂,总结如下
现阶段的面试注重实战和背景,技术基础要好(该会的八股文是一点也不能马虎),比2-3年前难度确实高很多。
王知无-import_bigdata
2023-08-08
1700
做项目去实习到底做的什么?
实习经历是校招同学几乎仅有的机会接触企业真实场景的方式,而且一般的实习3-6月,短的甚至只有2个月。
王知无-import_bigdata
2023-08-08
1060
点击加载更多
社区活动
AI大牛助你轻松上手人工智能
参与可得官方证书、鹅厂公仔等奖励
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品·最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档