大数据成神之路-腾讯云开发者社区

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

大数据成神之路

专注大数据领域的一切技术~

专栏成员

638

文章

1404360

阅读量

322

订阅数

2024年大数据方向的发展趋势

大数据行业开发实时计算数据

最近事情较多，因为临近年底，在做总结和后续规划，在这一年中，数据开发方向仍然在快速发展，新概念和新技术层出不穷。

王知无-import_bigdata

2024-02-01

8880

211硕士Java实习全挂！不想卷后端了，大数据方向想快速入门找实习，该怎么做？

java 大数据后端开发入门

今天给大家分享的是一个球友的提问，如果你也正好是应届生再找实习，那么也可以照着这个方向去学习。

王知无-import_bigdata

2023-11-14

3390

大数据面试实际场景类问题怎么准备，实在遭不住了！

大数据解决方案框架面试数据

前几天我发了一个面试总结的文章，实际场景类问题在大数据领域面试的占比越来越多。大家面试开始「务实」，在实际场景问题中，顺便增加对框架原理性内容的考察，这绝对是大数据领域内的一个进步，但是同时对工作经验较浅，平时缺少思考的同学们提出了巨大挑战！

王知无-import_bigdata

2023-08-08

3150

做项目去实习到底做的什么？

大数据架构开发面试数据

实习经历是校招同学几乎仅有的机会接触企业真实场景的方式，而且一般的实习3-6月，短的甚至只有2个月。

王知无-import_bigdata

2023-08-08

2100

阿里大数据之路：数据技术篇大总结

大数据日志事件数据数据同步

一、日志采集 1.1 浏览器的页面日志采集 1.2 无线客户端的日志采集 1.3 日志采集的挑战案例

王知无-import_bigdata

2023-04-07

9160

阿里大数据之路：数据管理篇大总结

大数据监控数据数据管理系统

元数据打通了源数据、数据仓库、数据应用，记录了数据从产生到消费的全过程。元数据主要记录数据仓库中模型的定义、各层级间的映射关系、监控数据仓库的数据状态及 ETL 的任务运行状态。

王知无-import_bigdata

2023-04-07

1.6K0

Flink1.16新特性图文解析

flink 大数据 hive 存储迁移

sql gateway这个功能超级强大，支持多租户，协议插件化，兼容hive生态，以后flink流批作业都可以通过sql gateway提交到集群了。

王知无-import_bigdata

2023-02-01

9570

Apache Hudi 使用文件聚类功能 (Clustering) 解决小文件过多的问题

windows flink 大数据 hive sql

本文详细阐述了在 “批处理后，流处理之前” 进行文件 Clustering 操作的方法。该方法可以将众多小文件合并成数量极少的大文件，从而防止过多小文件的产生。

王知无-import_bigdata

2022-11-11

1.2K0

看完这篇， FlinkSQL 统统能整明白了

flink 大数据 sql 神经网络深度学习

的确，这些年，越来越多开发，转行做大数据，又或通过大数据打造自己的竞争力（比如很多 Java 开发都会学学大数据），核心原因有三点：

王知无-import_bigdata

2022-11-11

8180

Hive SQL 大厂必考常用窗口函数及相关面试题

二、窗口函数的基本用法 1.基本语法 2.设置窗口的方法 1）window_name 2）partition by 子句 3) order by子句 4）rows 指定窗口大小 3.开窗函数中加order by 和不加 order by的区别

王知无-import_bigdata

2022-11-11

3.3K0

阿里大数据之路：数据模型篇大总结

数据库大数据数据分析 sql 架构设计

核心：从业务架构设计（如何快速上手工作）到模型设计，从数据研发到数据服务，做到数据可管理、可追溯、可规避重复建设。

王知无-import_bigdata

2022-11-11

1.6K0

全球第一！新一代云数仓 SelectDB 登顶 ClickBench

腾讯云测试服务 apache sql 数据库大数据

概述：分析型数据库性能排行榜 ClickBench 最近迎来了一匹黑马，那就是成立不满一年，成绩却斐然的新一代云数仓 SelectDB。其在业界最为通用的 c6a.4xlarge, 500gb gp2 机型下位居榜首，超越了此前霸占榜首的 ClickHouse，多项指标排行前列。这无疑在数据库领域掀起了大风浪，人们纷纷搜索 SelectDB 这个新名字。今天，就由小编带领大家来一探究竟吧！

王知无-import_bigdata

2022-11-11

7660

「Hudi系列」Hudi查询&写入&常见问题汇总

hive 大数据文件存储数据库 spark

2. 「Hudi系列」Apache Hudi入门指南 | SparkSQL+Hive+Presto集成

王知无-import_bigdata

2022-06-05

6.3K0

Apache Hudi 0.11 版本重磅发布，新特性速览!

spark 打包 flink 大数据 hive

在 0.11.0 中，默认为 Spark writer 启用具有同步更新的元数据表和基于元数据表的file listing，以提高在大型 Hudi 表上的分区和文件listing的性能。在reader方面，用户需要将其设置为 true 以从中受益。元数据表和相关文件listing 仍然可以通过设置hoodie.metadata.enable=false来关闭此功能。因此，使用异步表服务部署 Hudi 的用户需要配置锁服务。如果此功能与您无关，您可以通过额外设置这个配置 hoodie.metadata.enable=false 像以前一样使用 Hudi。

王知无-import_bigdata

2022-06-05

3.4K0

Flink SQL窗口表值函数（Window TVF）聚合实现原理浅析

sql flink 大数据

表值函数(table-valued function, TVF)，顾名思义就是指返回值是一张表的函数，在Oracle、SQL Server等数据库中屡见不鲜。

王知无-import_bigdata

2022-06-05

1.6K0

Presto在字节跳动的内部实践与优化

hive 数据分析日志数据大数据 sql

在字节跳动内部，Presto 主要支撑了 Ad-hoc 查询、BI 可视化分析、近实时查询分析等场景，日查询量接近 100 万条。

王知无-import_bigdata

2022-06-05

1.5K0

Flink 细粒度资源管理新特性解读

flink 大数据 windows bash

ApacheFlink努力为所有现成的应用程序自动导出合理的默认资源需求。对于希望根据特定场景的知识微调资源消耗的用户，Flink提供细粒度资源管理。

王知无-import_bigdata

2022-06-05

8760

Flink新特性之非对齐检查点(unaligned checkpoint)详细解析

flink 大数据编程算法分布式

作为 Flink 最基础也是最关键的容错机制，Checkpoint 快照机制很好地保证了 Flink 应用从异常状态恢复后的数据准确性。

王知无-import_bigdata

2022-06-05

5.5K0

美团数据指标体系搭建实战

数据可视化大数据

在美团商家版中，美团为商家搭建的数据指标体系，很好的指导了商家的经营发展方向以及提供经营状况概览。

王知无-import_bigdata

2022-06-05

1.5K0

基于Flink1.14 + Iceberg0.13构建实时数据湖实战

flink 大数据 hive 数据库 sql

Iceberg默认支持Hadoop Catalog。如果需要使用Hive Catalog，需要将flink-sql-connector-hive-3.1.2_2.12-1.14.3.jar放到Flink集群所有服务器的lib目录下，然后重启Flink

王知无-import_bigdata

2022-06-05

1.6K0

点击加载更多

社区活动

【纪录片】中国数据库前世今生

穿越半个世纪，探寻中国数据库50年的发展历程

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态