大数据处理 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签大数据处理

#大数据处理

CDO必读：如何向董事会证明数据治理的ROI？

促数聚变 6小时前2026-07-21 14:29:24

在企业数字化的进程中，CDO（首席数据官）常常面临一个尴尬的困境：当你向上级申请数百万的数据治理预算时，董事会往往会抛出一个极难回答的问题——“这笔钱投下去，什...

200

MySQL单表有10亿数据如何做迁移

Java大神之路 1天前2026-07-20 10:12:19

推荐方案：用 DataX 按主键范围切分 100-200 个并行任务做全量迁移，速度可达 10 万行 / 秒以上，10 亿数据约 2-3 小时完成。

3310

数据中台建设中的数据质量问题：从识别到治理的技术路径与实践

数据治理实践笔记 21天前2026-06-30 17:34:59

数据中台上线后，业务方反馈「数据不准」是行业高频痛点。本文从数据质量评价体系、监测架构、治理闭环三个层面，拆解数据质量问题的根因与解决方案，并提供轻量级起步路径...

18710

build 了业内首个实事求是的社交媒体时空文本语义分析 AI Agent Sys

月小水长 29天前2026-06-22 14:50:14

如题所言，我做的这个时空分析 AI Agent，SpatioAgent，可能是世界上首个同时在垂类爬虫资源调度和研究任务分析实现自闭环的大数据时空语义分析 AI...

27330

邮件文件存储格式对性能的影响

TurboEx技术分享 2026-05-292026-05-29 11:00:27

邮件存储层的性能瓶颈，从来不在于磁盘吞吐上限，而是文件锁争抢、inode 消耗、目录检索、元数据查询这类细碎的内核态开销。多数邮件服务后期性能崩坏，根源都是初期...

16010

什么是大数据分析？大数据分析技术为什么很重要？

帆软BI 2026-04-142026-04-14 10:03:09

一提到大数据分析，大家的第一反应往往是数据很多、系统很复杂、技术门槛很高。这个印象不算错，但如果只停留在这里，其实还是离实际应用有点远。

32610

从零开始学Flink：TopN 榜单

代码匠心 2026-04-062026-04-06 15:32:08

在上一篇《从零开始学Flink：Flink SQL四大Join解析》结尾提到过，下一篇要把窗口聚合（Window Aggregation）与 TopN 讲...

26510

万字详解偏度（Skewness）：数据不对称性的灵魂解码

jack.yang 2026-03-262026-03-26 13:10:35

本文将带您亲手触摸偏度的温度：🔹 为何收入报告必须标注偏度？🔹 为何右偏数据中“均值>中位数>众数”是铁律？🔹 为何小样本偏度值可能完全失真？——答案尽在手工推...

61720

从零开始学Flink：Flink SQL四大Join解析

代码匠心 2026-03-082026-03-08 20:51:41

在上一篇《从零开始学Flink：实时数仓与维表时态Join实战》中，我们通过引入 Hive Catalog，解决了 Flink SQL 元数据管理的痛点。

71910

AllData数据中台打通国产全链路，国产麒麟+国产海光CPU+国产OceanBase全栈国产化落地，信创环境100%可用

奥零数据科技 2026-03-052026-03-05 18:30:41

在过去，“信创”从一个政策口号，逐渐演变为政府、金融、能源、交通等关键行业的“必答题”。但很多企业发现：国产硬件有了，国产系统有了，国产数据库也有了，但把它们“...

50920

从零开始学Flink：Flink SQL 元数据持久化实战

代码匠心 2026-02-262026-02-26 00:16:52

在上一篇《从零开始学Flink：实时数仓与维表时态Join实战》中，我们通过「订单事实流 + 用户维表」构建了一条基础的实时数仓链路。

91810

商业实战复盘：并发不是越多越快

jackcode 2026-02-242026-02-24 12:38:43

在商业数据采集的战场上，新手往往迷信“天下武功唯快不破”，喜欢在代码里把线程池的 max_workers 拉到满；而成熟的爬虫工程师往往是“资源精算师”，他们深...

23810

从零开始学Flink：实时数仓与维表时态Join实战

代码匠心 2026-02-192026-02-19 13:15:56

在前一篇《Flink 双流 JOIN 实战详解》中，我们用「订单流 + 支付流」搞懂了事实双流之间的时间关联。

45210

从零开始学Flink：Flink 双流 JOIN 实战详解

代码匠心 2026-02-192026-02-19 13:10:13

在前一篇《Flink SQL 窗口(Window)操作详解》中，我们已经打好了时间与窗口的基础。

39610

流计算与数据湖融合：大数据处理的下一代范式

gavin1024 2026-02-122026-02-12 17:45:04

在当今数据驱动的时代，企业不仅需要存储海量数据，更要求能够实时处理和分析这些数据。数据湖作为集中存储各类数据的仓库，而流计算则负责实时处理数据流，二者的融合正成...

41910

从零开始学Flink：Flink SQL 窗口(Window)操作详解

代码匠心 2026-02-092026-02-09 14:41:10

在上一篇 Flink SQL 极简入门中，我们体验了 Flink SQL 的基础用法。但在流处理中，最核心、最迷人（也最让人头秃）的概念莫过于“时间”和“窗口...

45310

#大数据处理

CDO必读：如何向董事会证明数据治理的ROI？

MySQL单表有10亿数据如何做迁移

数据中台建设中的数据质量问题：从识别到治理的技术路径与实践

build 了业内首个实事求是的社交媒体时空文本语义分析 AI Agent Sys

邮件文件存储格式对性能的影响

什么是大数据分析？大数据分析技术为什么很重要？

从零开始学Flink：TopN 榜单

万字详解偏度（Skewness）：数据不对称性的灵魂解码

从零开始学Flink：Flink SQL四大Join解析

AllData数据中台打通国产全链路，国产麒麟+国产海光CPU+国产OceanBase全栈国产化落地，信创环境100%可用

从零开始学Flink：Flink SQL 元数据持久化实战

商业实战复盘：并发不是越多越快

从零开始学Flink：实时数仓与维表时态Join实战

从零开始学Flink：Flink 双流 JOIN 实战详解

流计算与数据湖融合：大数据处理的下一代范式

从零开始学Flink：Flink SQL 窗口(Window)操作详解

热门专栏

开源技术小栈

腾讯云TVP

数据狗说事儿

网络时间同步

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐