首页
学习
活动
专区
圈层
工具
发布
首页标签大数据

#大数据

腾讯云大数据解决方案,助力客户快速构建企业级数据架构,获取数据时代核心竞争优势

Hadoop实战详解:从环境搭建到企业级案例落地

1024068

在大数据爆发的时代,PB级数据的存储与计算成为企业数字化转型的核心需求,而Hadoop作为Apache开源的分布式大数据框架,凭借高可用性、可扩展性、高容错性和...

2800

第 3 篇|调度是如何“跑起来”的?

Apache DolphinScheduler

在前两篇中,我们已经分别拆解了调度系统要解决什么问题,以及Workflow 在逻辑层面是如何被抽象和建模的。

6410

HDFS从概念到实战详解:大数据分布式存储核心指南

1024068

在大数据时代,海量数据的存储的核心痛点的是“可靠、高效、可扩展”——单机文件系统无法承载TB/PB级数据,也难以应对硬件故障、高并发访问等场景。HDFS(Had...

8510

MapReduce详解:分布式计算的开山鼻祖与核心实践

1024068

在大数据浪潮席卷全球的今天,当我们面对PB级、EB级的海量数据时,传统单机计算早已力不从心——无论是服务器的算力上限,还是数据存储的容量瓶颈,都让大规模数据处理...

7610

从零开始学Flink:Flink SQL 窗口(Window)操作详解

用户4160816

在上一篇 Flink SQL 极简入门 中,我们体验了 Flink SQL 的基础用法。但在流处理中,最核心、最迷人(也最让人头秃)的概念莫过于“时间”和“窗口...

9610

别再拍脑袋上线了:用大数据把 A/B 测试和在线实验平台这件事干“正经”

Echo_Wish

听着是不是很熟?产品拍板、技术加班、运营祈祷,最后一看数据——效果好不好,全靠感觉。

9010

源代码:大批量SQL代码语法转换简单实例:ORACLE START WITH CONNECT 语法改写

用户12032828

### 问题:如果存在大量代码需要改写的情况,靠人工处理会很耗时,且容易出错。能不能通过工具实现代码语法的大批量自动转换?

9010

Spark SQL Catalyst 优化器详解

ETL 小当家

宏观来看:Spark SQL 语句,经过一个优化器(Catalyst),转化为 RDD,交给集群执行。

9710

模型说不清,人就不敢用:可解释性,往往死在数据准备那一步

Echo_Wish

模型在验证集上 AUC 0.92,线上效果也不错,结果一到评审会,被业务同学一句话打回原形:

7710

数据不够用?别急着骂业务,数据增强和合成数据真能救命

Echo_Wish

但真干几年你就会发现一个残酷现实:大多数业务场景,数据从一开始就不够,而且永远不够。

7110

从零开始学Flink:Flink SQL 极简入门

用户4160816

Flink SQL 是 Apache Flink 的核心模块之一,它让开发者可以使用标准的 SQL 语法来编写流处理和批处理作业。对于不想深究 Java/Sca...

13310

源代码:大批量SQL代码语法转换实战:PIVOT函数改写(案例2)

用户12032828

### 背景:在不同数据库迁移的项目中,往往会遇到SQL语法不兼容的情况。比如有的数据库支持PIVOT函数,有的不支持。遇到这种情况,就必须对PIVOT函数进行...

8810

模型服务化这件事:从 Batch 到 Stream,不只是改个部署方式那么简单

Echo_Wish

训练时 AUC 飞起、离线评估美如画,一到线上就翻车——延迟高、数据对不上、效果漂、被业务嫌弃。这事儿我见太多了。

9410

Palantir深度分析:9. 价值验证逻辑

IAN李车

在当代企业数字化转型的宏大叙事中,传统的"先治理,后应用"模式正面临前所未有的信任危机。长久以来,企业CIO和CDO们被灌输了一种观念:必须首先构建一个包罗万象...

15010

Palantir深度分析:10. AIP Bootcamps(AI 训练营)的运作SOP

IAN李车

在当今的企业级软件市场中,传统的"概念验证"(Proof of Concept, POC)模式正面临前所未有的危机。这种以PPT宣讲、静态演示和冗长合同谈判为特...

28110

第 2 篇|Apache DolphinScheduler 的核心抽象模型

Apache DolphinScheduler

本文为《深入理解 Apache DolphinScheduler:从调度原理到 DataOps 实战》系列专栏第 2 篇,从源码与调度模型视角,解析 Dolph...

7510

Palantir深度分析:8. 前向部署工程师(FDE)的工具箱

IAN李车

前向部署工程师(Forward Deployed Engineer, FDE)的角色,本质上是处于企业理想架构与现场数据"混乱现实"之间的突击队员。在项目进场的...

39110
领券