学习
实践
活动
专区
工具
TVP
写文章

大数据杂货铺

专栏作者
253
文章
173372
阅读量
39
订阅数
如何在CDP运营数据库(COD)上部署事务支持
Cloudera Operational Database 使开发人员能够快速构建面向未来的应用程序,这些应用程序的架构旨在处理数据演变。它通过自动缩放等功能帮助开发人员自动化和简化数据库管理,并与Cloudera Data Platform (CDP) 完全集成。有关更多信息和 COD入门,请参阅我们的文章 Cloudera Data Platform Operational Database (COD) 入门。
大数据杂货铺
2023-03-08
870
CDP运营数据库 (COD) 中的事务支持
CDP 运营数据库使开发人员能够快速构建面向未来的应用程序,这些应用程序的架构旨在处理数据演变。它通过自动缩放等功能帮助开发人员自动化和简化数据库管理,并与Cloudera Data Platform (CDP) 完全集成。有关更多信息和 COD入门,请参阅 Cloudera Data Platform Operational Database (COD) 入门。
大数据杂货铺
2022-12-02
1570
Hudi、Iceberg 和 Delta Lake:数据湖表格式比较
在构建数据湖时,可能没有比存储数据格式更重要的决定了。结果将直接影响其性能、可用性和兼容性。
大数据杂货铺
2022-12-02
4830
使用 NiFi、Kafka、Flink 和 DataFlow 进行简单的信用卡欺诈检测
随着越来越多的人呆在家里,让我们的信用卡代步,网上购物正在兴起。不幸的是,与这一趋势保持同步的是信用卡欺诈的增加。
大数据杂货铺
2022-12-02
1780
使用新的存储文件跟踪功能解锁 S3 上的 HBase
CDP 运营数据库 (COD)是由 Apache HBase 和 Apache Phoenix 提供支持的实时自动扩展运营数据库。它是在 Cloudera 数据平台 (CDP) 公共云上运行的主要数据服务之一。您可以从CDP 控制台访问 COD 。
大数据杂货铺
2022-12-02
1420
通过 Flink SQL 使用 Hive 表丰富流
流处理是通过在数据运动时对数据应用逻辑来创造商业价值。很多时候,这涉及组合数据源以丰富数据流。Flink SQL 执行此操作并将您应用于数据的任何函数的结果定向到接收器中。业务用例,例如欺诈检测、广告印象跟踪、医疗保健数据丰富、增加财务支出信息、GPS 设备数据丰富或个性化客户通信,都是使用Hive表来丰富数据流的很好的例子。 因此,Hive 表与 Flink SQL 有两种常见的用例:
大数据杂货铺
2022-12-02
2260
使用 Cloudera 流处理进行欺诈检测-Part 1
在本系列的前一篇博客“将流转化为数据产品”中,我们谈到了减少数据生成/摄取之间的延迟以及从这些数据中产生分析结果和洞察力的日益增长的需求。我们讨论了如何使用带有 Apache Kafka 和 Apache Flink 的Cloudera 流处理(CSP) 来实时和大规模地处理这些数据。在这篇博客中,我们将展示一个真实的例子来说明如何做到这一点,看看我们如何使用 CSP 来执行实时欺诈检测。
大数据杂货铺
2022-12-02
1560
Datagen-CDP平台的模拟数据生成器
Datagen 是一个项目,旨在提供一个用户友好、可定制的界面,以将数据生成到各种 Cloudera CDP平台服务中。(甚至在平台之外)。
大数据杂货铺
2022-12-02
1050
在CDP平台上安全的使用Kafka Connect
在这篇文章中,将演示如何将 Kafka Connect 集成到 Cloudera 数据平台 (CDP) 中,从而允许用户在 Streams Messaging Manager 中管理和监控他们的连接器,同时还涉及安全功能,例如基于角色的访问控制和敏感信息处理。如果您是将数据移入或移出 Kafka 的开发人员、管理员或安全专家,那么这篇文章适合您。但在我介绍细节之前,让我们先从基础开始。
大数据杂货铺
2022-12-02
1180
安全云数据湖仓一体的 10 个关键
在云中启用数据和分析可以让您拥有无限的规模和无限的可能性,以更快地获得洞察力并利用数据做出更好的决策。数据湖仓一体越来越受欢迎,因为它为您的所有企业数据提供了一个单一平台,并且可以灵活地运行任何分析和机器学习 (ML) 用例。与云数据湖和云数据仓库相比,云数据湖提供了显着的可扩展性、敏捷性和成本优势。
大数据杂货铺
2022-12-02
1410
网络安全:大数据问题
信息技术一直是世界各国政府的核心,使他们能够提供重要的公民服务,例如医疗保健、交通、就业和国家安全。所有这些功能都依赖于技术并共享一种有价值的商品:数据。
大数据杂货铺
2022-12-02
1380
在 Hue 中启用 Phoenix SQL 编辑器
在CDP7.1.8开始,Hue支持了很多编辑器,这里介绍了在CDP7.1.8中配置Hue支持Phoenix SQL。
大数据杂货铺
2022-12-02
1450
CDP 多Namenode配置
此功能为 CDP Private Cloud Base 提供了使用多个备用名称节点的能力。
大数据杂货铺
2022-12-02
1180
如何在RELS8.4上安装CDP-PvC Base 7.1.8并启用Auto-TLS
CDP PVC BASE7.1.8是Cloudera与Hortonworks合并后,第一个融合CDH和HDP所有组件的on-premise并且可用于生产环境的新功能版本,CDP PvC Base主要由Cloudera Runtime构成,Cloudera Runtime由超过40个开源项目组成,当然CDP PvC Base还包括其它功能如管理功能Cloudera Manager,Key Management,专业支持等。Cloudera Runtime的主要组件版本如下图所示:
大数据杂货铺
2022-12-02
460
Cloudera 的开放湖仓采用dbt Core增压
dbt允许数据团队使用 SQL 生成可信数据集,用于报告、ML 建模和操作工作流,其简单的工作流遵循模块化、可移植性和持续集成/持续开发 (CI/CD) 等软件工程最佳实践。我们很高兴地宣布针对 CDP 中的所有引擎(Apache Hive、Apache Impala和 Apache Spark)的 dbt 开源适配器普遍可用,并增加了对Apache Livy和Cloudera Data Engineering的支持。使用这些适配器,Cloudera 客户可以使用 dbt 在 CDP 公共云、CDP One 和 CDP 私有云上协作、测试、部署和记录他们的数据转换和分析管道。
大数据杂货铺
2022-12-02
1380
数据湖仓一体的好处
在最近的一篇博客中,Cloudera 首席技术官 Ram Venkatesh 描述了数据湖仓的演变,以及使用开放数据湖仓的好处,尤其是开放的 Cloudera 数据平台 (CDP)。如果你错过了,你可以在这里阅读。
大数据杂货铺
2022-12-02
1580
数据架构的三大纠缠趋势:数据网格、数据编织和混合架构
一本关于如何调和看似相似但不同的趋势的入门书,这些趋势使数据团队难以解决棘手的“一次无处不在”的问题。
大数据杂货铺
2022-12-02
1530
Ozone-适用于各种工作负载的灵活高效的存储系统
Apache Ozone 是一种分布式、可扩展和高性能的对象存储,可与Cloudera 数据平台(CDP) 一起使用,可以扩展到数十亿个不同大小的对象。它被设计为原生的对象存储,可提供极高的规模、性能和可靠性,以使用 S3 API 或传统的 Hadoop API 处理多个分析工作负载。
大数据杂货铺
2022-12-02
1860
【公告】CDP私有云基础7.1.8发布
我们很高兴地宣布 Cloudera Data Platform (CDP) Private Cloud (PvC) Base 7.1.8 和 Cloudera Manager 7.7.1 的发布,它们引入了关键的新功能,以改进为您的业务用户提供的分析能力,增强企业准备,以及额外的第三方支持。这是一个累积维护版本,继承了 7.1.7 Service Pack 1 (SP1) 和之前版本的功能。
大数据杂货铺
2022-12-02
1780
如何在 CDP 的湖仓一体中使用Iceberg
2022 年 6 月,Cloudera宣布在 Cloudera 数据平台 (CDP) 中全面推出 Apache Iceberg。Iceberg 是一种 100% 开放表格式,由Apache Software Foundation开发,可帮助用户避免供应商锁定并实现开放式 Lakehouse。
大数据杂货铺
2022-12-02
2090
点击加载更多
活动推荐
社区活动
腾讯云 x ES 三周年有奖征文
参与活动,赢取限量周边礼品
腾讯云自媒体分享计划
入驻社区,可分享总价值百万资源包
邀请好友加入自媒体分享计划
邀请好友,同享奖励 30 / 100 / 180 元云服务器代金券
关注
腾讯云开发者公众号
10元无门槛代金券
洞察腾讯核心技术
剖析业界实践案例
扫码关注腾讯云开发者
领券