腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Hadoop数据仓库

专栏作者

511

文章

708081

阅读量

108

订阅数

redis全局遍历替换特征字符串

https http 网络安全云数据库 Redis java

需求：将一个redis实例（如10.10.10.1:6379）范围内所有key值中的 .letssing.net 替换为 .kaixinvv.com。

2023-03-08

5310

ShardingSphere实践（9）——tpcc-mysql 压测

https 网络安全数据库云数据库 SQL Server sql

MySQL版本：5.7.34 ShardingSphere-Proxy：5.1.2

2022-09-21

7040

维度模型数据仓库（十九） —— 维度合并

网络安全数据库云数据库 SQL Server sql

（五）进阶技术 14. 维度合并随着数据仓库中维度的增加，会发现有些通用的数据存在于多个维度中。例如，客户维度的客户邮编相关信息、送货邮编相关信息和工厂维度里都有邮编、城市和州。本篇说明如何把三个维度里的邮编相关信息合并到一个新的邮编维度。修改数据仓库模式为了合并维度，需要改变数据仓库模式。图（五）- 14-1显示了修改后的模式。新增了一个zip_code_dim表，sales_order_fact和production_fact表的结构也做了相应的修改。注意图中只显示了与邮编维度相关的表。

2022-06-14

5070

ShardingSphere实践（6）——弹性伸缩

弹性伸缩网络安全数据迁移编程算法

对于使用单数据库运行的系统来说，如何安全简单地将数据迁移至水平分片的数据库上，一直以来都是一个迫切的需求。对于已经使用了ShardingSphere的用户来说，随着业务规模的快速变化，也可能需要对现有的分片集群进行弹性扩容或缩容。

2022-06-12

3.5K0

ShardingSphere实践（4）——读写分离

网络安全云数据库 SQL Server 数据库 sql 编程算法

ShardingSphere最重要的功能模块是数据分片，从规则到实现都比较复杂。其他功能相对来说比较简单，本篇介绍ShardingSphere的读写分离功能。

2022-06-05

4260

Greenplum 实时数据仓库实践（7）——维度表技术

前面章节中，我们实现了实时多维数据仓库的基本功能，如使用Canal和Kafka实现实时数据同步，定义Greenplum rule执行实时数据装载逻辑等。本篇将继续讨论常见的维度表技术。

2022-01-06

2.1K0

Kettle构建Hadoop ETL实践（八-1）：维度表技术

大数据云数据库 SQL Server hive 网络安全 sql

前面文章中，我们用Kettle工具实现了Hadoop多维数据仓库的基本功能，如使用Sqoop作业项、SQL脚本、Hadoop file output、ORC output等步骤实现ETL过程，使用Oozie、Start作业项定期执行ETL任务等。本篇将继续讨论常见的维度表技术，以最简单的“增加列”开始，继而讨论维度子集、角色扮演维度、层次维度、退化维度、杂项维度、维度合并、分段维度等基本的维度表技术。这些技术都是在实际应用中经常使用的。在说明这些技术的相关概念和使用场景后，我们以销售订单数据仓库为例，给出Kettle实现和测试过程。

2020-11-12

3.3K0

Kettle与Hadoop（九）提交Spark作业

大数据 https 网络安全专用宿主机 spark

实验环境： Spark History Server： 172.16.1.126

2020-06-11

1.5K0

Kettle与Hadoop（八）执行Oozie作业

https 网络安全 java

/root/big_data/job.properties文件的内容如下：

2020-06-10

5550

Kettle与Hadoop（六）执行HiveQL语句

hive https 网络安全

https://blog.csdn.net/wzy0623/article/details/106471124#2.%20%E5%90%91Hive%E5%AF%BC%E5%85%A5%E6%95%B0%E6%8D%AE。

2020-06-04

2860

Galera Cluster for MySQL 详解（四）——性能测试

https 网络安全腾讯云测试服务编程算法

本篇使用tpcc-mysql压测工具对实验环境的三节点Galera集群进行一系列性能测试。

2019-11-03

1.6K0

让Hive支持行级insert、update、delete

hive https 网络安全 apache 数据分析

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/51483674

2019-05-25

4.4K0

基于Hadoop生态圈的数据仓库实践 —— 进阶技术（六）

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/52022982

2019-05-25

3430

触类旁通Elasticsearch：扩展

es node.js 网络安全

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/87281895

2019-05-25

4440

基于hadoop生态圈的数据仓库实践 —— 进阶技术（十五）

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/52165035

2019-05-25

4170

Oracle ROLLUP和CUBE 用法

编程算法网络安全 sql javascript 打包

Oracle的GROUP BY语句除了最基本的语法外，还支持ROLLUP和CUBE语句。如果是ROLLUP(A, B, C)的话，首先会对(A、B、C)进行GROUP BY，然后对(A、B)进行GROUP BY，然后是(A)进行GROUP BY，最后对全表进行GROUP BY操作。如果是GROUP BY CUBE(A, B, C)，则首先会对(A、B、C)进行GROUP BY，然后依次是(A、B)，(A、C)，(A)，(B、C)，(B)，(C)，最后对全表进行GROUP BY操作。 grouping_id()可以美化效果：

2019-05-25

1.1K0

MADlib——基于SQL的数据挖掘解决方案（30）——模型评估之预测度量

http https 网络安全

该模块提供了一组度量来评估模型预测的质量。除非另有说明，典型的函数将采用一组“预测”和“观察”值，并使用它们来计算所需的度量。所有功能都支持分组（混淆矩阵除外）。

2019-05-25

5130

一个有趣的时间段重叠问题

编程算法 postgresql sql https 网络安全

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/wzy0623/article/details/79152961

2019-05-25

4.3K0

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态