前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据仓库之数据冗余规范

数据仓库之数据冗余规范

作者头像
chimchim
发布2022-11-13 13:17:40
4820
发布2022-11-13 13:17:40
举报

在数据详细设计阶段设计宽表冗余维度属性时,应该遵循以下几个建议准则:

1.冗余字段与表中其它字段高频率(大于3个下游应用SQL)同时访问。

2.冗余字段的引入不应造成其本身的更新完成时间过多延迟。

3.公共层数据不允许字段重复率大于60%的相同粒度数据表冗余,可以选择原表基础上拓宽或者下游应用通过JOIN方式实现。

4.从一个集合中冗余一部分记录作为另外一张表存在时,可以优先考虑子分区方式,但是多级子分区不超过(5级),只有以下情况才考虑冗余:

       子类型表有较多(大于10)个字段父类型表并不存在。

       子集合的过滤条件被多次(大于5次)应用。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-08-08,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 在数据详细设计阶段设计宽表冗余维度属性时,应该遵循以下几个建议准则:
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档