前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >12.4 Cassandra数据模型

12.4 Cassandra数据模型

作者头像
王小雷
发布2019-05-28 09:14:43
1.1K0
发布2019-05-28 09:14:43
举报
文章被收录于专栏:王小雷王小雷

12.4 Cassandra数据模型

卜算子·大数据”一个开源、成体系的大数据学习教程。——每周日更新

  • 没有JOIN操作

Cassandra没有表的连接操作,跟关系型数据库设计相比最好的方式是,反(非)规范化设计,设计为两个表连接后的结果表。

  • 没有参照完整性(外键) 虽然表中可以存储别的表的ID,但是没有级联删除的操作,所以没有外键操作。
  • 非规范化的设计在Cassandra数据库中表现最佳。适当冗余,相同的数据出现在不同的表中,具有不同的键。
  • 物化视图 基于已经存在的基础表,创建多个非规范化的数据视图(物化视图)。
  • 查询优先设计

设计表从查询的结果开始设计表(结果表)。

  • 存储空间设计 Cassandra每个表都是存储在磁盘上的单独文件中,相关的列尽量保持在同一个表中(磁盘文件)。 搜索单个分区的查询性能最佳,优化最小搜索分区数量。
  • 排序设计 Cassandra查询中的ORDER BY仅支持聚类列(Clustering columns)排序。
  • 分区单元值计算方法 避免分区太宽,分区中的单元值太大。 分区中的单元值计算方法: 分区中的单元值=静态列数+表的行数*(列数-主键列数-静态列数) Cassandra的限制是每个分区20亿。

开源、源码获取 https://github.com/wangxiaoleiAI/big-data

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年07月08日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 12.4 Cassandra数据模型
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档