MongoDB开发系列-字段存储长度使用探讨

图-1 场景图-机场

针对MongoDB中数据库字段的存储字符长度的疑问,本文采用提出问题假设,描述使用场景,给出对应的接入方案的方式,探讨MongoDB数据建模中字段存储和展示相关的问题,为基于MongoDB的数据库建模提供参考。

How to improve performance via reduce length of fild in MongoDB

Motivation

提出问题

MongoDB store BSON document in Memery.For most cases, in application development, you will want to use mongoDB databse,specially storing big data.

These are many ways for impving performance of MongoDB Appliction, shoud filed shorter and shorter

1 如何合理的进行MongoDB模式下的数据库设计与业务建模?

对MongoDB与关系型数据库在数据建模即数据库设计的深入理解,不断在探索合理的进行数据库设计。

既要符合MongoDB数据库的设计规范又要兼顾业务程序和应用设计的便利性,同时又要脱离传统关系型数据库设计的思维局限和思维惯性。

2 MongoDB设计规范追求的字段级简模式是否具有实际意义?

基于MongoDB是基于内存的文档数据库,出于节约内存存储的考虑,MongoDB中的集合字段是否应该越短越好。如果字段越短越好那就失去了字段本身的语义化作用。

MongoDB设计规范追求的极简模式更准确的使用场景和实际意义

3 如何在统一系统的不同信息调用阶段对于业务字段的长短描述做到平衡?

语义化缺失的问题,导致字段描述与其他数据库表字段和程序设计语言中的变量命名规范有冲突。

异构系统接口服务通信时,同一业务实体的字段描述风格之间的转化和平衡问题。

Example Problem

描述问题

以下图-2【前后端深度分离】的系统开发模式为例,假设node程序开发的一些功能需要借助MongoDB存储,而其中的部分数据需要借助Java的API接口提供,我们可以理解 Node层也是一个业务层,起到承上启下的作用。

也就是我之前文章中提到的BFF层。介绍一个架构新词-BFF(这个和微服务也有关系)

这一层基于外部接口做业务,业务数据持久化到MongoDB,那么在node程序层面就会出现如何将业务变量的命名字段和MongoDB数据库集合的字段相互对应,转化和存储的问题。

图-2 前后端深度分离

通常我们有以下两种解决方式

第一种:API接口遵守通用的API接口通信方式,入参采用驼峰命名,返回值采用小写和下划线命名。node采用其本身规范,在MongoDB存储时,程序内部映射为长度较短的key。MongoDb集合中存储为较短字符的字段。

数据结构如下

{
    "_id" : ObjectId("58b95ceea3ebf44aee3bb995"),
    "dt" : ISODate("2017-03-02T00:00:00.000+08:00"),
    "pid" : 440000,
    "prov" : "广东省",
    "etype" : 1,
    "dtime" : ISODate("2017-03-02T02:56:40.000+08:00"),
    "ct" : ISODate("2017-03-03T20:09:15.000+08:00"),
    "edit" : ISODate("2017-03-03T20:09:15.000+08:00")
}

第二种:对于前端应用本身的数据遵守MongoDB的集合字段极简原则,API数据不考虑转化,直接存储,数据结构如下

{
 "_id" : ObjectId("58b95ceea3ebf44aee3bb995"),
"dateTime" : ISODate("2017-03-02T00:00:00.000+08:00"),
"provinceId" : 440000,
"province" : "广东省",
"excelType" : 1,
"dateTime" : ISODate("2017-03-02T02:56:40.000+08:00"),
"createTime" : ISODate("2017-03-03T20:09:15.000+08:00"),
"updatetime" : ISODate("2017-03-03T20:09:15.000+08:00"),
}

My Idea

所见即所得

评估系统数量级,保证功能稳定性,简化应用程序开发难度,这种方式也是业界对于MongoDB所见即所得的高开发效率的一种应用,也就是前端传递的字段可以直接毫无转化的存入数据库。

MongoDB字段长度有限制吗?

值得注意的是业界资料,官方文档说明和Mongo社区的线下分享中,关于MongoDB字段的长度规范,都没有特别的作为一个重点指出。而且官方的文档Example中。字段大多是语义化的,下面的数据集结构摘自官方文档

{

  sku: "00e8da9b",

  type: "Audio Album",

  title: "A Love Supreme",

  description: "by John Coltrane",

  asin: "B0000A118M",

  shipping: {

    weight: 6,

    dimensions: {

      width: 10,

      height: 10,

      depth: 1

    },

  },

  pricing: {

    list: 1200,

    retail: 1100,

    savings: 100,

    pct_savings: 8

  },

  details: {

    title: "A Love Supreme [Original Recording Reissued]",

    artist: "John Coltrane",

    genre: ["Jazz", "General"],

    ...

    tracks: [

      "A Love Supreme Part I: Acknowledgement",

      "A Love Supreme Part II - Resolution",

      "A Love Supreme, Part III: Pursuance",

      "A Love Supreme, Part IV-Psalm"

    ],

  },

}

图-3 嵌套数据集

{

  sku: "00e8da9b",

  type: "Audio Album",

  title: "A Love Supreme",

  description: "by John Coltrane",

  asin: "B0000A118M",

  shipping: {

    weight: 6,

    dimensions: {

      width: 10,

      height: 10,

      depth: 1

    },

  },

  pricing: {

    list: 1200,

    retail: 1100,

    savings: 100,

    pct_savings: 8

  },

  details: {

    title: "A Love Supreme [Original Recording Reissued]",

    artist: "John Coltrane",

    genre: ["Jazz", "General"],

    ...

    tracks: [

      "A Love Supreme Part I: Acknowledgement",

      "A Love Supreme Part II - Resolution",

      "A Love Supreme, Part III: Pursuance",

      "A Love Supreme, Part IV-Psalm"

    ],

  },

}

在最开始使用MongoDb做系统存储的很长时间内,我倾向于数据库存储字段应该越短越好,并且不惜牺牲字段的语义化描述,也就是上文提到的解决方案中的第一种。

随着对MongoDb设计思路的理解和使用场景的细致分析,结合应用数据量级,现阶段的我认为 所见即所得,语义化的字段存储并没有明显的劣势。

在MongoDb数据模型设计时,应该被推荐。不需要刻意的强调字段越短越优。参看我之前的总结 MongoDB最佳实践系列-几个问题梳理和复盘

原文发布于微信公众号 - 图南科技(tunan_technology)

原文发表时间:2019-09-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券