前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Librdkafka的基础数据结构 4 --- String和ByteArray

Librdkafka的基础数据结构 4 --- String和ByteArray

作者头像
扫帚的影子
发布2018-09-05 16:52:47
5460
发布2018-09-05 16:52:47
举报

下面要介绍的数据类型都是在kafka protocol的序列化中使用的

  • Kafka Protocol String
  • Kafka Protocol ByteArray

Kafka Protocol String
  • 所在文件:src/rdkafka_proto.h
  • 表示kafka协议中的字符串,在协议的序列化中,先用2个字节表示字符串内容的长度,不包含结尾的\0, 紧随其后是字符串的内容: { uint16, data.. }
  • 定义如下,包含长度和指向实际字符内容的指针;
代码语言:javascript
复制
typedef struct rd_kafkap_str_s {
    /* convenience header (aligned access, host endian) */
    int         len; /* Kafka string length (-1=NULL, 0=empty, >0=string) */

    const char *str; /* points into data[] or other memory,
              * not NULL-terminated */
} rd_kafkap_str_t;

可以表示三种字符串格式:

  1. len = -1, 是一个null字符串,str = null;
  2. len = 0, 是一个空字符串, str = "";
  3. len > 0, 是一个长度 为len的字符串, 这个len不包含结尾的\0 ;
  • 获取Kafka String长度,根据rd_kafkap_str_t::len来判断
代码语言:javascript
复制
#define RD_KAFKAP_STR_LEN0(len) ((len) == RD_KAFKAP_STR_LEN_NULL ? 0 : (len))
#define RD_KAFKAP_STR_LEN(kstr) RD_KAFKAP_STR_LEN0((kstr)->len)
  • 获取Kafka String序列化后的长度,即在TCP发送协议中的长度:
代码语言:javascript
复制
/* Returns the actual size of a kafka protocol string representation. */
#define RD_KAFKAP_STR_SIZE0(len) (2 + RD_KAFKAP_STR_LEN0(len))
#define RD_KAFKAP_STR_SIZE(kstr) RD_KAFKAP_STR_SIZE0((kstr)->len)

上面的2字节用来放字串的长度

  • Kafka Protocol String的创建:不光要创建一个rd_kafkap_str_t对象,还要在其内存后紧挨着创建序列化所需要的内存空间,具体看下面代码里的注释
代码语言:javascript
复制
static RD_INLINE RD_UNUSED
rd_kafkap_str_t *rd_kafkap_str_new (const char *str, int len) {
    rd_kafkap_str_t *kstr;
    int16_t klen;

    if (!str)
        len = RD_KAFKAP_STR_LEN_NULL;
    else if (len == -1)
        len = str ? (int)strlen(str) : RD_KAFKAP_STR_LEN_NULL;

        //`rd_kafkap_str_t`结构体大小 + 2字节存放字符串长度 + 字符串实际长度 + 1字节的字符串结尾\0的长度
    kstr = rd_malloc(sizeof(*kstr) + 2 +
             (len == RD_KAFKAP_STR_LEN_NULL ? 0 : len + 1));
    kstr->len = len;

    /* 
           Serialised format: 16-bit string length 
           填充2字节的序列化后字符串长度
        */
    klen = htobe16(len);
    memcpy(kstr+1, &klen, 2);

    /* Serialised format: non null-terminated string */
    if (len == RD_KAFKAP_STR_LEN_NULL)
        kstr->str = NULL;
    else {
                // rd_kafkap_str_t::src指向实际的内存地址,copy实际字符串的内容
        kstr->str = ((const char *)(kstr+1))+2;
        memcpy((void *)kstr->str, str, len);
        ((char *)kstr->str)[len] = '\0';
    }

    return kstr;
}
Kafka Protocol Byte Array
  • 所在文件:src/rdkafka_proto.h
  • 与上在介结的String很相似,表示kafka协议中的字节娄组,在协议的序列化中,先用4个字节表示字节数组的内容的长度,紧随其后是其实际的内容: { uint32, data.. }
  • 定义如下:
代码语言:javascript
复制
typedef struct rd_kafkap_bytes_s {
    /* convenience header (aligned access, host endian) */
    int32_t     len;   /* Kafka bytes length (-1=NULL, 0=empty, >0=data) */
    const void *data;  /* points just past the struct, or other memory,
                * not NULL-terminated */
    const char _data[1]; /* Bytes following struct when new()ed */
} rd_kafkap_bytes_t;

可以表示三种byte数组:

  1. Kafka NULL bytes (bytes==NULL,len==0),
  2. Empty bytes (bytes!=NULL,len==0)
  3. 有实际数据 data (bytes!=NULL,len>0)
  • Kafka Byte Array的创建:
代码语言:javascript
复制
static RD_INLINE RD_UNUSED
rd_kafkap_bytes_t *rd_kafkap_bytes_new (const char *bytes, int32_t len) {
    rd_kafkap_bytes_t *kbytes;
    int32_t klen;

    if (!bytes && !len)
        len = RD_KAFKAP_BYTES_LEN_NULL;

        //`rd_kafkap_bytes_t`结构体大小 + 4字节存放byte array长度 + 内存实际长度
    kbytes = rd_malloc(sizeof(*kbytes) + 4 +
             (len == RD_KAFKAP_BYTES_LEN_NULL ? 0 : len));
    kbytes->len = len;

    klen = htobe32(len);
    memcpy(kbytes+1, &klen, 4);

    if (len == RD_KAFKAP_BYTES_LEN_NULL)
        kbytes->data = NULL;
    else {
        kbytes->data = ((const char *)(kbytes+1))+4;
                if (bytes)
                        memcpy((void *)kbytes->data, bytes, len);
    }

    return kbytes;
}

Librdkafka源码分析-Content Table

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018.01.07 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Librdkafka源码分析-Content Table
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档