GlusterFS之内存池（mem-pool）实现原理及代码详解

技巅

发布于 2018-05-25 11:38:05

1.3K0

文章被收录于专栏：技巅技巅

最近一直在研究glusterfs的源代码，自己也在上面做了一些小的改动。我最开始研究的是3.2.5这个版本，因为据同行和网上资料显示这个版本目前是最稳定的版本。glusterfs实现比较复杂，具体的设计思想和架构就不详细介绍了，网上有这方面的资料（CSDN博客里面就有很好介绍的文章）。

研究开源系统的一个好处就是可以充分了解它的实现，如果是看这方面的论文只能了解一些原理性的东西，但是我们真正做项目还需要实际的实现。很多开源系统可能本身不一定就很适合你的系统，但是如果可以改造那么利用它来改造也是很值得划算的。研究开源系统最大的好处就是学习它的优秀的代码，今天这篇博文就是要分享glusterfs里面使用的内存池技术。

glusterfs实现内存池技术的源文件和头文件分别是mem-pool.c和mem-pool.h，首先看看头文件中内存池对象结构体的定义如下：

[cpp]

struct mem_pool {
struct list_head list;//用于管理内存池的标准双向链表
int hot_count;//正在使用的内存数量计数
int cold_count;//未使用的内存数量计数
gf_lock_t lock;
unsigned long padded_sizeof_type;//带有填充
void *pool;//内存池开始地址
void *pool_end;//内存池结束地址
int real_sizeof_type;//内存池存放对象的真实大小
uint64_t alloc_count;//采用alloc分配的次数
uint64_t pool_misses;//内出池缺少次数
int max_alloc;//采用alloc分配的最大次数
int curr_stdalloc;
int max_stdalloc;
char *name;
struct list_head global_list;//加入到全局的内存池链表
};

然后我们在来分析几个重要的实现函数，第一个函数就是mem_pool_new_fn，它会新建一个内存池对象，然后按照传递进来的内存的大小和个数分配内存，还要加上一些额外存储内容的内存容量，如存放链表指针的因为这些内存池对象本身是通过通用链表来管理的，还有如标识内存是否在被使用的一个标志等。具体看下面代码的实现，关键代码都有注释：

[cpp]

struct mem_pool *
mem_pool_new_fn (unsigned long sizeof_type,
unsigned long count, char *name)
{
struct mem_pool *mem_pool = NULL;
unsigned long padded_sizeof_type = 0;
void *pool = NULL;
int i = 0;
int ret = 0;
struct list_head *list = NULL;
jdfs_ctx_t *ctx = NULL;
if (!sizeof_type || !count) {
gf_log_callingfn (“mem-pool”, GF_LOG_ERROR, “invalid argument”);
return NULL;
}
padded_sizeof_type = sizeof_type + GF_MEM_POOL_PAD_BOUNDARY;//计算大小：对象本身所占内存+链表头+内存池指针+int内存大小（存放in_use变量）
mem_pool = GF_CALLOC (sizeof (*mem_pool), 1, gf_common_mt_mem_pool);
if (!mem_pool)
return NULL;
ret = gf_asprintf (&mem_pool->name, “%s:%s”, THIS->name, name);//哪一个xlator分配什么名字内存
if (ret < 0)
return NULL;
if (!mem_pool->name) {
GF_FREE (mem_pool);
return NULL;
}
LOCK_INIT (&mem_pool->lock);
INIT_LIST_HEAD (&mem_pool->list);
INIT_LIST_HEAD (&mem_pool->global_list);
mem_pool->padded_sizeof_type = padded_sizeof_type;//总的对齐内存大小
mem_pool->cold_count = count;//数量：刚开始都是冷的（未使用的）
mem_pool->real_sizeof_type = sizeof_type;//使用内存池对象的真实内存大小
pool = GF_CALLOC (count, padded_sizeof_type, gf_common_mt_long);//分配count个padded_sizeof_type大小的内存
if (!pool) {
GF_FREE (mem_pool->name);
GF_FREE (mem_pool);
return NULL;
}
for (i = 0; i < count; i++) {
list = pool + (i * (padded_sizeof_type));//分配每一个内存对象大小到链表
INIT_LIST_HEAD (list);
list_add_tail (list, &mem_pool->list);//加入到内存池的链表中去
}
mem_pool->pool = pool;//记录分配的内存区域
mem_pool->pool_end = pool + (count * (padded_sizeof_type));//内存分配结束的地址
/* add this pool to the global list */
ctx = jdfs_ctx_get ();
if (!ctx)
goto out;
list_add (&mem_pool->global_list, &ctx->mempool_list);//加入全局的内存池链表
out:
return mem_pool;
}