Linux对于内存的管理涉及到非常多的方面,这篇文章首先从对进程虚拟地址空间的管理说起。(所依据的代码是2.6.32.60)
无论是内核线程还是用户进程,对于内核来说,无非都是task_struct这个数据结构的一个实例而已,task_struct被称为进程描述符(process descriptor),因为它记录了这个进程所有的context。其中有一个被称为'内存描述符‘(memory descriptor)的数据结构mm_struct,抽象并描述了Linux视角下管理进程地址空间的所有信息。
mm_struct定义在include/linux/mm_types.h中,其中的域抽象了进程的地址空间,如下图所示:
1 struct mm_struct {
2 struct vm_area_struct * mmap; //指向虚拟区间(VMA)的链表
3 struct rb_root mm_rb; //指向线性区对象红黑树的根
4 struct vm_area_struct * mmap_cache; //指向最近找到的虚拟区间
5 unsigned long(*get_unmapped_area) (struct file *filp,
6 unsigned long addr, unsigned long len,
7 unsigned long pgoff, unsigned long flags);//在进程地址空间中搜索有效线性地址区
8 unsigned long(*get_unmapped_exec_area) (struct file *filp,
9 unsigned long addr, unsigned long len,
10 unsigned long pgoff, unsigned long flags);
11 void(*unmap_area) (struct mm_struct *mm, unsigned long addr);//释放线性地址区间时调用的方法
12 unsigned long mmap_base; /* base of mmap area */
13 unsigned long task_size; /* size of task vm space */
14
15 unsigned long cached_hole_size;
16 unsigned long free_area_cache; //内核从这个地址开始搜索进程地址空间中线性地址的空闲区域
17 pgd_t * pgd; //指向页全局目录
18 atomic_t mm_users; //次使用计数器,使用这块空间的个数
19 atomic_t mm_count; //主使用计数器
20 int map_count; //线性的个数
21 struct rw_semaphore mmap_sem; //线性区的读/写信号量
22 spinlock_t page_table_lock; //线性区的自旋锁和页表的自旋锁
23
24 struct list_head mmlist; //指向内存描述符链表中的相邻元素
25
26 /* Special counters, in some configurations protected by the
27 * page_table_lock, in other configurations by being atomic.
28 */
29 mm_counter_t _file_rss; //mm_counter_t代表的类型实际是typedef atomic_long_t
30 mm_counter_t _anon_rss;
31 mm_counter_t _swap_usage;
32
33 unsigned long hiwater_rss; //进程所拥有的最大页框数
34 unsigned long hiwater_vm; //进程线性区中最大页数
35
36 unsigned long total_vm, locked_vm, shared_vm, exec_vm;
37 //total_vm 进程地址空间的大小(页数)
38 //locked_vm 锁住而不能换出的页的个数
39 //shared_vm 共享文件内存映射中的页数
40
41 unsigned long stack_vm, reserved_vm, def_flags, nr_ptes;
42 //stack_vm 用户堆栈中的页数
43 //reserved_vm 在保留区中的页数或者在特殊线性区中的页数
44 //def_flags 线性区默认的访问标志
45 //nr_ptes 进程的页表数
46
47 unsigned long start_code, end_code, start_data, end_data;
48 //start_code 可执行代码的起始地址
49 //end_code 可执行代码的最后地址
50 //start_data已初始化数据的起始地址
51 // end_data已初始化数据的最后地址
52
53 unsigned long start_brk, brk, start_stack;
54 //start_stack堆的起始位置
55 //brk堆的当前的最后地址
56 //用户堆栈的起始地址
57
58 unsigned long arg_start, arg_end, env_start, env_end;
59 //arg_start 命令行参数的起始地址
60 //arg_end命令行参数的起始地址
61 //env_start环境变量的起始地址
62 //env_end环境变量的最后地址
63
64 unsigned long saved_auxv[AT_VECTOR_SIZE]; /* for /proc/PID/auxv */
65
66 struct linux_binfmt *binfmt;
67
68 cpumask_t cpu_vm_mask; //用于惰性TLB交换的位掩码
69 /* Architecture-specific MM context */
70 mm_context_t context; //指向有关特定结构体系信息的表
71
72
73 unsigned int faultstamp;
74 unsigned int token_priority;
75 unsigned int last_interval;
76
77 unsigned long flags; /* Must use atomic bitops to access the bits */
78
79 struct core_state *core_state; /* coredumping support */
80 #ifdef CONFIG_AIO
81 spinlock_t ioctx_lock; //用于保护异步I/O上下文链表的锁
82 struct hlist_head ioctx_list;//异步I/O上下文
83 #endif
84 #ifdef CONFIG_MM_OWNER
85 struct task_struct *owner;
86 #endif
87
88 #ifdef CONFIG_PROC_FS
89 unsigned long num_exe_file_vmas;
90 #endif
91 #ifdef CONFIG_MMU_NOTIFIER
92 struct mmu_notifier_mm *mmu_notifier_mm;
93 #endif
94 #ifdef CONFIG_TRANSPARENT_HUGEPAGE
95 pgtable_t pmd_huge_pte; /* protected by page_table_lock */
96 #endif
97 #ifdef __GENKSYMS__
98 unsigned long rh_reserved[2];
99 #else
100 //有多少任务分享这个mm OOM_DISABLE
101 union {
102 unsigned long rh_reserved_aux;
103 atomic_t oom_disable_count;
104 };
105
106 /* base of lib map area (ASCII armour) */
107 unsigned long shlib_base;
108 #endif
109 };
Reference:
http://www.cnblogs.com/Rofael/archive/2013/04/13/3019153.html