在英文释义里fork
的意思为派生分支到的意思,是UNIX或类UNIX中的分叉函数。该函数也是UNIX中派生新进程的唯一方法,不熟悉fork,就不可能熟悉多线程编程。因此熟悉好fork函数也是程序员的必备技能之一。
在linux
环境下我们可以使用man fork
来了解它的功能:
根据文档我们可以知道,fork是用来创建一个新进程的,将新创建的进程称为子进程。子进程可以和原进程同时进行,原进程即为父进程。
#include <unistd.h> //fork头文件
int main()
{
pid_t id = fork();
//pid_t是系统封装的一个宏,本质上是int
return 0;
}
关于返回值: 子进程中返回0,父进程中返回子进程id,出错返回-1。
pid_t id = fork();
//因为存在出错情况,所以我们在使用时是需要进行错误判断的
if(id < 0)
{
perror("fork");
exit(1);
}
...
提问:为什么子进程返回0,而父进程返回子进程id呢? 答:因为子进程只有唯一的父进程,不需要额外标识就可以找到。而父进程可以存在多个子进程,需要额外的标识才能找到这个新创建的子进程。
验证父子进程的返回情况:
#include <unistd.h>
#include <sys/types.h>
#include <stdio.h>
#include <stdlib.h>
int main()
{
printf("Before: pid is %d\n",getpid());
pid_t id = fork();
if(id < 0)
{
perror("fork");
exit(1);
}
if(id == 0)
{
//child
printf("After: pid is %d,fork return %d\n",getpid(),id);
}
else if(id != 0)
{
//parent
printf("After: pid is %d,fork return %d\n",getpid(),id);
}
return 0;
}
//打印结果:
/*
Before: pid is 25514
After: pid is 25514,fork return 25515
After: pid is 25515,fork return 0
*/
进程调用fork后,当控制转移到内核的fork代码后,内核做:
if 和 else if
居然同时执行了,在正常情况下是匪夷所思的,但正常情况下是单进程的情况,使用了fork就变成了多进程情况了,程序在fork函数执行后就已经分成了两条路线了,只是这两条路线在同时执行。
画图理解:
当程序调用fork之后,就有两个二进制代码相同的进程,而且它们都运行到相同的地方,但每个进程都可以开始它们自己的进程,还是上面的代码:
#include <unistd.h>
#include <sys/types.h>
#include <stdio.h>
#include <stdlib.h>
int main()
{
printf("Before: pid is %d\n",getpid());
pid_t id = fork();
if(id < 0)
{
perror("fork");
exit(1);
}
if(id == 0)
{
//child
printf("After: pid is %d,fork return %d\n",getpid(),id);
}
else if(id != 0)
{
//parent
printf("After: pid is %d,fork return %d\n",getpid(),id);
}
return 0;
}
//打印结果:
/*
Before: pid is 25514
After: pid is 25514,fork return 25515
After: pid is 25515,fork return 0
*/
这里的Before打印了一变,可是after却打印了两遍。
正是有了这种机制,fork之前父进程独自执行,fork之后,父子进程执行流分别执行。注意,fork之后,谁先执行完全由调度器决定。
通常,父子代码共享,父子不再写入时数据是共享的,当任意一方尝试写入,便以写时拷贝的方式各种一份副本。