【Linux】进程的生命之旅——诞生、消逝与守候(fork/exit/wait)

一、进程创建
1.fork函数
操作系统中进程的创建通常是通过系统调用实现的,在Linux中是通过fork(),它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。

#include<unistd.h> // 使用需包含头文件unistd.h
pid_t pid = fork(); // 在子进程中返回0,父进程中返回子进程pid,出错返回-1
fork是操作系统提供的一种高层封装,它抽象了进程创建的复杂过程,fork将底层的一系列操作封装在一个简单的系统调用中,屏蔽了许多复杂的细节:

📚高层封装特性
① 简化进程创建的步骤:

fork的调用接口非常简洁,只需要调用一次,系统会自动创建一个子进程并返回。父进程和子进程共享相同的代码,子进程可以继续从父进程的当前执行点运行。

② 屏蔽底层细节:

底层需要分配新的内存空间、复制父进程的状态、初始化子进程的资源,fork函数将这些细节全部封装起来。

③ 依赖操作系统:

fork的具体实现以来于操作系统内核,它负责管理进程表等关键数据结构,系统调用fork,当控制转移到内核中的fork代码后,内核做:

1. 分配新的内存块和内核数据结构给子进程

2. 将父进程部分数据结构内容拷贝给子进程

3. 添加子进程到系统进程列表当中

4. fork返回,开始调度器调dan'ddandan

当一个进程调用fork之后就会有两个二进制代码相同的进程,并且都能运行到相同的地方,各自开始往下走:

int main() {
printf("Before: pid is %d, ppid is %d\n",getpid(),getppid());
fork();
printf("After: pid is %d, ppid is %d\n",getpid(),getppid());
return 0;
}

❓这里为什么只有三行输出,子进程共享父进程的代码,并各自独立执行,应该是打印两次Before才对。分析打印结果,10226应该是父进程,确实打印了Before,而子进程10227没有打印Before,说明子进程并没有执行Before的代码,正如上面所说的,子进程继续从父进程的当前执行点运行,也就是从fork代码处往下执行,而fork之前的不会被执行:

所以,在一个进程调用fork之前,该进程单独执行,调用fork之后,父子两个进程执行流各自执行

📚fork返回值
在子进程中,fork返回0;

在父进程中,frok返回子进程pid。

❓这里提出一个问题,在父进程中fork返回值没有异议,因为fork函数是父进程调用的,自然会有返回值,但是在子进程中fork也有返回值,那么是不是子进程也调用了fork函数呢? 这不肯定,因为一个进程调用fork函数之后会创建出它的子进程,而子进程再调用fork函数再创建。。。这显然不对,所以子进程并没有调用fork函数,但是为什么会有fork函数的返回值呢?

✅上面说到,子进程是从父进程的执行点开始往下执行的,所以对上述问题合理的解释是:父进程创建子进程时的执行点在fork函数调用之后,返回之前,所以子进程往下执行也会有返回值产生

2.写时拷贝
父子进程的代码是共享的,所以它们往后执行相同的操作,那么它们的数据也是共享的吗?的确,在没有进行写入时,父子进程的数据也是共享的,只有当一方尝试对共享数据进行写入时,系统才会拷贝一份数据用于写入,这样既确保了资源的高效利用,又保证了父子进程间的独立性 。

3.调用失败
fork()调用失败通常于系统资源、权限、或操作系统限制有关,下面是常见的原因:

📚资源耗尽
当系统的资源不足时(如内存或进程表项不足),fork()会失败:

内存不足:操作系统需要为每个新进程分配内存,如果系统内存耗尽,fork() 就会失败。

进程表已满:每个进程都有一个进程控制块(PCB),操作系统维护一个进程表。如果系统中运行的进程数量已经达到限制,无法再为新进程分配进程控制块时,fork() 会失败。

堆栈空间不足:如果子进程的堆栈空间无法分配(尤其在某些嵌入式或资源受限的环境中),fork() 也会失败。

📚进程数限制
大多数操作系统对一个用户或系统总共能创建的进程数有限制。若当前用户或系统已经达到了此限制,调用 fork() 时就会失败。

可以通过 ulimit -u 查看单个用户的最大进程数:

📚内核限制
内核的资源,如文件描述符和信号等,也可能导致 fork() 失败。例如,如果父进程持有太多打开的文件句柄,可能会达到系统文件描述符的限制。

📖二、进程终止
1.退出场景
进城退出场景无非下面三种:

①:代码运行完毕,结果正确

②:代码运行完毕,结果不正确

③:代码异常终止(没有运行完)

第一种情况自然是最好的,但是如果是另外两种情况,我们就需要进行额外处理,但是我们怎么才能知道进程退出是哪种情况呢(什么时候需要处理,什么时候不需要呢)?

这个时候就需要进程退出时,做一些标记(返回退出码),告知操作系统或程序员具体的退出情况

2.status退出码
status状态码用于表示进程的退出状态,提供了进程执行结果的信息,状态码遵循以下约定:

0:表示命令成功执行,没有错误发生。
非0:表示命令执行失败。具体的非0值表示不同类型的错误,具体含义通常与执行的程序或命令相关。例如:
1:一般性错误。
2:命令语法错误。
126:命令不能执行(权限问题)。
127:命令未找到。
128:命令因信号导致终止(例如,程序被 kill 命令中断)。
130:程序因接收到 Ctrl+C(SIGINT)信号而退出。
status通常被定义成整形,但是并不能当作一般的整形看待,而是要看作成位图:

我们有一个 32 位的 status,其中高8位用于表示退出状态,低8位用于表示因信号退出的原因。

高8位(退出状态)可以有 256 种可能的退出码:

0:正常退出。

1 到 127:表示不同的错误。

128 到 255:表示因信号终止,计算方式为 128 + 信号编号。

低8位(信号终止标志):

如果进程是由于信号终止的,那么低8位会记录相应的信号编号(例如,SIGKILL 对应 9,SIGSEGV 对应 11)。

如果进程不是由信号终止的,低8位通常为 0。

3.退出方法
进程退出的常见方法有:exit(),_exit()以及main()函数返回,下面依次进行介绍:

📚exit函数
exit(int status):这是进程正常终止的一种方式。调用exit()后,进程会清理其资源(文件描述符、内存等),并将状态码status返回给操作系统。当返回0时表示成功退出,返回非0表示出现错误。

在多线程程序中,exit() 会终止当前进程以及所有线程。

#include <stdio.h>
#include <stdlib.h>

int main() {
printf("This process will exit normally.\n");
exit(0); // 正常退出,状态码为0
}
📚_exit函数
_exit(int status):这个函数与 exit() 很相似,但它不会执行标准库的清理操作(如缓冲区刷新等),直接终止进程。来看下面这段代码:

int main()
{
printf("this is a process, pid is %d, ppid is %d",getpid(),getppid());
exit(0);
}

调用exit时,正常打印;

int main()
{
printf("this is a process, pid is %d, ppid is %d",getpid(),getppid());
_exit(0);
}

❓调用_exit时,没有正常打印,这是为什么呢?

✅printf输出时如果没有加上\n,此时输出的内容会存在标准输出缓冲区中,并不会立刻显示在终端,而调用_exit函数时,由于它不会执行标准库的清理操作,所以缓冲区的内容就不会显示在终端

exit函数最后其实会调用_exit函数,只不过在调用之前,多做了如清理缓冲区的操作:

📚main函数返回
return:在 main 函数中使用时,程序会结束并返回指定的退出状态码(通常为 0 表示成功,非 0 表示错误)。return 结束当前函数的执行,但如果在 main 函数中调用,它会导致程序退出。

return返回和exit调用的效果是一样的,其实他们本质上是等价的:return 0 等价于 exit(0)

只不过在main函数中用return返回作为程序终止的标志更符合函数的语义,可读性更强。

📖三、进程等待
之前的博客讲过,子进程退出,如果父进程不做任何处理,就会引发内存泄露(进程表等信息不会被清理),产生僵尸进程。 博客链接在此:详解僵尸进程于孤儿进程

那么避免僵尸进程的办法就是进程等待,父进程通过进程等待的方式,回收子进程资源,获取子进程退出信息。

1.wait方法
wait()是一个比较简化的系统调用,用于让父进程等待任意一个子进程的终止。wait()函数会阻塞父进程,直到有子进程终止,并且返回一个子进程的PID。

📚语法
#include <sys/wait.h>
pid_t wait(int *status);
status:用于返回子进程的退出状态。

返回值:如果调用成功,返回子进程的PID;如果没有则返回-1。

📚总结
1. 父进程调用wait()时会阻塞,直到有子进程结束并回收它的状态;

2. 如果有多个子进程退出,wait()返回任意一个子进程的PID;

3. 如果没有子进程,wait()会返回-1。

2.waitpid方法
waitpid() 是 wait() 的更为灵活和可控制的版本,允许父进程等待特定的子进程结束,或者通过指定参数进行更精细的控制。

📚语法
#include <sys/wait.h>
pid_t waitpid(pid_t pid, int *status, int options);
pid:指定需要等待的子进程的 PID。可以取以下几种值:
pid > 0:等待指定 PID 的子进程。
pid == -1:等待同组进程中的任意子进程。
status:与 wait() 相同,保存子进程的退出状态。
options:控制行为的标志,常用的选项有:
WNOHANG:非阻塞模式,如果没有子进程退出,立即返回,而不是阻塞。
WUNTRACED:如果子进程已经停止(但没有退出),也返回。
返回值:
返回子进程的 PID,如果没有子进程或者发生错误,返回 -1。
如果 status 中的退出状态有特殊状态(如退出信号),需要使用宏来解析。
int main()
{
pid_t pid = fork();
if(pid == 0)
{
// 子进程
printf("this is child process,pid is %d,ppid is %d\n",getpid(),getppid());
exit(20);
}
// 父进程
printf("this is father process,pid is %d\n",getpid());
int status;
pid_t child_pid = waitpid(-1,&status,WNOHANG);
printf("child process has exited,code is %d,pid is %d\n",WEXITSTATUS(status),child_pid);
exit(0);
}

父进程调用 wait() 或 waitpid() 时,它会传递一个指向 status 变量的指针,用于写入子进程的退出状态,所以我们需要在外部定义一个status变量,并通过取地址的方式传入函数内部。

❓定义成其他变量名可以吗:完全可以!

✅变量名只是内存的一个标识符,是用户自定义的,wait() 或 waitpid() 只关心的是传递给它的地址,而不是变量的名字,只不过定义成status这样代码更加易读。

❓定义成其他类型可以吗:不可以!

✅status 参数必须是一个指向 int 类型的指针。如果传递其他类型(例如 float* 或 char*),程序可能会产生编译错误,这是因为 wait() 和 waitpid() 会在 status 指向的内存中写入整数值,用来存储子进程的退出状态。如果指针指向的类型不匹配,内存解释将出错。

上述代码中由于waitpid内部设置为WNOHANG模式,没有子进程返回时直接退出,不阻塞:

需要sleep(1)等待子进程退出后,waitpid才能接收到退出信息:

// 父进程
printf("this is father process,pid is %d\n",getpid());
int status;
sleep(1);
pid_t child_pid = waitpid(-1,&status,WNOHANG);
printf("child process has exited,code is %d,pid is %d\n",WEXITSTATUS(status),child_pid);
exit(0);

其中WEXITSTATUS是一个宏函数,用于解码退出状态,因为上面讲过,32位status的高8位存储退出状态,所以不能直接引用status查看,而要用一个宏函数进行解码。

📚总结
特性 wait() waitpid()
等待目标 等待任意子进程的结束 可以指定特定的子进程(通过 pid 参数)
阻塞与非阻塞 总是阻塞,直到至少有一个子进程结束 可以通过 WNOHANG 使其非阻塞
灵活性 较少灵活性,只能等待任何一个子进程 更灵活,可以等待指定的子进程或进程组
选项 没有额外选项 支持更多控制选项,如 WNOHANG
返回值 返回一个子进程的 PID 返回指定子进程的 PID,或者 -1 错误
错误处理 如果没有子进程,返回 -1 如果没有子进程,返回 -1
以上就是【进程的生命之旅——诞生、消逝与守候】的全部内容,欢迎指正~
————————————————

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

原文链接:https://blog.csdn.net/dhgiuyawhiudwqha/article/details/143989577

版权声明:
作者:SE_Wang
链接:https://www.cnesa.cn/2440.html
来源:CNESA
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
打赏
海报
【Linux】进程的生命之旅——诞生、消逝与守候(fork/exit/wait)
一、进程创建 1.fork函数 操作系统中进程的创建通常是通过系统调用实现的,在Linux中是通过fork(),它从已存在进程中创建一个新进程。新进程为子进程,而原进程为父进程。 #include<unistd.h> // 使用需包含头文件unistd.h pid_t pid = fork(); // 在子进程中返回0,父进程中返回子进程pid,出错返回-1 fork是操作系统提供的一种高层封装,它抽象了进程创建的复杂过程,fork将底层的一系列操作封装在一个简单的系统调用中,屏蔽了许多复杂的细节: 📚高层封装特性 ① 简化进程创建的步骤: fork的调用接口非常简洁,只需要调用一次,系统会自动创建一个子进程并返回。父进程和子进程共享相同的代码,子进程可以继续从父进程的当前执行点运行。 ② 屏蔽底层细节: 底层需要分配新的内存空间、复制父进程的状态、初始化子进程的资源,fork函数将这些细节全部封装起来。 ③ 依赖操作系统: fork的具体实现以来于操作系统内核,它负责管理进程表等关键数据结构,系统调用fork,当控制转移到内核中的fork代码后,内核做: 1. 分配新的内存块和内核数据结构给子进程 2. 将父进程部分数据结构内容拷贝给子进程 3. 添加子进程到系统进程列表当中 4. fork返回,开始调度器调dan'ddandan 当一个进程调用fork之后就会有两个二进制代码相同的进程,并且都能运行到相同的地方,各自开始往下走: int main() { printf("Before: pid is %d, ppid is %d\n",getpid(),getppid()); fork(); printf("After: pid is %d, ppid is %d\n",getpid(),getppid()); return 0; } ❓这里为什么只有三行输出,子进程共享父进程的代码,并各自独立执行,应该是打印两次Before才对。分析打印结果,10226应该是父进程,确实打印了Before,而子进程10227没有打印Before,说明子进程并没有执行Before的代码,正如上面所说的,子进程继续从父进程的……
<<上一篇
下一篇>>