2019-2020-1 20199324《Linux内核原理与分析》第七周作业
阅读原文时间:2023年07月09日阅读:2

进程的描述

  • 操作系统内核实现操作系统的三大管理功能以及对应的抽象概念:

    • 进程管理(最核心)—— 进程
    • 内存管理 —— 虚拟内存
    • 文件系统 —— 文件
  • 进程是怎样描述的?

    • 通过进程控制块PCB描述进程
  • Linux内核中用数据结构 struct task_struct 来描述进程,称其为进程描述符

  • 进程描述符的结构示意图:

  • Linux内核管理的进程状态转化图:

  • 注意:操作系统原理中就绪态和运行态这两个状态在Linux内核中都是相同的 TASK_RUNNING 状态。在Linux内核中,当进程是 TASK_RUNNING 状态时,它是可运行的,也就是就绪态,是否运行取决于它有没有获得CPU的控制权。

  • 阻塞态也有两种:TASK_INTERRUPTIBLE 和 TASK_UNINTERRUPTIBLE 。

    • TASK_INTERRUPTIBLE 状态是可以被信号和 wake_up() 唤醒的。
    • TASK_UNINTERRUPTIBLE 状态只能被 wake_up() 唤醒的。
  • 进程标识符PID。在进程描述符中用pid和tgid标识进程。

  • 管理进程数据结构的双向链表:struct list_head tasks (是一个很关键的进程链表)

进程的创建

0号进程的初始化

  • 0号进程 init_task 的初始化时通过硬件编码方式固定下来的。(其他的所有进程都是通过 do_fork 复制父进程的方式初始化的)

内存管理相关代码

1301  struct mm_struct *mm,*active_mm;

mm 和 active_mm 是和进程地址空间,内存管理相关的数据结构指针。

进程之间的父子、兄弟关系

  • 进程描述符 struct task_struct 数据结构中记录了当前进程的父进程 real_parent;记录当前进程的子进程的是双向链表 struct list_head children;记录当前进程的兄弟进程的是双向链表 struct list_head sibling。

保存进程上下文中CPU相关的一些状态信息的数据结构

  • 数据结构 struct thread_struct 用来保存进程上下文中CPU相关的一些状态信息的数据结构,在进程切换时起着很重要的作用。
  • struct thread_struct 数据结构中最关键的是 sp 和 ip:
    • sp 用来保存进程上下文中ESP寄存器状态
    • ip 用来保存进程上下文中EIP寄存器状态

进程的创建过程分析

  • rest_init 通过 kernel_thread 创建两个内核线程:

    • kernel_init (1号进程),是所有用户态进程的祖先。
    • kthreadd 内核线程 (2号进程),是所有内核线程的祖先,负责管理所有内核线程。
  • fork,vfork,clone 三个系统调用都可以创建一个新进程,而且都可通过调用 do_fork 来实现进程的创建。

  • fork 一个子进程的过程中,复制父进程的资源采用了Copy On Write(写时复制)技术。不需要修改进程资源,父子进程是共享内存存储空间的。

  • 进程创建的过程

    • 复制进程的描述符,一一复制其他进程的资源(采用写时复制技术),分配子进程的内核堆栈并对内核堆栈关键信息进行初始化。
    • Linux创建一个新的进程是从复制开始的,在系统内核里首先是将父进程的进程控制块PCB进行拷贝,然后再根据自己的情况修改相应的参数,获取自己的进程号,再开始执行。
  • 进程创建过程中的重要函数或数据结构:

    • do_fork():主要完成调用 copy_process() 复制父进程信息、获得pid、调用 wake_up_new_task 将子进程加入调度器队列等待获得分配CPU资源运行、通过clone_flags标志做一些辅助工作。
    • copy_process():主要完成调用 dup_task_struct 复制当前进程(父进程)描述符 task_struct 、信息检查、初始化、把进程状态设置为 TASK_RUNNING (此时子进程置为就绪态)、采用写时复制技术逐一复制所有其他进程资源、调用 copy_thread 初始化子进程内核栈、设置子进程pid等。
    • dup_task_struct():复制当前进程(父进程)描述符 task_struct 和 copy_thread 初始化子进程内核栈,为子进程分配好内核栈。
    • copy_thread():完成内核栈关键信息的初始化。
    • thread_info 结构:小型的进程描述符。通过task指针指向进程描述符。thread_info 结构由低地址到高地址增长。task_struct 结构中没有直接指向 thread_info 结构的指针,而是用一个 void 指针类型的成员表示,然后通过类型转换来访问 thread_info 结构。

删掉menu之后克隆一份新的,把test.c覆盖掉,在menu下面执行 make roofts 。

编译运行出来可以看到列表中增加了fork。下图是 MenuOS 的运行效果。执行fork可以看到父进程和子进程都输出信息。

启动gdb,把内核加载进来,连接到target remote 1234

在sys_clone、do_fork、dup_task_struct、copy_process、copy_thread、ret_from_fork处各设置断点。

继续执行,停到了 do_fork 位置,next

到 copy_process() 函数。继续执行

继续执行,到copy_thread:

涉及 system_call 的那段段汇编代码跟踪不到。

1.在Linux中,fork()系统调用产生的子进程在系统调用处理过程中从何处开始执行?

从用户态空间来看,就是fork系统调用的下一条指令。

子进程和父进程都从调用fork函数的下一条语句开始执行

2.fork调用的特性“一次调用,两次返回”,它可能有三种不同的返回值:

1)在父进程中,fork返回新创建子进程的进程pid(返回值>0);

2)在子进程中,fork返回0;

3)如果出现错误,fork返回一个负值。

创建新进程成功后,系统中出现两个基本完全相同的进程,这两个进程执行没有固定的先后顺序,哪个进程先执行要看系统的进程调度策略。此时,两个进程都从fork开始往下执行,只是pid不同。

3.父进程和新创建的子进程之间最大区别在于他们有着不同的PID。

4.所有的子进程是在do_fork实现创建和调用的。

5.对后面的跟踪状态还不太懂,等弄清楚了再进行补充。

参考资料:https://blog.csdn.net/zxm342698145/article/details/56513252

https://blog.csdn.net/Always2015/article/details/45008785?locationNum=9&fps=1