拼多多面试:linux下应用程序开始执行到main经历了什么

Linux下一个应用程序开始执行到main被调用之间经历了什么?

在Linux系统中,一个应用程序从开始执行到main函数被调用之间经历了多个复杂的步骤。以下是一个详细的流程概述:

1. 加载器(Loader)

当用户在终端或脚本中启动一个程序时,shell调用系统调用execve。这个系统调用将负责启动程序的执行。

2. 内核态操作

内核处理execve系统调用并执行以下操作:

  • 可执行文件查找:内核找到并验证要执行的可执行文件。
  • 文件读取:读取ELF(Executable and Linkable Format)可执行文件头,以获取程序入口点、程序头表等。

3. 创建进程环境

  • 创建新进程:内核为新进程分配资源,如进程控制块(PCB)、内存空间等。
  • 加载程序段:根据ELF文件的程序头表,内核将可执行文件的各个段(如代码段、数据段)加载到新进程的地址空间。
  • 设置堆栈:为进程分配用户栈,并将命令行参数和环境变量拷贝到用户栈上。
  • 动态链接器:如果程序是动态链接的,内核会加载动态链接器(ld-linux.so),并将控制权移交给它。

4. 动态链接器(Dynamic Linker/Loader)

如果程序是动态链接的,动态链接器将执行以下步骤:

  • 解析符号:解析并加载所需的共享库,满足所有未定义的符号。
  • 重定位:修改程序中的地址引用,使其指向正确的内存地址。
  • 初始化函数:执行共享库中的初始化代码(如.init段中的代码),通常通过调用构造函数(constructor)。

5. 用户态准备

在动态链接器完成工作后,程序的控制权会传递给程序的入口点(通常是 _start 函数)。

6. C运行时(C Runtime, CRT)初始化

程序的入口点 _start 通常是由C运行时库提供的启动代码。它完成以下操作:

  • 堆栈和全局数据初始化:设置堆栈指针,初始化全局变量和静态变量。
  • 调用程序初始化函数:执行编译器生成的初始化函数(如 .init_array 数组中的函数)。
  • 准备参数:将命令行参数和环境变量传递给 main 函数。

7. 调用 main

完成所有初始化步骤后,CRT代码调用 main 函数,开始执行用户定义的程序逻辑。

具体步骤的示例代码

下面是一些伪代码,描述了从 _startmain 的执行过程:

.section .text
.globl _start

_start:
    # 设置栈指针
    # 初始化堆栈、全局变量等
    call __libc_start_main

__libc_start_main:
    # 初始化C运行时环境
    # 调用全局和静态构造函数
    call init_functions

    # 调用用户定义的main函数
    call main

    # main函数返回后调用退出处理函数
    call exit

小结

综上所述,从Linux系统下启动一个应用程序到调用main函数,需要经过以下主要步骤:

  1. 加载器处理execve系统调用,加载程序到内存。
  2. 内核创建进程环境,加载程序段和动态链接器。
  3. 动态链接器解析符号,加载共享库,执行初始化代码。
  4. C运行时库初始化,设置堆栈和全局数据,准备main函数的参数。
  5. 最后调用main函数,开始执行用户程序逻辑。

每个步骤都涉及复杂的底层操作,确保程序能够正确加载并运行。

#拼多多面试#
全部评论

相关推荐

点赞 9 评论
分享
牛客网
牛客企业服务