面试爱考 | OS系统相关
- 进程是什么?有哪几种状态?
- fork的用法?
- 僵尸进程,孤儿进程,守护进程是什么?
- 线程是什么?有哪几种线程?
- 进程与线程的区别?(多进程与多线程的区别?)
- 哪些是线程私有的?
- 集群,分布式的区别?
- 多核是什么意思?
- 并发与并行的区别
- 大内核与微内核
- 分时系统与实时系统
- 32位的系统一个进程最多有多少内存空间?
- 用户态与内核态的区别?(用户空间和内核空间的区别?)
- 库函数与系统调用的区别
- 上下文切换
- 多线程锁的种类?(linux多线程锁?)
- 什么是半双工管道?全双工管道?
- 进程间(IPC:Interprocess communication)通信方式有哪些?
- 如何选择进程间的通信方式?
- 线程池中多线程的线程数该如何设置?
- 操作系统的进程调度算法有哪些?
- linux的任务调度机制是什么?
- 死锁是什么?
- 如何解决死锁问题?
- 可重入函数与不可重入函数?如何编写不可重入函数?
- 静态链接和动态链接的区别?
- 静态库与动态库的区别?
- 软链接与硬链接的区别?
- 程序编译到运行的流程?
- 逻辑地址与物理地址是什么?
- 简述分页系统?
- 简述分段系统?
- 分页与分段的区别?
- 内部碎片和外部碎片的区别?
- 虚拟内存是什么?
- 页面置换算法有哪些?
- 简述Linux文件系统结构?
- 写一个c程序判断系统是32位还是64位的?
- 写一个c程序判断系统是大端字节序 还是 小端字节序?
- 有哪些常见的信号?
- i++是原子操作吗?为什么?
- exit(0),exit(1),return的区别?
- 守护进程如何实现?
进程是什么?有哪几种状态?
进程是运行中的程序,程序只是静态的指令的集合。 进程包括指令,数据段以及PCB(进程控制块)。是操作系统分配资源的最小单位。
进程有三种状态:阻塞态,就绪态,执行态。
以read函数进程读取管道中内容为例:
- 当管道中没有数据时,进程read等待管道另一端写数据,此时进程为阻塞态。
- 写端向管道中写数据,进程read发现数据可读,等待CPU分配时间片,此时进程由阻塞态转为就绪态。
- 当CPU分配给read进程时间片,进行读取数据,进程由就绪态变为执行态。
fork的用法?
fork系统调用用于创建一个子进程,首先给子进程分配空间,再将父进程中的所有值复制到子进程中即可。 注意:子进程会继承父进程的 所有锁与条件变量(包括他们的状态)。
关于返回值:父进程得到子进程的pid,子进程得到0。如果fork失败那么返回一个负值,并且子进程不会被创建。
僵尸进程,孤儿进程,守护进程是什么?
- 孤儿进程
父进程提前退出,子进程仍然在运行,称子进程为孤儿进程。孤儿进程对系统没有危害,产生孤儿进程后,有init进程来接管该孤儿进程(通过ps命令可以查看init进程的pid为1)。
- 僵尸进程
子进程提前退出,父进程仍然在运行,称子进程为僵尸进程。僵尸进程对系统有害,僵尸进程并不会释放拥有的进程号资源。如果出现了大量的僵尸进程占用资源,将会无法创建新的进程(通过ps命令可以查看僵尸进程的状态位z(zombie))。
解决僵尸进程的办法有两个:
- 是杀死父进程,僵尸进程将会转变为孤儿进程,此时init进程会来接管这些孤儿进程,资源得到回收。
- 父进程调用 wait 函数回收子进程资源;
- 守护进程
一种特殊的孤儿进程,不论终端是否关闭,都会一直运行到系统关闭。
在Linux中我们可以使用top , ps 等指令查看进程的状态。
线程是什么?有哪几种线程?
线程是一种轻量级的进程,是操作系统任务调度和执行的最小单位。
线程有两种类型:用户级线程 和 内核级线程。
- 内核级线程:内核态使用的线程。
- 用户级线程:用户态使用的线程。
进程与线程的区别?(多进程与多线程的区别?)
用一个形象的例子可以说明进程与线程之间的关系,将进程比作火车,线程比作火车车厢。
-
本质 进程是运行中的程序,是操作系统分配资源的最小单位;线程是一种轻量级的进程,是操作系统任务调度和执行的最小单位。
-
联系 一个进程可以有多个线程,但至少有一个线程;一个线程只能属于一个进程。
-
数据的共享与同步 多进程的数据是分开的,共享较为困难,需要通过IPC,同步较为简单;多线程的数据是共享的,共享简单,但是同步困难。这一点各有优势。(好比不同的火车共享数据困难,同步简单;车厢之间共享数据简单,同步困难)。
-
CPU与内存消耗 多进程CPU利用率低,内存消耗大(每一个进程都有独立的内存空间),切换复杂;多线程CPU利用率高,内存消耗小(线程共享同一个内存空间),切换简单。多线程占优。
-
创建销毁,切换 多进程创建,销毁,切换速度慢;多线程较快。多线程占优。
-
编程调试 多进程的编程,调试都简单;多线程的编程,调试都较复杂。多进程占优。
-
可靠性 多进程之间不会相互影响;多线程之间会相互影响,一个线程挂掉导致整个进程挂掉。多进程占优。
那么相比于进程,哪些东西又是线程私有的?请见下一个问题。
哪些是线程私有的?
-
线程id:每一个线程都有自己的线程id,可以通过
pthread_self()
查看。 -
寄存器:线程需要不断进行切换,需要使用寄存器存放旧线程的状态。
-
函数堆栈:线程需要拥有属于自己的函数堆栈,使得函数调用可以正常进行。
-
errno:错误返回码
-
线程优先级
集群,分布式的区别?
- 集群
同一个业务,部署在多个服务器上面(不同的服务器运行同样的代码,干同一件事)。
- 分布式
一个业务拆分成多个子业务,部署在不同的服务器上面(不同的服务器运行不同的代码,为了同一个目的)。
多核是什么意思?
多核也就是多内核,是指在一个处理器(CPU)中集成多个完整的计算引擎。
并发与并行的区别
- 并发
单核CPU根据时间片的划分,依次处理多任务。
- 并行
多核CPU同时处理多个任务。
举个例子:吃饭的时候接到电话,接了电话后继续吃饭,这是并发;一般吃饭一边接电话,这是并行。
大内核与微内核
- 大内核
将操作系统的主要功能模块作为一个紧密联系的整体运行在内核态,优点是效率高,缺点是代码量过大难以维护。
- 微内核
随着操作系统内核越来越复杂难以维护,于是提出了微内核的概念;微内核是将最基本的功能留在内核态,而其他功能放在用户态,大大降低了内核的复杂性,从而增加了可维护性,但是由于用户态与内核态之间的频繁切换,效率大大降低。
分时系统与实时系统
- 分时系统
CPU划分多个时间片并发执行任务,有较好的交互性与及时性。
- 实时系统
规定截止时间内处理完任务并作出响应,有较高的及时性,安全性与可靠性,例如飞机自动驾驶,飞机订票,股票交易等。
32位的系统一个进程最多有多少内存空间?
32位系统意味着4G的寻址空间,在Linux中将其分为两个部分,0 ~ 3G为用户空间,3 ~ 4 G为内核空间。
补充:关于用户空间和内核空间的区别见下一个问题。
用户态与内核态的区别?(用户空间和内核空间的区别?)
内核态和用户态是操作系统运行的两种级别。在32位寻址的Linux系统中有4G的虚拟地址空间,0 ~ 3G分为用户空间,3 ~ 4G分为内核空间。
- 内核态
内核空间存放的是内核代码和数据,权限较高,可以访问所有的内存空间和对象,CPU不会被抢占。如 系统调用 和 操作硬件 都处在内核态。
- 用户态
用户空间存放的是用户程序的代码和数据,权限较低,能访问的内存空间和对象受限,CPU可被抢占。 大部分用户使用的应用程序都是在用户态。
库函数与系统调用的区别
- 本质
库函数是可以自己编写的函数,发生在用户地址空间;而系统调用属于内核提供的API,发生在内核空间。 如fread属于库函数,如read,write,open属于系统调用。
- 开销方面
库函数的开销较小;系统调用需要经过用户态,内核态,用户态的转换,所以开销较大。
- 移植性方面
库函数较容易移植,而系统调用由于不同操作系统之间的差异较大,移植较困难。
上下文切换
上下文切换是指CPU挂起一个进程/线程,去执行另一个进程/线程。
上下文切换只能发生在内核态
,是多任务操作系统的一个特点。不过由于上下文的高速切换,在用户眼中仿佛任务是同时处理的一样。
多线程锁的种类?(linux多线程锁?)
- 互斥锁(pthread_mutex_t)
最为常用的锁,任意时刻只能有一个线程能访问加锁资源。
- 递归锁(pthread_mutex_recursive)
相比于互斥锁无法对同一个资源多次加锁或解锁,递归锁可以对同一个资源进行多次加锁和解锁。
- 自旋锁(pthread_spinlock_t)
相比于互斥锁在阻塞状态会让出cpu去忙其他事务,自旋锁在阻塞状态下并不会让出cpu而是一直占用cpu直到得到锁,这样减小了cpu上下文切换的时间,多用于内核中消耗时间较少临界区。
- 读写锁(pthread_rdlock_t)
该锁区分读和写操作,加写锁时其他线程不能对资源进行操作,加读锁的时候多个线程可以对该临界资源加读锁。
什么是半双工管道?全双工管道?
-
单工管道:只有一端可以使用,用作读或者写。
-
半双工管道:两端都可以使用,但只能一端读一端写,数据单向流动。
-
全双工管道:两端都可以使用,且每一端均可读写,数据双向流动。
进程间(IPC:Interprocess communication)通信方式有哪些?
- 管道
管道分为无名管道和有名管道两种,速度较慢,且容量有限。
无名管道(pipe):通过 pipe()函数
创建,存在于内存之中,且只能在亲属进程之间使用,会返回两个文件描述符,一个读一个写。
有名管道(FIFO):通过 mkfifo命令
创建,即使不是亲属进程也可以通信,会直接生成一个文件,通过这个文件进行读写操作。
pipe和FIFO用来实现进程间相互发送非常小的,频率高的消息;这两种方式适用于两个进程间的通信。
-
消息队列 由消息组成的链表,存放在内存中。此方法不太常用。
-
信号量 主要作为锁机制,可以作为同步机制,不能用于传递复杂的消息。通常可以用来做PV操作,也就是加解锁。
-
共享内存 映射一段能够被其他进程所访问的内存。是最快的IPC方式,共享内存用来实现进程间共享非常庞大的,频率高的消息;此方法适用于多进程之间的通信。常常和信号量等方式配合使用。
-
socket套接字 Socket套接字也是一种进程间通信机制,与其他通信机制不同的是,它可以用于不同主机的进程间通信,也就是我们所说的socket网络通信。例如项目中用到的TCP通信, 服务端通过socket创建套接字,再通过bind->listen->accept后接收到新的套接字进行通信;而服务端通过socket->connect之后对套接字进行通信。
-
signal信号 用于通知接收进程某个事件已经发生,主要用于同步。例如在网盘进行上传下载的项目中,如果按下ctrl+c,那么则会进行信号捕获,然后记录下上传了多大的文件,还剩余多少文件,以便下一次进行断点续传。
如何选择进程间的通信方式?
-
Pipe和FIFO用来实现进程间相互发送非常小的,频率高的消息;这两种方式适用于两个进程间的通信。
-
共享内存用来实现进程间共享非常庞大的,频率高的消息;此方法适用于多进程之间的通信。
-
其余主要使用socket。
线程池中多线程的线程数该如何设置?
可以分为以下两种情况进行分析:
- CPU密集型(需要进行大量计算的类型)
线程数 = CPU核数 + 1
- IO密集型(需要进行大量IO操作的类型)
线程数 = CPU核数 * 2
操作系统的进程调度算法有哪些?
-
先来先服务(FCFS) 算法原理是哪一个进程先到达,就先服务哪一个进程。 属于非抢占式算法,有利于长作业,不利于短作业,总体效率不好。
-
短作业优先(SJF) 算法原理是优先处理短作业。 属于非抢占式算法,有利于短作业,不利于长作业,总体效率不好。
-
高响应比优先 优先处理高响应比的作业,
响应比=(等待时间+服务时间)/ 服务时间
; 属于非抢占式算法,该算法介于FCFS和SJF两种算法之间。 -
优先级队列 为每一项作业设置好优先级,先处理优先级高的作业。 有抢占式也有非抢占式。
-
时间片轮转(RR) 将CPU的处理时间划分为若干个时间片,分别去处理各个作业。 该算法常常用于分时系统,并且简单有效。
-
多级反馈队列 是比较好的一种任务调度算法,这也是linux系统使用的进程调度算法。 本质上是
优先级队列算法+ RR
算法。 设置多个优先级队列,所有队列都采取FCFS的原则,并且队列优先级约小,分配的时间片越大。当有新的进程加入时,加入第一个优先级队列。具体可参考多级反馈队列调度算法
linux的任务调度机制是什么?
Linux采用 多级反馈队列算法 调度进程(见上一个问题第6点)。
死锁是什么?
死锁是指多个进程/线程因竞争资源而造成的一种僵局(相互等待)。
死锁形成的条件(必须同时满足下面的四个条件):
-
互斥条件 线程对于资源的占有必须是互斥的。
-
不可剥夺条件 不能强行剥夺线程对资源的占有权。
-
请求且保持条件 线程在请求其他的资源时,会保持自己拥有的资源。
-
循环等待条件 一个线程在等待另一个线程释放资源,从而形成一个循环等待链。
如何解决死锁问题?
- 鸵鸟策略 直接忽视死锁,解决死锁的代价很高,并且发生死锁的概率很低时,可以直接忽视死锁。
在Linux,Windos系统中解决死锁的办法仅仅是忽略它。
-
死锁预防 设定限制条件,从而让形成死锁的四个条件不再成立。如当资源不再互斥,打破互斥形成死锁的条件。
-
死锁避免 通过一系列资源分配策略,从而避免形成死锁,比如经典的
银行家算法
。 -
死锁检测与解除 检测到死锁后进行解除。比如直接剥夺进程拥有的资源。
可重入函数与不可重入函数?如何编写不可重入函数?
-
可重入函数:可以被打断,重新进入的函数。
-
不可重入函数:不可以被打断,不能够重新进入的函数。不可重入函数由于拥有了一些公共资源,如果被中断重新进入则会出现问题。
满足下列条件的函数属于不可重入函数:
- 使用了静态,全局的变量;
- 调用malloc,free函数;
- 调用标准IO函数。
静态链接和动态链接的区别?
-
静态链接也就是将
.o
文件静态链接成可执行文件
;生成的程序较大,不需要依赖系统环境变量。 -
动态链接是在
可执行文件
运行时进行的,之前的程序中只是存放了一个引用,该引用指向动态库。动态链接由于只是存放了引用,所以生成的程序较小,但是需要依赖系统环境变量。
静态库与动态库的区别?
- 静态库(.a/.lib):一组目标文件(.o)的集合,也就是打包压缩之后的.o文件集合。用于静态链接时使用。
- 动态库(.so/.dll):一组目标文件(.o)的集合,也就是打包压缩之后的.o文件集合。用于动态链接时使用。
编写库的目的有两个:
- 不希望别人看到源码。
- 对于不会再修改的代码,将其做成库,减少编译成本。
软链接与硬链接的区别?
- 软链接
也称为符号链接,类似于创建Windos的快捷方式。相当于对该inode节点创建了一个快捷方式,该inode节点的引用计数并不会增加。
- 硬链接
类似于引用计数的概念。假设A文件和B文件同时硬链接向一个inode节点,该inode节点的引用计数就为2,当inode节点的引用计数为0时删除该inode节点。
程序编译到运行的流程?
预编译->编译->汇编->链接->执行
- 预编译:进行宏替换以及头文件展开等
- 编译:将高级语言编译为汇编语言
- 汇编:将汇编语言转换成二进制代码(.o文件)
- 链接:将多个二进制文件链接成为可执行文件
- 执行:运行程序
逻辑地址与物理地址是什么?
- 逻辑地址
又称为虚拟地址,也就是在程序编译时将目标模块从0开始编址,装入内存之后再转换成物理地址,从0开始编制的地址就称为逻辑地址。例如C语言中的取地址操作符(&)就是求的逻辑地址。
- 物理地址
又称为绝对地址,是加载到内存单元中的真正物理地址。
一般来说,从逻辑地址到物理地址有两种方式:分页和分段。操作系统根据映射表,将逻辑地址转换为物理地址。
简述分页系统?
- 组成
分页系统是将 磁盘区分为固定大小的数据块,称为页
;也将 内存分为固定大小的数据块,称为页框
,程序载入时,将页装入页框中
,缺页中断时也是将需要的页放入页框中。
- 地址结构
分页系统分为 页号+页偏移
。地址空间最有有 2^20^ 页,页内偏移量为4KB。
- 页表
作用是实现
页号->物理块号
的地址映射。
简述分段系统?
- 组成
分段系统是程序员人为对代码进行分段
,在高级编程语言中由编译器帮助我们完成
;例如C++的分段系统将内存段划分为:堆段,栈段,代码段,全局静态变量段,文字常量段。
- 地址结构
分段系统分为 段号+段内偏移
,最多有 2^16^ 个段,每个段大小为 64KB。
- 段表
作用是实现 段号->物理块号
的 地址映射。
分页与分段的区别?
-
分页的目的在于实现虚拟内存以便拥有更大的内存空间;分段的目的在于将代码与数据进行分区以便共享以及保护。
-
分页对于程序员是透明的,由操作系统直接帮助我们完成;而分段则是在编译过程中进行的,需要程序员自己设定,在高级语言中由编译器帮助划分段。
-
分页系统由于页的大小相同,地址空间是一维的;分段系统由于段长不相同,所以地址空间是二维的。
-
分页系统属于固定分区,会产生内部碎片;分段系统属于动态分区,会产生外部碎片。
内部碎片和外部碎片的区别?
- 内部碎片:是已经被分配出去却不能被使用的内存空间。
- 外部碎片:是还没有被分配出去但是由于太小了无法分配给新进程的内存空间。
也有一种说法是固定分区会产生内部碎片,动态分区会产生外部碎片。
虚拟内存是什么?
虚拟内存实质上就是将硬盘中的一部分当做内存来使用,从而创建了一个比实际内存大得多的虚拟内存。 原理在于程序装入内存时将需要使用的部分调入,不需要使用的部分调出到磁盘。 虚拟内存通过分页系统实现。
页面置换算法有哪些?
-
最佳置换算法(OPT) 将之后不会使用的页面调出内存,由于并不知道之后会不会使用哪些页面,所以这种理想算法无法实现。
-
LRU算法 将最近最久没有使用的页面调出内存。
-
FIFO算法 先进先出式算法,会出现Belady异常。
简述Linux文件系统结构?
Linux的哲学是万物皆文件,文件系统结构是树结构,文件类型包括普通文件与目录文件。
每一个文件由两部分构成:
-
inode节点号 每一个文件都会占用一个inode,inode的数据结构可以通过
man fstat命令
查看。 -
block 用于记录文件的内容。 在读取一个文件时,首先找到其inode,然后根据inode找到block并进行读取。
写一个c程序判断系统是32位还是64位的?
cout << sizeof(long) << endl;
如果是32位系统则输出4; 如果是64位系统则输出8。
写一个c程序判断系统是大端字节序 还是 小端字节序?
大端模式就是高位优先存放,小端模式就是低位优先存放。 如数据 0x12345678
- 大端模式:0x12345678
- 小端模式:0x78563412
int main()
{
short a = 0x1234;
char b = static_cast<char>(a);
if (b == 0x12)
cout << "大端模式" << endl;
else if (b == 0x34)
cout << "小端模式" << endl;
return 0;
}
有哪些常见的信号?
可以通过 kill –l 命令
查看信号。
-
SIGINT 中断进程信号,
ctrl+c
实现; -
SIGTSTP 任务挂起信号,可以通过
fg/bg 命令
将其重新放到前台或者后台执行,ctrl+z
实现;该信号与SIGSTOP的区别在于SIGSTOP不能够被捕捉或者忽略。 -
SIGKILL 杀死进程信号,
kill -9 pid
实现。
注意:其中SIGKILL 和 SIGSTOP信号不能够被捕捉或者忽略。
i++是原子操作吗?为什么?
i++不是原子操作,因为i++的操作分为了3个阶段(读,写,改):
- 从内存读取到寄存器;
- 寄存器中进行自加;
- 将结果写回内存;
这三个阶段可以被割断,所以不是原子操作。
exit(0),exit(1),return的区别?
-
exit是程序的退出,return属于函数的退出。
-
return是C语言中的关键字;exit是系统调用函数。
-
exit(0)代表程序正常退出,exit(1)代表程序非正常退出;return代表函数返回值。程序员可以通过
echo $? 命令
查看程序的exit值,从而判断程序是否产生错误。
守护进程如何实现?
守护进程是一种特殊的后台程序,会一直运行到系统关闭。
创建守护进程有五个步骤:
-
fork() 创建子进程,终止父进程。
-
setsid() 在子进程中创建新的会话,让其摆脱原终端的控制,成为独立的会话。
-
chdir(“/”) 由于fork中子进程继承了父进程的工作目录,所以需要改变工作目录。
-
umask(0) 由于fork中子进程继承了父进程的文件创建掩码,所以需要改变掩码为0。
-
close(i) 由于fork中子进程继承了父进程的文件描述符,所以需要关闭描述符防止消耗系统资源。
总结:创建子进程->成为独立会话->改变fork继承不必要的东西
- 实例:创建守护进程,向系统日志中定期写入信息。写完后可以通过
sudo cat /var/log/syslog |tail 20 命令
查看结果。
void daemon()
{
if (fork() > 0)
exit(0);
setsid();
chdir("/");
umask(0);
for (int i = 0; i < 64; i++)
close(i);
int cnt = 0;
while (cnt < 10)
{
syslog(LOG_INFO, "this is %d message", cnt);
cnt ++;
sleep(1);
}
}
《计算机基础必考必赢》专栏,专为追求卓越的你打造!这里汇集了计算机组成原理的精髓、计算机网络的奥秘、以及操作系统的深度解析,直击面试核心考点。通过系统学习与实战演练,你将迅速提升解决复杂问题的能力,成为面试官眼中的佼佼者。