计算机系统

RAM & ROM

RAM(Read Access Memory)和ROM(Read Only Memory)是很多小白感到困惑的东西，只知道跟主存有关，傻傻分不清。

RAM分为SRAM和DRAM。DRAM就是通常用作主存的设备，速度快于普通硬盘，访问速度以ns计算，目前已经可以到几十ns。SRAM速度更快，价格更贵，所以通常用作缓存(Cache，一种读写速度比主存更快的设备，用于缓解CPU与主存之间的速度差异，CPU指令周期低于1个ns)。这两种设备都是靠电压驱动的，断电就无法保存数据。

ROM也是一种访问速度很快的设备，它与RAM的区别是，ROM在断电的情况下仍然可以保存数据。ROM分很多类型，比如PROM（可编程的ROM，只能编写一次）、EPROM（可编程1000次）。

Flash memory是基于EPROM的一种重要存储设备，在手机、电子照相机等设备中大量使用。SSD（固态硬盘）也是基于Flash memory的。

ROM设备中存储的程序通常称为固件（firmware）。计算机启动的时候，会先执行ROM中的固件程序。有些系统会在固件中提供了一系列读写函数（比如BIOS）。

GCC工作流程

gcc从编译源代码到生成可执行程序，要经过四个步骤：

C preprocessor（cpp）预处理源文件（main.c），生成中间文件（main.i，ASCII字符）：这一过程中，cpp程序会替换文件中定义的宏，并将头文件拷贝到源文件中，最后生成中间文件（main.i）；
C compiler（cc1）编译（main.i）生成汇编代码（main.s）；
Assembler（as）编译（main.s）生成目标文件（main.o，relocatable object file）
Linker program（ld）链接所有的目标文件，生成可执行程序。

Static Linking

静态链接器（Static linker）会将可重定位的目标文件（relocatable object file）链接起来生成可执行文件。这个过程中它要执行两个很重要的任务：

符号表（Symbol resolution）：目标文件中可能有符号引用了其他目标文件定义的内容，链接器要将符号的引用串接起来，并保证定义的唯一性；
重定位（Relocation）：编译器和汇编器生成的代码段和数据段的位置都是从0开始的，链接器需要将这些目标文件组合起来，并重新生成地址。事实上，目标文件可以看作是字节块的集合，Linker只是把这些块重新编排，并分配新的地址给它们。

Object Files

目标文件分为三种类型：

可重定位的目标文件（Relocatable object file）：包括二进制码和数据，可能被链接器链接起来生成可执行程序；
可执行的目标文件（Executable object file）：包括二进制码和数据，可以直接载入内存并执行；
可共享的目标文件（Shared object file）：一种特殊的relocatable object file，可以在加载或运行时被链接到程序中。

Compiler和assembler生成的是第一和第三种文件。

不同系统生成的目标文件的格式是不同的，例如：Linux使用的是ELF格式的目标文件。

Relocatable Object Files

这里以ELF格式为例，说明目标文件包含哪些内容：

.text：机器码；
.rodata：程序中的只读数据；
.data：已经初始化的全局变量（c语言）；
.bss：未初始化的全局变量，它们在目标文件中没有分配空间，仅仅是一个占位符；
.symtab：目标文件中引用到的函数和全局变量；
.rel.text：一个包含.text段的地址列表，这些地址在Linker组合目标文件的时候是需要修改的，所以事实上这些地址一般是指向一些外部函数或全局变量；
.debug：调试需要的信息，用-g命令生成；
.line：调试需要的信息，用-g命令生成；
.strtab：字符串符号表，可以认为是.symtab和.debug的辅助表。

Symbols and Symbol Table

每个目标文件（relocatable object file）中都包含一个符号表，记录该文件定义和引用的符号，包括函数和一下变量。具体来说，包括以下两类：

Global symbols：目标文件中定义的函数和全局变量（在c里面没有static修饰的符号），目标文件引用的在其他目标文件中定义的函数和全局变量；
Local symbols：目标文件中定义的仅在该文件中使用的函数和变量（在c里面用static修饰的符号）。

需要注意的是，local symbols中不包括程序中的局部变量，这些局部变量是在运行的时候在stack中生成的，而symbols中记录的变量是编译时在目标文件的.data或.bss段中生成的。对于前者，编译器可以保证符号名称的唯一性，对于后者，Linker需要保证其在所有目标文件中的唯一性。

Linking with Static Libraries

所谓静态链接库，就是事先将一些目标文件压缩打包而成的*.a文件。在链接的时候，Linker会根据应用程序代码中的引用，把静态链接库中需要用到的object modules拷贝到最终的可执行程序中。

可以用ar工具生成静态链接库，例如：

1	unix> ar rcs lib.a lib1.o lib2.o

然后在链接的时候将它们引入：

1	unix> gcc -static -o main main.o lib.a

Linker在解决链接时的符号引用问题时，采用从左向右扫描的方法，如果扫描一个目标文件时，发现一个未定义的符号，就记录下来（保存到未定义符号集），在之后扫描到的目标文件中查找，找到该符号则将其从未定义符号集中删除，并将对应的目标文件放入目标文件集合。

这种方法需要保证目标文件的输入顺序，如果main.c引用了lib.a中的符号，但在编译的时候，把lib.a放在了main.c前面，这样链接将会出错。

Dynamic Linking with Shared Libraries

动态链接库链接到程序中的方法有两种：

程序被载入内存时，由loader控制dynamic linker加载动态链接库；
在程序运行的时候，由程序自己调用dynamic linker加载并链接库，例如：Linux提供了接口来执行这样的操作
1
void *dlopen(const char *filename, int flag);
JNI的工作原理与这种思路很类似。

Unix I/O

在unix中，文件就是一个字节序列。

所有的I/O设备，例如：网络、硬盘、终端，都被当作是文件模型。所以，所有的输入输出都被当作是对特定文件的读写（比如键盘输入到终端）。

每次应用程序打开文件的时候，kernel会返回一个descriptor，应用程序根据这个descriptor来跟踪文件状态，而文件的所有信息都是由kernel维护的（比如：改变当前文件的读写偏移位置，关闭文件等）。

共享文件

Unix内核通过三种数据结构来表示打开的文件，从而实现文件共享的目的：

Descriptor table：由每个进程单独维护，表中的每个子项指向file table中的一个子项；
File table：打开的文件的集合，由所有进程共享。每个子项包含当前文件的偏移位置、引用数目等。如果一个descriptor指向某个File table的子项，这个子项的引用数目会增加1，当引用数目为0的时候，内核会关闭该文件。同时，每个子项也包含一个指向v-node table子项的指针；
v-node table：由所有进程共享，每个子项包含文件的绝大部分信息。

具体的，通过三幅图了解其工作原理：

上图中，进程的descriptor table中，fd1和fd4指向两个不同的子项（File table），这两个子项指向两个不同的文件，所以不存在共享。

上图中，fd1和fd4同样指向两个子项，但这两个子项却指向同一个v-node table的子项，所以它们实际上使用了同一个文件。由于file table的两个子项维护两个File pos，所以fd1和fd4在读文件的时候是“隔离”的。

上图是父进程和子进程的文件共享模型，它们使用的是相同的文件，包括File pos。

Virtual Memory

虚拟内存是位于disk上面的用于模拟物理内存的空间。早期计算机没有虚拟内存，CPU直接通过物理内存地址访问Main Memory。有了虚拟内存后，CPU只拥有Virtual address(VA)，先通过MMU转换成物理内存，再访问Main Memory。

（使用VM）

（没有使用VM）

VM as Tool for Caching

如图，虚拟内存和物理内存都是将空间分成block进行管理的。VM中的块称为virtual page，物理内存上的块称为physical page或page frame。

virtual page有三种类型：

Unallocated: 尚未分配空间的虚拟内存；
Cached: 已经分配空间且映射到物理内存的页；
Uncached: 已经分配空间但还没有映射到物理内存的页（物理内存不够用），当CPU需要访问这块内存时，需要进行页调度。

由于disk跟DRAM的读写速度存在巨大差异，所以VM的主要工作之一是减少页调度。通常来说，virtual page的大小为4KB到2KB（物理内存跟它一致）。

Page Tables

Page Tables是MMU的辅助工具，简单来讲，它是用来判断virtual page的状态的。

Page tables主要包括两个信息：valid bit，n-bit address。前者用来表示这块virtual page是否已经缓存到物理内存，后者表示这块virtual page在disk上对应的空间位置（即用户是否拥有使用权）。

Page tables在CPU寻址的时候发挥作用。CPU访问一块virtual page，通常有三种状态：

Page Hits: 这块vp刚好在DRAM中，直接引用；
Page Faults: 这块vp不在DRAM中，但用户已经在vm上分配了空间。这时发生页调度算法，在vm上找到这块地址空间，将它拷贝到DRAM，如果DRAM没有位置了，需要置换出一个frame，将这块frame写回vm后，再将新的vp写进去。最后要更新Page tables；
Allocating Pages: 这个动作通常是malloc等系统调用导致的。先在vm上分配virtual pages，接下来的步骤跟Page Faults是一致。

要知道，程序的内存调优基本上就是为了防止频繁的页调度。频繁的页调度又称为“抖动”，它受限于disk的读取速度。

VM as a Tool for Memory Management

事实上，操作系统为每个进程单独分配一张Page table，这么做的好处是，对于每个进程而言，它们的内存地址空间可以看作是从0开始的，至于具体对应哪一块物理地址，由MMU决定。

这种设计有多种好处：

简化linking：

之前学linking的时候，提到linking就是将obj链接起来，为符号分配新的地址，这里的地址其实是相对地址，对于Linux而言，每个进程的起始地址（virtual address）都是一样的（例如：32bit系统是0x08048000），因此只要以这个地址为起点，计算往后的偏移地址，就知道程序运行时真正对应的地址是什么。而这个相同的起始地址其实就是每个进程的virtual address space的起始位置，对应到具体的物理内存肯定是不一样的（参见上图）。这样的工作大大简化了linker的设计。
简化loading：

加载程序的时候，会为目标文件中的变量（.text、.data）分配空间，但实际上，初次加载的时候，系统只是在disk的vm上为这些section分配一个virtual pages（没有复制内容，仅仅分配一大块空间，因此速度较快），然后在进程的Page tables中将这些vp的valid bit设为0（not cached），并将address指向obj files中的真正的section，只有当程序真正引用到它们时，才会将它们载入内存。

注：这种将连续的vp跟任意文件的任意地址映射起来的技术称为memory mapping。Unix提供了mmap系统调用给开发人员使用。
简化了sharing：

如果两个进程都调用了系统函数，不必要将系统函数的代码都复制到进程空间，而是将它们的vp都指向相同的磁盘空间（空间上有相应的内核函数代码）即可。
简化了memory allocation：

当程序想分配新的heap空间时，系统可以分配连续的vps给进程（对应到进程的page tables），然后将这些vps映射到物理内存，这样就不用管在物理内存上如何分配连续空间了。

VM as a Tool for Memory Protection

虚拟内存机制可以控制vp的访问权限，通过在PTE（Page table entry）中加入权限标识位来实现。

例如：如果SUP标识位为NO，就表示这个vp内的程序没法访问内核代码。

通过这种方法，可以防止程序在运行时修改代码，或者访问没有权限的区域。