linux内存虚拟地址映射物理地址


    Linux 内核给每个进程都提供了一个独立的虚拟地址空间,并且这个地址空间是连续的。虚拟地址空间的内部又被分为内核空间和用户空间两部分。不同字长(也就是单个 CPU 指令可以处理数据的最大长度)的处理器,地址空间的范围也不同。
    
    其中,所有进程的内核空间,关联的都是相同的物理内存。进程切换到内核态后,才可以访问内核空间内存。我们下面说到的分段只针对用户空间。
    有两种方式管理虚拟地址与物理地址之间的关系。
    1、段式管理(Segment):由段选择子和段内偏移量找到物理地址。
    
    
    用户空间从低地址到高地址分别是五种不同的内存段。
    代码段(只读段),包括代码和常量等。
    数据段,包括全局变量等。
    堆,包括动态分配的内存,从低地址开始向上增长。
    文件映射段,包括动态库、共享内存等,从高地址开始向下增长。(本图没有画出)
    栈,包括局部变量和函数调用的上下文等。栈的大小是固定的,一般是 8 MB。
    分段容易出现碎片,内存交换效率低(不容易换出到磁盘)的问题。为了解决这两个问题,就出现了内存分页。
    2、页式管理(Paging):虚拟地址分为两部分,页号和页内偏移。
    
    
    MMU 规定了一个内存映射的最小单位,也就是页,通常是 4 KB 大小。为了解决页表项过多的问题,有多级页表和大页两种方式。
    并不是给进程的所有的虚拟内存都会分配物理内存,只有那些实际使用的虚拟内存才分配物理内存。这叫程序的局部性原理。根据此原理,为了提高访问速度,MMU(Memory Manage Unit)里配有一个硬件:TLB(Translation Lookaside Buffer)。用于缓存进程常用页表。
    内存分段和内存分页并不是对立的,他们组合起来使用,通常称为段页式内存管理。
    程序所使用的地址,称为逻辑地址;
    通过段式内存管理映射的地址,称为虚拟地址(线性地址);
    通过页式内存管理将线性地址映射成物理地址。