资源预览内容
第1页 / 共125页
第2页 / 共125页
第3页 / 共125页
第4页 / 共125页
第5页 / 共125页
第6页 / 共125页
第7页 / 共125页
第8页 / 共125页
第9页 / 共125页
第10页 / 共125页
亲,该文档总共125页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
八章节存储管理Stillwatersrundeep.流静水深流静水深,人静心深人静心深Wherethereislife,thereishope。有生命必有希望。有生命必有希望n本章主要内容:本章主要内容:(1) 缺少缺少缺少缺少MMU支持的内存管理;支持的内存管理;支持的内存管理;支持的内存管理;(2) 内存管理内存管理内存管理内存管理3 3种模型;种模型;种模型;种模型;(3) 标准标准标准标准LinuxLinux的内存管理、的内存管理、的内存管理、的内存管理、uClinuxuClinux内存管内存管内存管内存管 理及其的局限性;理及其的局限性;理及其的局限性;理及其的局限性;(4) 内存管理模块的启动过程;内存管理模块的启动过程;内存管理模块的启动过程;内存管理模块的启动过程;(5) 用户程序的内存分布、用户程序的内存分布、用户程序的内存分布、用户程序的内存分布、relocreloc段机制、段机制、段机制、段机制、可可可可 执行文件格式和执行文件加载流程。执行文件格式和执行文件加载流程。执行文件格式和执行文件加载流程。执行文件格式和执行文件加载流程。MMU(Memory Management Unit) 第第 8 章章 目录目录1 缺少缺少MMU支持的内存管理支持的内存管理2 FLAT平模式内存管理平模式内存管理 2.1 3种内存管理模型种内存管理模型 2.2 标准标准Linux的内存管理的内存管理 2.3 uClinux内存管理内存管理 2.4 uClinux内存管理的局限性内存管理的局限性3 内存管理模块的启动过程内存管理模块的启动过程4 可执行程序的加载可执行程序的加载 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc段机制段机制 4.3 FLAT可执行文件格式可执行文件格式 4.4 执行文件加载流程执行文件加载流程 第第 8 章章 目录目录1 缺少缺少MMU支持的内存管理支持的内存管理2 FLAT平模式内存管理平模式内存管理 2.1 3种内存管理模型种内存管理模型 2.2 标准标准Linux的内存管理的内存管理 2.3 uClinux内存管理内存管理 2.4 uClinux内存管理的局限性内存管理的局限性3 内存管理模块的启动过程内存管理模块的启动过程4 可执行程序的加载可执行程序的加载 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc段机制段机制 4.3 FLAT可执行文件格式可执行文件格式 4.4 执行文件加载流程执行文件加载流程8.1 缺少缺少MMU支持的内存管理支持的内存管理 内存管理是操作系统中非常重要的内存管理是操作系统中非常重要的子模块。子模块。 如同普通操作系统一样,在嵌入式如同普通操作系统一样,在嵌入式操作系统中,内存管理实现的好坏对系统性操作系统中,内存管理实现的好坏对系统性能有决定性的作用能有决定性的作用。8.1 缺少缺少MMU支持的内存管理支持的内存管理 Linux内核的内存管理内核的内存管理子模块性能优越。子模块性能优越。 目前大多数使用的嵌入式目前大多数使用的嵌入式Linux解决方案中解决方案中都直接使用了都直接使用了标准标准Linux内存管理机制内存管理机制,或者对,或者对Linux内核的内存管理子模块做了很小的改动,内核的内存管理子模块做了很小的改动, 但嵌入式但嵌入式Linux的内存管理仍然是值得关心的问的内存管理仍然是值得关心的问题。题。 8.1 缺少缺少MMU支持的内存管理支持的内存管理 目前的目前的LinuxLinux内核已经被移植到大量的内核已经被移植到大量的非非x86x86平台上,包括平台上,包括ARMARM,M68KM68K,PPCPPC,AlphaAlpha,SparcSparc等。等。 其中其中uClinuxuClinux主要针对缺少主要针对缺少MMUMMU内存内存管理的优秀嵌入式管理的优秀嵌入式LinuxLinux操作系统。操作系统。8.1 缺少缺少MMU支持的内存管理支持的内存管理 目前,由于体积限制或者出于降低成本的考虑,目前,由于体积限制或者出于降低成本的考虑,嵌入式系统中所使用的微处理器大多缺少嵌入式系统中所使用的微处理器大多缺少MMU。 这些硬件平台包括数字信号处理器这些硬件平台包括数字信号处理器(DSP),SoC(System on Chip),以及那些不具有以及那些不具有MMU的的微处理器,例如微处理器,例如ARM7TDMI,Motorola的的M68K龙珠系列等。龙珠系列等。 8.1 缺少缺少MMU支持的内存管理支持的内存管理 这些没有这些没有MMUMMU的微处理器为传统的微处理器为传统LinuxLinux的的应用造成了一个障碍,它们要求使用应用造成了一个障碍,它们要求使用flatflat内内存模型存模型即没有虚拟内存即没有虚拟内存( (分页页面交换分页页面交换) )、内存地址转换、内存地址转换( (分段分段) )和内存保护的内存管和内存保护的内存管理机制。理机制。 在基于在基于LinuxLinux的嵌入式操作系统中,的嵌入式操作系统中,uClinuxuClinux因为具有在不带内存管理单元因为具有在不带内存管理单元(MMU)(MMU)的硬件平台上运行的能力而独领风骚。的硬件平台上运行的能力而独领风骚。 8.1 缺少缺少MMU支持的内存管理支持的内存管理 它通过提供修改过的它通过提供修改过的LinuxLinux内核、内核、C C库和编库和编译器为嵌入式系统开发者提供了与标准译器为嵌入式系统开发者提供了与标准LinuxLinux相同的相同的APlAPl,实现了从,实现了从LinuxLinux到无到无MMUMMU的微处理的微处理器上的无缝转化。器上的无缝转化。 目前,在无目前,在无MMUMMU平台上能够运行的平台上能够运行的LinuxLinux仅有仅有uClinuxuClinux一家。一家。 第第 8章章 目录目录1 缺少缺少MMU支持的内存管理支持的内存管理2 FLAT平模式内存管理平模式内存管理 2.1 3种内存管理模型种内存管理模型 2.2 标准标准Linux的内存管理的内存管理 2.3 uClinux内存管理内存管理 2.4 uClinux内存管理的局限性内存管理的局限性3 内存管理模块的启动过程内存管理模块的启动过程4 可执行程序的加载可执行程序的加载 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc段机制段机制 4.3 FLAT可执行文件格式可执行文件格式 4.4 执行文件加载流程执行文件加载流程8.2.1 3种内存管理模型内存管理模型可以分成如下内存管理模型可以分成如下3种:种:1. 单一程序模型单一程序模型2. 多程序模型多程序模型3. 具有地址转换硬件的内存管理模型具有地址转换硬件的内存管理模型1. 单一程序模型单一程序模型 这是没有硬件地址转换的内存管理模型。一个应用程序可以对所有的物理内存地址进行寻址。 应用程序始终在物理内存中的同一地址空间运行,一个时刻只有一个应用程序被加载运行,程序加载器把应用程序加载到内存低端,将操作系统加载到高端。 2. 多程序模型多程序模型 这也是没有硬件地址转换的内存管理模型。 即使没有硬件地址转换功能,多个程序也可以共享相同的物理地址。 在程序被加载到内存的时候,改变程序中寻址指令(load,store,jump)所使用的地址值为当前被加载到的位置。 正是使用了这种模型。uClinux 应用程序使用的是虚拟地址,CPU实际执行程序所使用的是物理地址,从虚拟地址到物理地址的转换需要操作系统和MMU硬件的参与。 标准Linux以及大多数现代操作系统都使用这种内存管理模型。3. 具有地址转换硬件的内存管理模型 第第 8章章 目录目录1 缺少缺少MMU支持的内存管理支持的内存管理2 FLAT平模式内存管理平模式内存管理 2.1 3种内存管理模型种内存管理模型 2.2 标准标准Linux的内存管理的内存管理 2.3 uClinux内存管理内存管理 2.4 uClinux内存管理的局限性内存管理的局限性3 内存管理模块的启动过程内存管理模块的启动过程4 可执行程序的加载可执行程序的加载 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc段机制段机制 4.3 FLAT可执行文件格式可执行文件格式 4.4 执行文件加载流程执行文件加载流程8.2.2 标准Linux的内存管理 Linux使用了上述的第三个模型(地址转换硬件的内存管理模型)。 为了理解uClinux对标准Linux的裁减,首先必须清楚标准Linux中内存管理的各种基本概念。这里对相关于虚拟内存的各个概念作一个总结。 8.2.2 标准Linux的内存管理 虚拟内存是一种对RAM和磁盘(或称做主存和辅存)进行无缝混合访问的技术。所有的虚拟内存对于应用程序来说好像是真的存在一样,应用程序在加载的时候并不需要关心是否会超过系统中实际的物理RAM的大小8.2.2 标准Linux的内存管理 内核主要通过页目录和页表的地址转换功能将内核主要通过页目录和页表的地址转换功能将应用程序的虚拟地址转换成物理地址。应用程序的虚拟地址转换成物理地址。 这个过程中可能将应用程序中使用的超过了实这个过程中可能将应用程序中使用的超过了实际物理内存大小的虚拟地址映射到适当的真实物理际物理内存大小的虚拟地址映射到适当的真实物理地址,从而使应用程序可以随心所欲地使用巨大的地址,从而使应用程序可以随心所欲地使用巨大的虚拟存储空间虚拟存储空间( (对对Linux 2.4Linux 2.4内核来说为内核来说为4GB)4GB)。8.2.2 标准Linux的内存管理 但是只通过地址映射还不能解决有限的物理但是只通过地址映射还不能解决有限的物理内存被虚拟地址空间所使用的问题,操作系统还内存被虚拟地址空间所使用的问题,操作系统还必须使用必须使用页面交换机制页面交换机制将那些暂时不再使用的内将那些暂时不再使用的内存空间交换到外存中以使其他程序,能够使用物存空间交换到外存中以使其他程序,能够使用物理内存。理内存。 LinuxLinux没有将整个进程所使用的空间都交换没有将整个进程所使用的空间都交换到外存中,而是对部分不再使用的大小为到外存中,而是对部分不再使用的大小为4KB 4KB 的的页面进行交换,这样就获得了更多的灵活性页面进行交换,这样就获得了更多的灵活性。 应用程序在标准应用程序在标准LinuxLinux中的加载使用了中的加载使用了“按按需调页需调页”的策略,也就是说,应用程序在开始被的策略,也就是说,应用程序在开始被加载的时候并没有一次被全部装载到内存中,只加载的时候并没有一次被全部装载到内存中,只有那些现在必需的代码和数据在开始进行了加载。有那些现在必需的代码和数据在开始进行了加载。 8.2.2 标准Linux的内存管理 在程序执行的过程中,如果遇到了不在内存在程序执行的过程中,如果遇到了不在内存中的程序部分将产生页面错误,操作系统在处理中的程序部分将产生页面错误,操作系统在处理这个错误中断的时候会到外存中找到相应的应用这个错误中断的时候会到外存中找到相应的应用程序部分进行加载。程序部分进行加载。 8.2.2 标准Linux的内存管理 这种设计是基于计算机科学中著名的90-10规则的:90的程序执行时间花费在整个程序10的代码上。 所以只要保持我们用到的程序在内存中,就可以既满足程序的执行速度又节约物理内存空间。 标准Linux中的内存管理模型如图如图8-1所示所示。 第第 8章章 目录目录1 缺少缺少MMU支持的内存管理支持的内存管理2 FLAT平模式内存管理平模式内存管理 2.1 3种内存管理模型种内存管理模型 2.2 标准标准Linux的内存管理的内存管理 2.3 uClinux内存管理内存管理 2.4 uClinux内存管理的局限性内存管理的局限性3 内存管理模块的启动过程内存管理模块的启动过程4 可执行程序的加载可执行程序的加载 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc段机制段机制 4.3 FLAT可执行文件格式可执行文件格式 4.4 执行文件加载流程执行文件加载流程8.2.3 uClinux的内存管理 由于由于M68K系列微处理器中没有分段的系列微处理器中没有分段的概念,所以标准概念,所以标准Linux内核中从虚拟地址到内核中从虚拟地址到线性地址的映射已经不必存在了。线性地址的映射已经不必存在了。 而且由于缺少了而且由于缺少了MMU硬件的支持,硬件的支持,uClinux不能支持虚拟内存管理和内存保护。不能支持虚拟内存管理和内存保护。 8.2.3 uClinux的内存管理n这就意味着它完全不使用标准Linux内核中的分页管理机制,也就没有了页表和页目录对线性地址的映射,从而线性地址到物理地址的转换也是不需要进行任何工作的。n换句话说,uClinux中所使用的都是直接物理地址。 8.2.3 uClinux的内存管理n而且,由于没有了虚拟内存管理功能,uClinux不再使用“按需调页”算法。 这样在程序载入内存执行的时候需要将程序的全部映像都一次装入。n 那些比物理内存还大的程序将无法执行。8.2.3 uClinux的内存管理n 尽管如此,uClinux还是将整个物理内存划分成大小为4KB的页面。n 由数据结构page管理,有多少页面就有多少page结构,它们又作为元素组成一个数组mem_map。n 物理页面可以作为进程的代码、数据和堆栈的一部分,还可以存储装入的文件,也可以当作缓冲区。8.2.3 uClinux的内存管理 uClinux仍然使用标准Linux内核中的变型Buddy System机制来管理空闲的物理页面,bitmap表和free_area数组,以及相关的函数或宏_get_free_pages()、free_pages()、_get_free_page()现在仍然在被使用。8.2.3 uClinux的内存管理n 进程可以向核心申请使用物理内存。这仍然通过使用传统的kmalloc()和kfree()实现。n 这些内存块来自于free_area数组,由blocksize表、size表、page_descriptor结构和block_header结构共同管理。 8.2.3 uClinux的内存管理 而过去的vmalloc()和vfree()由于是从虚拟空间3GB以上的虚拟空间的最高端分配内存,所以现在对它们的实现只是简单地调用kmalloc()和kfree(),实际上分配的也是从空闲物理页面链表中获得的页面。8.2.3 uClinux的内存管理n 不使用虚拟空间的概念,虚存段结构vm_area_struct以及由它构成的线性链表和AVL树都不再使用。n 没有了虚拟内存的应用,也就不再有将页面换出到外存中的机制。n 所以过去的kswapd页面换出守护进程和交换空间的页面管理数据结构在uClinux中都被删除。第第 8章章 目录目录1 缺少缺少MMU支持的内存管理支持的内存管理2 FLAT平模式内存管理平模式内存管理 2.1 3种内存管理模型种内存管理模型 2.2 标准标准Linux的内存管理的内存管理 2.3 uClinux内存管理内存管理 2.4 uClinux内存管理的局限性内存管理的局限性3 内存管理模块的启动过程内存管理模块的启动过程4 可执行程序的加载可执行程序的加载 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc段机制段机制 4.3 FLAT可执行文件格式可执行文件格式 4.4 执行文件加载流程执行文件加载流程8.2.4 uClinux内存管理的局限性 由于缺少了MMU硬件的支持,uClinux的多任务管理功能受到一定限制:1. uClinux中无法实现fork()而只能使用vfork() 这并不意味着uClinux不具有多任务功能,而是父进程在调用vfork()之后必须在子进程调用exec()或者exit()之前阻塞。8.2.4 uClinux内存管理的局限性2. 标准Linux中的内存分段为应用程序提供了接近无限的堆空间和栈空间,而uClinux为可执行程序在紧随它的数据段结束处分配堆栈空间。 这样如果堆增长的太大,它将可能覆盖程序的静态数据段和代码段。8.2.4 uClinux内存管理的局限性3. uClinux中没有自动扩展的栈,也没有brk()调用。 用户必须通过使用mmap()来分配内存空间。 可以在程序的编译过程中指定它所使用的栈大小。4. 不具有内存保护。任何程序都有可能导致内核崩溃。 8.2.4 uClinux内存管理的局限性 uClinux与标准Linux的主要区别在于它针对没有MMU的处理器进行改造。 uClinux所做的修改最大的部分理所当然位于内存管理部分,而内存管理上最大变化就是uClinux没有使用虚拟内存机制。 8.2.4 uClinux内存管理的局限性 这样,标准Linux的内存管理模块中的许多功能实际上都被抛弃了,诸如对页目录和页表的管理,对于交换空间的维护,页交换内核守护进程和页面换出功能,缺页中断和页面保护机制等。 8.2.4 uClinux内存管理的局限性 而为了解决由此产生的新问题,uClinux同时设计了一种新的可执行文件格式:flat,以及修改了部分进程管理的代码:如用vfork()来代替了fork()调用,实现了无法共享页面的do_mmap()等。 uClinux下的多任务管理远比Linux简单,因为没有进程的页表项和保护机制要处理。 8.2.4 uClinux内存管理的局限性 内核的调度器不需要进行修改,唯一需要完成的工作就是进行程序上下文的正确保存和恢复。 这些上下文包括所有的在进程被中断的时候必须保存的寄存器的值。8.2.4 uClinux内存管理的局限性 这些机制的缺少归根结底都在于微处理芯片没有MMU的支持。 例如,在没有MMU的处理器上不可能实现内存共享和保护,这是由于各种UNIX的内存共享都是需要MMU中的页表和页目录管理功能支持的。 8.2.4 uClinux内存管理的局限性 标准Linux中的内存共享以页面共享的形式实现,共享该页的各个进程的页表项直接指向共享页,当共享状态发生变化的时候共享该页的各进程的页表都进行修改。 另一个例子是内存保护机制的缺少。 8.2.4 uClinux内存管理的局限性 标准Linux中对内存的加锁保护是在虚拟内存段VMA的基础上进行的, 也就是每一个VMA段由一个自己的保护权限标志vm_flags,将这个标志设置成PROT_READ,PROT_ WRITE和PROT_EXEC就可以实现保护机制, 但实际上在VMA操作的最底层,保护的实现还是要依靠各个页面本身的页表项标志。第第 8章章 目录目录1 缺少缺少MMU支持的内存管理支持的内存管理2 FLAT平模式内存管理平模式内存管理 2.1 3种内存管理模型种内存管理模型 2.2 标准标准Linux的内存管理的内存管理 2.3 uClinux内存管理内存管理 2.4 uClinux内存管理的局限性内存管理的局限性3 内存管理模块的启动过程内存管理模块的启动过程4 可执行程序的加载可执行程序的加载 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc段机制段机制 4.3 FLAT可执行文件格式可执行文件格式 4.4 执行文件加载流程执行文件加载流程8.3 内存管理模块的启动过程内存管理模块的启动过程 在标准Linux的启动过程中要进行许多与内存管理相关的功能模块的初始化工作,诸如页目录和页表映射的建立等。 在把它改造成不使用MMU的系统的过程中必然要对这些功能进行修改。 所以在这一部分中将展开对uClinux中内存模块的启动初始化分析。8.3 内存管理模块的启动过程内存管理模块的启动过程 arch/armnommu/kernel/entry_armv.S是一个汇编文件,它包含了一个kernel_entry的定义,这是整个内核的进入点。 在完成某些平台相关的初始化工作之后,执行流程跳转到start_kernel()处。 从这里开始考察uClinux的内存模块启动初始化是如何实现的。8.3 内存管理模块的启动过程内存管理模块的启动过程 start_kernel()中与内存模块相关的函数调用流程如下:1.setup_arch() 2. paging_init() 3.free_area_init() 4.mem_init()下面分别分析这些函数各自的功能以及uClinux对它们的改造。1.setup_arch() setup_arch()首先根据目前内核所配置的平台向某些特定地址写入特殊字符序列,以完成对特定硬件的初始化, 比如工作状态发光二极管、错误和报警发光二极管等。1.setup_arch() 存储了可用物理内存起始地址的变量memory_start的初始化是通过一个ld脚本中定义的变量_end进行的。 ld脚本是用来控制GNU ld连接器在连接内核各个目标文件部分的时候的配置动作,比如这样一个脚本:1.setup_arch()SECTIONS .=0x10000; .text : *(.text) .=0x8000000; .data : *(.data) .bss : * (.bss) 1.setup_arch() 用来配置ld连接目标文件的时候将所有目标文件中的存储程序正文的. text段(section)连接到一起,并且映射到输出文件的地址0x10000处,将所有目标文件中已初始化的数据 1.setup_arch() data段连接到一起并放置到输出可执行文件的0x8000000地址处,而所有目标文件中还未初始化的数据段. bss连接起来后映射到输出文件中紧跟在.data段之后的位置。1.setup_arch() 这个ld配置脚本文件对每个平台都是不同的。 如为MICETEK上所使用的uClinux版本使用的ld配置文件为arch/armnommu/vmLinux.lds。 可以通过修改某个平台上的ld脚本配置文件中的_end变量来达到配置其可用物理内存起始地址的目的。1.setup_arch() setup_arch()在完成对memory_start变量的初始化之后,通过某些特定手段检测不同类型的内存分布情况。 比如为检测某段地址范围是否为RAM的方法是通过将某个地址的数据读出来,将它加1后写回内存地址中,然后再读出来和原始数据比较看看其值是否成功增加了1,这样反复操作两次,最后将原数据恢复。 1.setup_arch() 如果是可读可写的RAM,那么这个测试的结果就是每次比较都是成功的,否则就不能将这个地址当作RAM。1.setup_arch() 在setup_arch()中还可能根据所用平台进行对flashmemory和ROM的测试。 在这些平台相关的工作完成以后,setup_arch()将对系统运行的第一个进程init_task的mm_struct结构中描述地址空间分布的变量start_code,end_code,end_data和brk进行初始化,start_code为0,其他三个数值分别为来自于ld脚本配置文件中定义的相关变量_etext、_edata和_end。1.setup_arch() 此后setup_arch()将根据Linux中为系统中的第块rom/flash memory card所分配的固定的主从设备号(可以从Documentdevicestxt中得到)来创建根文件系统的设备号,并存储在后来将要用到的全局变量ROOT_DEV中。1.setup_arch() Setup_arch()最后完成对系统启动参数的保存。 在调用setup_arch()返回之后,start_kernel()中得到了系统可用物理内存的起始和结束地址,以及系统启动时的命令行参数。2. paging_init() 在Linux中,paging_init()的一项主要功能是建立页目录和页表,而且将Linux移植到不同平台的过程中非常重要的一个步骤就是修改这个函数来适应新的硬件平台的虚拟内存体系。 2. paging_init() 但是由于在uClinux中不再使用虚拟内存机制,也就不再需要维护页目录和页表数据结构了,所以paging_init()在这里只是为系统启动的时候保留一部分特殊用途的内存区间。 它返回后,从可以使用的内存区间开始,依次是如下的数据结构:2. paging_init()empty_bad_page_table 占用1页 empty_bad_page 占用1页 empty_zero_page 占用1页,并且被初始化为全0 mem_map bitmap2. paging_init() paging_init()函数在返回前通过调用free_area_init(start_mem,end_mem)进行建立buddy system的映射位图关系,以及建立空闲物理页面链表的操作。3. free_area_init() 这个函数用于建立管理物理页帧的数据结构mem_map,有多少物理页帧就有多少mem_map_t类型的结构体与之相对应。 每个页面的mem_map_t结构中的flags被标明为PG_DMA和PG_reserved,并且页帧号被赋给相应的数值。 同时建立了管理空闲页面的bitmap映射表,并且所有的位都被清0。4. mem_init() mem_init()函数遍历整个可用物理内存地址空间,将每个页面相对应的struct page结构中flags的PG_reserved标志位清除,标志用户个数的count计数器置1,并同时统计可用物理页面数量,然后打印系统的各个内存参数,如可用RAM和ROM的大小、内核代码段和数据段大小等。第第 8章章 目录目录1 缺少缺少MMU支持的内存管理支持的内存管理2 FLAT平模式内存管理平模式内存管理 2.1 3种内存管理模型种内存管理模型 2.2 标准标准Linux的内存管理的内存管理 2.3 uClinux内存管理内存管理 2.4 uClinux内存管理的局限性内存管理的局限性3 内存管理模块的启动过程内存管理模块的启动过程4 可执行程序的加载可执行程序的加载 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc段机制段机制 4.3 FLAT可执行文件格式可执行文件格式 4.4 执行文件加载流程执行文件加载流程8.4 可执行程序的加载可执行程序的加载 在普通的Linux中,虚拟内存技术的使用使我们不必关心一个应用程序是从什么地址开始的。 即使所有的应用程序都使用同一个连接脚本配置。 8.4 可执行程序的加载可执行程序的加载n 也就是说,即使它们使用的虚拟地址是重叠的,经过页表和页目录的转换之后它们也可以被映射到不同的物理地址。n 但是在uClinux中,由于缺少了MMU的硬件支持,在内核中不会发生地址的映射转换,这样就必须解决应用程序的加载问题。8.4 可执行程序的加载可执行程序的加载n uClinux系统使用flat可执行文件格式,gcc的编译器不能直接形成这种文件格式,n 但是可以首先编译生成coff可执行格式或者elf可执行格式的文件,n 然后使用格式转化工具(coff2flt或者elf2flt)将这些中间代码转换成flat文件格式。8.4 可执行程序的加载可执行程序的加载n当用户执行一个flat格式的可执行程序时,内核的执行文件加载器将对flat文件进行进一步处理,主要是对reloc段进行修正。n下面对do_load_flat_binary()函数的分析将详细描述其实现过程。 第第 8章章 目录目录1 1 缺少缺少MMUMMU支持的内存管理支持的内存管理2 FLAT2 FLAT平模式内存管理平模式内存管理 2.1 32.1 3种内存管理模型种内存管理模型 2.2 2.2 标准标准LinuxLinux的内存管理的内存管理 2.3 uClinux 2.3 uClinux内存管理内存管理 2.4 uClinux 2.4 uClinux内存管理的局限性内存管理的局限性3 3 内存管理模块的启动过程内存管理模块的启动过程4 4 可执行程序的加载可执行程序的加载 4.1 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc 4.2 reloc段机制段机制 4.3 FLAT 4.3 FLAT可执行文件格式可执行文件格式 4.4 4.4 执行文件加载流程执行文件加载流程8.4.1 用户程序的内存分布 1.堆堆 标准Linux上用户程序的动态内存分配是通过调用glibc库的malloc函数从程序的堆空间中获得内存页面。 在虚拟内存系统中malloc是使用sbrk调用将程序的数据段向后扩展得到。 应用程序的内存使用分布图如图8-2所示。8.4.1 用户程序的内存分布 而在uClinux的平地址模式中,堆空间是通过mmap调用获得的。 uClibc中的malloc函数是一个非常简单的实现,它将所有分配内存的细节都交给了内核。 2. 栈 uClinux中的栈紧随着用户程序的数据段,而堆是从栈底向下扩张的,如图8-2所示。 由于uClinux中没有内存保护机制,这样必须在程序编译连接的时候就确保为栈保留了足够的空间使它不会覆盖程序的数据段和代码段。第第 8章章 目录目录1 缺少缺少MMU支持的内存管理支持的内存管理2 FLAT平模式内存管理平模式内存管理 2.1 3种内存管理模型种内存管理模型 2.2 标准标准Linux的内存管理的内存管理 2.3 uClinux内存管理内存管理 2.4 uClinux内存管理的局限性内存管理的局限性3 内存管理模块的启动过程内存管理模块的启动过程4 可执行程序的加载可执行程序的加载 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc段机制段机制 4.3 FLAT可执行文件格式可执行文件格式 4.4 执行文件加载流程执行文件加载流程8.4.2 reloc段机制 一个可执行程序通常包含代码段、数据段、堆栈段、未初始化数据段。 在普通的Linux系统上,程序连接的时候,连接器ld都要受一个叫做连接器脚本的配置文件所控制,这个脚本用连接器命令语言写成,连接器会根据它来决定将程序的各个段加载到内存中的什么位置。8.4.2 reloc段机制 但是由于uClinux中没有使用虚拟内存机制,也就没有了从虚拟地址到物理地址之间的映射, 所以程序连接时所指定的程序运行空间在uClinux中成为实际的物理地址而不是像Linux那样可以通过内核维护的页目录和页表来映射到任意物理地址空间。 8.4.2 reloc段机制 在后面的分析中可以看到,程序加载的时候它所加载的地址是由内核的页面分配机制所决定的,在程序加载之前不可能被预知。 这样就形成了一个矛盾:程序连接时连接器所假定的程序运行空间与实际程序加载到的内存空间可能不同。 比如下面的一条指令: bl app_start; 这一条指令采用直接寻址,跳转到app_start地址处执行,连接程序将在编译完成时按照连接器1d的配置文件计算出app_start的实际地址(设若实际地址为Oxl0000), 这个实际地址是根据ld的配置文件做出的假设(因为连接器总是假定该程序将被加载到由ld配置文件指明的内存空间)。 8.4.2 reloc段机制注:但实际上操作系统在加载程序时根本没有考虑到要按照ld配置文件规定的地址进行加载。 这时如果程序仍然跳转到绝对地址Oxl0000处执行,通常情况这是不正确的。 uClinux采用的解决办法是在连接生成的可执行文件中增加一个变量用于在程序加载的时候动态修正app_start的实际地址8.4.2 reloc段机制这种变量的类型如下:include/asm-armnommu/flat.h:struct flat_reloc signed long offset:30; unsigned long type:2; 这实际上是一块32位的空间,前30位用来纪录程序中的那些标明绝对地址的变量在数据段中离数据段的开始位置的偏移量, 后2位用来标明这个变量究竟是指示一个什么地址:分为代码地址,数据地址和未初始化数据地址三种, 以便于在程序加载的时候,相应程序的代码段,数据段和BSS段被加载到内存中的实际位置对这个地址变量做出相应调整。 在上面的例子中,对于程序中的标明地址值的变量app_start就需要这样一个flat_reloc结构的变量。 设若使用变量addr表示这个变量的存储空间,则addr的前30位记录了app_start离数据段开始位置的偏移量。 因为这个地址app_start是跳转代码执行地址,所以addr的后2位被赋值为FLAT_RELOC_TYPE_TEXT(数值为0)。 8.4.2 reloc段机制 增加的4字节变量addr被存放在称为reloc的段内。 程序中的所有的这样的变量被连续存放在可执行文件的头部reloc段中。 连接器连接程序的时候,变量app_start存储的是根据ld配置脚本计算出的地址,通常只是距离代码段、数据段或者BSS段头的相对偏移量。 8.4.2 reloc段机制 在可执行文件加载时,可执行文件加载器遍历可执行文件头部的整个reloc段,对每一个其中的flat_reloc类型的变量首先根据offset的值得到它所对应的地址变量在数据段中的位置8.4.2 reloc段机制 然后根据type的值将这个数据段中的地址变量加上程序在物理内存中的实际的代码段,数据段和BSS段的起始地址进行修正。 这样程序中的地址变量中保存的就是正确的物理地址。第第 8章章 目录目录1 缺少缺少MMU支持的内存管理支持的内存管理2 FLAT平模式内存管理平模式内存管理 2.1 3种内存管理模型种内存管理模型 2.2 标准标准Linux的内存管理的内存管理 2.3 uClinux内存管理内存管理 2.4 uClinux内存管理的局限性内存管理的局限性3 内存管理模块的启动过程内存管理模块的启动过程4 可执行程序的加载可执行程序的加载 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc段机制段机制 4.3 FLAT可执行文件格式可执行文件格式 4.4 执行文件加载流程执行文件加载流程8.4.3 FLAT可执行文件格式 为了适应uClinux中新的内存管理模式而引入了一种专为它所使用的flat可执行文件格式。 可执行文件头是前面描述的reloc段,紧接着是程序的文本段、数据段、未初始化数据段。 可执行文件加载到内存之后程序的堆栈段紧随在BSS段的后面。8.4.3 FLAT可执行文件格式 flat可执行文件格式如图如图8-2所示所示。 但是注意在可执行文件被加载到内存的时候reloc段仍然在外存中。8.4.3 FLAT可执行文件格式n 每实现一个可执行二进制文件格式,只要通过调用内核文件系统中的register_ binfmt( )函数将一个struct Linux_binfmt类型的结构注册到内核中。n 这个结构中包含了这种文件格式的执行文件加载器,共享库加载器和core dump内存镜像文件生成器:include/linux/binfmts.h:struct linux_binfmt struct linux_binfmt *next; long *use_count; int (*load_binary)(struct linux_binprm *, struct pt_regs * regs); int (*load_shlib)(int fd); int (*core_dump)(long signr,struct pt_regs * regs); 其中load_binary函数是每一个二进制文件格式的实现都必须提供的,而其他的两个函数指针可以为空, 比如在uClinux中,由于内存管理的特定方式决定了不能使用代码的共享,所有的可执行程序都在编译时进行了静态库的连接 8.4.3 FLAT可执行文件格式 所以没有必要实现运行时动态加载连接库的功能,而且uClinux也没有实现core dump机制的支持, 所以它的flat可执行文件格式注册过程是这样的:static struct linux_binfmt flat_format = #ifndef MODULE NULL,NULL,load_flat_binary,NULL,NULL#else NULL,&mode_use_count_,load_flat_binary,NULL,NULL#endif;register_binfmt(&flat_format); 注册完成后,内核文件系统在加载flat binary格式的可执行程序的时候自动调用load_flat_binary( )函数完成加载。第第 8章章 目录目录1 1 缺少缺少MMUMMU支持的内存管理支持的内存管理2 FLAT2 FLAT平模式内存管理平模式内存管理 2.1 32.1 3种内存管理模型种内存管理模型 2.2 2.2 标准标准LinuxLinux的内存管理的内存管理 2.3 uClinux 2.3 uClinux内存管理内存管理 2.4 uClinux 2.4 uClinux内存管理的局限性内存管理的局限性3 3 内存管理模块的启动过程内存管理模块的启动过程4 4 可执行程序的加载可执行程序的加载 4.1 4.1 用户程序的内存分布用户程序的内存分布 4.2 reloc 4.2 reloc段机制段机制 4.3 FLAT 4.3 FLAT可执行文件格式可执行文件格式 4.4 4.4 执行文件加载流程执行文件加载流程8.4.4 执行文件加载流程n 下面考察一个磁盘上的可执行文件是如何被加载到内存中并执行的。n 在已注册的flat可执行文件加载器被调用的时候,load_flat_binary()通过调用do_load_flat_binary()函数完成加载功能。8.4.4 执行文件加载流程 每一个应用程序在内核中对应一个进程,由一个进程控制块描述,也就是task_struct结构。 在调用do_load_flat_binary()的时候,已经为这个任务的运行创建了进程上下文环境,包括task_struct结构空间的分配和初始化。 8.4.4 执行文件加载流程 Do_load_flat_binary()所要完成的就是从磁盘文件中按照可执行文件的格式读取可执行文件的各个段到RAM中(正文段可以在ROM中执行, 所以可能并不加载到RAM内存中,而数据段、未初始化数据段BSS必须被加载到RAM中,程序的堆栈空间也必须在RAM中被分配)。 8.4.4 执行文件加载流程 并且由于flat binary的特性,还要在必要的时候进行reloc段的内存偏移量修正。 函数do_load_flat_binary()负责实际加载二进制文件的工作,其定义如下:inline int do_load_flat_binary(struct linux_binprm * prm,struct pt_regs * regs); 其中函数do_load_flat_binary( )的参数bprm是一个如下类型的结构变量: include/linux/binfmts.h: struct linux_binprm char buf128; #ifndef NO_MM unsigned long pageMAX_ARG_PAGES; #else /*!NO_MM */ char * envp,*argv;#endif /* !NO_MM */ unsigned long p; int sh_bang; struct inode * inode; int e_uid,e_gid; int argc,envc; char * filename; /*Name of binary */ unsigned long loader,exec; int dont_iput; /*binfmt handler has put inode */;8.4.4 执行文件加载流程 它用来在加载各种可执行文件的时候存储参数信息。 在加载flat_bin格式的可执行文件的情况下,开始的buf域实际上存储了一个struct flat_hdr类型的结构变量(只使用了64个字节)。 envp和argv是执行程序时的环境变量指针列表和参数指针列表。 inode是可执行文件在文件系统中的inode指针,通过它可以得到这个文件的所有相关信息。 Filename是这个可执行文件在磁盘上的文件名的字符串指针等。 其中buf域中保持的flat_hdr结构用于每个flat binary格式的磁盘文件的格式描述,定义如下:include/asm-armnommu/flat.hstruct flat_hdr char magic4; unsigned long rev; unsigned long entry; /* offset of first executable instruction with text segment from beginning of file */unsigned long data_start; /*offset of data segment from beginning of file*/unsigned long bss_end; /*offset of end of bss segment from beginning of file */ /*(It is assumed that data_end through bss_end forms the bss segment.)*/ unsigned long stack_size; /*Size of stack,in bytes */ unsigned long reloc_start; /* offset of relocation records from beginning of file */ unsigned long reloc_count; /* Number of relocation records */ unsigned long flags; unsigned long filler6; /*Reserbered,set to zero*/; magic字符数组中必须包含字符串“bFLT”,其他的各个变量描述了在这个flatbinary可执行文件中各个段的起始位置离文件头的偏移量和长度,并且说明了这个文件中的reloc结构数组离文件头的偏移量和数组项个数。 do_load_flat_binary()的流程如下: 1. 首先调用flush_o1d_exec()根据当前进程(current)的mm_struct结构创建一个新的mm_struct结构,它的引用计数器count设为1,占用内存页面数rss为0,tblock.rblock和tblock.next置为0, 然后将task_struct中的mm指针指向这个mm_struct结构,将原来的mm_struct以及它所包含的内存空间使用kfree()释放。 这个过程结束后,当前进程只有个新分配的mm_struct结构,它里面不包含任何内存空间。2. 调用do_mmap()尝试将根据调用参数bprm中的inode所代表的文件映射到当前进程管理的内存空间中: error = do_mmap(file, 0, code_len + data_len + bss_len + stack_len, PROT_READ|PROT_EXEC|(hdr -flags & FLAT_FLAG_RAM) PROT_WRITE : 0), 0 /*MAP_ * */, 0);0第二步第二步 其中进行映射的文件内容包括正文段、数据段、未初始化数据段,以及预先计算出来的需要保留大小的堆栈段。 映射的保护权限设置为可读、可执行,并且根据hdr中的调用参数flag中是否有FLAT_FLAG_RAM被设置(表明是否希望在ROM中直接执行还是装载到RAM中再执行)而决定是否设置可写位。 do_mmap()根据flags参数决定是否真正进行RAM映射,如果flags中的FLAT_FLAG_RAM位被设置,它只简单的返回可执行程序在ROM中的地址而没有从RAM中申请空间,这种情况下需要为程序的数据段、BSS段和堆栈段再分配空间。 如果成功地将这些内容装入物理内存并且建立了用户对他们的管理映射之后,返回的是它们在物理内存中的地址。 所以do_mmap()返回之后需要通过检查它的返回值来确定是否需要再为数据段、BSS段和堆栈段在RAM中分配空间。 因为uClinux没有使用虚拟内存技术,所以这也是文件被装载到的实际物理地址。 通过is_in_rom()调用检查所返回的内存地址是否是rom空间的地址,如果属实,进行如下操作,否则将变量pos赋值为内存中数据段的起始地址,跳转步骤6。3. 上次do_mmap()调用返回的是代码段rom映射的地址,所以有必要为数据段、未初始化数据段BSS,以及堆栈段分配RAM空间。继续使用读、写和执行权限调用do_mmap()。 但是注意这次调用do_mmap()使用的参数file为空, 在这种情况下do_mmap()将只分配一块为此进程所管理的大小为“数据段大小+未初始化数据段BSS大小+堆栈段大小”的空间,以及与此相应的一个struct mm_tblock_struct结构和一个struct mm_rblock_struct结构, 但是没有任何通过file指针进行的操作(如file-f_op-mmap和file-f_op-read)。 这次调用的返回值pos是一块全部被初始化为“0”的内存空间的起始地址。4 调用read_exec()函数将文件中的数据段读入pos所指的内存空间中。5 将所映射的未初始化数据段BSS和堆栈段全部初始化为“0”。6将当前进程的mm_struct结构中的start_code,end_code分别赋值为二进制文件加载之后代码段在物理内存中的实际起始地址和结束地址, start_data和end_data分别赋值为数据段在物理内存中的实际起始地址和结束地址, brk赋值为堆栈段在物理内存中的实际起始地址。7修正程序中使用的地址变量的值。 注意flat可执行程序的reloc段在程序加载的时候并没有像其他段那样被加载,也就是说,它总是存在于外存的文件内部的。 这样,如果代码段是放在ROM中的,那么只要直接从中读取放在离文件头偏移hdr-reloc_start的struct flat_reloc类型变量就可以得到reloc段中第一个变量的地址。否则要调用read_ exec()函数从磁盘文件中读取这些信息。 对于reloc段中的每一个变量,调用do_reloc()函数修正它所对应的程序中的地址变量的值。 do_reloc()函数很简单,它首先根据struct flat_reloc指针类型的参数r得到这个flat_reloc类型的变量所对应的程序中的地址变量的地址, 然后对这个地址变量进行修正:如果它指示的是程序地址,那么将它加上程序的正文段被实际加载到的内存地址; 如果是数据地址,那么将它加上程序的数据段加载的实际地址; 如果是BSS地址,那么将它加上程序的BSS段被加载到的实际物理地址。8. 将可执行文件名,环境变量列表和参数列表依次压入程序堆栈。 注意这个栈的栈底在离BSS段结束处最远的高端地址处,栈顶上限即BSS的结束地址,栈是由高地址向低地址的方向增长的。 然后调用create_flat_tables()将环境变量列表和参数列表解析出来通过put_user()调用使用户能够访问它们, 并将此进程的mm_struct结构中的记录栈顶位置的变量start_stack赋值为此时的栈顶指针。9. 此时所有的程序运行环境都已经创建,调用start_thread()开始此程序的执行。 本章小结本章小结 本章主要介绍了缺少本章主要介绍了缺少MMU支持的内存管支持的内存管理,给出了内存管理理,给出了内存管理3种模型、标准种模型、标准Linux的的内存管理、内存管理、uClinux内存管理及其的局限性;内存管理及其的局限性; 介绍了内存管理模块的启动过程;介绍了内存管理模块的启动过程; 给出了用户程序的内存分布、给出了用户程序的内存分布、reloc段机段机制、可执行文件格式和执行文件加载流程。制、可执行文件格式和执行文件加载流程。练练 习习 题题1. 简述内存管理3种模型。2简述uClinux内存管理机制。3简述reloc段机制。4简述flat可执行文件格式及加载过程。
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号