资源预览内容
第1页 / 共63页
第2页 / 共63页
第3页 / 共63页
第4页 / 共63页
第5页 / 共63页
第6页 / 共63页
第7页 / 共63页
第8页 / 共63页
第9页 / 共63页
第10页 / 共63页
亲,该文档总共63页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
嵌入式系统原理与接口技术,NEUSOFT Institute of information Technology .ChengDu 成都东软信息技术学院计算机系 杨宗德 028-82878167 Y,嵌入式系统的软/硬件框架,冯诺依曼体系结构和哈佛体系结构 CISC与RISC IP 核 流水线 存储器系统,嵌入式系统硬件基础,哈佛体系结构,指令寄存器,控制器,数据通道,输入,输出,中央处理器,程序存储器,指令0,指令1,指令2,数据存储器,数据0,数据1,数据2,地址,指令,地址,数据,ARM简介,ARM(Advanced RISC Machines)系列微处理器,采用的ARM技术知识产权(IP)核都是由ARM公司提供的。 ARM公司本身不生产芯片,转让设计许可,由合作公司生产各具特色的芯片。 ARM32位体系结构目前被公认为是嵌入式应用领域领先的32位嵌入式RISC微处理器结构。从版本1到版本6,ARM体系的指令集功能不断扩大。,ARM Ltd,成立于1990年11月 前身为 Acorn计算机公司 Advance RISC Machine(ARM) 主要设计ARM系列RISC处理器内核 授权ARM内核给生产和销售半导体的合作伙伴 ARM 公司不生产芯片 IP(Intelligence Property) 另外也提供基于ARM架构的开发设计技术 软件工具, 评估板, 调试工具,应用软件, 总线架构, 外围设备单元,等等,ARM处理器系列,ARM7系列 ARM9系列 ARM9E系列 ARM10E系列 SecurCore系列 Inter的Xscale Inter的StrongARM,1.4 命名的含义,ARM,Partner,OEM Customer,ARM的业务模型,ARM处理器结构,从一下四个方面介绍: ARM和Thumb状态 RISC技术 流水线技术 超标量执行,ARM和Thumb状态,V4版以后有: 32位ARM指令集 16位Thumb指令集,功能是ARM指令集的功能子集。 ARM7TDMI核以后,T变种的ARM微处理器有两种工作状态: ARM状态 Thumb状态。,ARM与Thumb状态转换,在程序的执行过程中,微处理器可以随时在两种工作状态之间切换,并且该转变不影响处理器的工作模式和相应寄存器中的内容。 进入Thumb状态:当操作数寄存器的状态位(位0)为1时,执行BX指令。 进入ARM状态:当操作数寄存器的状态位(位0)为0时,执行BX指令。,CISC和RISC,CISC:复杂指令集(Complex Instruction Set Computer) 具有大量的指令和寻址方式 8/2原则:80%的程序只使用20%的指令 大多数程序只使用少量的指令就能够运行。,RISC:精简指令集(Reduced Instruction Set Computer) 在通道中只包含最有用的指令 确保数据通道快速执行每一条指令 使CPU硬件结构设计变得更为简单,知识产权核(IP核, intellectual property),识产权知识产权(IP) 电路或核是设计好并经过验证的集成电路功能单元 IP复用意味着设计代价降低(时间,价格) IP核的类别: 微处理器微处理器: ARM, PowerPC; 存储器存储器: RAM, memory controller; 外设: PCI, DMA controller; 多媒体处理: MPEG/JPEG ; encoder/decoder ; 数字信号处理器(DSP) 通信: Ethernet controller, router,IP核的种类,Soft Cores(“code”)(软核) HDL语言描述 灵活度高,可修改 与工艺独立,可根据具体的加工工艺重新综合; IP很难保护 Firm cores(“code+structure”)(固核) 逻辑综合后的描述 与工艺相关 Hard cores(“physical”)(硬核) 物理综合后的描述 准备流片 包含工艺相关的布局和时序信息 IP很容易保护 多数的处理器和存储器,IP核的商业模型,三种模式 一、计者提供设计和工具的许可证 DSP Group (Pine and Oak Cores), 3Soft, ARM 提供包括HDL在内的模拟模型,工具或仿真器 使用者负责设计制造 二、核厂商设计并制造集成电路芯片 TI, Motorola, Lucent VLSI, SSI, Cirrus, Adaptec 三、核厂商卖核, 负责为客户设计并制造芯片 LSI logic, TI, Lucent,IP核的市场构成,74% 为硬件设计厂商. 26% 将购买IP 核: 40% hard, 68% soft, 32% firm,ARM的IP核,固化宏单元(硬核) ARM920T ARM7TDMI ARM720T ARM1022E,可综合内核(软核) ARM926EJ-S ARM7TDMI-S ARM1026EJ-S,测试芯片 ARM10200E,流水线技术,流水线技术:几个指令可以并行执行 提高了CPU的运行效率 内部信息流要求通畅流动,译码,取指,执行add,译码,取指,执行sub,译码,取指,执行cmp,时间,Add,Sub,Cmp,指令流水线以ARM为例,为增加处理器指令流的速度,ARM7 系列使用3级流水线. 允许多个操作同时处理,比逐条指令执行要快。 PC指向正被取指的指令,而非正在执行的指令,Fetch,Decode,Execute,从存储器中读取指令,解码指令,寄存器读(从寄存器Bank) 移位及ALU操作 寄存器写(到寄存器Bank ),PCPC,PC - 4PC-2,PC - 8PC - 4,ARMThumb,最佳流水线,该例中用6个时钟周期执行了6条指令 所有的操作都在寄存器中(单周期执行) 指令周期数 (CPI) = 1,操作,周期,1 2 3 45 6,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Decode,Execute,Fetch,Decode,Fetch,Fetch,LDR 流水线举例,该例中,用6周期执行了4条指令 指令周期数 (CPI) = 1.5,周期,操作,123456,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Execute,Data,Writeback,Fetch,Decode,Execute,Fetch,Decode,Fetch,分支流水线举例,流水线被阻断 注意:内核运行在ARM状态,周期,1 2 3 4 5,地址 操作,Fetch,Decode,Execute,Fetch,Decode,Execute,Fetch,Decode,Fetch,Fetch,Decode,Execute,Linkret,Adjust,Fetch,Decode,Fetch,流水线技术,2ARM的流水线设计问题 (1)缩短程序执行时间: 提高时钟频率fclk 减少每条指令的平均时钟周期数CPI (2)解决流水线相关: 结构相关 数据相关 控制相关,2.4 存储系统机制,存储器的分类,ROM(Read only Memory)只读存储器 RAM(Random access Memory)随机存取存储器 PROM(programmable ROM)可编程只读存储器 EPROM(Erasable Programmable)可改写只读存储器 SRAM(Static RAM) DRAM(DynamicRAM) SDRAM(Synchronization DynamicRAM ),存储器系统,RAM:随机存取存储器, SRAM:静态随机存储器, DRAM:动态随机存储器 1)SRAM比DRAM快 2)SRAM比DRAM耗电多 3)DRAM存储密度比SRAM高得多 4)DRM需要周期性刷新 ROM:只读存储器 FLASH:闪存,SDRAM,输入 CE是芯片的输入信号。CE=0,使能。 R/W Address Data 读操作 (1)片选 (2)读/写 (3)地址 (4)数据.,DRAM,CE:片选 R/W读写控制信号 RAS行地址选通,地址高位,CAS列地址选通,地址低位; Address地址 DATA数据。,存储器的性能,大容量、高速度、低价格是评价存储器性能的三个主要指标,也是存储体系设计的主要目标。 容量:SwWlm。其中W为存储体的字长(单位为位或字节),l为单个存储体的字数,m为并行工作的存储体个数。 速度:m个存储体并行工作时,可达到的最大频率宽度为BmWmTM 。其中TM是连续起动一个存储器所必要的时间间隔,TMTA。Bm是连续提供数据的速率。 价格:具有SM位的存储器,每位价格表示为c=CSm。其中C是总价格。,存储体系的组成,单体单字存储器 单体多字存储器 多体单字交叉存取存储器 多体多字交叉存取存储器 一般把这些能并行读出多个CPU字的单体多字和多体单字及多体多字的交叉存取系统,统称为并行主存系统。,存储体系的形式,(a)两级存储器层次结构,(b)三级存储器层次结构,总线结构,1.总线协议 :四周期握手协议,总线结构,2.总线读写,总线结构,3总线的时序图,总线结构,4直接内存访问(DMA),总线结构,5系统总线配置 多总线系统,ARM存储数据类型,ARM处理器支持以下六种数据类型: 8位有符号和无符号字节。 16位有符号和无符号半字,以2字节的边界对齐。 32位有符号和无符号字,以4字节的边界对齐。,ARM存储格式,大端存储模式,小端存储模式(缺省),存储器接口,1.存储周期的基本类型: 空闲周期 非顺序周期 顺序周期 协处理器寄存器传送周期,存储器接口,2.ARM的总线接口信号分成4类(以ARM7TDMI为例说明): 时钟和时钟控制信号:MCLK、ECLK、nRESET、nWAIT。 地址类信号:A31.0、nRW、MAS1.0、nOPC、nTRANS、LOCK、TBIT。 存储器请求信号:nMREQ、SEQ。 数据时序信号:D31.0、DIN31.0、DOUT31.0、ABORT、BL3.0。,存储器接口,3. ARM的总线接口可以实现4种不同类型的总线周期。,高速缓冲存储器,1.分类: 统一Cache VS 独立的数据/程序Cache 写通cache VS 写回cache 读操作分配cache VS 写操作分配cache,高速缓冲存储器,2.工作原理:,高速缓冲存储器,3.地址映像和变换方式: 全相联地址映像和变换 组相联地址映像和变换 直接映像和变换,高速缓冲存储器,4.Cache的替换算法: 轮转法 随机替换算法,存储管理单元MMU,1.在ARM系统中,存储管理单元MMU主要完成工作: 虚拟存储空间到物理存储空间的映射。在ARM中采用了页式虚拟存储管理。 存储器访问权限的控制。 设置虚拟存储空间的缓冲的特性。,存储管理单元MMU (1),2.存储访问过程 使能MMU时存储访问过程 :,存储管理单元MMU (2),禁止MMU时存储访问过程: 先要确定芯片是否支持cache和write buffer。如果芯片规定当禁止MMU时禁止cache和write buffer,则存储访问将不考虑C和B控制位。如果芯片规定当禁止MMU时可以使能cache和write buffer
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号