一文搞懂芯片内执行XIP技术

嵌入式ARM 2023-09-14 12:01

1、什么是XIP?

eXecute In Place,即芯片内执行,是指CPU直接从存储器中读取程序代码执行,而不用再读到内存中。应用程序可以直接在flash闪存内运行,不必再把代码读到系统RAM中。

flash 内执行是指 nor flash 不需要初始化,可以直接在flash内执行代码。但往往只执行部分代码,比如初始化RAM。好处即是程序代码无需占用内存,减少内存的要求。

所谓片内执行不是说程序在存储器内执行,CPU的基本功能是取指、译码、运行。Nor Flash 能在芯片内执行,指的是CPU能够直接从Nor flash中取指令,供后面的译码器和执行器来使用。

为实现就地执行,必须满足几个条件:

  • 存储器必须提供与内存相似的接口给 CPU。

  • 该接口必须提供足够快的读取操作,并具有随机访问模式。

  • 如有文件系统,则需要提供合适的映射功能。

  • 程序链接时需要知道存储器的地址或地址与位置无关。

  • 程序不能修改已加载映像中的数据。

NOR Flash和 EEPROM 通常能满足上述要求。

2、XIP技术需要CPU和flash同时支持

(1) CPU控制器支持

而按照通常的理解,要能够实现XIP,Flash 应该是并行总线接口挂在 AMBA 总线上,这个并行总线应有独立的地址线和数据线,且地址线宽度跟Flash大小相对应,类似于DDR或SRAM总线。

那么SPI NorFlash为什么能实现XIP,答案就是 FlexSPI 外设,也就是说需要CPU具备特殊的SPI控制,该控制器实现了串行flash总线到并行总线的转换。为了提升性能控制器内部可以集成类似cache功能的buffer。下图所示为某款CPU的支持XIP的SPI控制器逻辑拓扑。

(2)SPI Nor Flash支持

以下文字摘自某款芯片手册:

XIP mode requires only an address (no instruction) to output data, improving random access time and eliminating the need to shadow code onto RAM for fast execution。

大概意思是:

XIP 模式只需要一个地址(无指令)就可以输出数据,从而提高了随机存取时间。

无指令,这是和普通模式的最大区别,XIP 模式下 flash 能卖满足一个输入地址一个输出数据要求。以下是XIP模式下的时序图。

3、一些应用

(1)系统引导时的XIP

通常,第一阶段的引导程序是一个XIP程序,它链接时指定从flash芯片上电后的映射地址开始运行,设置系统RAM,把第二阶段的引导程序或操作系统内核加载进RAM。

在这初始化期间,可写存储器可能不可用,所有的计算都必须在处理器寄存器中执行。因此,第一阶段的引导程序通常以汇编语言编写,提供尽量少的功能,只为下一阶段程序的提供正常的执行环境。有些处理器也能通过嵌入少量SRAM或允许将 Cache 用作RAM来允许用高级语言编写这些程序。

对于内核和引导程序,地址空间通常是内部分配的。为了使用XIP,需要指示链接程序将不可修改的数据和可修改数据放在不同的地址区间,并提供将可修改数据复制到可写内存的机制,使得任何程序正常访问这些数据。

如果地址空间是外部分配的,比如不提供虚拟内存的系统,编译器需要通过向数据区域的私有副本的指针添加偏移量来访问所有可修改的数据。在这种情况下,外部加载程序负责设置实例特定的内存区域。

主内存初始化之前,BIOS 和 UEFI 使用 XIP 技术。

(2)文件系统的XIP

文件系统的XIP通常难以满足。在没有页表的系统中,整个文件必须连续存储,不能碎片化,而基于闪存的文件系统通常会将数据分配到擦除周期最小,磨损最少的扇区,以延长生命周期。

复杂性和速度的折中意味着XIP通常仅用于第一阶段引导程序或RAM极度短缺的情况。例如,第二代至第四代的视频游戏机如Atari 2600将ROM卡带的地址和数据总线连接到游戏机的地址和数据总线,从而能在只有128字节的RAM上。

AXFS(高级XIP文件系统,Advanced XIP File System)是Linux系统上一种较新的文件系统,旨在克服与XIP相关的,特别是在 XIP 用户空间应用程序方面的某些缺点。例如,可以将可执行的二进制文件拆分为“ XIP区域”,从而避免了上面提到的碎片限制。

4、NOR Flash和Nand Flash

这两种种 flash 是现在市场上两种主要的非易失闪存技术。

Intel于1988年首先开发出NOR Flash 技术,彻底改变了原先由 EPROM (Electrically Programmable Read-Only-Memory电可编程序只读存储器) 和 EEPROM (电可擦只读存储器Electrically Erasable Programmable Read - Only Memory)一统天下的局面。

紧接着,1989年,东芝公司发表了 NAND Flash 结构,强调降低每比特的成本,有更高的性能,并且像磁盘一样可以通过接口轻松升级。

NOR Flash 的特点是芯片内执行(XIP ,eXecute In Place),这样应用程序可以直接在Flash闪存内运行,不必再把代码读到系统RAM中

NOR的传输效率很高,在1~4MB的小容量时具有很高的成本效益,但是很低的写入和擦除速度大大影响到它的性能。NAND的结构能提供极高的单元密度,可以达到高存储密度,并且写入和擦除的速度也很快。应用 NAND 的困难在于Flash的管理和需要特殊的系统接口。通常读取NOR的速度比NAND稍快一些,而NAND的写入速度比NOR快很多。

这样我们就知道程序能直接在 Nor flash 中执行的原因就是 XIP。

Nand Flash 器件的 IO 口比较少,通过串行地进行读写数据,硬件接口少了,势必会带来复杂的软件成本,一般使用8个引脚来进行传输控制、地址和数据信息,由于时序非常复杂,所以一般 CPU 最好集成NAND控制器,另外由于Nand flash没有挂接在地址总线上,所以如果想用Nand flash作为系统的启动盘,就需要CPU具备特殊的功能,比如s3c2440在被选择为NandFlash启动方式时会在上电时自动读取NandFlash的4k数据到地址0的SRAM中。

如果CPU不具备这种特殊功能,用户不能直接运行 NandFlash 上的代码,因为使用 Nand Flash 必须要各种初始化,复杂逻辑。

Nor Flash能够在片内执行,Nand Flash不能,区别如下图所示:

这张图很直观,但是需要用心看,左边是普通的flash,可以理解成是Nand Flash,CPU想要从Nand Flash中读取数据,必须要先通过在RAM中计算地址,各种时序计算,然后通过MMU转换地址,然后给Nand flash发送命令,注意是命令,不是地址Nand Flash根据命令进行相应的操作,如果是读命令,则返回对应地址的数据到RAM中,如果是写命令,则进行写操作。

而右边的图,是针对Nor Flash的,这个很明显,CPU可以像读内存一样,直接跟Nor flash交互,即可以直接从Nor Flash中取指令,然后交给译码模块和执行模块进行执行,可以说,相比较Nand flash,Nor flash的操作对于CPU来说,简直就像是面对面一样。

5、为什么Nor Flash可以实现XIP,而Nand flash不行?

解释一:嵌入式系统中代码的执行方式主要有3种

(1)完全映射:嵌入式系统程序运行时,将所有代码从非易失存储器(Flash、ROM等)复制到RAM中运行。

(2)按需分页:只复制部分代码到RAM中,这种方法对RAM中的页进行导入/导出管理,如果访问位于虚存中但不在物理RAM中会产生页错位,这时才将代码和数据映射到RAM中。

(3)XIP:在系统启动时,不将代码复制到RAM,而是直接在非易失性存储位置执行,RAM中只存放需要不断变化的数据部分,如下图所示:

如果非易失性存储器(Flash)的读取速度与RAM相近,则XIP可以节省复制和解压的时间,Nor flash和rom的读取速度比较看(约100ns),比较适合XIP,而Nand flash的读取操作是基于扇区的,速度相对很慢(us级),因此不适合实现XIP系统,不过Nand flash的写速度比Nor的快,更适合做存储和下载系统。

解释二:两种芯片的结构不同

NOR flash之所以可以片内执行,就是因为他符合CPU去指令译码执行的要求。CPU送一个地址出来,NORflash就能给一个数据让CPU执行,中间不需要额外的处理操作。

NAND flash不一样是因为nand flash有地址,数据,命令共用IO口的问题,cpu把地址发出来之后,并不能直接得到数据,还需要控制线的操作才能完成。就是他没有专用的SRAM接口。

解释三:芯片内执行主要是是看芯片可不可以线性存储代码(假如硬件支持芯片接口),只要能保证芯片的存储空间是线性的(也就是无坏块),都可以片上执行

在读取Flash时候,容易出现位翻转(bitconvert):在Flash的位翻转(一个bit位发生翻转)现象上,NAND的出现几率要比NorFlash大得多。

这个问题在Flash存储关键文件时是致命的,所以在使用NandFlash时建议同时使用EDC/ECC等校验算法。但是,如果能保证不出错,也还是可以进行XIP,可以在其上执行代码的:

“所谓XIP,就是CODE是在FLASH上直接运行。NANDFLASH只是不适合做XIP,但并不是不能做XIP。”

要一段CODE能够正确的运行,要保证它的CODE是连续的,正确的。

由于一些电气特性的原因,NOR FLASH能够做到这一点,不存在坏道或坏块,所以能够做XIP。而对于NAND FLASH, 它只保证它的BLOCK 0是好的,其他的块并不保证,虽然出错的几率比较低,但还是有出错的可能,所以CODE可能无法连续正确地执行。

但只要有额外的保障措施,比如说在执行CODE之前去做一次ECC校验,来确保CODE是连续正确的,那也可以做XIP。有人这么做了,而且也证明是成功的。

END

来源:一起学嵌入式

版权归原作者所有,如有侵权,请联系删除。

推荐阅读
脏话越多,代码越好!
我把ST-Link当做J-link用
单片机哪些方面不能替代PLC?

→点关注,不迷路←

嵌入式ARM 关注这个时代最火的嵌入式ARM,你想知道的都在这里。
评论 (0)
  • 据先科电子官方信息,其产品包装标签将于2024年5月1日进行全面升级。作为电子元器件行业资讯平台,大鱼芯城为您梳理本次变更的核心内容及影响:一、标签变更核心要点标签整合与环保优化变更前:卷盘、内盒及外箱需分别粘贴2张标签(含独立环保标识)。变更后:环保标识(RoHS/HAF/PbF)整合至单张标签,减少重复贴标流程。标签尺寸调整卷盘/内盒标签:尺寸由5030mm升级至**8040mm**,信息展示更清晰。外箱标签:尺寸统一为8040mm(原7040mm),提升一致性。关键信息新增新增LOT批次编
    大鱼芯城 2025-04-01 15:02 189浏览
  • 随着汽车向智能化、场景化加速演进,智能座舱已成为人车交互的核心承载。从驾驶员注意力监测到儿童遗留检测,从乘员识别到安全带状态判断,座舱内的每一次行为都蕴含着巨大的安全与体验价值。然而,这些感知系统要在多样驾驶行为、复杂座舱布局和极端光照条件下持续稳定运行,传统的真实数据采集方式已难以支撑其开发迭代需求。智能座舱的技术演进,正由“采集驱动”转向“仿真驱动”。一、智能座舱仿真的挑战与突破图1:座舱实例图智能座舱中的AI系统,不仅需要理解驾驶员的行为和状态,还要同时感知乘员、儿童、宠物乃至环境中的潜在
    康谋 2025-04-02 10:23 77浏览
  • 北京贞光科技有限公司作为紫光同芯授权代理商,专注于为客户提供车规级安全芯片的硬件供应与软件SDK一站式解决方案,同时配备专业技术团队,为选型及定制需求提供现场指导与支持。随着新能源汽车渗透率突破40%(中汽协2024数据),智能驾驶向L3+快速演进,车规级MCU正迎来技术范式变革。作为汽车电子系统的"神经中枢",通过AEC-Q100 Grade 1认证的MCU芯片需在-40℃~150℃极端温度下保持μs级响应精度,同时满足ISO 26262 ASIL-D功能安全要求。在集中式
    贞光科技 2025-04-02 14:50 95浏览
  • 职场之路并非一帆风顺,从初入职场的新人成长为团队中不可或缺的骨干,背后需要经历一系列内在的蜕变。许多人误以为只需努力工作便能顺利晋升,其实核心在于思维方式的更新。走出舒适区、打破旧有框架,正是让自己与众不同的重要法宝。在这条道路上,你不只需要扎实的技能,更需要敏锐的观察力、不断自省的精神和前瞻的格局。今天,就来聊聊那改变命运的三大思维转变,让你在职场上稳步前行。工作初期,总会遇到各式各样的难题。最初,我们习惯于围绕手头任务来制定计划,专注于眼前的目标。然而,职场的竞争从来不是单打独斗,而是团队协
    优思学院 2025-04-01 17:29 191浏览
  • 文/郭楚妤编辑/cc孙聪颖‍不久前,中国发展高层论坛 2025 年年会(CDF)刚刚落下帷幕。本次年会围绕 “全面释放发展动能,共促全球经济稳定增长” 这一主题,吸引了全球各界目光,众多重磅嘉宾的出席与发言成为舆论焦点。其中,韩国三星集团会长李在镕时隔两年的访华之行,更是引发广泛热议。一直以来,李在镕给外界的印象是不苟言笑。然而,在论坛开幕前一天,李在镕却意外打破固有形象。3 月 22 日,李在镕与高通公司总裁安蒙一同现身北京小米汽车工厂。小米方面极为重视此次会面,CEO 雷军亲自接待,小米副董
    华尔街科技眼 2025-04-01 19:39 192浏览
  • 文/Leon编辑/cc孙聪颖‍步入 2025 年,国家进一步加大促消费、扩内需的政策力度,家电国补政策将持续贯穿全年。这一利好举措,为行业发展注入强劲的增长动力。(详情见:2025:消费提振要靠国补还是“看不见的手”?)但与此同时,也对家电企业在战略规划、产品打造以及市场营销等多个维度,提出了更为严苛的要求。在刚刚落幕的中国家电及消费电子博览会(AWE)上,家电行业的竞争呈现出胶着的态势,各大品牌为在激烈的市场竞争中脱颖而出,纷纷加大产品研发投入,积极推出新产品,试图提升产品附加值与市场竞争力。
    华尔街科技眼 2025-04-01 19:49 199浏览
  • 在智能交互设备快速发展的今天,语音芯片作为人机交互的核心组件,其性能直接影响用户体验与产品竞争力。WT588F02B-8S语音芯片,凭借其静态功耗<5μA的卓越低功耗特性,成为物联网、智能家居、工业自动化等领域的理想选择,为设备赋予“听得懂、说得清”的智能化能力。一、核心优势:低功耗与高性能的完美结合超低待机功耗WT588F02B-8S在休眠模式下待机电流仅为5μA以下,显著延长了电池供电设备的续航能力。例如,在电子锁、气体检测仪等需长期待机的场景中,用户无需频繁更换电池,降低了维护成本。灵活的
    广州唯创电子 2025-04-02 08:34 141浏览
  • 退火炉,作为热处理设备的一种,广泛应用于各种金属材料的退火处理。那么,退火炉究竟是干嘛用的呢?一、退火炉的主要用途退火炉主要用于金属材料(如钢、铁、铜等)的热处理,通过退火工艺改善材料的机械性能,消除内应力和组织缺陷,提高材料的塑性和韧性。退火过程中,材料被加热到一定温度后保持一段时间,然后以适当的速度冷却,以达到改善材料性能的目的。二、退火炉的工作原理退火炉通过电热元件(如电阻丝、硅碳棒等)或燃气燃烧器加热炉膛,使炉内温度达到所需的退火温度。在退火过程中,炉内的温度、加热速度和冷却速度都可以根
    锦正茂科技 2025-04-02 10:13 54浏览
  • 探针本身不需要对焦。探针的工作原理是通过接触被测物体表面来传递电信号,其精度和使用效果取决于探针的材质、形状以及与检测设备的匹配度,而非对焦操作。一、探针的工作原理探针是检测设备中的重要部件,常用于电子显微镜、坐标测量机等精密仪器中。其工作原理主要是通过接触被测物体的表面,将接触点的位置信息或电信号传递给检测设备,从而实现对物体表面形貌、尺寸或电性能等参数的测量。在这个过程中,探针的精度和稳定性对测量结果具有至关重要的影响。二、探针的操作要求在使用探针进行测量时,需要确保探针与被测物体表面的良好
    锦正茂科技 2025-04-02 10:41 56浏览
  • 提到“质量”这两个字,我们不会忘记那些奠定基础的大师们:休哈特、戴明、朱兰、克劳士比、费根堡姆、石川馨、田口玄一……正是他们的思想和实践,构筑了现代质量管理的核心体系,也深远影响了无数企业和管理者。今天,就让我们一同致敬这些质量管理的先驱!(最近流行『吉卜力风格』AI插图,我们也来玩玩用『吉卜力风格』重绘质量大师画象)1. 休哈特:统计质量控制的奠基者沃尔特·A·休哈特,美国工程师、统计学家,被誉为“统计质量控制之父”。1924年,他提出世界上第一张控制图,并于1931年出版《产品制造质量的经济
    优思学院 2025-04-01 14:02 144浏览
我要评论
0
1
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦