彻底搞懂虚拟地址翻译为物理地址的过程

一口Linux 2021-06-17 11:50

作者:大话IT

现代的操作系统将可执行文件加载后,创建了进程,进程中每一条指令和数据都被分配了一个虚拟地址,CPU获取到这个虚拟地址后,需要翻译成内存的物理地址后,才能访问指令和数据,本片文章阐述的重点就是虚拟地址翻译物理地址的流程和实践,因此分成2部分阐述

1.虚拟地址翻译物理地址的流程?

2.举一个例子实践下?

虚拟地址翻译物理地址的流程?

当CPU第一次访问虚拟地址时,虚拟地址所在的虚拟页不在内存中,虚拟页表项(PTE)也不在TLB中,因此需要执行的步骤比较多,如下图

第一次访问虚拟地址

1.处理器将虚拟地址(VA)送往MMU(内存管理单元)

虚拟地址格式

如上图所示,虚拟地址长度为n,虚拟页偏移量长度为p。

2.MMU获取虚拟地址中的虚拟页号(VPN),然后将虚拟页号发送给TLB(翻译后备缓冲器),TLB根据虚拟页号从TLB映射表中查询PTE(页表项即Page Table Entry)。

PTE(页表项)

3.TLB(翻译后备缓冲器)将查询结果返回给MMU(内存管理单元)

4.MMU(内存管理单元)分析查询结果是否有PTE(页表项),发现PTE为空,没有命中,因此MMU根据页表基址寄存器(PTBR)中的页表起始地址加上虚拟页号(VPN),得出虚拟页页表项的物理地址PTEA(即Page Table Entry Address),然后将这个物理地址送往高速缓冲(L1)

5.高速缓冲(L1)根据PTEA查询内部的缓冲映射表,发现没有找到PTEA映射的内容即PTE(页表项),然后向内存请求PTEA下的内容。

6.内存将PTEA下的内容PTE,发送给高速缓冲(L1),高速缓冲(L1)建立了PTEA和PTE的映射关系。

7.高速缓冲(L1)再次根据PTEA查询内部的缓冲映射表,这次找到了,然后将PTE发送给TLB

8~9.TLB收到了PTE后,建立了虚拟页号(VPN)和PTE的映射(8),然后将PTE发送给MMU

10.MMU收到了PTE后,检查PTE的有效位,看看虚拟页是否在内存中。

11.MMU检查PTE后,发现虚拟页不在内存中,因此发送缺页中断给CPU,CPU开始执行缺页中断处理程序。

12.缺页中断处理程序根据页面置换算法,选择出一个已经缓冲的虚拟页作为牺牲页(如果这个虚拟页发生了变化,则更新到磁盘中),将这个牺牲页的PTE的有效位设置为0,表明这个牺牲页不在内存了。

13.缺页中断处理程序将缺少的页,从磁盘换入到空闲的物理内存中,设置缺少的虚拟页的PTE的有效位为1,更新物理号。

14.缺页中断处理程序执行完毕,跳转到发生缺页的指令处,然后CPU重新执行该指令,重新发出虚拟地址到MMU,跳到了1,开启下一个循环。

当CPU第二次访问同一个虚拟地址时,虚拟地址所在的虚拟页已经内存中,虚拟页表项(PTE)也在TLB中了,因此需要执行的步骤少了很多,如下图

第二次访问虚拟地址

1.处理器将虚拟地址(VA)送往MMU(内存管理单元)

2.MMU获取虚拟地址中的虚拟页号(VPN),然后将虚拟页号发送给TLB(翻译后备缓冲器),TLB根据虚拟页号从TLB映射表中查询PTE(页表项即Page Table Entry)。

3.TLB(翻译后备缓冲器)将查询结果返回给MMU(内存管理单元)

4.MMU(内存管理单元)分析查询结果是否有PTE(页表项),发现PTE有值,命中了,然后检查PTE的有效位,发现有效位是1,因此不缺页,根据PTE中的物理号加上虚拟地址中的(VPO)计算出指令或者数据的物理地址PA,将PA发送到高速缓冲(L1)

5.高速缓冲(L1)根据PA查询内部的缓冲映射表,发现没有找到PA映射的内容即指令或者数据,然后向内存请求PA下的内容。

6.内存将PA下的内容,发送给高速缓冲(L1),高速缓冲(L1)建立了PA和内容的映射关系。

7.高速缓冲(L1)再次根据PA查询内部的缓冲映射表,这次找到了,然后将代码或者指令发送到数据总线,CPU收到数据总线的数据后,感叹道,终于拿到数据了。

当CPU第三次访问同一个虚拟地址时,与第二次不同的是,因为虚拟地址对应的物理地址的数据,已经映射到高速缓冲(L1),所以不再从内存中查询。

好了,虚拟地址翻译物理地址的整个过程阐述完毕,下面来举个具体的例子来实践下!

举一个例子实践

上一节是虚拟地址翻译物理地址的过程,现在实践下,实践前先普及两个概念TLB和高速缓冲。

TLB

TLB全称叫做翻译后备缓冲器,这是一个映射表,它建立了虚拟页号(VPN)和页表项(PTE)的映射关系,每次访问虚拟地址时,都需要找这个虚拟地址对应的页表项,每次都去内存中查需要耗费几十个甚至上百个的时钟周期,虽然页表项缓冲在高速缓冲后,耗费的周期可以降到1-2个周期,但是缓冲在TLB后,几乎不用耗费时钟周期,它跟CPU几乎是同步的,类似于寄存器。

那么,虚拟地址怎么通过TLB映射页表项(PTE)呢,先来看看TLB,我们说TLB就是一个映射表,先来看看这个映射表长什么样,如下图


如上图所示,一个TLB由m个TLB组构成,每个TLB组下有个n个条目,每个条目里有PTE和标记位构成。

标记位是一个数字,每个TLB组的标记位不能重复,所以一个TLB组里,可以根据这个标记位定位到某个条目。

每个组都有一个唯一的编号叫做组号。

因此这么看,TLB就是一个二维数组,知道了组号和标记位就可以定位到唯一的PTE(页表项)。

虚拟地址中的虚拟页号(VPN)可以拆分成两部分即组号和标记位,假设一个n位长度的虚拟地址,如下图

虚拟地址中的TLB部分

由上图得知,VPN由标记位(TLBT)和组号又叫标记索引(TLBI)构成,组号占t位,标记位占了虚拟页号剩余的位。

假如一个TLB有4组,总共有64个条目,每组就有16个条目,那么VPN中的组号就占用2位(2的2次方=4),标记位就占用4位(2的4次方=16)。

高速缓冲

高速缓冲通常采用SRAM(静态随机访问存储器)进行存储,它比内存DRAM(动态随机访问存储器)快上几十甚至上百倍,因此为了加速CPU获取数据的速度,最近访问的数据存储在高速缓冲中。

高速缓冲内部有一张映射表,这张映射表建立内存物理地址PA和该内存物理地址下内容的映射关系,如下图所示

高速缓冲映射表

如上图所示,映射表分为m个组,每个组由标记位,有效位,和n个块组成,有效位为1表示该缓冲没过期,为0表示该缓冲过期了。

一个物理地址由组号+标记位+块号构成,如下图所示

物理地址的构成

由上图得知,物理地址为m位,块号占用p位,组号占用t为,剩下的位就是标记位占用的位数。

我们可以根据物理地址的组号定位到映射表的一个组,然后看看这个组下的有效位是不是为1,如果不为1,那么表示这一组的内容都无效了,没有必要比较下去了,因此缓冲没有命中,如果为1呢,那么比较这个组下的标记位和物理地址中标记位,如果不相等,那就是没有命中,如果相等呢,则继续根据物理地址中的块号去这个组相应的块号下找,如果找到数据,则表示命中了,否则缓冲没有命中。

假设一个高速缓冲有16个组,每个组有4个块,那么物理地址当中组号占用的空间就是4位(2的4次方等于16),块号占用的位数就是2位(2的2次方等于4),剩余的位数就是标记位占用的位数。

好了,概念普及完了,下面正式开始举例

先假设

1.内存是按字节寻址,每个字是一个字节(通常对于32位的系统一个字是4个字节)。

2.虚拟地址长度为14位,假设页表有256个页表项,因此虚拟页号(VPN)占用位数为8,虚拟一偏移量(VPO)占用6位。

3.物理地址长度为12位。

4.页面大小为64个字节(P=64)

5.TLB有4个组,每个组4个条目,总共16个条目组成

6.高速缓冲(L1)有16个组,每个组有4个块。

7.采用一级页表(多级页表复杂些,但原理类似)。

先看看虚拟地址和物理地址的格式,如下图:

虚拟地址

由上图得知,组号(TLBI)占用2位,因为我们假设TLB有4个组,标记位占用6位。

物理地址

由上图得知,组号(CI)占用4位,因为我们假设高速缓冲有16个组,每个组下有4个块,因此块号(CO)占用2位,剩下的6位就是标记位(CT)。

我们假定TLB,高速缓冲映射表如下图:

TLB映射表

高速缓冲映射表

页表总共有256项,我们把前16项列出,如下图

页表前16项

好了,一切就绪,假设CPU访问的虚拟地址是0x03d4,它的二进制是16位即00000011 11010100,而虚拟地址只有14位,所以高2位被抛弃,如下图

0x03d4虚拟地址分布图

由上图得知,组号(TLBI)为11即0x03,标记位(TLBT)为000011即0x03,从TLB映射表查找,发现命中了,如下图

TLB命中

由上图命中了红色部分的标记位,PTE中的PPN=0x0D,有效位为1,我们根据PPN然后在加上虚拟页偏移量,如下图

虚拟地址

由上图,我们得知虚拟页偏移量(VPO)为010100=0x14,虚拟页偏移量(VPO)=物理页偏移量(PPO),即PPO=0x14,PPN和PPO连接起来就是物理地址PA即001101010100=0x354,如下图

物理地址

由上图得知,组号是0101即0x05,块号(CO)为00即0x00,标记位为001101即0x0D,通过组号+标记位+块号,可以定位到高速缓冲的数据0x36,如下图所示

物理地址命中数据

物理地址对应的数据找到了,返回给了CPU,当然也可能发生其他的情况,如TLB未命中,高速缓冲未命中,缺页等,这些读者可以自行实践。

- END -
关注,回复【1024】海量Linux资料赠送
 精彩文章合集
所有原创
从0学Linux驱动
粉丝问答
C语言
从0学ARM
计算机网络
一口Linux 写点代码,写点人生!
评论
  • HDMI 2.2 规格将至,开启视听新境界2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新HDMI规范为规模庞大的 HDMI 生态系统带来更多选择,为创建、分发和体验理想的终端用户效果提供更先进的解决方案。新技术为电视、电影和游戏工作室等内容制作商在当前和未来提供更高质量的选择,同时实现多种分发平台。96Gbps的更高带宽和新一代 HDMI 固定比率速率传输(Fixed Rate Link)技术为各种设备应用提供更优质的音频和视频。终端用户显示器能以最
    百佳泰测试实验室 2025-01-09 17:33 107浏览
  • 在智能网联汽车中,各种通信技术如2G/3G/4G/5G、GNSS(全球导航卫星系统)、V2X(车联网通信)等在行业内被广泛使用。这些技术让汽车能够实现紧急呼叫、在线娱乐、导航等多种功能。EMC测试就是为了确保在复杂电磁环境下,汽车的通信系统仍然可以正常工作,保护驾乘者的安全。参考《QCT-基于LTE-V2X直连通信的车载信息交互系统技术要求及试验方法-1》标准10.5电磁兼容试验方法,下面将会从整车功能层面为大家解读V2X整车电磁兼容试验的过程。测试过程揭秘1. 设备准备为了进行电磁兼容试验,技
    北汇信息 2025-01-09 11:24 97浏览
  • 在当前人工智能(AI)与物联网(IoT)的快速发展趋势下,各行各业的数字转型与自动化进程正以惊人的速度持续进行。如今企业在设计与营运技术系统时所面临的挑战不仅是技术本身,更包含硬件设施、第三方软件及配件等复杂的外部因素。然而这些系统往往讲究更精密的设计与高稳定性,哪怕是任何一个小小的问题,都可能对整体业务运作造成严重影响。 POS应用环境与客户需求以本次分享的客户个案为例,该客户是一家全球领先的信息技术服务与数字解决方案提供商,遭遇到一个由他们所开发的POS机(Point of Sal
    百佳泰测试实验室 2025-01-09 17:35 101浏览
  • 在过去十年中,自动驾驶和高级驾驶辅助系统(AD/ADAS)软件与硬件的快速发展对多传感器数据采集的设计需求提出了更高的要求。然而,目前仍缺乏能够高质量集成多传感器数据采集的解决方案。康谋ADTF正是应运而生,它提供了一个广受认可和广泛引用的软件框架,包含模块化的标准化应用程序和工具,旨在为ADAS功能的开发提供一站式体验。一、ADTF的关键之处!无论是奥迪、大众、宝马还是梅赛德斯-奔驰:他们都依赖我们不断发展的ADTF来开发智能驾驶辅助解决方案,直至实现自动驾驶的目标。从新功能的最初构思到批量生
    康谋 2025-01-09 10:04 93浏览
  • 职场是人生的重要战场,既是谋生之地,也是实现个人价值的平台。然而,有些思维方式却会悄无声息地拖住你的后腿,让你原地踏步甚至退步。今天,我们就来聊聊职场中最忌讳的五种思维方式,看看自己有没有中招。1. 固步自封的思维在职场中,最可怕的事情莫过于自满于现状,拒绝学习和改变。世界在不断变化,行业的趋势、技术的革新都在要求我们与时俱进。如果你总觉得自己的方法最优,或者害怕尝试新事物,那就很容易被淘汰。与其等待机会找上门,不如主动出击,保持学习和探索的心态。加入优思学院,可以帮助你快速提升自己,与行业前沿
    优思学院 2025-01-09 15:48 98浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球中空长航时无人机产值达到9009百万美元,2024-2030年期间年复合增长率CAGR为8.0%。 环洋市场咨询机构出版了的【全球中空长航时无人机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球中空长航时无人机总体规模,包括产量、产值、消费量、主要生产地区、主要生产商及市场份额,同时分析中空长航时无人机市场主要驱动因素、阻碍因素、市场机遇、挑战、新产品发布等。报告从中空长航时
    GIRtina 2025-01-09 10:35 95浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 113浏览
  • 1月7日-10日,2025年国际消费电子产品展览会(CES 2025)盛大举行,广和通发布Fibocom AI Stack,赋智千行百业端侧应用。Fibocom AI Stack提供集高性能模组、AI工具链、高性能推理引擎、海量模型、支持与服务一体化的端侧AI解决方案,帮助智能设备快速实现AI能力商用。为适应不同端侧场景的应用,AI Stack具备海量端侧AI模型及行业端侧模型,基于不同等级算力的芯片平台或模组,Fibocom AI Stack可将TensorFlow、PyTorch、ONNX、
    物吾悟小通 2025-01-08 18:17 84浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2025-01-09 09:58 79浏览
  • 一个真正的质量工程师(QE)必须将一件产品设计的“意图”与系统的可制造性、可服务性以及资源在现实中实现设计和产品的能力结合起来。所以,可以说,这确实是一种工程学科。我们常开玩笑说,质量工程师是工程领域里的「侦探」、「警察」或「律师」,守护神是"墨菲”,信奉的哲学就是「墨菲定律」。(注:墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。)做质量工程师的,有时会不受欢迎,也会被忽视,甚至可能遭遇主动或被动的阻碍,而一旦出了问题,责任往往就落在质量工程师的头上。虽然质量工程师并不负
    优思学院 2025-01-09 11:48 114浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦