内功大增!从机械硬盘和固态硬盘的结构来看IO

一口Linux 2021-12-10 11:50

“磁盘”这个词,对于程序员来说并不陌生,我们知道它是一种存储介质,主要用来存储数据的,可以说常用的中间件基本上都离不开它,比如我们常用的MySQL数据库、kafka消息引擎,甚至redis缓存都离不开磁盘。

我们在优化某个业务逻辑的时候,经常需要用到缓存,尽量让热数据都从缓存里读取,因为我们知道磁盘是缓慢的,特别在高并发的场景下,我们要保证极少的请求走磁盘IO。不知道你有没有思考过以下问题:

  1. 机械硬盘为什么慢?
  2. 机械硬盘有多慢?
  3. kafka也是写磁盘的,它却挺快的,为什么?
  4. SSD为什么比普通的机械磁盘要快?
  5. 既然SSD这么快,那为什么不抛弃传统的机械磁盘?

带着这些疑问,我们一起来看看磁盘相关的知识。

从机械硬盘开始

这是一块普通机械硬盘的内部结构,它的组成并不多,我们重点关注磁盘磁头臂磁头就行。

先说磁盘,它的样子就像光盘,我们的数据就是存在它里面的,我们其实一般称它为盘片,盘片的表面涂有磁性的记录材料,注意这里不是只有一面可以存数据,盘片的两面都可以存,同时对于一块磁盘来说,通常它是由多个盘片组成的,因此的它组成应该是这样的。

图中一共有4个盘片,一共8个盘面,其中每个盘面都被画成了一圈一圈的同心圆。

这样的一圈一圈的橙色圆我们把它叫做磁道,当然磁道也是由一个个弧段组成的。

像如图的绿色弧段部分我们叫做扇区,扇区是磁盘组成的最小单位,一般一个扇区可以存储512个字节。

多个盘片相同的磁道,可以组成一个虚拟的圆柱,这个虚拟的圆柱面,我们叫做柱面

对于一个盘面来说,它的存储容量=单个扇区的大小 * 磁道的扇区数 * 磁道数。

对于一个盘片来说,它有两个面所以一个盘片的容量=2 * 盘面容量。

对于一个磁盘来说,磁盘的容量=盘片的数量 * 单盘片的容量。

说完了盘片,我们来说说磁头,我们的数据是在盘片上的,盘片上的数据并不能直接传输到总线上,因此需要一个媒介,这个媒介就是磁头,磁头可以把某个扇区的数据传输到总线上。

说完了磁头,接下来就是磁臂了,磁头解决了数据读写的问题,但是没有解决读写哪个扇区的问题,这时候就需要磁臂,磁臂可以在一定范围内摆动,来找到目标扇区。

当然磁臂的摆动范围有限,比如磁臂无论怎么摆动也无法摆动到扇区B处,这时就该转动盘片了,你应该听过磁盘的转速,比如7200转/分,这个其实就是转轴来带动盘片的转动的速度,因此最终通过盘片的转动+磁臂的摆动,就可以定位到我们的目标扇区。

机械硬盘有多快

搞懂了机械硬盘的物理结构之后,我们接下来看看它有多快。我们知道定位到一条数据需要盘片的转动,还需要磁臂的摆动,这些都是物理的,当我们的磁头定位到具体的扇区之后,读写数据的速度是很快的,因此影响机械硬盘读写速度的主要原因就是这两个物理运动,这两个物理运动对应两个专业名词叫做 平均延时平均寻道时间

我们先说平均延时,我们上面说到当一个目标扇区不在磁臂的摆动范围之内时,就要转动盘片,以7200转/min的磁盘为例,它每秒可以转动120圈,转一圈就是1/120s=8.33ms左右,那我们定位目标区域的平均耗时是多少呢?以一个磁道为例,它是圆形的,目标节点可以分布在圆上的任何位置。

比如当我们要找A的时候,可能只需要转一点点,找B的时候,可能要转半圈,找C的时候可能要转将近一圈。所以根据算术平均法可以大致判断平均找到一个目标节点需要转动半圈,这个半圈的时间就是8.33/2=4.17ms,也就是平均延时。

我们再来看看平均寻道时间,通过盘面的转动我们大致找到了目标区域,但是还没精确定位到,这时候需要磁臂的摆动去定位我们具体的目标扇区,这个摆动的耗时一般是4-10ms

因此磁盘随机IO大概的耗时就是4.17+4=8.17 ~ 4.17+10=14.14ms,这个数字代表了什么?我们取个折中,假设随机IO的耗时是10ms,那么1s可以做100次随机IO,看到100这个数字,你是不是明白了什么~,这个是真的小,这也是为什么我们对于QPS较高的接口,都要加个缓存层,因为磁盘扛不住啊。

这里科普下,我们上面说的1s内存能做100次随机IO,这个100我们叫做IOPS,即每秒的输入输出量(或读写次数),是衡量磁盘性能的关键指标

我们可以通过iostat,来查看当前机器磁盘的指标:

iostat
KB/t  tps  MB/s  us sy id   1m   5m   15m
23.44    9  0.20  12  8 80  2.40 1.97 1.90

其中tps就是我们当前磁盘的每秒传输次数,当这个数值很大时需要注意。

当然以上都是随机IO,顺序IO就大大不一样了,顺序IO的速度堪比内存的离散读写,总之很快,像大名鼎鼎的kafka就是磁盘顺序IO,所以至少在磁盘读写这块它的性能还不错。顺序IO之所以快,首先盘片不需要每次转动了,其次我们的磁臂也不需要大幅度的摆动去寻道了,因此节省了大量的物理耗时,速度和随机IO之间应该是数量级的差异。

更加快速的固态硬盘

先说个数字,我们日常用的机械硬盘的数据传输率差不多在200MB/s左右,而固态硬盘的传输率差不多在768MB/s,可以发现固态硬盘比普通机械硬盘快了不少,然而这只是在接口是SATA3.0的情况下,我们的固态硬盘还支持PCI Express接口,在这个接口下,固态硬盘的读写能力还会上一个等级,可以达到1GB/s以上,当然这些只是科普知识,作为程序员的我们不用太在意接口相关的知识。

我们还是先从原理开始讲起,固态硬盘的运作方式和机械磁盘一点都不一样,通过上图的内部结构可以看出,固态硬盘并没有盘片、磁臂等机械部件。

那么它是如何存储数据的呢?答案是电容,电容是非常小的电子元件,我们只需要给电容充上电,那么就可以表示比特位1,给电容放电就可以表示比特位0,采用这样方式存储数据的固体硬盘,我们一般称之为使用了SLC的颗粒,全称是 Single-Level Cell,也就是一个存储单元中只有一位数据,那么一块固态硬盘能存储多少数据就完全取决于能放多少电容,因此后来有的工程师发明了更高级的用法,即让一个电容里能放下2个比特位、3个比特位、甚至4个比特位。

那么问题来了一个电容如何表示这个多的比特位?答案是电压,给电容充电的玩意叫做电压计,以能放两位比特位的电容为例,它可以表示00、01、10、11 4个数字,放电状态是00,其余我们只需要充上不同的电压即可。

当然想要表示的数字越多,就得充很多不同的电压,因此速度就会相对慢些。

短命的固态硬盘

搞懂了固态硬盘的内部结构之后,我们来看看固态硬盘的读写原理,看看为什么固态硬盘的寿命不高。

相比机械硬盘存储数据的盘片,固态硬盘的叫做裸片,裸片之间也是叠放在一起的,以一个裸片为例,它的结构大致如下:

还是划分的概念,首先一张裸片上可以放多个平面,一般一个平面上的存储容量大概是GB级别,然后一个平面上可以分成很多块,一般一个块的存储大小,通常几百KB到几MB大小,一个块里面再就是分很多的页,一个页的大小通常是4KB,我们着重关注下,这和我们接下来要说的固态硬盘的寿命息息相关。

我们知道对于机械硬盘来说,我们写入数据的时候,不会在乎要写入的扇区是否已经有数据,直接覆盖就行了,但是固态硬盘就不一样了,如果某块要写的区域已经有数据了,必须要先擦除,然后才能写入

这个擦除很关键,因为它就是影响固定硬盘寿命的直接原因,擦的越多寿命就会越来越短,它就像你用一个橡皮擦在一张纸上擦拭一样,擦的多了,纸张也就通了,纸张通了,纸就不能用了。

那么一块固态硬盘可以擦除多少次呢?以单比特电容的模式来说,它大概可以擦除10w次,其他的多比特位的更少,可能只有几千次。因此如果的你业务数据需要经常更新,不太建议使用固态硬盘。

关于擦除数据,还有一点很重要,那就是它是以块为单位的,通过上图我们知道数据存储的最小单位其实是页,页属于块,一个块上有很多的页,如果一个块上的某些页的数据被标记删除了,此时也不能直接擦除这些单独的页,因此这些页就无法被复用,除非整个块上的页都被标记删除了。

如图,页A、页B、页C虽然都是被标记删除的数据,但是因为它所属的块还有其它有效数据,所以当有新数据要写入的时候,它只能写入白色区域未使用的页,并不能利用这些红色区域。但是这样的话,就会出现这样一个问题:随着时间的推移,红色区域会越来越多,也就是碎片越来越多,这样势必会造成浪费。

浪费可耻,因此需要一套紧凑机制,这时候会把相关块的有效数据移动到一个新的块中,让不同块的有效数据更加紧凑的分布,那么对于被移动出数据的块来说,它上面的页要么没数据,要么是标记删除的数据,可以直接对这个块进行擦除,从而达到回收利用的目的。

回到题目

通过对机械硬盘和固态硬盘的了解,我们再来看看一开始的问题:

  1. 机械硬盘为什么慢?机械磁盘慢的原因主要是因为定位一条数据需要盘片的转动 + 磁臂的摆动,这些都是物理的,所以会慢
  2. 机械硬盘有多慢?,通过上面的计算,我们可以大概得出对于一个7200转的机械硬盘来说,它的iops大概在100左右,每次io的耗时在10ms左右
  3. kafka也是写磁盘的,它却挺快的,为什么?因为kafka是顺序io,就算对于机械硬盘来说,顺序io也是很快的,因为它不会像离散io那样,需要过多的寻道。
  4. SSD为什么比普通的机械硬盘要快?这里主要因为SSD不需要像机械硬盘那样的物理运动来寻道。
  5. 既然SSD这么快,那为什么不抛弃传统的机械硬盘?首先从价格上来讲,固态硬盘价格稍贵,其次固态硬盘的寿命没有机械硬盘的高。

end



一口Linux 


关注,回复【1024】海量Linux资料赠送

精彩文章合集

文章推荐

【专辑】ARM
【专辑】粉丝问答
【专辑】所有原创
专辑linux入门
专辑计算机网络
专辑Linux驱动
【干货】嵌入式驱动工程师学习路线
【干货】Linux嵌入式所有知识点-思维导图


点击“阅读原文”查看更多分享,欢迎点分享、收藏、点赞、在看

一口Linux 写点代码,写点人生!
评论
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 103浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 176浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 378浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 191浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 239浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 141浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 94浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 153浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 159浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 118浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 70浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 35浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦