随着超过100层的3D NAND的量产,QLC逐步被PC OEM厂商采用,NVMe标准提出了更多新的功能,SSD存储控制也在不断发展。虽然PCIe Gen4的SSD还正在普及之中,但PCIe Gen5 SSD已即将到来,Intel打算明年正式实现Gen5的支持。而AI在冷热数据上的运用,也催生了面向数据中心的“智能存储”方案……

无容置疑2020是非常特别的一年,疫情的初期由于防护和隔离的要求,在某种程度上影响了SSD的产能和销售,然而当今高度互联的世界很快就调整了过来,充分利用网络来进行正常的商业生产和生活,使得宽带,网络会议,社交服务网站等有了急速的发展,因此也带动了对高性能SSD的需求。

随着超过100层的3D NAND的量产,QLC逐步被PC OEM厂商采用,NVMe标准提出了更多新的功能,SSD存储控制也在不断发展。为此,我们专访了英韧科技(上海)有限公司联合创始人、SoC设计副总裁赖的是先生。英韧科技是专注于SSD主控芯片的一家国内企业——这家公司在短时间内就声名鹊起。除了产品之外,很大程度也是源自其最初的几名创始人,包括吴子宁博士、赖的是等此前都有Marvell这类老牌企业的工作经验,比如吴子宁博士此前是Marvell的全球CTO,而赖的是则是东芝美国高级研发总监。

在与赖的是的对话中,我们大致可以窥见企业级尤其是数据中心SSD市场发展的几个重要趋势,并且从中理解英韧科技预备为行业带来的一些新的技术;同时也加深对于某些特定技术和应用发展方向的理解。

威刚去年展示的达到7GB/s顺序读取速度的PCIe Gen4 SSD,采用Innogrit Rainier控制器

PCIe Gen5提前到来

赖的是在与我们对话中,首先就提到了PCIe Gen5 SSD的即将到来。这就让人感到意外,因为目前PCIe Gen4还正在普及之中,PCIe Gen5为什么就要来了?“Gen5比想象中来得要快一些。Intel打算明年正式实现Gen5的支持。整个高端存储产业,明年年初到年中,就会有一些Gen5的产品问世。大概到2023年,Gen5的产品可能会更多。”赖的是表示。

英韧科技现有面向数据中心的Tacoma产品线,“我们准备把Tacoma升级到PCIe Gen5”。同时赖的是确认了,英韧科技明年就会有PCIe Gen5的SSD控制器产品推向市场。

“事实上,每代PCIe规格产品的迭代大概是5-8年。Gen4的迭代可能会快一些,我们可能会以更快的速度跨入Gen5产品的支持。Gen6则还需要一段时间,要求也会很高。”

Gen4的迭代为什么会更快?赖的是补充说:“AMD在2019年7月7日发布了PCIe Gen4的chipset支持。Intel在2020的下半年才有一些对应的产品问世。Intel期望能够挽回技术领导者位置,立刻就准备去支持PCIe Gen5。”

事实上在Intel晚于AMD近一年才推出PCIe Gen4之际,市场就猜测Intel可能会更早地跳过Gen4过渡到Gen5。在Intel的规划表中,今年将推向市场的服务器平台Sapphire Rapids(Willow Cove)会首次引入DDR5和PCIe Gen5支持,而且支持的通道数上限还将更高。

与此同时,明年推向市场的Intel首个大小核设计的Alder Lake,以及AMD Zen 4都将实现对PCIe Gen5的支持。另外,2019年Intel就宣布其CXL(Compute eXpress Link)缓存一致互联就将建基于PCIe Gen5。

在我们看来,这是x86阵营两名市场玩家竞争,带动周边I/O大跨步的体现。英韧科技作为PCIe Gen4 SSD控制芯片的领导者,也将抓住PCIe Gen5的科技创新和领先的机会。“今后英韧的产品会逐步变得普及,各种应用场景都会适配。”赖的是说,“我们会走向高端市场,比如说16个通道,再加上PCIe Gen5市场,去开辟我们的新增长点。”

“PCIe Gen5带宽实际上就是PCIe Gen4的两倍,每个通道从 16 Gb/s变为32 Gb/s,X8就是256Gb/s。目前已经有了100Gbps、200Gbps的Ethernet Backbone, 用PCIe Gen5 X8去连接服务器所能实现的吞吐量就大了很多。”

虽然就目前来看, PCIe Gen5 “真正走进消费用户或数据中心,应该还需要一段时间。PCIe Gen4目前刚刚进入到数据中心领域。服务器更新一般是4-5年为一个周期,产品后续淘汰20%-25%。而且PCIe Gen5的产品也比较贵。” 想必最早的PCIe Gen5产品会集中在企业级应用上——正如Gen4最早应用于数据中心,如今开始普及到了消费市场。但由于当前市场的特殊性,PCIe Gen5大约的确会提前来到。先一步有PCIe Gen5的产品落地将是英韧科技这类技术领先的高端应用企业间的新一轮的较量,也很有可能成为新的市场格局建立的起点。

存储中的AI技术

英韧科技联合创始人、董事会董事长兼CEO吴子宁博士在FMS 2019(闪存峰会)上曾经做过题为《怎样通过系统与控制器优化,实现2倍吞吐和IOPS(How to get 2x throughput and IOPS by System and Controller Optimization)》的演讲。英韧科技也是较早提出“智能存储”,或者“AI存储”的企业之一。

这项技术预期是应用在英韧科技的Tacoma控制器中的,意即主要面向数据中心。

赖的是在采访中向我们解释了AI在SSD存储中的价值。“有个冷热数据的概念,我们已经验证了在SSD存储过程中对冷热数据进行区分的实现方法。什么是冷热数据呢?如果某段空间频繁读写,那么这就成为了热数据;一段空间很长时间采取读写一次,那么就是冷数据。”

“我们知道,SSD的PE cycle(Program/Erase Cycle)是有限的。如果频繁读写某一段空间而不做特殊处理,就会影响整体SSD的寿命。如果能够将冷、热数据分开,热的数据比如说放到SLC或者其他PE cycle更久的NAND区间,整个SSD的寿命就会增加不少。这是个使用趋势。”

“对于数据中心这类应用而言,我相信这样的技术能够带来性能上的提升。”虽然赖的是很谦虚地表示目前仍在“尝试以后会不会变成流行,能不能给客户带来利益”,并表示“希望它会成为趋势”,但我们认为其发展潜力仍然是相当之甚的,足以成为企业级或至少数据中心类SSD发展的技术趋势。

吴子宁博士在闪存峰会上的主题演讲提到,“英韧科技找到一种方法,基于这些SCM构建低时延SSD。结合网络(NVMeOF)、软件(新型的文件系统)上的改进,我们能够将整体访问时延缩减85%(从远程服务器获取数据)。”吴子宁博士说。

其中针对时延占比较高的SSD,下面这张图是当时吴子宁博士提到降低SSD时延,各部分的方法。比如SCM介质替代TLC NAND;英韧科技开发的新型ECC架构将控制器的时延降低至5ms;再加上PCIe Gen4将传输时间减半。”

这个数据应该是基于XL-FLASH(铠侠、西数推的一种SCM),相比一般的TLC NAND实现了据说将近10倍的读取时延缩减,亦极大增加了IOPS(IO per second)。

虽然SCM很快,但同时成本高、容量小。“要造大而快的存储,最符合直觉的方法应该是把TLC和SCM结合起来。”“关键是把热数据(hot data)放进SCM中,能够实现快速存储;而将冷数据(cold data)放进TLC中,以降低成本。”

不过怎么才能知道数据是“冷”的还是“热”的呢?这其实就是“智能存储”这个称谓的由来。英韧科技就应用了AI,或者说神经网络。首先是做数据识别的模型训练,喂的数据是PC用户数据时,据说能够实现99.94%的精度;针对企业数据应用另外的模型,则可实现94.72%的精度。基于此在控制器中加入冷/热数据的预测器。

在控制器芯片中,这个预测器应该是个专门的硬件单元。输入是用户数据,输出则是冷热数据标签(flag)。存储管理模块利用这些数据标签,将对应的热数据放到SCM中,将冷数据放进TLC NAND。当然这种设定在英韧现有架构的实施方案中,可能具备了更大的弹性。

这个架构被英韧科技称作Tacoma架构,即利用CPU和专门的神经网络加速器进行冷热数据的预测。应该也是英韧科技Tacoma系列产品名的由来。结合XL-Flash,AI技术,各种读写、检索操作相比没有应用这些技术的普通SSD(虽然keynote上并没有明确对比对象),吞吐增加将近2倍。而且它相比由应用去说明冷/热数据,具备了比较出色的自适应性。

我们特别询问赖的是,应用于Tacoma的AI专用硬件IP,是否来自英韧科技自己。“也不是一开始就是自己的。存储中应用AI,我们自己也一直在摸索的过程中。刚开始我们用的是NVDLA(Nvidia Deep Learning Accelerator)。”赖的是说,“后来逐步发现我们的方向,包括听取了客户的需求,跟之前有一些不符,所以我们就开始自己做。”

RISC-V成为选择之一

去年11月份,SiFive发布的博客文章中提到SiFive和英韧科技合作,英韧科技未来的SSD控制器可能会采用SiFive 7-Series核心IP。赖的是表示,“我们一直与ARM紧密合作,目前所有的SSD控制器都使用ARM的CPU。由于RISC-V 逐步成熟,加上我们有不少客户在要求我们对RISC-V的支持,我们开始考虑把RISC-V作为选择之一,从而开始和SiFive以及国内的StarFive(赛昉科技)进行了技术讨论,探讨未来可能的合作。”

“我们对SiFive和StarFive的RISC-V CPU做过一些测试,我们觉得其潜力不错。其性能和ARM R5系列类似,设计比较灵活,同时也有某些对SSD控制比较友好的功能。”赖的是说。

SiFive也的确在宣传页上,提及SiFive面向存储市场的的7 series。虽然我们不清楚英韧预备在未来推的产品具体会采用哪个IP,不过SiFive方面曾提及ISC(In-Storage Computing) SoC所需的一些关键特性。这些特性,实则也能帮我们更深入地理解,SSD主控芯片中的处理器,究竟有什么独特。

这些特性包括:(1)低时延、实时地执行数据移动,以及智能的损耗均衡管理,实现SSD寿命延长、增强SSD存储设备的可靠性。(2)跑Linux应用,实现各种数据处理、数据分析、AI计算,在存储设备内执行;也包括追踪、debug、高级中断控制、安全、硬件加密等。(3)“在全球范围内,降低商业风险,加强产品可用性”。

以上几点看起来是相当契合英韧科技SSD控制器产品需求的,当然还有Silicon Proven实现层面的问题等等。其中技术选择多元化、“降低商业风险” 大约也是英韧科技作为一家中国企业,开始选择RISC-V的原因。

西数一直以来就是RISC-V的支持者,2017年就宣布准备将HDD、SSD和存储系统的处理器转向RISC-V,其SweRV核心就是RISC-V架构;此前希捷面向HDD也宣布利用RISC-V控制器做HDD磁头定位的运动控制信息处理;韩国FADU很早之前就有RISC-V SSD解决方案……或许现有市场环境,对RISC-V而言,是个相当难得的契机。

未来的更多机遇

英韧科技作为成立仅4年的初创企业,已经实现了3颗芯片的流片和量产,产品落地效率还是相当之快的。所以此前CES展一些成熟的SSD产品上都能见到其身影。在我们看来,这类有丰富行业经验的技术领军人物带领的年轻企业,眼中的机遇大概是更能代表存储行业未来的。除了上述几个相关SSD的几个重要趋势外,赖的是在谈英韧科技着眼的方向时,主要提到了两点。

“一方面是PCIe,刚才已经提到过了,我们可能会更快地跨入到Gen5产品的支持。”赖的是说。

“而在闪存方面,接口速率也在不断提升。从800 MT/s,到1.2 GT/s、1.6 GT/s甚至更高。这也是我们要投入和保持领先的一个方向。”

“控制器本身要根据这两边的情况往前走,我们一直在做相关的开发和跟进。随着对于这些方向的理解,AI存储就是为了解决怎样更高效地使用存储的问题,存储就成为了一个存储系统。”

“我们在这方面都有规划,包括数据处理的加速,还有存储系统本身。比如最新的一些存储系统,像是ZNS(Zoned Namespaces)、Key-Value Object storage的支持等等,都会是我们关注和投入的方面。”这些机遇,理论上应当也是其他SSD控制器市场玩家的机遇。

英韧科技目前面向市场的策略似乎是首先由Shasta、Shasta+以及Rainier,打开消费级、企业级及工业级市场,扩大产量和用户群。“我们还会有一些迭代,把性能做得更好、功耗做得更低,同时降低成本,让客户能够从中受益。那么今后的产品会更为普及。各种应用场景都会有。包括逐步在数据中心这样的市场上一展拳脚。“

面向高端客户端、数据中心和企业级应用的Rainier和Tacoma系列控制器都选择了台积电的12nm工艺。“之前的PCIe Gen3,选择的节点是28nm,PCIe Gen4我们用的节点是12nm。简单地说,这个节点的优势在die size上,12nm大概是28nm的一半。”

“而在功耗方面,12nm大概是28nm的40%左右。假设要是用28nm去实现PCIe Gen4的话,功耗会比较大。” 这应该是为英韧科技做企业市场开拓的组成部分。尤其像Tacoma这样融合了各种尖端技术的SSD控制器,会是我们更加乐见的。

责编:Luffy Liu

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
随着支持AI的应用程序的普及以及6400MT/s或更高速度成为主流,PC内存性能要求不断提高,使用CKD的系统数量将伴随时间的推移呈现显著增长的态势。
SK海力士29日宣布,全球首次成功开发出采用第六代10纳米级(1c)工艺的16Gb(Gigabit,千兆比特)DDR5 DRAM。由此,公司向世界展现了10纳米出头的超微细化存储工艺技术。
在AI大模型的时代,行业中的一个关键趋势是更大的NAND裸片密度,这有助于推动更大容量的SSD,使系统构建者能够设计更多的服务器,以便拥有更大的容量或将更多的GPU或CPU放入服务器中。鉴于此,特别是随着人工智能的发展,GPU直接存储的能力变得愈发重要。 
SK海力士将在其未来的NAND闪存中应用这种技术,通过在两块晶圆上分别制造外围电路和存储单元,然后使用W2W(晶圆对晶圆)形式的混合键合技术将这两部分整合为一个完整的闪存。
几十年来,半导体行业一直在寻找替代内存技术,以填补传统高性能计算系统架构中DRAM(计算系统的主内存)和NAND闪存(系统的存储介质)之间的空白。
半导体技术因行业标准而生,也因行业标准而亡,但在某些时候,制造高度定制化甚至专有的存储器件是否有意义呢?
• 得益于西欧、关键亚洲市场和拉丁美洲市场的增长,以及中国品牌的持续领先,全球折叠屏手机出货量在2024年第二季度同比增长了48%。 • 荣耀凭借其在西欧特别强劲的表现,成为最大的贡献者,成为该地区排名第一的品牌。 • 摩托罗拉的Razr 40系列在北美和拉丁美洲表现良好,为其手机厂商的出货量贡献了三位数的同比增长。 • 我们预计,头部中国手机品牌厂商的不断增加将至少在短期内抑制三星Z6系列在第三季度的发布。
AI技术的发展极大地推动了对先进封装技术的需求,在高密度,高速度,高带宽这“三高”方面提出了严苛的要求。
奕斯伟计算2024首届开发者伙伴大会以“绿色、开放、融合”为主题,从技术创新、产品应用、生态建设等方面,向开发者、行业伙伴等相关方发出开放合作倡议,加速RISC-V在各行各业的深度融合和应用落地,共同推动RISC-V新一代数字基础设施生态创新和产业发展。
2024年 Canalys 中国云计算渠道领导力矩阵冠军厂商分别是:阿里云、华为云和亚马逊云科技(AWS)
点击蓝字 关注我们德州仪器全球团队坚持克服挑战,为电源模块开发新的 MagPack™ 封装技术,这是一项将帮助推动电源设计未来的突破性技术。  ■ ■ ■作为一名经验丰富的马拉松运动员,Kenji K
文|德福很多去成都旅游的朋友都有个疑惑——为什么在成都官方的城市标志上看不到熊猫,而是一个圆环?其实这个“圆环”大有来头,它被唤作太阳神鸟,2001年出土于大名鼎鼎的金沙遗址,距今已有三千余年历史。0
文|萝吉今年下半年开始,国内新能源市场正式跨过50%历史性节点,且份额依然在快速增长——7月渗透率破50%,8月份破55%……在这一片勃勃生机万物竞发的景象下,新能源市场占比最高的纯电车型,却在下半年
在当今人工智能飞速发展的时代,AI Agent正以其独特的方式重塑着企业的生产运营方式。澜码科技作为AI Agent领域的先行者,其创始人兼CEO周健先生分享了对大模型与AI Agent发展现状的深刻
近日,又一国产SiC企业宣布实现了主驱突破,并将出口海外。据“行家说三代半”的追踪统计,自2022年起,国内主驱级SiC器件/模块开始在多款车型中得到应用,尤其是2024年,本土供应商的市场份额显著上
‍‍据龙芯中科介绍,近日,基于龙芯3A6000处理器的储迹NAS在南京师范大学附属小学丹凤街幼儿园、狮山路小学、南京大学附属中学等学校相继落地。储迹NAS是基于最新的龙芯CPU--3A6000,其代表
[关注“行家说动力总成”,快速掌握产业最新动态]9月6日,据“内江新区”消息,晶益通(四川)半导体科技有限公司旗下IGBT模块材料和封测模组产业园项目已完成建设总进度的40%,预计在明年5月建成。据了
在苹果和华为的新品发布会前夕,Counterpoint公布了2024年第一季度的操作系统详细数据,数据显示, 鸿蒙操作系统在2024年第一季度继续保持强劲增长态势,全球市场份额成功突破4%。在中国市场
随着汽车智能化升级进入深水区,车载ECU(域)以及软件复杂度呈现指数级上升趋势。尤其是多域、跨域和未来的中央电子架构的普及,以及5G/V2X等车云通信的增强,如何保障整车的信息与网络安全,以及防范外部
近日,3个电驱动项目迎来最新进展,包括项目量产下线、投产、完成试验等,详情请看:[关注“行家说动力总成”,快速掌握产业最新动态]青山工业:大功率电驱项目下线9月5日,据“把动力传递到每一处”消息,重庆