海量小文件!全闪存该怎么办?

SSDFans 2020-05-02 00:00


点击蓝字
关注我们



移动互联网、人工智能、5G、IoT等技术的发展,海量的终端催生了越来越高的业务性能需求,越来越多的文件业务场景要求被“加速”,以提供快速响应和高带宽访问。HDD存储设备已无法满足高IOPS、低延迟的业务需求,越来越多的企业数据中心开始选择全闪存的解决方案。据Gartner预计,到2020年数据中心50%的机械硬盘存储将被全闪存存储取代,应用于新数据时代的诸多业务场景。


01 方案背景


海量小文件难题


大数据、人工智能、物联网、智慧金融、电子商务、新媒体等应用产生了大量数据,其中小文件数量可以可轻松达到千万甚至十亿级别。如淘宝、京东等购物网站的海量产品图片;微博微信里用户上传的表情、图片;人工智能领域的人脸识别、安防监控的卡口图片、金融的影像数据等,这些文件在几KB至几百KB不等,数量可达上亿级,属于典型的海量小文件。


海量小文件简称LOSF(lots of small file),业内将大小在1MB以内的文件称为小文件,百万级数量及以上称为海量。LOSF读写性能低下一直是困扰存储界的难题,无论是传统磁盘阵列,还在风头正劲的分布式存储,都无法有效应对海量小文件的I/O压力。


海量小文件的文件尺寸小,因此多个文件在硬盘上的分布不连续,物理位置跨度较大;而文件系统的每次文件访问都会伴随一定的元数据操作,文件数量越多,元数据访问压力越大。因此海量小文件读写是并发随机访问,资源开销大,对存储系统的随机读写性能有极高的要求。而目前的文件系统包括本地文件系统、分布式文件系统等主要面向传统场景设计,在元数据管理、数据布局、缓存策略等方面都侧重于大文件,在海量小文件压力下性能极差,业务访问时常常出现目录无法打开、检索缓慢、响应迟钝、甚至发热宕机等情况。


大文件带宽压力

一方面,小文件的数量在疯狂增长,另一方面,大文件的尺寸在快速增加。如像素越来越高的手机照片、动辄几百GB甚至TB级的4K/8K视频、精密科研仪器产生的大尺寸素材数据。这些数据不仅仅需要海量的存储空间,更需要充足的带宽性能,满足大量数据在快速查看、编辑、处理、共享等多方面的需求。


以高清非编为例,它通过多个工作站对于高清视频素材的编辑与渲染,最终处理生成符合播放要求的视频文件。无损4K视频码率可超过300MB/s,压缩后仍有500Mb/s的码率,某些特殊场景因有更高的帧率,码率更可达到惊人的1.5GB/s。


在10个工作站规模、无损4K素材视频编辑时,假设每工作站平均编辑5层4K素材,需要的带宽性能为300MB/s×5×10=15000MB/s。这对于存储系统是一个巨大的性能挑战,SAN文件系统方案架构复杂,且需要很多套光纤阵列支撑;而传统分布式存储需要众多存储节点,且网络延时带来的抖动也很难满足视频渲染的稳定性要求。类似的大文件应用场景,需要更高带宽、更低延时、简单经济的解决方案。


02 FASS文件网关解决方案说明


为满足海量小文件高效管理和大文件的高带宽性能需求,TaoCloud基于FASS分布式全闪存储系统,推出了FASS文件网关解决方案。该方案主要采用分布式全闪存储架构,通过在资源调度、元数据管理、数据组织、I/O 流程优化等多方面优化,可以有效释放全闪存介质的性能,实现海量小文件访问的快速响应;文件网关可以支持多种文件存储协议,实现便捷的数据共享和强大的带宽性能。


△FASS文件网关方案拓扑图


为保障文件网关的高性能表现,方案采用配备全闪存介质的FASS分布式全闪存储集群作为存储底座,FASS使用本地SSD资源创建多个LUN卷,并映射到不同的网关节点。FASS是面向IO密集型应用的高性能块存储系统。它采用高性能的全闪存硬件平台,针对NVMe闪存介质设计了高效的分布式存储软件栈,FASS可将多个节点的SSD资源通过高速以太网或Infiniband网络组成高性能、高可用、易扩展的块存储资源池,并通过iSCSI、iSER、NVMeoF存储接口对外提供超高性能的存储服务。随着业务性能需求的增长,FASS可以通过横向扩展,轻松提升容量与性能。


文件网关相当于IO节点,它们通过高速IP SAN网络访问FASS存储服务,使用iSER协议挂载其LUN资源。每个网关节点以多路径的形式挂载所有LUN卷,并使用其中某个卷作为自己的存储介质资源。各网关节点使用的LUN卷各不相同,可以单独导出文件服务,或将所有LUN创建存储资源池,并以CIFS/NFS/S3等协议对外导出,通过10/25/100Gb以太网为应用提供高性能、易共享、弹性扩展的存储服务。


网关节点本身即一套高可用集群,通过LUN多路径映射以及SAN高可用设计,任何一个网关节点故障后,它的LUN卷会由其他网关节点自动接管,最大允许N-1节点故障,而不影响文件存储服务的正常使用。


FASS文件网关包含IO链路、集群内部、业务访问几层,不同网络可单独配置,也可以复用简化。为保证方案整体性能,推荐配置10Gbps以上网络配置。


FASS文件网关可以提供远高于传统NAS的文件访问性能,满足新兴文件应用场景对于高IOPS和带宽的苛刻要求,参考性能:


 

03 FASS方案优势


·优秀的性能表现


FASS网关方案采用share-nothing分布式集群架构,可以消除独立元数据性能瓶颈,支持百亿级别文件总数目和千万级单目录文件数目。FASS元数据服务基于内存K/V数据库实现,文件数据与元数据分别存储和管理,具备优秀的性能扩展能力。通过NVMe盘提供极致I/O性能,结合软件层的XPE引擎设计、微控制器技术、轻量元数据索引等机制,块存储端可达到三节点千万级IOPS、微秒级延迟;文件存储性能可达到数十万OPS、10GB/S级带宽。


·统一存储、便捷共享


FASS文件网关方案同时提供高性能块、文件、对象访问,如CIFS、NFS、FTP、S3、iSCSI、iSER,可以满足用户各类应用的存储访问需求。数据库可以使用iSER高性能块服务,满足关键业务的性能需求;海量小文件或大文件编辑,可以使用NAS协议或POSIX共享访问。方案采用透明共享机制,可以让文件协议和对象协议实现零拷贝数据共享,异构应用可以轻松共享彼此写入的数据,而无需任何拷贝或转换。。


·高可用、灵活扩展


FASS分布式全闪存储系统采用全活高可用架构,可以允许任意节点故障而不中断块存储服务;存储网关通过多路径映射加SAN高可用机制,可以允许N-1个网关节点故障。两者结合,具有极高的业务可用性。


随着业务的增长,方案可以按需配置相应的集群规模,以最小的投入满足业务性能需求。方案前后端相对独立,用户可以根据业务对块存储和文件/对象存储的不性能要求,对FASS存储底座与文件网关可以配置不同的网络、集群规模、硬件规格,以经济灵活的配置,满足业务的实际资源需求。随着集群规模的扩展,文件网关的整体性能呈线性增长。


 


04 典型业务场景


FASS文件网关解决方案主要面向海量小文件和高业务带宽需求场景,可以通过标准的NAS或CIFS协议,可以便捷的文件共享和高吞吐带宽性能。可广泛应用于AI海量小文件、4K/8K非编、HPC、基因测序、高速数据采集 (雷达、卫星等)等业务场景。


海量小文件

AI人脸识别、大型电商、交通卡口等场景,每天都会产生高级TB量级的小图片文件,这些数据要求保存一定的周期,到期后需要批量删除,集中操作往往给存储系统带来巨大的压力。大量的元数据操作导致传统存储系统对小文件的删除、检索效率极低,读写放大明显,HDD存储系统难以应对如此庞大的文件数据和随机访问压力,成为类似应用的最大性能瓶颈。


FASS网关方案采用分布式轻量级元数据设计,可以支持百亿级别文件总数目和千万级单目录文件数目。结合软件层的的多种优化,可以充分发挥NVMe盘的随机读写性能,应对海量小文件的同时删除或并发随机访问压力。

 

△FASS文件网关交通卡口海量图片管理


高清非编

4K/8K不仅给播放设备、网络带宽带来的新的挑战,给后端的存储设备更是带来了性能和容量上的巨大压力。视频后期制作通常需要同时编辑多层素材,导致存储带宽需求数倍增长;除了极高的带宽,还要求存储的访问延迟较低,不能存在明显的性能抖动,否则会导致画面卡顿、丢帧等情况,极大影响编辑人员的工作体验。随着业务的增长,视频素材的累积,工作站所需要的存储空间也越来越大,存储设备需要具备强大的扩展能力,以弹性满足业务发展的需要。 


FASS文件网关解决方案可以较低的成本提供非编所需的容量、带宽与共享特性,解决4K/8K视频编辑处理面临的性能难题。


△FASS文件网关4K/8K非编应用


高性能计算

随着HPC逐渐往大数据、AI等方向融合和演进,对存储容量、I/O性能、弹性扩展能力提出了更多的要求。多个HPC高工作需要便捷的数据共享,通过文件协议实现高带宽业务访问。也对数据提供出了全场景交叉共享,跨业务自由流动的要求。


FASS文件网关支持多种文件存储协议,高吞吐、可扩展的带宽表现,可以满足多个高性能计算节点的并行数据处理要求,并提供原生的数据共享;内置的冷数据归档功能,可以将重要的结果数据归档至蓝光或云端保存;软件定义方案,支持主流的服务器硬件平台,降低用户建设成本。


△FASS文件网关基因测序HPC应用


(TaoCloud团队原创)


高端微信群介绍

创业投资群


AI、IOT、芯片创始人、投资人、分析师、券商

闪存群


覆盖5000多位全球华人闪存、存储芯片精英

云计算群


全闪存、软件定义存储SDS、超融合等公有云和私有云讨论

AI芯片群


讨论AI芯片和GPU、FPGA、CPU异构计算

5G群


物联网、5G芯片讨论

第三代半导体群

氮化镓、碳化硅等化合物半导体讨论

储芯片群

DRAM、NAND、3D XPoint等各类存储介质和主控讨论

汽车电子群

MCU、电源、传感器等汽车电子讨论

光电器件群

光通信、激光器、ToF、AR、VCSEL等光电器件讨论

渠道群

存储和芯片产品报价、行情、渠道、供应链




< 长按识别二维码添加好友 >

加入上述群聊




长按并关注

带你走进万物存储、万物智能、

万物互联信息革命新时代

微信号:SSDFans
SSDFans AI+IOT+闪存,万物存储、万物智能、万物互联的闪存2.0时代即将到来,你,准备好了吗?
评论
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 44浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 124浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 75浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 119浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 25浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 34浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 156浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 89浏览
  • 在物联网(IoT)短距无线通信生态系统中,低功耗蓝牙(BLE)数据透传是一种无需任何网络或基础设施即可完成双向通信的技术。其主要通过简单操作串口的方式进行无线数据传输,最高能满足2Mbps的数据传输速率,可轻松实现设备之间的快速数据同步和实时交互,例如传输传感器数据、低采样率音频/图像与控制指令等。低功耗蓝牙(BLE)数据透传解决方案组网图具体而言,BLE透传技术是一种采用蓝牙通信协议在设备之间实现数据透明传输的技术,设备在通信时会互相验证身份和安全密钥,具有较高的安全性。在不对MCU传输数据进
    华普微HOPERF 2025-01-21 14:20 33浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 42浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦