干货 | 公有云存储技术分享

SSDFans 2020-01-08 00:30

随着5G+IoT时代来临,产生数据的主角除了人类还有海量的物理设备,相比4G移动互联网的短视频、直播等,会有更大量的数据产生。据IDC发布的《数据时代2025》的预测,全球每年产生的数据将从2018年的33ZB增长到2025年的175ZB,每年新增约20ZB,如果使用8T的磁盘,只保存一份副本,每年需要25亿块磁盘,数亿台主机。


这些数据大多以视频、图片、文本等非结构化形式存在,并需要妥善保存以做后续利用。为此,数据的存储载体需要具备随时随地上传、安全、可扩展以及低成本的特性。目前,对象存储是这些海量非结构化数据最好的存储载体。

 

UFile做Costco式的对象存储


UFile是UCloud 2015年推出的对象存储产品。过去一年间,UFile从整体上做了一次较大升级,推出不少功能特性和优化,更好地满足用户对海量非结构化数据的需求。这一过程中,UFile将其产品理念概括为“成为Costco式的存储”,为什么是Costco式的?


图:UFile控制台界面


前段时间量贩式仓储会员店Costco在国内火爆开业,在一个既不缺线下商超、同时线上电商更是遍地开花,市场竞争异常激烈的中国市场,Costco靠什么去切入用户?雷军是这么评价Costco的:“Costco这么多年所向披靡的最重要原因就是抓住了其存在的本质,商品做到极好,价格做到极低,服务做到超预期。


这个理念也同样适用于对象存储领域,UFile把用户最本质的需求概括为3点:极高的可靠性和性能、极低的成本以及极优的体验。

 

对象存储的三个典型案例


在介绍UFile之前,我们先来看看AI、大数据和IoT场景下的3个案例:


1、某传统金属件加工企业原本有这样一项业务:员工人力摘捡不合格产品。现在,该项业务转变为拍照取证+AI智能检测的方式,相较之前大大节省了企业的人力投入成本,并降低了人工检测的误差。同时也产生了一项新需求:所有图片数据需保存25年以供后续质保检验。

用户的需求:如何保证数据长时间存储的高可靠需求?


2、某大数据分析企业积攒了数个PB的大数据,在完成分析后这些数据的访问量降到较低,但在一段时间内仍需存储保留原始数据或者分析后的中间数据。对企业来讲,这数PB的数据存储将会是一笔不小的开销。


用户的需求:如何实现海量数据的低成本存储需求?


3、某城市地铁每天停运后都需要人工沿地铁进行检修,效率较低且需要大量人力的投入。因此计划引入IoT技术:在地铁中部署一些传感器,检测地铁的声音、温度、图像、视频等,数据使用4G网络随时随地上传到云端存储,解决人力工作成本并提高检修效率。


用户的需求:这些分散在地下各处的传感器如何方便、安全、低延时的进行数据的上传?


我们总结了这三个案例的关键字:高可靠、低成本、使用体验,下面我们来详细介绍UFile在这三方面所做的工作。


数据高可靠


1、多副本+同构的冗余机制


首先,UFile采用3副本和纠删码技术,可以确保数据在两块磁盘损坏的时候数据不丢失。不同于类似Ceph异构的数据分布技术,UFile 3副本技术采用同构的数据分布方式,这种同构的数据分布可以保证数据更高的可靠性。


图:同构与异构数据分布对比


从上图可知,同构情况下只有集群a或者b同时损坏2种丢失数据的可能情况,而在异构结构下有6种丢失数据的组合情况,同构的可靠性显然更高。


2、跨地域的数据灾备


UFile是一个地域级别的存储产品,为了更好的提供数据灾备能力,UFile今年推出了跨地域的灾备功能:支持3个及以上的地域复制,复制方式包括链式结构(A->B->C)与技术实现更复杂的环式结构(A->B->C->A)。环状结构的优点是能够支持更多地域的读写,并满足就近读写业务的需求。


图:多地域复制及就近读写功能示意


3、故障处理机制的完善和创新


除此之外,UFile还在故障的快速发现和恢复上做了不少创新。除应用常规的硬件和软件层面的监控帮助用户快速发现数据异常外,UFile采用Set化的架构设计,当出现机器或磁盘故障时,可以将该Set集群设置为只读,从而降低该Set集群的业务负载,帮助恢复程序以最快的速度恢复故障磁盘或机器,大大提高数据的可靠性。


业务低成本


1、对象级别的分层存储


UFile采用专门的存储机型,存储密度更高,单位存储的成本最低可降到计算机型的15%。同时采用纠删码技术,在确保数据可靠性的前提下,存储成本可降低到3副本冗余机制下的40%左右。


此外,UFile还对数据分层和数据生命周期管理进行了优化,致力于从数据分层存储的角度进一步降低用户存储的成本。


用户业务往往同时存在高频和低频访问的数据,而相同数据在不同生命周期也存在不同的访问频率。一个刚产生的高频访问的数据,随着时间的推移访问频率往往会逐渐减低,数个月后便可能从高频转为低频。不同访问频率的数据可采用不同成本的存储方案。


业内早期的解决方案是通过支持热、温、冷3种存储产品来满足不同频率访问数据的要求,用户分别在3种存储产品上创建Bucket,然后根据数据的访问频率放置到对应的Bucket。按照用户设置的时间规则,在不同时间点数据会在3种Bucket进行迁移。这种解决方案虽然解决了数据存储的成本问题,但是缺点在于对业务不太友好,需要业务感知这种变化。


图:传统的分层存储数据流转示意


针对该问题,UFile在今年推出了对象级别的分层存储方案。和传统解决方案不一样的是,UFile支持同个Bucket中同时存在热、温、冷3种数据,用户可以将同个业务中的3种数据上传到同个Bucket,同时数据访问频率发生变化后还会保留在同个Bucket中。


这种方案对用户的业务更加友好,而且也为后续即将推出的数据自动化分层管理奠定了良好的基础。用户很多时候无法区分数据的冷、热程度,或者无法准确的预测数据什么时候开始变冷,而更好的做法是将这些工作交给后台程序自动完成,这样可以让用户享受到最低的存储成本。


图:UFile分层存储方案数据流转示意


2、自建大数据存储与UFile归档存储的成本对比


我们回到开头的大数据用户的场景,该企业现有5PB的数据量,因为用户的数据访问频率较低,所以推荐采用UFile的归档存储方案,下表是使用自建大数据存储和UFile归档存储方案成本差异对比。



事实上,我们还没有考虑数据逐渐增长的过程,对象存储是按需付费的,实际使用多少资源才会支付多少费用,而自建大数据存储往往会存在资源和成本的空闲浪费。因此,针对海量数据的冷存储,UFile归档存储方案能够提供更高的性价比。


产品体验优化 


1、数据安全+高质量网络保证


移动设备和IoT设备都有随时随地上传的需求,而随时随地的上传则对数据安全和网络质量都提出了更高的要求。


针对该需求,首先UFile支持Https协议,支持用户使用公私钥或者Token的方式来随时随地的传输数据、确保数据的安全性。


其次,UFile已在全球10多个国家和地区分布有节点,覆盖国内主要城市和国外主要国家,按照规划UFile后续还将覆盖到更多地区和国家。国内外的数据节点均采用BGP机房或者运营商节点机房,能够提供高质量的网络保障,确保用户数据上传过程中的稳定和低延时。


图:UFile全球数据中心分布


2、用户接入体验优化


目前UFile的SDK覆盖了主流的开发语言,并分别支持iOS和Android移动端。同时UFile还兼容了常用的S3协议,支持第三方用户态网络文件系统访问UFile,如S3fs、Goofys,这样用户可以像使用本地文件系统一样使用对象存储。相比本地文件系统,以UFile为存储池的用户态网络文件系统可以为用户带来更大的存储空间和更低的存储成本。


图:通过Goofys把某个Bucket挂载成文件系统并操作


图:通过Goofys写UFile后的效果


3、各类应用场景下的定制化解决方案


此外,UFile还提供了各类常用应用场景和备份场景的定制化解决方案:


  • 针对多媒体场景,UFile结合UCloud全球500多个CDN节点,给用户提供高质量的视频和图片类服务。

  • 针对大数据场景,UFile推出了计算存储分离的方案,使用UFile来替代HDFS,计算层只需修改配置文件即可完成替换。


在UCloud今年推出的重量级数据分析产品USQL中便采用了计算存储分离的解决方案,对计算和存储都采用按需计费的方式,大大降低了大数据分析的成本。同时USQL依托于UFile强大的IO能力,以及无限存储容量,实现了海量数据的快速分析。


  • 针对备份类的场景,UFile提供了Hadoop 冷数据备份场景、MySQL 数据库备份和恢复场景、ES 日志备份的场景、网站文件备份场景等解决方案,帮助用户轻松完成数据备份。


Hadoop 冷数据备份场景实例分析:


Step1

图:Hadoop集群中的文件在UFile的某个Bucket中不存在


Step2

图:通过distcp工具备份至UFile的某个Bucket中


Step3


图:备份成功后可以在UFile控制台看到该文件

 

结语


最后,针对海量非结构化数据,除了数据高可靠、低成本以及良好的使用体验,还有一个非常重要的需求便是高性能。特别是在引入生命周期和目录功能后的列表查询场景以及类似网络摄像头的大量写入及删除类的场景,对索引和存储的性能提出较大的挑战。


UFile目前已经上线了目录功能和生命周期功能,大批量删除的性能也相比以往有较大的提升。后期我们还将专门介绍这两类场景下索引和存储的优化工作,敬请期待。



SSDFans AI+IOT+闪存,万物存储、万物智能、万物互联的闪存2.0时代即将到来,你,准备好了吗?
评论
  • 在过去十年中,自动驾驶和高级驾驶辅助系统(AD/ADAS)软件与硬件的快速发展对多传感器数据采集的设计需求提出了更高的要求。然而,目前仍缺乏能够高质量集成多传感器数据采集的解决方案。康谋ADTF正是应运而生,它提供了一个广受认可和广泛引用的软件框架,包含模块化的标准化应用程序和工具,旨在为ADAS功能的开发提供一站式体验。一、ADTF的关键之处!无论是奥迪、大众、宝马还是梅赛德斯-奔驰:他们都依赖我们不断发展的ADTF来开发智能驾驶辅助解决方案,直至实现自动驾驶的目标。从新功能的最初构思到批量生
    康谋 2025-01-09 10:04 88浏览
  • 职场是人生的重要战场,既是谋生之地,也是实现个人价值的平台。然而,有些思维方式却会悄无声息地拖住你的后腿,让你原地踏步甚至退步。今天,我们就来聊聊职场中最忌讳的五种思维方式,看看自己有没有中招。1. 固步自封的思维在职场中,最可怕的事情莫过于自满于现状,拒绝学习和改变。世界在不断变化,行业的趋势、技术的革新都在要求我们与时俱进。如果你总觉得自己的方法最优,或者害怕尝试新事物,那就很容易被淘汰。与其等待机会找上门,不如主动出击,保持学习和探索的心态。加入优思学院,可以帮助你快速提升自己,与行业前沿
    优思学院 2025-01-09 15:48 87浏览
  • 在当前人工智能(AI)与物联网(IoT)的快速发展趋势下,各行各业的数字转型与自动化进程正以惊人的速度持续进行。如今企业在设计与营运技术系统时所面临的挑战不仅是技术本身,更包含硬件设施、第三方软件及配件等复杂的外部因素。然而这些系统往往讲究更精密的设计与高稳定性,哪怕是任何一个小小的问题,都可能对整体业务运作造成严重影响。 POS应用环境与客户需求以本次分享的客户个案为例,该客户是一家全球领先的信息技术服务与数字解决方案提供商,遭遇到一个由他们所开发的POS机(Point of Sal
    百佳泰测试实验室 2025-01-09 17:35 90浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球中空长航时无人机产值达到9009百万美元,2024-2030年期间年复合增长率CAGR为8.0%。 环洋市场咨询机构出版了的【全球中空长航时无人机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球中空长航时无人机总体规模,包括产量、产值、消费量、主要生产地区、主要生产商及市场份额,同时分析中空长航时无人机市场主要驱动因素、阻碍因素、市场机遇、挑战、新产品发布等。报告从中空长航时
    GIRtina 2025-01-09 10:35 91浏览
  • 1月7日-10日,2025年国际消费电子产品展览会(CES 2025)盛大举行,广和通发布Fibocom AI Stack,赋智千行百业端侧应用。Fibocom AI Stack提供集高性能模组、AI工具链、高性能推理引擎、海量模型、支持与服务一体化的端侧AI解决方案,帮助智能设备快速实现AI能力商用。为适应不同端侧场景的应用,AI Stack具备海量端侧AI模型及行业端侧模型,基于不同等级算力的芯片平台或模组,Fibocom AI Stack可将TensorFlow、PyTorch、ONNX、
    物吾悟小通 2025-01-08 18:17 80浏览
  • HDMI 2.2 规格将至,开启视听新境界2025年1月6日,HDMI Forum, Inc. 宣布即将发布HDMI规范2.2版本。新HDMI规范为规模庞大的 HDMI 生态系统带来更多选择,为创建、分发和体验理想的终端用户效果提供更先进的解决方案。新技术为电视、电影和游戏工作室等内容制作商在当前和未来提供更高质量的选择,同时实现多种分发平台。96Gbps的更高带宽和新一代 HDMI 固定比率速率传输(Fixed Rate Link)技术为各种设备应用提供更优质的音频和视频。终端用户显示器能以最
    百佳泰测试实验室 2025-01-09 17:33 101浏览
  • 故障现象一辆2017款东风风神AX7车,搭载DFMA14T发动机,累计行驶里程约为13.7万km。该车冷起动后怠速运转正常,热机后怠速运转不稳,组合仪表上的发动机转速表指针上下轻微抖动。 故障诊断 用故障检测仪检测,发动机控制单元中无故障代码存储;读取发动机数据流,发现进气歧管绝对压力波动明显,有时能达到69 kPa,明显偏高,推断可能的原因有:进气系统漏气;进气歧管绝对压力传感器信号失真;发动机机械故障。首先从节气门处打烟雾,没有发现进气管周围有漏气的地方;接着拔下进气管上的两个真空
    虹科Pico汽车示波器 2025-01-08 16:51 112浏览
  • 一个真正的质量工程师(QE)必须将一件产品设计的“意图”与系统的可制造性、可服务性以及资源在现实中实现设计和产品的能力结合起来。所以,可以说,这确实是一种工程学科。我们常开玩笑说,质量工程师是工程领域里的「侦探」、「警察」或「律师」,守护神是"墨菲”,信奉的哲学就是「墨菲定律」。(注:墨菲定律是一种启发性原则,常被表述为:任何可能出错的事情最终都会出错。)做质量工程师的,有时会不受欢迎,也会被忽视,甚至可能遭遇主动或被动的阻碍,而一旦出了问题,责任往往就落在质量工程师的头上。虽然质量工程师并不负
    优思学院 2025-01-09 11:48 110浏览
  • 在智能网联汽车中,各种通信技术如2G/3G/4G/5G、GNSS(全球导航卫星系统)、V2X(车联网通信)等在行业内被广泛使用。这些技术让汽车能够实现紧急呼叫、在线娱乐、导航等多种功能。EMC测试就是为了确保在复杂电磁环境下,汽车的通信系统仍然可以正常工作,保护驾乘者的安全。参考《QCT-基于LTE-V2X直连通信的车载信息交互系统技术要求及试验方法-1》标准10.5电磁兼容试验方法,下面将会从整车功能层面为大家解读V2X整车电磁兼容试验的过程。测试过程揭秘1. 设备准备为了进行电磁兼容试验,技
    北汇信息 2025-01-09 11:24 93浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2025-01-09 09:58 77浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦