“高性能数据管理与存储系统”论坛内容集锦

SSDFans 2024-11-27 07:53


导语







7月30日下午,上海市计算机学会存储专业委员会和高性能计专业委员会携手DOIT主办的“高性能数据管理与存储系统”论坛以线上直播的形式开展。本论坛主要涵盖高性能计算应用及其背景下的计算存储架构和数据存储管理系统,包括新型基于非易失内存的键值对存储系统、新型脉动阵列结构设计、人工智能编译器、高可靠键值存储、可计算存储在数据库的应用和车载高性能计算与存储。会议邀请了华中科技大学刘海坤教授、国防科技大学马胜教授、上海交通大学冷静文长聘教轨副教授、中国科学技术大学李永坤副教授、ScaleFlux技术团队负责人孙建强先生和上汽技术中心基础软件架构师张毅峰先生参与。与会专家和学者分享了他们目前正在探索的问题和发表的学术成果,激发了同仁和学生们对高性能数据管理和存储系统方面的深入思考和探讨。本论坛由上海计算机学会存储专委会和高性能计算专委会携手ScaleFlux与DOIT联合呈现。


报告内容概览


来自华中科技大学的刘海坤教授的报告主题为基于新型非易失内存的键值对存储系统(MioDB)作为一种简单高效的数据结构,键值对(KV)存储系统已成为互联网应用的基本组件,而为了利用高速的顺序写,LSM-Tree牺牲了一定读性能,将随机写转化为顺序写,大幅提高了KV存储系统的写吞吐率。然而,LSM存在严重的写放大和写停留问题。目前新兴的非易失内存(PM)为解决这一问题提供了契机。目前国内外利用PM对基于LSM树的KV键值对存储系统的优化方案并没有利用PM的字节寻址特性,没有对传统LSM数的SSTable改进,而MioDB则提出使用跳表代替SSTable,消除序列化和反序列化开销,减少系统写放大和写停留。经测试,MioDB和最新工作MatrixKV相比,随机写吞吐量提高2.5倍,写放大降低2.6倍。


来自国防科技大学的马胜教授的报告主题为面向紧凑型卷积神经网络的脉动阵列结构优化设计。脉动阵列为有节奏地计算、传输数据的处理单元网络,传统的脉动阵列无法适应卷积神经网络发展过程中小尺寸卷积和深度可分离卷积的优化方案,性能出现严重损失和可扩展性不足。因而报告提出了可配置多向脉动阵列(CMSA),通过双向路径解决非对称切分问题,从而优化小尺寸卷积计算,并且设计新的数据流、改动脉动阵列结构来优化深度卷积。随后,报告对深度卷积进行进一步分析,提出可配置异构脉动阵列(CHSA),通过单通道输出固定数据流扩展映射空间和改变循环展开策略,并进一步设计异构PE设计,有效提高了计算时PE利用率


来自上海交通大学冷静文长聘教轨副教授的报告主题为人工智能芯片编译器研究。人工智能编译器是发挥硬件算力的重要基础,国产人工智能芯片的峰值算力高,但实际代码的利用率低,研究AI芯片的配套软件工具栈(包括编译、优化、运行时系统等)刻不容缓。而新一代人工智能编译器有三大挑战:①多模型的协同编译优化、②跨硬件架构的算子级优化和③模型精度感知的编译优化,为了应对上述挑战,冷静文副教授扩充了现有编译器的中间表示,提出了多层次IR的编译器范式,并产出了三大成果:①基于任务IR的静态多版本编译器、②基于硬件级IR的跨架构编译器和③计算图IR的插桩接口以及计算图重编译。


来自中国科学技术大学的李永坤副教授的报告主题为高可靠键值存储系统。报告分为背景介绍、LSM树的优化和LSM树在实际应用中存在的问题三个部分。在海量非结构化数据飞速增长的背景下,键值存储以其灵活的数据类型、简单的接口、无需目录树和高可扩展性的优点代替传统关系数据库和文件系统得以广泛应用。主流持久化键值存储系统采用LSM树结构,然而LSM树的层间合并会导致写放大,逐层搜索会导致读放大,在有多副本容错的高可靠存储系统中,尤其将多副本在一个LSM树中统一管理会带来更加严峻的读写放大。李永坤副教授提出了DEPART,在存储层对主副本和从副本解耦,进行差异化管理,主副本保证用户访问,需要快速写入和查询,而从副本保证容错,也需要快速写入但查询可以放松。因而主副本采用LSM树存储,从副本采用有序可调的两层日志存储,根据性能需求在读写性能之间权衡。


来自ScaleFlux技术团队负责人孙建强先生的报告主题为可计算存储在数据库应用场景的实践。随着CPU主频增速减缓和业务数据的增长,减少软件栈开销以加速计算的近存储计算得到发展,ScaleFlux独家推出的拥有数据透明压缩能力的可计算存储CSD(2000和3000)应运而生。本报告基于CSD以数据透明压缩为例介绍可计算存储的广阔前景。存储中的透明压缩即在SoC中对写入的数据压缩后写入存储介质,压缩和解压缩的过程对主机透明。这一技术可以减少写入量进而提高闪存的寿命,同时达到逻辑扩容、提高性能的效果。和软件压缩相比,透明压缩数据存放更紧凑、压缩率更高,以MySQL无压缩场景为基准,在纯文本数据集中,CSD 2000的压缩比达2.96:1。


来自上汽技术中心基础软件架构师张毅峰先生的报告主题为车载高性能计算与存储。报告分为电子电器架构(E/E)的进化、车载高性能计算、车载高性能存储和云端高性能存储四大部分。张毅峰先生提出,从车辆到云端各个环节都需要大量数据存储,车载数据主要为无需连接即可工作的实时应用的车辆数据,而云存数据主要为性能分析,改进和推送到车辆的数据,因而需要结合两个特性,全面支持从“车”到“云”,再从“云”到“车”的存储需求。最后张毅峰先生以高级驾驶辅助系统(ADAS)的存储需求及其在云平台中的运用为例进行案例分析,进一步透彻阐释这一主题。


— E N D—


扫码关注SCS存储专委





SSDFans AI+IOT+闪存,万物存储、万物智能、万物互联的闪存2.0时代即将到来,你,准备好了吗?
评论 (0)
  • 这款无线入耳式蓝牙耳机是长这个样子的,如下图。侧面特写,如下图。充电接口来个特写,用的是卡座卡在PCB板子上的,上下夹紧PCB的正负极,如下图。撬开耳机喇叭盖子,如下图。精致的喇叭(HY),如下图。喇叭是由电学产生声学的,具体结构如下图。电池包(AFS 451012  21 12),用黄色耐高温胶带进行包裹(安规需求),加强隔离绝缘的,如下图。451012是电池包的型号,聚合物锂电池+3.7V 35mAh,详细如下图。电路板是怎么拿出来的呢,剪断喇叭和电池包的连接线,底部抽出PCB板子
    liweicheng 2025-05-06 22:58 172浏览
  • 二位半 5线数码管的驱动方法这个2位半的7段数码管只用5个管脚驱动。如果用常规的7段+共阳/阴则需要用10个管脚。如果把每个段看成独立的灯。5个管脚来点亮,任选其中一个作为COM端时,另外4条线可以单独各控制一个灯。所以实际上最多能驱动5*4 = 20个段。但是这里会有一个小问题。如果想点亮B1,可以让第3条线(P3)置高,P4 置低,其它阳极连P3的灯对应阴极P2 P1都应置高,此时会发现C1也会点亮。实际操作时,可以把COM端线P3设置为PP输出,其它线为OD输出。就可以单独控制了。实际的驱
    southcreek 2025-05-07 15:06 49浏览
  • 想不到短短几年时间,华为就从“技术封锁”的持久战中突围,成功将“被卡脖子”困境扭转为科技主权的主动争夺战。众所周知,前几年技术霸权国家突然对华为发难,导致芯片供应链被强行掐断,海外市场阵地接连失守,恶意舆论如汹涌潮水,让其瞬间陷入了前所未有的困境。而最近财报显示,华为已经渡过危险期,甚至开始反击。2024年财报数据显示,华为实现全球销售收入8621亿元人民币,净利润626亿元人民币;经营活动现金流为884.17亿元,同比增长26.7%。对比来看,2024年营收同比增长22.42%,2023年为7
    用户1742991715177 2025-05-02 18:40 174浏览
  • 5小时自学修好BIOS卡住问题  更换硬盘故障现象:f2、f12均失效,只有ESC和开关机键可用。错误页面:经过AI的故障截图询问,确定是机体内灰尘太多,和硬盘损坏造成,开机卡在BIOS。经过亲手拆螺丝和壳体、排线,跟换了新的2.5寸硬盘,故障排除。理论依据:以下是针对“5小时自学修好BIOS卡住问题+更换硬盘”的综合性解决方案,结合硬件操作和BIOS设置调整,分步骤说明:一、判断BIOS卡住的原因1. 初步排查     拔掉多余硬件:断开所有外接设备(如
    丙丁先生 2025-05-04 09:14 72浏览
  • 某国产固态电解的2次和3次谐波失真相当好,值得一试。(仅供参考)现在国产固态电解的性能跟上来了,值得一试。当然不是随便搞低端的那种。电容器对音质的影响_电子基础-面包板社区  https://mbb.eet-china.com/forum/topic/150182_1_1.html (右键复制链接打开)电容器对音质的影响相当大。电容器在音频系统中的角色不可忽视,它们能够调整系统增益、提供合适的偏置、抑制电源噪声并隔离直流成分。然而,在便携式设备中,由于空间、成本的限
    bruce小肥羊 2025-05-04 18:14 130浏览
  • 多功能电锅长什么样子,主视图如下图所示。侧视图如下图所示。型号JZ-18A,额定功率600W,额定电压220V,产自潮州市潮安区彩塘镇精致电子配件厂,铭牌如下图所示。有两颗螺丝固定底盖,找到合适的工具,拆开底盖如下图所示。可见和大部分市场的加热锅一样的工作原理,手绘原理图,根据原理图进一步理解和分析。F1为保险,250V/10A,185℃,CPGXLD 250V10A TF185℃ RY 是一款温度保险丝,额定电压是250V,额定电流是10A,动作温度是185℃。CPGXLD是温度保险丝电器元件
    liweicheng 2025-05-05 18:36 187浏览
  • 浪潮之上:智能时代的觉醒    近日参加了一场课题的答辩,这是医疗人工智能揭榜挂帅的国家项目的地区考场,参与者众多,围绕着医疗健康的主题,八仙过海各显神通,百花齐放。   中国大地正在发生着激动人心的场景:深圳前海深港人工智能算力中心高速运转的液冷服务器,武汉马路上自动驾驶出租车穿行的智慧道路,机器人参与北京的马拉松竞赛。从中央到地方,人工智能相关政策和消息如雨后春笋般不断出台,数字中国的建设图景正在智能浪潮中徐徐展开,战略布局如同围棋
    广州铁金刚 2025-04-30 15:24 334浏览
  • ‌一、高斯计的正确选择‌1、‌明确测量需求‌‌磁场类型‌:区分直流或交流磁场,选择对应仪器(如交流高斯计需支持交变磁场测量)。‌量程范围‌:根据被测磁场强度选择覆盖范围,例如地球磁场(0.3–0.5 G)或工业磁体(数百至数千高斯)。‌精度与分辨率‌:高精度场景(如科研)需选择误差低于1%的仪器,分辨率需匹配微小磁场变化检测需求。2、‌仪器类型选择‌‌手持式‌:便携性强,适合现场快速检测;‌台式‌:精度更高,适用于实验室或工业环境。‌探头类型‌:‌横向/轴向探头‌:根据磁场方向选择,轴向探头适合
    锦正茂科技 2025-05-06 11:36 284浏览
  • UNISOC Miracle Gaming奇迹手游引擎亮点:• 高帧稳帧:支持《王者荣耀》等主流手游90帧高画质模式,连续丢帧率最高降低85%;• 丝滑操控:游戏冷启动速度提升50%,《和平精英》开镜开枪操作延迟降低80%;• 极速网络:专属游戏网络引擎,使《王者荣耀》平均延迟降低80%;• 智感语音:与腾讯GVoice联合,弱网环境仍能保持清晰通话;• 超高画质:游戏画质增强、超级HDR画质、游戏超分技术,优化游戏视效。全球手游市场规模日益壮大,游戏玩家对极致体验的追求愈发苛刻。紫光展锐全新U
    紫光展锐 2025-05-07 17:07 52浏览
  • 随着智能驾驶时代到来,汽车正转变为移动计算平台。车载AI技术对存储器提出新挑战:既要高性能,又需低功耗和车规级可靠性。贞光科技代理的紫光国芯车规级LPDDR4存储器,以其卓越性能成为国产芯片产业链中的关键一环,为智能汽车提供坚实的"记忆力"支持。作为官方授权代理商,贞光科技通过专业技术团队和完善供应链,让这款国产存储器更好地服务国内汽车厂商。本文将探讨车载AI算力需求现状及贞光科技如何通过紫光国芯LPDDR4产品满足市场需求。 车载AI算力需求激增的背景与挑战智能驾驶推动算力需求爆发式
    贞光科技 2025-05-07 16:54 52浏览
我要评论
0
0