·聚焦:人工智能、芯片等行业
欢迎各位客官关注、转发
存算一体”打破了运行70年的冯诺依曼架构,将成为AI时代主流的计算架构;
目前国内外在存算一体方面都处于起步阶段,存算一体正处于学术界向工业界迁移的关键时期;
进入大数据和人工智能时代,巨大的算力需求为存算一体架构的发展提供了新的舞台。
市面上的传统芯片普遍都采用冯诺依曼架构。该架构的特点是将处理单元和存储单元分开,需要进行计算时,处理单元从存储单元中读取数据进行处理,处理完成后再将数据返回存储单元。
而存算一体方案创新性实现了计算与存储模块一体化的整合创新。
解决了传统芯片架构中计算与存储模块间巨大的数据传输延迟、能量损耗痛点,既增加了数据处理速度,又大大降低了数据传输的功耗,从而使芯片能效比得到2-3个数量级(>100倍)的提升。
达摩院计算技术实验室科学家郑宏忠曾讲过:“存算一体是颠覆性的芯片技术,它天然拥有高性能、高带宽和高能效的优势,可以从底层架构上解决后摩尔定律时代芯片的性能和能耗问题。”
因此,存算一体架构可以把算力做的更大,其芯片算力天花板比传统冯·诺依曼架构更高;同时,大幅降低了数据传输的能量损耗,提升了能效比。
另外,还能得到更低的延时,存储和计算单元之间数据搬运的减少,大幅缩短了系统响应时间。
更重要的是,用存算一体架构做大算力AI芯片另一大优势在于成本控制。不依赖于GDDR或HBM,存算一体芯片的成本能够相应的降低50%~70%。
尤其在现代大数据和大规模并行的应用场景中,存算一体架构非常适用。
目前,国内外很多企业纷纷展开存算一体技术的研发,其中包括英特尔、IBM、华为、三星、阿里巴巴、SK海力士、美光、台积电等一众知名公司,几乎都在积极布局近存计算领域。
据不完全统计,A股市场中涉及存算一体技术的公司,包括东芯股份、恒烁股份、罗普特、首都在线、长电科技、澜起科技和润欣科技等。
同时,千芯科技、亿铸科技、知存科技、苹芯科技、九天睿芯等十余家初创公司都采用存算一体架构,但各家方向略有不同。
亿铸科技选择了专注AI大算力,目前,亿铸科技首次流片已回片,并成功点亮首颗面向数据中心、云计算、自动驾驶等场景的人工智能(AI)算力芯片,具有大算力、低功耗、不依赖先进制程等优势,可满足大模型的算力及功耗需求。
亿铸科技表示,公司可实现“基于成熟工艺制程,单卡突破P级算力”的极强性能与极高能效比,远超英伟达基于5nm工艺制程的H100系列能效比。
千芯科技为例目前已拥有面向数据中心的大算力计算板卡和计算IP核,以及多并发实例核心技术。
其可支持ARM核心Stacking,具备轻量GPU技术,可基于SRAM/RRAM/MARM存储单元,可为客户提供灵活易用的AI推理计算加速及一站式解决方案。
通过千芯科技自研存算一体技术,可提供能效比超过10-100TOPS/W,优于其他类型AI芯片 10-40倍的吞吐量支持。
目前针对端侧的可穿戴等小设备,对算力的要求远低于智能驾驶和云计算设备,但对成本、功耗、时延、开发难度很敏感。
端侧竞品众多,应用场景碎片化,面临成本与功效的难题。存算一体技术在端侧的竞争力影响约占30%。例如arm占30%,降噪或ISP占40%,AI加速能力只占30%。
针对云计算和边缘计算的大算力设备,是存算一体芯片的优势领域。存算一体在云和边缘的大算力领域的竞争力影响约占90%。
边缘端存算一体芯片在边缘端具有高算力、低功耗、高性价比的优势。
而针对智能驾驶、数据中心等大算力应用场景,在可靠性、算力方面有较高要求云计算市场玩家相对集中。各家有各家的算法和生态细节,芯片售价较高。
存算一体芯片以其高能效大算力优势有望另辟蹊径抢占云计算市场。
不过令人期待的是,大模型已然成为存算一体大算力芯片的核心应用场景,而它对算力能效和密度有强烈需求,这正是存算一体的优势所在。
全球范围内无论学术界还是工业界都开始对存算一体展开资源投入,但在大模型火起来之前,存算一体的研究还是相对零散的技术攻关。
为了面向大模型的部署,芯片从业者更需要对存算一体进行体系化布局,包括算法、框架、编译器、工具链、指令集、架构、电路等各个层次方面的协同设计,以形成全栈式的体系、工具链和生态链。
相信随着存算一体芯片技术的进一步落地应用,AI大模型必将获得新的性能飞跃,从而推动数智化时代的加速到来。
内容参考来源于:测控技术:存算一体技术是什么?发展史、优势、应用方向、主要介质;晓曦:「存算一体」能解决吗?
推荐阅读:
商务合作请加微信勾搭:
18948782064
请务必注明:
「姓名 + 公司 + 合作需求」