FujitsuA64FX 处理器采 用 64 位 ARMv8.2A 指令集,同时支持以富士通为主导、与 ARM联合开发的可伸缩向量扩展SVE(Scalable Vector Extension)指令集,SVE支持3种128/256/512单指令多数据流 SIMD执 行 宽 度 的 自 动 向 量 化 处 理。FujitsuA64FX运算核心架构如图5所示,包含2 条 512位宽的向量 SIMD 流水线,共享 64KB 指令 L1I Cache和64KB数据 L1DCache,每条向量流水线集成8/16/32个双/单/半精度浮点乘加部件,并支持8/16/32/64 个 64/32/16/8 位 整 数 乘 加 操 作。为加速AI运算,FujitsuA64FX 处理器还支持16位和8位整数的点积运算。
FujitsuA64FX每拍可以发射 2 条向量浮点乘加指令,并行在2条 SIMD 流水线上执行,因此单个核心每拍执行双精度浮点运算数32个,最高工作频 率 为 2.2 GHz,单 核 心 峰 值 性 能 为 70.4GFlops,全片集成48个计算核心,单处理器双精度浮点峰值性能为3.3792TFlops。
综上所述,FujitsuA64FX 采用超标量多发射和SIMD 并行方式提升性能,同时 SVE(Scalable Vector Extension)指 令 支 持 128/256/512 位SIMD自动向量化处理,扩展应用适用性;支持半精度和16/8位整数运算,并支持低精度点积运算,以加速 AI处理。
算力铸就大模型:超算、智算及数据中心行业报告(2023)
《2023年高性能计算研讨合集(上)》
《2023年高性能计算研讨合集(下)》
《AI基础知识深度专题详解合集》
Hyperion Research:SC22 HPC Market Update(2022.11)
Hyperion Research:ISC22 Market Update(2022.5)
Intersect360全球HPC-AI市场报告(2022—2026)
Intersect360 AMD CPU和GPU调研白皮书
《AIGC行业深度报告系列合集》
AIGC行业深度报告(9):华为算力编年史
8、AIGC行业报告(8):谁是国产英伟达
7、AIGC行业报告(7):ChatGPT三大主线,AI算力需求井喷
6、AIGC行业报告(6):ChatGPT存算一体,算力的下一极 5、AIGC行业报告(5):ChatGPT加速计算服务器时代到来
1、AIGC行业报告(1):ChatGPT开启AI新纪元(华西证券) 2、AIGC行业报告(2):ChatGPT重新定义搜索入口 3、AIGC行业报告(3):ChatGPT打响AI算力“军备战” 4、AIGC行业报告(4):ChatGPT百度文心一言畅想
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。