今天,ARM中国正式发布了“周易”Z2 AIPU,一颗针对深度学习而自主研发的创新性AI专用处理器(AI Processing Unit)。
它的单核算力最高可达4TOPS(每秒4万亿次计算),相比上代“周易”Z1 AIPU提升了一倍,同时可扩展至最多32个核心,从而能在单个SoC中实现128TOPS的强大算力。
2018年11月,ARM中国发布了名为“周易”的人工智能平台,“周易”Z1 AIPU也是ARM中国合资公司成立后第一款正式对外发布的本土研发IP产品。
该平台得到了很多中国客户的信赖,多家厂商等已经完成相关产品研发和流片,比如全志科技的R329 AI语音专用芯片。
“周易”Z2 AIPU延用了此前的架构,并在微架构上进行优化,芯片面积减少30%,运行部分神经网络模型时,相同算力配置下的性能提升可达100%,效率翻了一番。
内存子系统也进行了优化,并升级了高级带宽节省技术(ABST),除了上代已有的权重压缩(weight compression),还新增加了feature map压缩技术。
它提供三种配置,分别是:4TOPS算力的Z2-1104、2TOPS算力的Z2-1002、1TOPS算力的Z2-0901。目前,LAC版本开发已完成,所有配置的EAC版本将在年底前向中国客户提供。
“周易”Z2 AIPU主要面向中高端安防、智能座舱和ADAS、边缘服务器等应用场景,客户芯片预计2021年面世。
“周易”AIPU针对人工智能计算定义了一套新的适用于AI算法的指令集,通过指令驱动向量处理单元、固定AI算法处理单元,从而完成各种复杂网络的组合的操作,支持各种AI计算,并具有很好的安全性。
它既有完全的可编程性,同时又有固定AI算力单元的高效率性,构成了相对平衡的平台型AI解决方案,还有仿真器、编译器、调试器等全套开发工具,支持ARM NN、安卓NN等流行接口,TensorFlow、ONNX等主流AI框架,以及合作伙伴的自有OS、Runtime框架。