继成功推出第一代训练芯片“邃思1.0”和“云燧T10/T11”人工智能训练加速卡后,2021年7月,燧原科技全新一代“邃思2.0”和“云燧T20/T21”芯片面世,多项性能指标刷新了中国芯片的记录,也让燧原科技成为了国内首家发布第二代人工智能训练产品组合的公司。

作为一家专注于人工智能领域云端算力的高科技公司,燧原科技自2018年成立以来,已累计获得32亿人民币投资。经过几年的发展,目前,燧原科技员工人数超过五百人,研发人员接近90%,拥有52项专利(包括45项发明专利),还有近30项专利正在申请。

在公司成立18个月后,燧原科技成功推出第一代训练芯片“邃思1.0”和“云燧T10/T11”人工智能训练加速卡。两年后,2021年7月,全新一代“邃思2.0”和“云燧T20/T21”芯片面世,多项性能指标刷新了中国芯片的记录,也让燧原科技成为了国内首家发布第二代人工智能训练产品组合的公司。

中国计算芯片的多项纪录被刷新

新发布的邃思2.0芯片采用2.5D封装,整合了9颗芯片,整体封装尺寸达到了惊人的57.6mm×57.6mm。燧原科技创始人兼COO张亚林在发布会上强调称,这是目前中国最大的计算芯片,即便与竞争对手的旗舰产品相比也毫不逊色。

邃思2.0进行了大规模的架构升级,采用了新一代全自研的GCU-CARA全域计算架构,针对人工智能计算的特性进行深度优化,夯实了支持通用异构计算的基础;支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8,并成为中国首款支持单精度张量TF32数据精度的人工智能芯片。单精度FP32峰值算力达到40 TFLOPS,单精度张量TF32峰值算力达到160 TFLOPS,以上数据均为国内第一。

张亚林指出,TF32几乎可以应用在大部分AI场景中,包括机器视觉、语音、自然元翻译、强化学习等,都具有应用TF32的潜力。从行业趋势来看,TF32很可能会成为用于训练业务的最重要的数据精度类型之一。

值得关注的是,邃思2.0芯片上共搭载了4颗HBM2E片上存储芯片,高配支持64 GB内存,带宽达1.8 TB/s,这也是中国第一颗支持HBM2E和单芯片64 GB内存的产品。

“燧原的每一代产品必须比前一代在‘平均业务’中将每瓦性能提升三倍以上。“这是张亚林代表燧原科技公布的“燧原产品定理”,基于上述思路,燧原还同时发布了公司训练计算产品和推理计算产品路线图。根据规划,下一代训练芯片将于2023年面世,每瓦性能会比邃思2.0提升两倍。届时还会有推理芯片同步亮相,其性能也将获得大幅提升。

燧原科技第二代通用人工智能训练加速卡“云燧T20”是一个全高全长的PCIE板卡,在FP 32/TF 32下的峰值算力可以达到134.4T(单精度张量)和33.6T(单精度)。在BF16/FP16下的峰值算力则能做到134.4T,INT8的峰值算力更是达到了268.8T,可以与友商旗舰一较高下。云燧T21采用OAM模组模式设计,在多个模式下拥有杰出的表现。

除了硬件性能的提升,为了降低开发门槛,燧原科技还在互联与软件上加大了投入。

GCU-LARE全域互联技术即为代表之一,作为一项专为人工智能训练集群研发的互联技术,GCU-LARE能提供双向300GB/s互联带宽,支持数千张云燧CloudBlazer加速卡互联,实现优异的线性加速比。

与此同时,燧原自主知识产权的计算及编程平台驭算TopsRider也获得了升级。通过软硬件协同架构设计,全新的驭算TopsRider能够充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,能支持主流深度学习框架下的各类模型训练;再通过利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。

基于训练加速卡,燧原还推出了超大规模智算集群,被命名为“云燧智算集群(CloudBlazer Matrix 2.0)”。该智算集群包含了8192张云燧训练卡,可实现最高1.3E的算力,代表着燧原“正使用集群化产品登上中国智能计算和新基建算力舞台”,张亚林说。

星星之火,可以燎原

在工业4.0“智造”时代,人工智能是关键动力。但因为摩尔定律放缓,产业必须加快在异构计算领域的投入,这就意味着以芯片为核心的算力将成为工业4.0兵家必争之地。基于上述考虑,燧原科技推出了异构计算生态——“燎原”计划。

燧原科技CEO赵立东表示,“燎原”计划有三大特征和目标,第一,一定要原始创新,自己从头打造基础;第二,一定要建立标准化生态,第三,以开放的姿态共建生态。三个目标则分别是以人工智能为起点,构建通用异构计算生态,构建标准化的技术体系,以及共建完整生态服务数字中国。而“燎原”计划的内涵也包括繁荣开放的开发者生态、健康互利的产业生态和持续创新的教科研生态。

不仅如此,燧原科技正在与杭州之江实验室、上海交通大学、西安交通大学等一系列产学研伙伴合作,这些合作都依附于燧原科技已有产品进行合作,通过现有的产品不断去打磨生态。

张亚林指出,2020年燧原科技公布第一个客户落地开始,就一直在坚持三条业务线:泛互联网、传统行业和新基建,在这三个业务线上不断发力,构筑整个业务群,同时也得到了非常多的客户反馈,这在反馈侧面印证了客户对燧原科技的重视度,也助力催生了第二代产品。所以,第二代产品是在看到一些客户的需求后推出的。燧原整个公司推出的产品与节奏,第一代和第二代间距是一年半,快于行业内的标杆速度。 

本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
Rapidus将与博通合作分享其2纳米制程芯片原型,并推动芯片生产的外包。一旦博通确认了芯片性能,Rapidus将能够向博通的客户提供芯片。
尽管Imagination在RISC-V领域取得了一定的成就,但公司似乎认为继续投入资源于RISC-V处理器核心的开发并不符合其长期战略目标。Imagination决定终止其基于RISC-V指令集架构的GPGPU内核的研发工作,并将重心转向其擅长的GPU和AI领域......
Ken Glueck认为,美国2800亿美元的芯片法案所取得的成就,将被出口管制框架夺走,“因为在一项IFR中,它成功地将美国公司的全球芯片市场缩小了80%,并将其交给了中国。”
Intel在CES上发布了面向笔记本的酷睿Ultra 200H, 200HX, 200U系列,基本完善了这一代酷睿Ultra处理器产品线...这也是面向高性能笔记本的酷睿Ultra二代处理器初次亮相。
英特尔临时联席CEO Michelle Johnston还表示,“英特尔会在2025年及以后继续增强AI PC产品组合,向客户提供领先的英特尔18A产品样品,并在2025年下半年量产”。
NVIDIA刚才在CES上发布了GeForce RTX 50系显卡,据说这一代的5070就能达到上代4090的性能水平...
• 目前,iPhone在翻新市场中是最热门的商品,并将长期主导着翻新机的平均销售价格。 • 全球翻新机市场持续向高端化发展,其平均销售价格(ASP)现已超过新手机。 • 新兴市场是增长的最大驱动力,消费者对高端旗舰产品有着迫切需求。 • 由于市场固化和供应链的一些问题限制推高中国、东南亚和非洲等大市场的价格。 • 2024年,这些翻新机平均销售价格将首次超过新手机。
从全球厂商竞争来看,三季度凭借多个新品发布,石头科技市场份额提升至16.4%,连续两季度排名全球第一……
2025年1月9日,美国 拉斯维加斯丨全球瞩目的国际消费电子产品展(CES 2025)盛大开幕,来自世界各地的科技巨头与创新企业齐聚一堂共同展示最新的科技成果。中国高性能微控制器产品及嵌入式解决方案提供商上海先楫半导体科技有限公司(先楫半导体,HPMicro)闪耀登场,发布了专注于机器人运动与控制的高性能MCU产品——HPM6E8Y系列,为火热的机器人市场注入新的活力。
最新Wi-Fi HaLow片上系统(SoC)为物联网的性能、效率、安全性与多功能性设立新标准,配套USB网关,可轻松实现Wi-Fi HaLow在新建及现有Wi-Fi基础设施中的快速稳健集成
今天推荐的视频介绍了单片机(MCU)和数字信号控制器(DSC)之间的差异、Microchip DSC的单核和双核架构、DSC的应用示例以及可将您的设计推向市场的开发资源。更多更全视频尽在Microch
小米15 Ultra目前已经三证齐全,静待2月份发布了,大概率会是2025年第一款超大杯旗舰。博主定焦数码最新公布了一张该机的渲染图,后摄区域是根据内部结构绘制,展示了全新的排列方式。四摄呈L形排列,
1月7日,据韩媒 sisajournal-e 消息,三星计划 2025 年下半年推出三折叠手机,采用 G 形双内折设计,完全展开后尺寸为 12.4 英寸。据称,有别于华为的 S 形折叠屏方式(In&O
CES 2025,黑芝麻智能携旗下华山系列、武当系列芯片参展,并带来与产业链伙伴的合作新进展。1月8日,黑芝麻智能与汽车嵌入式互联软件产品和解决方案供应商Elektrobit联合发布了基于武当系列C1
当地时间2025年1月7日,全球备受期待的技术盛宴——国际消费电子展(CES 2025)在美国拉斯维加斯盛大开幕。作为显示领域的领军企业,天马携一系列前沿创新技术和最新智能座舱解决方案惊艳登场,带来手
亚化咨询重磅推出《中国半导体材料、晶圆厂、封测项目及设备中标、进口数据全家桶》。本数据库月度更新,以EXCEL表格的形式每月发送到客户指定邮箱。中国大陆半导体大硅片项目表(月度更新)中国大陆再生晶圆项
    大联大控股宣布,其旗下世平推出基于安森美(onsemi)NCP5156x芯片的双通道隔离驱动IC评估板方案。    图
近日,闻泰科技在一场电话会议中阐述了其出售ODM(原始设计制造)业务的战略考量。           闻泰科技表示,基于地缘政治环境变化,考虑到 ODM 业务稳健发展和员工未来发展利益最大化,公司对战
近日,由工业和信息化部、国家广播电视总局、国家知识产权局联合评选的“2024年度视听系统典型案例”公示名单正式发布。聚飞光电自主研发的大尺寸 Micro LED 超高清显示屏系统经专家评审及公示程序,
据彭博社报道,软银集团及其控股子公司 Arm 正在探讨收购 Ampere Computing 的可能。 Ampere Computing 是甲骨文支持的半导体设计公司,致力于塑造云计算的未来,并推出了