国产TPU化茧成蝶

集成电路IC 2024-09-17 18:40

英伟达凭借 GPU创造了辉煌业绩,却也腹背受敌,面临着来自谷歌TPU、苹果M系列等强劲竞争。其中,谷歌专门为加速机器学习应用中的矩阵运算而设计的一种定制化DSA (DomainSpecificArchitecture,领域特定架构)芯片——TPU(TensorProcessingUnit,张量处理单元),已经发展到第六代,成为了对标英伟达AI芯片的强力替代方案之一。

强强联袂,搭建坚实AI 计算底座

研发高性能 TPU 芯片“刹那® ”的 AI 服务器, 以及大规模 AI 计算集群系统“泰则® ”, 为项目搭建提供了坚实的AI 计 算底座。

与不足,降低成本。依托联通云“星罗 ”平台,实现多元异 构算力适配与服务编排,融合“通算+智算+超算 ”调度能力, 提供一体化算力服务,支持企业私有化部署与智能算力网络

据介绍,为打造为算力核心高地,合作双方通过构建智算中

心进一步强化了算力基础设施。其中,大亚湾核心算网调度 平台实现了算力资源的统一纳管与高效调度。该平台不仅整 合了国内外各类高性能算力资源,还能根据客户需求灵活分 配任务,确保算力资源的高效利用。例如,针对高校及科研 机构忙闲不均的算力需求,平台通过智能调度实现资源优化 配置,提升整体使用效率。

此外,作为算法调度核心, 中国联通推出的“星罗平台 ”集 成了大模型应用与评测功能,为客户提供一站式模型选择与 应用服务。客户可轻松上传自有模型进行训练推理,或利用 平台功能进行模型微调,实现从模型选择、感知到应用的全 程服务,极大地促进了算力与算法的深度融合与应用创新。

上述合作不仅代表了双方在技术层面的深度融合,同时也是 对未来AI 产业发展趋势的深刻洞察与精准把握。杨龚轶凡 表示:“双方的基础是各自的优势。”中昊芯英的优势在于芯 片设计、软件优化以及集群的软硬件栈构建,为 AI 算法提 供了坚实的硬件基础;而深圳联通则擅长云平台建设、物理 层面的突破、智算中心管理以及能耗控制,为 AI 算法的运 行提供了高效、可靠且可扩展的云端环境。“双方合作不仅 弥补了彼此的短板,还共同构建了高效、可靠的人工智能算 法基础设施资源平台,实现了资源的最优配置和效益的最大 化,”他说。

他补充道:“TPU 智算中心开启了商业化落地模式,具有里程 碑意义。此前, 中昊芯英已向多家模型公司销售 TPU,但非 共建单一优化平台。此次合作标志着双方共建最优算力平台 的新篇章。

国产TPU 应运而生

随着 AIGC(AI Generated Content,人工智能生成内容)时 代的全面到来,大模型训练、神经网络开发等前沿应用对算 力的需求呈现出了爆炸性的增长态势。事实上,在中国 AI 发展浪潮中, 自研芯片需求十分殷切。

早在 2018 年,杨龚轶凡依托谷歌 TPU 研发经验,归国创立 公司,专注人工智能(AI)TPU 芯片研发,聚焦于AIGC 需求, 专注于为超大规模AI 模型提供高性能AI 芯片与计算集群。

历经五年深耕,中昊芯英成功量产基于全自研 GPTPU 架构的 高性能 TPU 芯片,引领了技术革新。这一成就不仅彰显了中 国在AI 芯片领域的突破,也让中昊芯英在 2024 年荣获杭州 市准独角兽企业称号,进一步巩固了其行业领先地位。

近年来,伴随 TPU 架构AI 芯片的迅速发展,其高效的矩阵 运算能力已成为AI 大模型训练的关键推手,不断推动着AI 技术在各领域的深入应用与革新。随着技术迭代,TPU 芯片 性能持续提升,满足日益增长的算力需求,为 AI 产业的蓬勃发展奠定了坚实基础。

在国内,TPU 架构AI 芯片发展势头强劲,多家企业积极投入 研发,致力于提升芯片性能的突破与应用场景的拓展。随着 AI 技术的广泛应用和算力需求的激增,TPU 芯片以其高效、 低功耗的特点,在 AI 大模型训练、智能推理等领域展现出 巨大潜力,为推动国内AI 产业的快速发展赋能。

在杨龚轶凡看来,随着大模型的爆发,AI 正式迈入了一个崭新纪元。昔日被戏称为“人工智障”的AI,如今已蜕变为真正意义上的AI,其展现出的判断力令人瞠目。传统AI多局限于模式与物体识别,仅停留于“见过与否”的初级层面。而今,AI不仅能识别,更能进行复杂的逻辑推理,如规划从A楼5层至B楼2楼的最佳路径,展现出前所未有的智慧。

这一飞跃得益于大模型的崛起,它们如同智力的放大器,模 型规模与人类智力水平间似乎存在某种正相关关系,尽管这 尚属实验性结论,却已成为业界的共识。在此背景下,强大 的算力集群成为支撑高参数量模型运算的关键,将构建坚实 的计算底座,让 AI 在实际应用中展现出更为精湛的逻辑推 理与决策能力,预示着一个由AI 驱动的全新智能时代的到 来。

作为国内 TPU 架构AI 芯片核心技术的领航者, 中昊芯英凭

借其独特的“算力基础设施+生态合作+产业应用场景 ”三位 一体化策略,不仅为客户量身打造了能够引发生产模式深刻 变革的AI 创新技术方案,更有力地推动了AI 技术的工程化 落地与产业化进程。这一举措不仅彰显了中昊芯英在AI 芯 片领域的深厚积累与前瞻视野,更为整个行业的快速发展注 入了强劲动力。

杨龚轶凡表示,TPU 是一种全新的架构,复杂性不言而喻。

其首要挑战在于非线性优化计算方式,以提升模型运算效率, 这一过程既漫长又投资巨大。研发中,需通过模拟器模拟芯  片运行,以验证优化算法的实际效果,这一过程充满迭代与  试错,类似科研探索。

他指出,随着技术的发展,在相同制造工艺、芯片尺寸和能 耗条件下,TPU相较于传统GPU架构,其不可替代的优势在于专为AI深度学习定制。TPU舍弃了GPU的部分灵活性,如光线追踪等复杂计算,转而专注于优化深度学习中的非线性计算,性能可提升3到5倍,具有显著的性价比。“在AI领域,尤其是深度学习模型的训练和部署,性价比是决定模型能否广泛落地的关键因素,”他说。

TPU 的架构设计使其在处理深度学习模型时,无论是单线程 还是集群性能均表现出色,特别适用于大规模模型训练和推 理。其网络基础架构和网络形态专为深度学习数据流量特征设计,无向前兼容负担,进一步增强了AI 算法运行的性价 比。

他回顾道, 中昊芯英团队凭借在谷歌 TPU 及 Oracle-Sun 高 性能服务器级 GPU 的深厚经验,构建了模拟器与创意框架, 经过多轮优化验证架构,确认其能为算法带来 3-5 倍性能提 升后,才推进至芯片实现阶段。从设计到实现完整规划到成功实现量产,历经近 5 年才完成了第一代产品。

他坦言:“首代产品的研发,缺乏现实参照,全凭想象与探 索,导致量产风险很高。然而,正是这些挑战促使团队采用 最尖端工具、封装技术及生产制程,历经近 5 年的艰苦努力, 最终实现了产品的诞生。”

他强调,这一过程不仅是技术上的突破,更是对人类智慧与 生产工艺极限的挑战,凝聚了无数人的心血与汗水,展现了 系统化工程的浩大与艰辛。随着技术的不断迭代,未来的研 发之路虽仍充满未知与挑战,但团队已积累了宝贵的经验, 为后续产品的顺利推出奠定了坚实基础。“国内研发的自主 可控AI 芯片不仅能带动经济效益,还能带动社会效益,”他 说。

智算基建,绿色未来

在算力领域,智能算力和绿色算力可以说是两大支柱。智能 算力赋能AI 创新,基于 GPU 等芯片,支撑算法训练与运行, 提升科学计算效能。而绿色算力则关注计算能效与环保,衡 量单位碳排放的算力输出,推动节能减排,实现数字经济与 环境保护的双赢。

关于智能算力落地应用,杨龚轶凡表示,芯片与系统集成的 挑战尤为显著。随着芯片数量的激增,通信效率成为一大难 题。犹如千百人同室而语,协调难度骤增,背景噪音干扰严 重,信息传递效率急剧下降。如何设计高效的信息交换协议 与物理链路,以实现从千到万乃至十万级别核心间的顺畅交 流,成为亟待解决的技术瓶颈。

恰恰是 TPU 独特的片间互联能力展现出强大的可拓展性优 势。它能够轻松实现千片以上互连,形成数据网络,并支持 节点间的灵活交互与通信。这一特性使得 TPU 在构建大规模 集群时更为简便,谷歌第 6 代 TPU 已能内部连接 16000 个芯 片,无需依赖外部以太网,为万卡至百万卡级别的集群部署 奠定了坚实基础。

他说,软件栈与系统集群的复杂性亦不容忽视。产品设计完 成后,光通信的可靠性问题接踵而至,跳码、误码现象频发, 需要在软硬件层面综合施策,以确保系统稳定运行。

此外,物理层面的能耗、计算机房等限制也是不容忽视的挑 战,需进一步优化芯片设计与系统架构,以突破性能瓶颈。 对此,深圳联通副总经理赵桂标指出,随着智算中心单机密未来展望

在企业布局与市场需求合力推动下, 中昊芯英AI 高性能智  算中心运营方案日臻成熟,正成为产业升级转型的强劲引擎, 赋能算力时代新飞跃。项目成功启动对深圳联通与中昊芯英

中昊芯英则在华南树立AI 算力新标杆,推动国 AI 算力运营与产业升级迈向新高度。

“展望未来,深度学习稳固了AI 领域主导地位,TPU 则以其 深度优化特性,将持续增强AI 赛道竞争力,成为推动技术 发展的关键力量,”杨龚轶凡对此充满信心。

集成电路IC 想陪你一起,目睹这个充满变化的时代
评论
  • ARMv8-A是ARM公司为满足新需求而重新设计的一个架构,是近20年来ARM架构变动最大的一次。以下是对ARMv8-A的详细介绍: 1. 背景介绍    ARM公司最初并未涉足PC市场,其产品主要针对功耗敏感的移动设备。     随着技术的发展和市场需求的变化,ARM开始扩展到企业设备、服务器等领域,这要求其架构能够支持更大的内存和更复杂的计算任务。 2. 架构特点    ARMv8-A引入了Execution State(执行状
    丙丁先生 2025-01-12 10:30 461浏览
  • 数字隔离芯片是现代电气工程师在进行电路设计时所必须考虑的一种电子元件,主要用于保护低压控制电路中敏感电子设备的稳定运行与操作人员的人身安全。其不仅能隔离两个或多个高低压回路之间的电气联系,还能防止漏电流、共模噪声与浪涌等干扰信号的传播,有效增强电路间信号传输的抗干扰能力,同时提升电子系统的电磁兼容性与通信稳定性。容耦隔离芯片的典型应用原理图值得一提的是,在电子电路中引入隔离措施会带来传输延迟、功耗增加、成本增加与尺寸增加等问题,而数字隔离芯片的目标就是尽可能消除这些不利影响,同时满足安全法规的要
    华普微HOPERF 2025-01-15 09:48 42浏览
  • 食物浪费已成为全球亟待解决的严峻挑战,并对环境和经济造成了重大影响。最新统计数据显示,全球高达三分之一的粮食在生产过程中损失或被无谓浪费,这不仅导致了资源消耗,还加剧了温室气体排放,并带来了巨大经济损失。全球领先的光学解决方案供应商艾迈斯欧司朗(SIX:AMS)近日宣布,艾迈斯欧司朗基于AS7341多光谱传感器开发的创新应用来解决食物浪费这一全球性难题。其多光谱传感解决方案为农业与食品行业带来深远变革,该技术通过精确判定最佳收获时机,提升质量控制水平,并在整个供应链中有效减少浪费。 在2024
    艾迈斯欧司朗 2025-01-14 18:45 41浏览
  • 01. 什么是过程能力分析?过程能力研究利用生产过程中初始一批产品的数据,预测制造过程是否能够稳定地生产符合规格的产品。可以把它想象成一种预测。通过历史数据的分析,推断未来是否可以依赖该工艺持续生产高质量产品。客户可能会要求将过程能力研究作为生产件批准程序 (PPAP) 的一部分。这是为了确保制造过程能够持续稳定地生产合格的产品。02. 基本概念在定义制造过程时,目标是确保生产的零件符合上下规格限 (USL 和 LSL)。过程能力衡量制造过程能多大程度上稳定地生产符合规格的产品。核心概念很简单:
    优思学院 2025-01-12 15:43 510浏览
  • 随着通信技术的迅速发展,现代通信设备需要更高效、可靠且紧凑的解决方案来应对日益复杂的系统。中国自主研发和制造的国产接口芯片,正逐渐成为通信设备(从5G基站到工业通信模块)中的重要基石。这些芯片凭借卓越性能、成本效益及灵活性,满足了现代通信基础设施的多样化需求。 1. 接口芯片在通信设备中的关键作用接口芯片作为数据交互的桥梁,是通信设备中不可或缺的核心组件。它们在设备内的各种子系统之间实现无缝数据传输,支持高速数据交换、协议转换和信号调节等功能。无论是5G基站中的数据处理,还是物联网网关
    克里雅半导体科技 2025-01-10 16:20 442浏览
  • 随着数字化的不断推进,LED显示屏行业对4K、8K等超高清画质的需求日益提升。与此同时,Mini及Micro LED技术的日益成熟,推动了间距小于1.2 Pitch的Mini、Micro LED显示屏的快速发展。这类显示屏不仅画质卓越,而且尺寸适中,通常在110至1000英寸之间,非常适合应用于电影院、监控中心、大型会议、以及电影拍摄等多种室内场景。鉴于室内LED显示屏与用户距离较近,因此对于噪音控制、体积小型化、冗余备份能力及电气安全性的要求尤为严格。为满足这一市场需求,开关电源技术推出了专为
    晶台光耦 2025-01-13 10:42 492浏览
  • 新年伊始,又到了对去年做总结,对今年做展望的时刻 不知道你在2024年初立的Flag都实现了吗? 2025年对自己又有什么新的期待呢? 2024年注定是不平凡的一年, 一年里我测评了50余块开发板, 写出了很多科普文章, 从一个小小的工作室成长为科工公司。 展望2025年, 中国香河英茂科工, 会继续深耕于,具身机器人、飞行器、物联网等方面的研发, 我觉得,要向未来学习未来, 未来是什么? 是掌握在孩子们生活中的发现,和精历, 把最好的技术带给孩子,
    丙丁先生 2025-01-11 11:35 452浏览
  • PNT、GNSS、GPS均是卫星定位和导航相关领域中的常见缩写词,他们经常会被用到,且在很多情况下会被等同使用或替换使用。我们会把定位导航功能测试叫做PNT性能测试,也会叫做GNSS性能测试。我们会把定位导航终端叫做GNSS模块,也会叫做GPS模块。但是实际上他们之间是有一些重要的区别。伴随着技术发展与越发深入,我们有必要对这三个词汇做以清晰的区分。一、什么是GPS?GPS是Global Positioning System(全球定位系统)的缩写,它是美国建立的全球卫星定位导航系统,是GNSS概
    德思特测试测量 2025-01-13 15:42 480浏览
  •   在信号处理过程中,由于信号的时域截断会导致频谱扩展泄露现象。那么导致频谱泄露发生的根本原因是什么?又该采取什么样的改善方法。本文以ADC性能指标的测试场景为例,探讨了对ADC的输出结果进行非周期截断所带来的影响及问题总结。 两个点   为了更好的分析或处理信号,实际应用时需要从频域而非时域的角度观察原信号。但物理意义上只能直接获取信号的时域信息,为了得到信号的频域信息需要利用傅里叶变换这个工具计算出原信号的频谱函数。但对于计算机来说实现这种计算需要面对两个问题: 1.
    TIAN301 2025-01-14 14:15 103浏览
  • 流量传感器是实现对燃气、废气、生活用水、污水、冷却液、石油等各种流体流量精准计量的关键手段。但随着工业自动化、数字化、智能化与低碳化进程的不断加速,采用传统机械式检测方式的流量传感器已不能满足当代流体计量行业对于测量精度、测量范围、使用寿命与维护成本等方面的精细需求。流量传感器的应用场景(部分)超声波流量传感器,是一种利用超声波技术测量流体流量的新型传感器,其主要通过发射超声波信号并接收反射回来的信号,根据超声波在流体中传播的时间、幅度或相位变化等参数,间接计算流体的流量,具有非侵入式测量、高精
    华普微HOPERF 2025-01-13 14:18 474浏览
  • 根据Global Info Research(环洋市场咨询)项目团队最新调研,预计2030年全球无人机电池和电源产值达到2834百万美元,2024-2030年期间年复合增长率CAGR为10.1%。 无人机电池是为无人机提供动力并使其飞行的关键。无人机使用的电池类型因无人机的大小和型号而异。一些常见的无人机电池类型包括锂聚合物(LiPo)电池、锂离子电池和镍氢(NiMH)电池。锂聚合物电池是最常用的无人机电池类型,因为其能量密度高、设计轻巧。这些电池以输出功率大、飞行时间长而著称。不过,它们需要
    GIRtina 2025-01-13 10:49 173浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦