自研芯片梳理2024

集成电路IC 2024-07-03 12:06

国内自研



1.1 阿里巴巴


平头哥半导体有限公司 于 2018 年 9 月宣布成立,是阿里巴巴集团的全资半导体芯片业务主体。平头哥拥有端云一体全栈产品系列,涵盖数据中心芯片、IoT 芯片等,实现芯片端到端设计链路全覆盖。
2019 年 9 月 25 日的杭州云栖大会上,阿里巴巴第一颗自研芯片正式问世。含光 800 推理性能达到 78563IPS,比 2019 年业界最好的 AI 芯片性能高 4 倍;能效比 500IPS/W,是第二名的 3.3 倍。含光 800 性能的突破得益于软硬件的协同创新:硬件层面采用自研芯片架构,通过推理加速等技术有效解决芯片性能瓶颈问题;软件层面集成了达摩院先进算法,针对 CNN 及视觉类算法深度优化计算、存储密度,可实现大网络模型在一颗 NPU 上完成计算。

在 2021 年 10 月 19 日云栖大会上,平头哥发布旗下首颗 Arm 服务器芯片倚天 710。倚天 710 由平头哥自主设计研发,采用先进架构,具备高性能、高能效、高带宽等特点,性能业界领先。该芯片采用 2.5D 封装,分为两个 DIE,总计 600 亿晶体管。包含 128 个 Armv9 高性能 CPU 核,每个 CPU 核心配置 64KB 一级指令缓存,64KB 一级数据缓存,以及 1MB 二级缓存,片上集成 128MB 系统缓存。内存子系统配置 8 通道 DDR5,峰值总带宽达到 281GB/s ,1/0 子系统含 96 通道 Pcle5.0,双向理论总带宽达到 768GB/s。截至 2023 年,该芯片已在阿里云数据中心规模化部署,算力性价比提升超 30%,已服务数千家电商、短视频、在线教育等领域客户。

倚天 710

羽阵 600 芯片架构
同时在该会上发布的还有 RFID 电子标签芯片羽阵 600,这是一款面向物联网场景的感知芯片,它具备高读取灵敏度、全方位读取以及强环境适应性等特征,适用于智慧物流、智慧仓储、智慧零售、资产管理等场景。目前该芯片已在菜鸟物流场景规模化应用。
2022 年 11 月的国际物联网展上,平头哥发布面向万物互联场景的超高频 RFID 电子标签芯片羽阵 611 和羽阵 612。两款芯片性能、稳定性、一致性和环境适应性均达到业界领先水平,可满足商超零售、智慧物流、供应链、航空包裹跟踪、资产管理等复杂场景下的高识别率要求。羽阵 611 是一款单端口芯片,灵敏度达到业界领先的-24dBm,配合全自动阻抗调谐,适用于商超零售、智慧物流、供应链、航空包裹跟踪、资产管理等多种场景,大幅提升生产和盘点效率;羽阵 612:采用双端口全向天线设计,灵敏度达到-24dBm,具备更好的通用性,能够满足货物堆叠、遮挡等复杂场景的需求。

2023 年 11 月 1 日,在 2023 云栖大会上,阿里巴巴平头哥发布旗下首颗 SSD 主控芯片镇岳 510,该芯片为云计算场景深度定制,实现 4μs 超低时延,比业界主流降低 30%以上,误码率低至 10-18,比业内标杆领先一个数量级。镇岳 510 将率先在阿里云数据中心部署,可应用于 AI、在线交易、大数据分析、高性能数据库、软件定义存储等业务场景。镇岳 510 集成了多项创新技术,使用平头哥自研芯片架构,采用 RISC-V 架构玄铁 910 多核 CPU 系统,内置大量自研硬件加速模块,有效平衡性能与功耗;在内存和接口方面,支持业界最领先的 DDR5、PCIe 5.0 技术,大幅提升芯片的数据吞吐速率;在可靠性方面,通过自研 LDPC 纠错算法与介质电压预测算法,误码率比业内标杆领先 1 个数量级。此次镇岳 510 的问世,意味着平头哥的芯片产品家族从算力扩展到了存力领域,进一步为云计算行业提供高性价比的技术底座。

1.2 腾讯


2021 年 11 月 3 日,在位于武汉的腾讯数字生态大会上,腾讯宣布已在三款自研芯片上取得进展,分别是 AI 推理芯片“紫霄”、视频转码芯片“沧海”和智能网卡芯片“玄灵”。
紫霄 AI 推理芯片 最显著的特点是结合图片和视频处理、自然语言处理、搜索推荐等场景,通过采用 2.5D 封装技术合封 HBM2e 内存与 AI 核心,以及在芯片内部增加计算机视觉 CV 加速器和视频编解码加速器等创新措施,对芯片架构进行了优化,打破了制约芯片算力发挥的瓶颈点。
沧海转码芯片 在算法上完整实现了高精度运动搜索、全率失真优化、高效自适应量化等所有主流编码工具,并融合了腾讯云软件编码器码率控制等方面的领先技术;同时,沧海通过灵活的多核扩展架构、高性能编码流水线、层级化 Memory 布局等技术,也能够有效满足业务高吞吐、低时延和实时的要求。
玄灵智能网卡芯片 则定位于云主机的性能加速,结合 CVM/BM/容器等场景优化芯片架构,将原来运行在主 CPU 上的虚拟化、网络/存储 IO 等功能下移到芯片,实现了主 CPU 的 0 占用。

腾讯公司副总裁、云与智慧产业 COO 兼腾讯云总裁邱跃鹏表示,AI 推理芯片紫霄的性能相比业界提升 100%,2021 年已经流片成功并顺利点亮;视频转码芯片沧海的压缩率相比业界提升 30%以上;智能网卡芯片玄灵的性能相比业界产品提升 4 倍。之外,腾讯还将通过生态共建,与国内外芯片企业保持深度战略合作,把芯片的定制化能力和软件的定制化能力结合起来,获得最优的性能和最佳的性价比,确保给客户提供更多元化和更适配的选择。

腾讯在自研芯片领域的研发和应用正在不断加速:视频编解码芯片“沧海”,已经量产并投用数万片,并在云游戏、直点播等场景中,面向腾讯自研业务和公有云客户提供服务。2023 年 4 月,在莫斯科国立大学举办的 MSU 硬件视频编码比赛中,腾讯沧海芯片包揽了所参加的两个赛道 8 项评分的全部第一,遥遥领先于行业 GPU 等标品硬件。沧海芯片已在业务场景中投用数万片,服务腾讯自研业务及公有云客户。高性能网络芯片“玄灵”,采用自研的网络、存储、计算加速方案,实现主机 CPU 的“0”占用及高达 4 倍的性能提升,助力打造下一代高性能网络基础设施。自研 AI 推理芯片“紫霄”,已经量产并在多个头部业务落地,目前在腾讯会议实时字幕上已实现全量上线,单卡紫霄机器负载可达到 T4 的 4 倍,并将超时率从 0.005%降低至 0。


1.3 百度


在 2018 百度 AI 开发者大会上,百度面向开发者发布了中国首款云端全功能 AI 芯片“昆仑”,包含训练芯片“昆仑 818-300”和推理芯片“昆仑 818-100”。除了常用深度学习算法等云端需求,还能适配诸如自然语言处理、大规模语音识别、自动驾驶、大规模推荐等具体终端场景的计算需求。2019 年下半年芯片流片成功。截至目前,实现量产的百度昆仑 1 已在百度搜索引擎及云计算用户部署 2 万片。

2021 年 4 月,前身为百度智能芯片及架构部的昆仑芯(北京)科技有限公司完成独立融资,首轮估值约 130 亿元。公司团队在国内最早布局 AI 加速领域,深耕十余年,是一家在体系结构、芯片实现、软件系统和场景应用均有深厚积累的 AI 芯片企业。
2021 年百度世界大会上,百度宣布自主研发的第二代百度昆仑 AI 芯片——昆仑芯 2 实现量产,昆仑芯 2 采用 7nm 制程,搭载自研的第二代 XPU 架构,相比一代性能提升 2-3 倍,适用云、端、边等多场景,可应用于互联网、智慧城市、智慧工业等领域,还将赋能高性能计算机集群、生物计算、智能交通、自动驾驶等更广泛空间。值得一提的是,百度昆仑 AI 芯片针对语音、自然语言处理、图像等 AI 技术专门优化,支持飞桨等深度学习框架,使得 AI 模型计算效率更高、效果更好。

1.4 字节跳动


2023 年 8 月 22 日, 火山引擎视频云&AIGC 大会以“视象新生”为主题, 发布 了自研的视频编解码芯片。经验证, 此次大会发布的火山引擎自研视频编解码芯 片,其压缩效率相比行业主流硬件编码器提升 30%以上, 可应用于视频点播、直 播、图像压缩、 XR 等业务场景。与具备通用计算能力的 CPU 芯片相比,火山引 擎自研芯片仅支持视频编解码任务,因此能够在视频处理场景具备更高的计算密 度。一台芯片服务器的转码能力与百台 CPU 服务器相当。简单来说, 在 4K/8K 超 高清、高帧率场景中,相对软件编码,火山引擎这款视频编解码芯片能实现低延 时的高质量转码,针对观看人数比较小的中长尾直播,可以节省大量算力成本。用户端的感受则是更高质的画面和更低延时。
火山引擎硬件编码能力此前在世界编码器大赛 MSU 中夺得多项第一,达到 行业领先水平。此次自研视频编解码芯片的发布, 有望大幅提升 4K 超高清应用 场景的编码速度,保证较高的视频主客观质量,大幅降低 4K 编码计算成本,推 动更多 4K 应用的不断普及。
风险提示:自研芯片进展不及预期的风险。

国外AI自研芯片



2.1 微软


在微软 Ignite 2023 技术大会上,微软推出了两款自研的 AI 芯片:Microsoft Azure Maia 和 Azure Cobalt。Azure Maia 是一款 AI 加速器芯片,用于 OpenAI 模型、Bing、GitHub Copilot 和 ChatGPT 等 AI 工作负载的云端训练和推理。Azure Cobalt 是基于 Arm 架构的云原生芯片,优化了通用工作负载的性能、功率和成本效益。Maia 100 作为系列的第一代产品,拥有 1050 亿个晶体管,是采用 5nm 制程技术的最大芯片之一。
这些芯片预计将在明年初开始在微软数据中心投入使用,为 Microsoft Copilot 和 Azure OpenAI Service 等服务提供动力。


2.2 谷歌


谷歌在 2016 年 I/O 大会上发布了 TPU(Tensor Processing Unit),专门为机器学习和 Tensorflow 量身定做的芯片。随后,谷歌又发布了 TPU v2、TPU v3,并在 2021 年发布了 TPU v4,提供了千万亿次级的机器学习性能。
2023 年 12 月,作为 v4 TPU 的继任者, TPU v5p 发布。v5p 针对大规模训 练进行了优化, 并且是开发基础 LLM、扩散模型和生成式 AI  的领先平台。概括 来讲, v5p  可提供高达 v4  的性能的 2 倍,同时还能在 Pod  中容纳多出 2 倍 的 TPU(v4  中的最大切片是 6000 个,而 v4  中则为 3000 个),从而在 Pod  级 别实现高达 4 倍的性能。它还以更高的时钟频率(1.75Ghz  与 1.05Ghz)运行, 为大规模嵌入添加了 SparseCore,并将高带宽内存(HBM)容量提高至原来的 3 倍。
每个 TPU v5p Pod  由多达 8960 个芯片组成,使用最高带宽的芯片间连接 (每芯片 4800 Gbps)进行互连,确保快速传输速度和最佳性能。在 AI 性能方面, TPU v5p 能够提供 459 teraFLOPS(每秒可执行 459 万亿次浮点运算)的 bfloat16  (16 位浮点数格式)性能或 918 teraOPS(每秒可执行 918 万亿次整数运算)的 Int8(执行 8 位整数) 性能, 支持 95GB 的高带宽内存, 能够以 2.76 TB/s 的速度 传输数据。与 TPU v4 相比,新发布的 TPU v5p 具有两倍的 FLOPS(每秒浮点运算) 和三倍的高内存带宽提升,这在人工智能领域是令人惊叹的。
此外, 在模型训练方面, TPU v5p 在 LLM(大语言模型) 训练速度上显示出 2.8 倍的代际提升。Google 还挤出更多的计算能力,因为 TPU v5p“就每个 Pod 的 总可用 FLOP  而言,可扩展性比 TPU v4  高 4 倍”。


2.3 Meta


2023 年 5 月,Meta 发布其第一代基于 7nm 工艺的自研 AI 芯片 MTIA(MTIA v1),Meta 将该 AI 芯片称为 Meta Training and Inference Accelerator,简称 MTIA, 并将其描述为加速 AI 训练和推理工作负载的 AI 芯片“ 家族” 的一部分。MTIA 是 一种 ASIC ,一种将不同电路组合在一块基板上的芯片,允许对其进行编程以并 行执行一项或多项任务。MTIA v1 基于 7 纳米工艺,可以从其内部 128 MB  内 存扩展到高达 128 GB。Meta 表示, MTIA 可以专门用于处理与 AI  推荐系统相关 的工作,其计算性能和处理效率都胜过 CPU。另外,在 Meta 设计的基准测试 中, MTIA 处理“低复杂性” ”和“ 中等复杂度” 的 AI 模型也比 GPU 更高效。
除了 MTIA ,Meta 还在开发另一种芯片来处理特定类型的计算工作负载。这 款芯片被称为 Meta 可扩展视频处理器(Meta Scalable Video Processor), 简称 MSVP,它是 Meta 内部开发的第一个专用集成电路(ASIC)解决方案, 专为应对 视频点播和流播的处理需求而设计。Meta 表示, 该公司的计划是最终将大部分 “稳定而成熟” 的视频处理工作负载转移给 MSVP,只对需要特定定制和“ 显著”提 高质量的工作负载使用软件视频编码。Meta 还称,通过智能去噪和图像增强等 预处理方法,以及伪影去除和超分辨率等后期处理方法, MSVP 持续助力提高视 频质量。

集成电路IC 想陪你一起,目睹这个充满变化的时代
评论
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 41浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 37浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 51浏览
  • 学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&
    youyeye 2024-11-30 14:30 70浏览
  • 《高速PCB设计经验规则应用实践》+PCB绘制学习与验证读书首先看目录,我感兴趣的是这一节;作者在书中列举了一条经典规则,然后进行详细分析,通过公式推导图表列举说明了传统的这一规则是受到电容加工特点影响的,在使用了MLCC陶瓷电容后这一条规则已经不再实用了。图书还列举了高速PCB设计需要的专业工具和仿真软件,当然由于篇幅所限,只是介绍了一点点设计步骤;我最感兴趣的部分还是元件布局的经验规则,在这里列举如下:在这里,演示一下,我根据书本知识进行电机驱动的布局:这也算知行合一吧。对于布局书中有一句:
    wuyu2009 2024-11-30 20:30 106浏览
  • 国产光耦合器正以其创新性和多样性引领行业发展。凭借强大的研发能力,国内制造商推出了适应汽车、电信等领域独特需求的专业化光耦合器,为各行业的技术进步提供了重要支持。本文将重点探讨国产光耦合器的技术创新与产品多样性,以及它们在推动产业升级中的重要作用。国产光耦合器创新的作用满足现代需求的创新模式新设计正在满足不断变化的市场需求。例如,高速光耦合器满足了电信和数据处理系统中快速信号传输的需求。同时,栅极驱动光耦合器支持电动汽车(EV)和工业电机驱动器等大功率应用中的精确高效控制。先进材料和设计将碳化硅
    克里雅半导体科技 2024-11-29 16:18 168浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 70浏览
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 83浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 102浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 98浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 65浏览
  • 艾迈斯欧司朗全新“样片申请”小程序,逾160种LED、传感器、多芯片组合等产品样片一触即达。轻松3步完成申请,境内免费包邮到家!本期热荐性能显著提升的OSLON® Optimal,GF CSSRML.24ams OSRAM 基于最新芯片技术推出全新LED产品OSLON® Optimal系列,实现了显著的性能升级。该系列提供五种不同颜色的光源选项,包括Hyper Red(660 nm,PDN)、Red(640 nm)、Deep Blue(450 nm,PDN)、Far Red(730 nm)及Ho
    艾迈斯欧司朗 2024-11-29 16:55 167浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 66浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 86浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦