半导体周要闻
2023.11.13-2023.11.17
1. 长江存储准备下一代晶栈4.0架构:新款128/232层3D NAND闪存研发中
据TomsHardware报道,已经有文件显示,长江存储正在准备下一代晶栈4.0(Xtacking 4.0)架构,至少会用于两款产品,分别是名为X4-9070的232层3D TLC NAND闪存,以及名为X4-9060的128层3D TLC NAND闪存。
长江存储在2022年闪存峰会(FMS)上,发布了基于晶栈3.0(Xtacking 3.0)架构的第四代3D TLC NAND闪存芯片,名为X3-9070,随后大量应用于各大品牌的SSD上。之后长江存储又扩大了新架构的应用范围,推出了128层3D TLC NAND闪存和232层3D QLC NAND闪存产品,这些芯片更便宜、更容易制造。
2. 被指对公司不够坦诚,OpenAI董事会宣布解雇首席执行官Sam Altman
当地时间周五晚间,OpenAI董事会解雇了首席执行官萨姆·奥尔特曼(Sam Altman)。
该公司表示,OpenAI首席技术官Mira Murati将担任临时首席执行官,并补充说将正式物色永久首席执行官。
3. 日本与法国将合作开发1nm制程半导体
根据最新消息,日本半导体公司Rapidus、东京大学将与法国半导体研究机构Leti合作,共同开发电路线宽为1nm等级的新一代半导体设计的基础技术,此外2024年将正式开展人才交流和技术共享。Rapidus将利用Leti的技术,构建1nm芯片产品的供应体制。
双方的目标是确立设计开发线宽为1.4nm~1nm半导体所需的基础技术。这一节点需要与传统不同的晶体管结构,Leti在该领域的成膜等关键技术上占优。
位于日本北海道的Rapidus正在与比利时半导体开发机构IMEC、美国IBM合作,目标是2027年量产2nm制程晶圆。关于下一代1nm产品,预计将在2030年之后普及,能效、性能比2nm节点高10%~20%。Rapidus不仅与Leti合作,在1nm技术方面也考虑寻求与IBM合作。
2023年年初,Rapidus已派遣数百名工程师前往IBM学习最新2nm技术,IMEC公司近期也考虑在日本设立办事处。
4. 算力技术未来发展路径概述2023
以 ChatGPT 为代表的大模型需要巨大算力支撑。大模型对算力的需求增速远大于摩尔定律增速。
自微处理器诞生以来,算力的增长按摩尔定律发展,即通过增加单位芯片面积的门电路数量来增加处理器算力,降低处理器成本和功耗。但近年来这条路已经遇到越来越大的困难,通过持续缩微来提升性能已经无法满足应用的需求。
More Moore:继续追求更高的晶体管单位密度。比如晶体管工艺结构从鳍式结构FinFET 到环形结构 GAA,以及纳米片、纳米线等技术手段有望将晶体管密度继续提升 5 倍以上。但这条路在成本、功耗方面的挑战非常大。
Beyond CMOS:放弃 CMOS 工艺,寻求新材料和新工艺。比如使用碳纳米管、二硫化钼等二维材料的新型制备工艺,和利用量子隧穿效应的新型机制晶体管。但这条路径的不确定性较大,离成熟还需要很长时间。
存算一体技术就是从应用需求出发,进行计算和存储的最优化联合设计,减少数据的无效搬移、增加数据的读写带宽、提升计算的能效比,从而突破现有内存墙和功耗墙的限制。
5. 国内首创高交会上国产14nm Chiplet大模型推理芯片问世
云天励飞迄今算力最强的旗舰AI芯片SoC,内置自研新一代神经网络处理器NNP400T,通过D2D高速互联Chiplet技术、C2CMesh互联架构实现算力扩展,能够支持千亿级参数大模型,落地于边缘设备和边缘服务器。
制程工艺是国产,基板是国产,D2D Chiplet先进封装架构是国产,RISC-V CPU IP、GPU IP是国产,云天励飞自研的NNP更是国产。
DeepEdge10芯片的研发始于2020年。得益于其算法部门在前沿AI算法方面的敏锐认知,云天励飞芯片团队预见到未来视觉算法会基于Transformer和注意力机制,因此对大模型计算方式进行了深度解构,着重考虑到如何通过灵活的架构设计来实现高效支持。
Edge10有4大技术加持:1)主控级SoC;2)新一代神经网络处理器,高效支持Transformer;3)D2D Chiplet架构,实现算力灵活扩展;4)C2CMesh互联扩展,支持千亿级参数大模型。
单芯片算力最高48TOPS,
加速卡能跑70亿参数大模型
通过上述架构创新,云天励飞Edge10系列芯片有三种规格:Edge10C(8核CPU)、Edge10标准版(10核CPU)、Edge10Max(40核CPU),峰值算力分别为8TOPS、12TOPS、48TOPS,总体性能比上一代芯片高出20倍;统一内存最高32GB,内存带宽最高120GB/s。
其中,Edge10C和Edge10标准版适用于边缘计算领域;Edge10Max适用于边缘CV大模型,单芯片能跑SAM视觉大模型。
6. 嘉芯半导体周伟芳:U型周期正是半导体设备企业潜心修炼良机
嘉芯半导体董事长兼CEO周伟芳在接受集微网采访时表示,仅从α设备量产以后,进入客户工厂现场验证,就需要至少6个月以上时间进行数据搜集、反馈的过程,通过验证以后客户才会下单,整个周期通常超过一年。“假如是晶圆厂在产能扩张的黄金期,绝大部分产能和人力都要去服务量产线,根本没有时间去验证新机台,因此整个半导体行业的周期和设备企业的发展周期是反向的,也是设备企业成长的绝佳机会,嘉芯半导体将紧握当前这个设备企业成长的时间窗口。”
她强调,首先,聚焦嘉芯半导体现已覆盖的薄膜沉积、刻蚀、快速热处理等主制程设备及尾气处理等支撑制程设备,不断完善补强,打造一个完整的一站式前道设备解决方案,目标覆盖领域占晶圆厂整厂设备价值量的50%以上。
随着海外加大对国内半导体产业影响,倒逼上游环节的国产化加速。然而从一个国际供应链体系下的生产线逐渐转到部分国产再到全部国产,这个过程可能很痛苦,并且可能长达5年以上。周伟芳强调,尽管痛苦,但是这是一个终局思路,越来越多有前瞻性的、有战略眼光和产业抱负的Fab,开始加大提升国产设备的使用比例。首先解决“买不到”的问题,接下来“好不好用”的问题再逐步解决。
周伟芳提到,如今向晶圆厂客户推介设备时,他们一是在意设备是不是国产的,二是在意设备中的核心零部件是不是国产的,尤其是例如像压力计、流量计、E-chuck等部件目前国产化比例几乎为0。当前的国产化提升,不仅是设备的提升,也在倒逼最难涉足的零部件、材料等领域同步实现国产替代,需要整个产业链共同努力。
7. 产业观察巨头争抢AI芯片中国市场至关重要
随着AI大模型成为新型智算基础设施,行业巨头在AI芯片赛道上打得愈发火热。近日,除了微软首次推出两款自研芯片,英伟达也发布了堪称“地表最强”AI芯片H200,性能相较前代H100提升60%到90%。时间往前推移,英特尔在其On技术创新大会上首次公开了三代AI芯片路线图,计划明年将推出算力提升达两倍的Gaudi 3。而AMD此前则重磅发布了其最新AI芯片GPU MI300X,更大的HBM内存和带宽直接叫板英伟达的H100。
英伟达对H200的升级幅度可谓“挤牙膏”,即不卷频率卷内存和带宽。尽管其日前声称将从每两年发布一次新架构转向每一年发布一次,但H200依旧采用了Hopper架构,因此浮点运算速率基本与H100相同。但在内存容量和带宽方面,H200以每秒4.8 TB的速度提供141GB的HBM3e内存,与H100相比容量提升76%、带宽提升了43%。基于此,H200在Llama 2(700亿参数的LLM)上的推理速度比H100快了一倍。
在AI芯片上逐渐被英伟达、AMD甩开差距后,英特尔近年来在相关战略布局愈发“激进”,颇显示出“三分天下必有其一”之志。9月,英特尔在其On技术创新大会上首次亮出三代AI芯片路线图,宣布采用5nm制程的AI芯片Gaudi 3将于明年推出,算力将会是前一代Gaudi 2的两倍,网络带宽、HBM容量则会是Gaudi 2的1.5倍。而其下一代Max系列GPU芯片Falcon Shores,HBM3规格将达到288GB,支持8bit浮点运算。
毫无疑问,在巨头争抢AI芯片形势下,中国将成为最关键的市场之一。数据显示,2022年我国AI芯片市场规模达到850.2亿元,同比增长99.2%,预计2025年市场规模将翻倍增长至1780亿元。单从体量上看,任何芯片企业都不想错过如此庞大的增量市场,但这却遭遇了国际地缘的强制“割裂”。根据美国最新的芯片出口管制条款,只要芯片总算力大于或等于4800TOPS,或芯片总算力低于4800 TOPS但性能密度达到一定阈值都将受到管制。
但英伟达并没有打算放弃中国AI芯片市场,计划再推出三款针对中国市场的“特供”AI芯片,即HGX H20、L20 PCle、L2 PCle,其中HGX H20就是“缩水版”的H100。据悉,H20计算密度被大幅削弱以符合出口新规,比H100芯片下降80%左右,但内存带宽等方面保持较高水准,因而在业内仍然是一个具备竞争力的选项。
除了英伟达,英特尔也曾于7月推出针对中国市场的定制版AI处理器Gaudi2,具备96GB HBM2E内存容量和2.1TB/秒的总内存带宽等,可用于加速AI训练及推理。而在美国更新芯片出口管制条款后,据称英特尔也在计划推出Gaudi 2改良版。此外,AMD也曾表示将调整其相关AI芯片的参数规格,以在合规情况下向中国市场出货。
从多重角度来看,英伟达、AMD和英特尔都绝不甘心缺席中国AI芯片市场。首先,数据显示,这三家芯片企业在中国市场的营收占比落在达20%-30%的区间 。
可见对于英伟达、AMD和英特尔等美国芯片企业长远发展而言,在中国市场的经营正愈发显得至关重要,否则将在历史潮流中逐渐江河日下。一定程度上,其针对中国市场推出的“特供版”、“定制版”已成为特殊的时代符号
8. 芯原股份戴伟民:Chiplet将在AIGC与智慧驾驶领域率先落地
近两年,芯片行业的三大传统设计要素“PPA(性能、功耗与面积)”又新增了一项考量C——(Cost,成本)。不过,随着工艺不断向下演进,PPAC每项数据之间的矛盾正快速激化,例如性能与功耗愈发难以兼顾,二者又导致成本陡升等等。
戴伟民在演讲中引用的研究机构IBS的数据指出,当前半导体行业和AI相关的种类只占20%左右,而到2030年时全行业将有超过70%的半导体产品参与到AI应用中。
戴伟民看来,未来社会实际并不需要如此多的大模型,大量通用大模型带来的重复计算将导致高昂的经济成本,与绿色计算和可持续发展趋势相违背。通过训练和推理之间的微调,基于通用大模型演变出的医疗、金融、政务等垂直领域大模型(垂域大模型)才是大势所趋。
戴伟民将未来的AIGC平台生态栈形象地比作一棵树,树根是算力,通用大模型是树干,通过行业数据微调和部署的垂域大模型为树枝,千亿、万亿级别的AI相关应用是最上层的树叶。
众所周知,Chiplet技术的核心是IP芯片化,而芯原是中国大陆排名第一、全球排名第七的半导体IP授权服务提供商,且在全球排名前七的企业中,芯原的IP 种类排名前二。针对AIGC主要应用,戴伟民在演讲中重点介绍了芯原已广泛部署在各个高端及主流汽车中的GPU IP及其衍生发展而来的GPGPU、已在全球68家企业的120余款人工智能芯片中获得采用的NPU IP,以及已被全球前20大云平台解决方案提供商中的12家所采用的VPU IP等。
回归到Chiplet技术本身,芯原当前对该领域的布局包括IP芯片化、芯片平台化和平台生态化。在接受集微网采访时,戴伟民解释称,IP芯片化指的是将传统意义上的IP转变成实实在在的Chiplet,一方面便于IP交易后的数量稽查,另一方面,已经生产出来的Chiplet也能够为客户降低成本,实现共赢。另外,由于近年来外部环境变幻莫测,在健康水位内储存一部分芯片化的IP能够在一定程度上帮助公司抵御供应链风险
最后,在被问及Chiplet技术的未来走向时,戴伟民提出,面板级封装有望超越当前主流的晶圆级封装,成为Chiplet技术的最佳封装方案。不过,目前在材料、封装技术等方面还有诸多问题需要解决。
9. 应用材料上季度营收67.2亿美元,同比持平 全财年营收同比增长3%
2023财年,Applied创造了创纪录的265.2亿美元营收,同比增长3%。按美国通用会计准则,该公司录得46.7%的毛利率,营业利润为76.5亿美元,占净销售额的28.9%,每股收益录得8.11美元。按非公认会计原则调整后,该公司报告的毛利率为46.8%,营业利润为77.2亿美元,占净销售额的29.1%,每股收益为创纪录的8.05美元。
据报告,第四季度Applied创造了67.2亿美元的收入,同比持平。按公认会计原则计算,该公司报告的毛利率为47.1%,营业利润为19.7亿美元,占净销售额的29.3%,每股收益(EPS)为创纪录的2.38美元。按非公认会计原则调整后,该公司报告的毛利率为47.3%,营业利润为19.8亿美元,占净销售额的29.5%,每股收益为创纪录的2.12美元。
10. 俄罗斯芯片还有戏吗?
1949年11月,为了加强对苏联的技术封锁,在美国的提议下,美国与西欧国家秘密成立巴黎统筹委员会,正式名称为“对共产党国家出口管制统筹委员会”,简称“巴统”。巴统的宗旨是限制成员国向社会主义国家出口战略物资和高技术,列入禁运清单的有军事武器装备、尖端技术产品和稀有物资等三大类上万种产品。
当然,这仅仅只是泽列诺格勒面临的问题之一,更大的困境是半导体设备,尤其是需要大规模生产之际,苏联在设备上的短板就愈发突出,因此T局除了要搜集技术和芯片外,还得负责偷运设备:美国中央情报局声称,苏联几乎已经获得了半导体制造所需的所有设备,包括900台用于制、备原材料的西方机器,800台用于光刻和蚀刻的机器,以及300台用于掺杂、封装和测试芯片的机器。
专业机构ImportGenius提供的从2017年到2021年7月的146000条海关记录显示,2021年上半年,俄罗斯仅进口了4000万美元的芯片,一年预计在1亿美元左右,相比于全球全年5000亿美元的市场规模,几乎没有太多存在感。
目前俄罗斯有两家主要的晶圆厂,分别是Mikron和Angstrem公司,前者提供65-250纳米制程工艺加工能力,后者(2019年破产重组)提供90-250纳米制程工艺,拥有8英寸晶圆厂,两家公司都以提供军用、航天和工业领域的产品为主。
而无晶圆厂的芯片设计公司也有三家规模较大的,分别为Baikal、YADRO和MCST(Moscow Center of SPARC Technologies),其中Baikal与MCST均有研发成功并量产的处理器。
但好消息是,俄罗斯除了继承了苏联薄弱的半导体产业外,也继承了它的一部分不认输的精神,既然没办法用台积电的光刻机,那就选择自己造,目前俄罗斯已经开始研发用于生产芯片的微影光刻机。
俄罗斯工业和贸易部副部长Vasily Shpak 在接受媒体访问时指出,2024 年将开始生产350 nm微影光刻机,2026年启动用于生产130 nm制程芯片的微影光刻机,生产将在莫斯科、泽列诺格勒、圣彼得堡和新西伯利亚的现有工厂进行。
莫大康:浙江大学校友,求是缘半导体联盟顾问。亲历50年中国半导体产业发展历程的著名学者、行业评论家。
- 以上评价仅代表嘉宾立场。
- 求是缘半导体联盟版权所有,转载需注明出处。
- 求是缘半导体联盟开设‘莫大康专栏’,公众号底部点击‘精彩回顾-专家专栏’查看。
- 如有疑问,敬请留言。
求是缘半导体联盟是全球半导体产业生态链上的多个高校的校友、公司、组织机构、政府园区及科研院校等自愿组成的跨区域的非营利性公益组织。联盟由浙江大学校友发起,总部位于上海,其主要职能是为半导体和相关行业的人才、技术、资金、企业运营管理、创新创业等方面提供交流合作和咨询服务的平台,致力于推动全球,特别是中国大陆区域的,半导体及相关产业的发展。
目前联盟不定期举办线上、线下专题活动,有一周芯闻、名家专栏、招聘专栏、活动报道、人物访谈等多种资讯栏目,同时提供咨询、资源对接、市场拓展等服务。