寒武纪专家交流纪要

集成电路IC 2024-07-31 12:05

以下是专家观点。

Patrick:请问专家寒武纪产品的性能表现如何?和主要竞争对手的对比情况?

专家:2月份左右拿到的卡,3月份安排了测试,590的单卡和8卡通过Llama2-7B/13B模型去跑了一下训练和推理。整体指标层面来讲,是通过了验证,在特定的7B/13B没有经过特定训练调优的情况下,参数以A100为1,在部分场景当中能够达到85-90%,在一些小场景下可以更高。在后续会在7月底或8月初入库1000多张590看其组网的情况,但是按照现在的叙事逻辑来讲,和A100的对比来说还可以,结论是寒武纪支持BF16,不支持FP8;物理机的实测数据基本上能够与寒武纪提供的性能参数对齐,相差在5%以内;寒武纪MLU590-M9端到端的训练,Llama2的性能是略低于A100,大概是相当于A100的80-85%,推理侧的表现还可以。后续展望全年590的订单,包括上周对H20的影响,590订单有可能是从4-5千张的产能预算和计划数增加到1万张,但这完全取决于寒武纪台积电版本的卡的供应情况。国产卡方面,公司已经在推动立项,应该会在今年的8月份到9月份拿到阉割版或者说国产制程的寒武纪590来测,在今年Q3还需要测完XX和910C,以及有可能会测试海光的E100。现在已经测完了海光的K100-AI,按照我们的测试指标来说,海光在K100-AI这边做一些定向的调优,在大尺寸模型的推理层面,70B的Llama做推理的性能表现是超预期的。590一定会买。910C和XX应该也会有采购量。海光的E100个人认为也是值得期待的,但市场上传闻可以跟H100做对比的话应该是做不到的,可能会比910B强一点,毕竟设计比较晚。另外补充寒武纪的一点是,目前是认可其实测单卡的结果,但是对其集群的表现不抱有太大的期待,因为本来也不用它做训练,主要可能还是在于它的供应侧的情况,如果确认供应没有问题,对它的采购量可能会再稍微多一点。对于明年的采购量现在还没有结论,按照大厂的决策链和逻辑来说,现在最多是预测,但真正确认需求一定是在10-11月份,或者等到12月份,各个部门报需求,汇总需求,然后再去做统一的测算。因为在模型端存在很大的不确定性,不确定模型这一侧的业务能够有多大的收入和体量,至少在Q4才会有一个比较明确的结论。

Patrick:如何看待今年和明年寒武纪芯片的出货量?

专家:整个市场来看,个人认为可能最多不超过6-7万张。寒武纪的卡有可能会满产满销,今年是卡缺,明年可能形势逆转,变成卡不缺但缺客户。今年对于所有国产卡的需求逻辑都差不多,只要能够量产出来,基本上都有人接盘,但明年的逻辑就变成根据业务的需求决定卡的量。现在国内英伟达的卡就明显出现了这个问题,没有下游客户。比如市场上现在H800的购买价格在230-240万,租赁价格已经跌到了6.6-6.7万。从去年年中到今年年中这一年的时间范围内,在任何的时间节点介入到GPU的租赁上,除非快进快出,否则很难赚钱。这一年的时间内,所有做智算中心运营的公司,一定要想到自己的退出方式,或者是否有长租约,例如三年租约锁死租金价格,否则可能无法收回成本。比如250万人民币一台H800来算,假设按照4年平均折旧,250万除以4再除以12就是硬性的成本,还要再加上组网的费用,但现在H800的租赁价格,有的公司报价66000人民币一个月就可以租到,以这样的逻辑来说,GPU租赁的毛利就不像23年那么高。现在整个市场英伟达的卡还是不太缺,在全球范围内,英伟达芯片的租赁价格一直在下降,不是所有的公司都像云厂商一样有议价权,很多小的资源池为了资金成本的回笼可能就会选择低价租出去,先保证稳定的现金流。现在GPU租赁市场的情况就可以映射到明年,当终端的业务需求没有那么旺盛的情况下,国产信创的智算中心的定向需求也基本被满足,真正需要去看下游需求的情况下,整个下游的模型的训练和推理还是会有一定量存在,但不确定这些量会分给哪些国产卡。因此,今年的需求问题不大,包括像昆仑在手的订单就很多,所以只要能做出来就一定能消化掉。但是明年的需求情况可能需要重点关注几个指标:第一个是已经建好的数据中心的出租的比例和价格,以及租出去的卡的GPU的利用率是多少,是不是在空跑没有业务;第二个指标是各家模型公司业务端上量的情况。所以明年对于寒武纪的压力最大的问题在于下游客户现在有没有pipeline或者明确的资源池。

匿名投资者:寒武纪590的价格是多少?

专家:公司能拿到的价格是8-9万人民币,标价可能11-12万人民币。

匿名投资者:不同代工厂版本的价格是否不同?

专家:性能肯定不同,但价格不确定,现在还没有看到三星和国产版本的报价,应该会有差别,但差别不大。

匿名投资者:海光的产品型号是什么?

专家:目前在测的是K100-AI,后面会入库测试的是E100

匿名投资者:这两个产品有什么区别?

专家:K100和K100-AI应该是二代卡(深算二号),推理为主;E100按照定义逻辑应该是深算三号。

匿名投资者:字节在采购寒武纪和昇腾上如何侧重?

专家:综合考虑供应和价格以及算子适配情况,还会多家公司比对,没有明显的侧重指标。

匿名投资者:从性能的角度,目前几款国产GPU的排序是怎样?

专家:如果不考虑690、深算四、910C这些,从现在的纸面参数来说,由于是基于三星和HBM的全套方案,在单卡中是最好的,然后E100和590可能是同级别,910B的供应链稳定,再往下是A800,然后所有的卡都没有超过H100。

匿名投资者:如果从集群的综合性能来讲,排序是怎么样的?

专家:集群角度不清楚没数据。因为不会用他们来做训练,看集群性能的意义也不大。

匿名投资者:寒武纪集群测试情况,集群是测的多少张卡,和昇腾集群性能的对比。

专家:应该是要测千卡,这个月底开始测,下个月出结果。但是这仅供参考意义不大,不会用于训练,非要比对的话,有可能590好一点,但现在没数据,要等下个月。

匿名投资者:寒武纪/海光/昇腾/昆仑这几家后续竞争力,需要担心软件生态的问题吗?

专家:软件生态是老生常谈的问题,现在担心也没有什么意义。软件生态设备兼容性这一块来讲不是特别大的一个门槛,它是阶段性的一个瓶颈,取决于想不想做。性价比或者排序的问题现在还很难说,到最后感觉大家的同质化反而会比较严重,卡的算力差别不大,现阶段也不是充分竞争的市场,可能还是定向支持的问题。如果是定向投喂的市场,竞争可能不会很激烈。然后今年最核心的就是供应问题;明年是下单需求,哪一家公司能够在下游拿到更多公司的青睐和认可。现在看来昇腾还是值得期待的,现在很多大厂对910B的选择比较多,大家已经付出了沉没成本。

匿名投资者:字节25年推理+训练总需求,大概多少张卡?

专家:具体的量不清楚,现在还没有预估,猜的话可能跟今年差不多。

匿名投资者:相比今年增加50-60%的可能性大吗?

专家:不一定。要等年底看多模态和市场反馈这一侧是否有大量上量,如果有的话,可能还会更激进,没有的话就不好说。

匿名投资者:字节后续会做万亿以上的模型吗?

专家:目前没计划。可能要等OpenAI的情况。

匿名投资者:请教690与910C的进度,在年底可以出来吗?

专家:910C有可能,690没戏。

集成电路IC 想陪你一起,目睹这个充满变化的时代
评论
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 85浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 45浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 127浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 119浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 75浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 68浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 173浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 145浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦