寒武纪专家交流纪要

集成电路IC 2024-07-31 12:05

以下是专家观点。

Patrick:请问专家寒武纪产品的性能表现如何?和主要竞争对手的对比情况?

专家:2月份左右拿到的卡,3月份安排了测试,590的单卡和8卡通过Llama2-7B/13B模型去跑了一下训练和推理。整体指标层面来讲,是通过了验证,在特定的7B/13B没有经过特定训练调优的情况下,参数以A100为1,在部分场景当中能够达到85-90%,在一些小场景下可以更高。在后续会在7月底或8月初入库1000多张590看其组网的情况,但是按照现在的叙事逻辑来讲,和A100的对比来说还可以,结论是寒武纪支持BF16,不支持FP8;物理机的实测数据基本上能够与寒武纪提供的性能参数对齐,相差在5%以内;寒武纪MLU590-M9端到端的训练,Llama2的性能是略低于A100,大概是相当于A100的80-85%,推理侧的表现还可以。后续展望全年590的订单,包括上周对H20的影响,590订单有可能是从4-5千张的产能预算和计划数增加到1万张,但这完全取决于寒武纪台积电版本的卡的供应情况。国产卡方面,公司已经在推动立项,应该会在今年的8月份到9月份拿到阉割版或者说国产制程的寒武纪590来测,在今年Q3还需要测完XX和910C,以及有可能会测试海光的E100。现在已经测完了海光的K100-AI,按照我们的测试指标来说,海光在K100-AI这边做一些定向的调优,在大尺寸模型的推理层面,70B的Llama做推理的性能表现是超预期的。590一定会买。910C和XX应该也会有采购量。海光的E100个人认为也是值得期待的,但市场上传闻可以跟H100做对比的话应该是做不到的,可能会比910B强一点,毕竟设计比较晚。另外补充寒武纪的一点是,目前是认可其实测单卡的结果,但是对其集群的表现不抱有太大的期待,因为本来也不用它做训练,主要可能还是在于它的供应侧的情况,如果确认供应没有问题,对它的采购量可能会再稍微多一点。对于明年的采购量现在还没有结论,按照大厂的决策链和逻辑来说,现在最多是预测,但真正确认需求一定是在10-11月份,或者等到12月份,各个部门报需求,汇总需求,然后再去做统一的测算。因为在模型端存在很大的不确定性,不确定模型这一侧的业务能够有多大的收入和体量,至少在Q4才会有一个比较明确的结论。

Patrick:如何看待今年和明年寒武纪芯片的出货量?

专家:整个市场来看,个人认为可能最多不超过6-7万张。寒武纪的卡有可能会满产满销,今年是卡缺,明年可能形势逆转,变成卡不缺但缺客户。今年对于所有国产卡的需求逻辑都差不多,只要能够量产出来,基本上都有人接盘,但明年的逻辑就变成根据业务的需求决定卡的量。现在国内英伟达的卡就明显出现了这个问题,没有下游客户。比如市场上现在H800的购买价格在230-240万,租赁价格已经跌到了6.6-6.7万。从去年年中到今年年中这一年的时间范围内,在任何的时间节点介入到GPU的租赁上,除非快进快出,否则很难赚钱。这一年的时间内,所有做智算中心运营的公司,一定要想到自己的退出方式,或者是否有长租约,例如三年租约锁死租金价格,否则可能无法收回成本。比如250万人民币一台H800来算,假设按照4年平均折旧,250万除以4再除以12就是硬性的成本,还要再加上组网的费用,但现在H800的租赁价格,有的公司报价66000人民币一个月就可以租到,以这样的逻辑来说,GPU租赁的毛利就不像23年那么高。现在整个市场英伟达的卡还是不太缺,在全球范围内,英伟达芯片的租赁价格一直在下降,不是所有的公司都像云厂商一样有议价权,很多小的资源池为了资金成本的回笼可能就会选择低价租出去,先保证稳定的现金流。现在GPU租赁市场的情况就可以映射到明年,当终端的业务需求没有那么旺盛的情况下,国产信创的智算中心的定向需求也基本被满足,真正需要去看下游需求的情况下,整个下游的模型的训练和推理还是会有一定量存在,但不确定这些量会分给哪些国产卡。因此,今年的需求问题不大,包括像昆仑在手的订单就很多,所以只要能做出来就一定能消化掉。但是明年的需求情况可能需要重点关注几个指标:第一个是已经建好的数据中心的出租的比例和价格,以及租出去的卡的GPU的利用率是多少,是不是在空跑没有业务;第二个指标是各家模型公司业务端上量的情况。所以明年对于寒武纪的压力最大的问题在于下游客户现在有没有pipeline或者明确的资源池。

匿名投资者:寒武纪590的价格是多少?

专家:公司能拿到的价格是8-9万人民币,标价可能11-12万人民币。

匿名投资者:不同代工厂版本的价格是否不同?

专家:性能肯定不同,但价格不确定,现在还没有看到三星和国产版本的报价,应该会有差别,但差别不大。

匿名投资者:海光的产品型号是什么?

专家:目前在测的是K100-AI,后面会入库测试的是E100

匿名投资者:这两个产品有什么区别?

专家:K100和K100-AI应该是二代卡(深算二号),推理为主;E100按照定义逻辑应该是深算三号。

匿名投资者:字节在采购寒武纪和昇腾上如何侧重?

专家:综合考虑供应和价格以及算子适配情况,还会多家公司比对,没有明显的侧重指标。

匿名投资者:从性能的角度,目前几款国产GPU的排序是怎样?

专家:如果不考虑690、深算四、910C这些,从现在的纸面参数来说,由于是基于三星和HBM的全套方案,在单卡中是最好的,然后E100和590可能是同级别,910B的供应链稳定,再往下是A800,然后所有的卡都没有超过H100。

匿名投资者:如果从集群的综合性能来讲,排序是怎么样的?

专家:集群角度不清楚没数据。因为不会用他们来做训练,看集群性能的意义也不大。

匿名投资者:寒武纪集群测试情况,集群是测的多少张卡,和昇腾集群性能的对比。

专家:应该是要测千卡,这个月底开始测,下个月出结果。但是这仅供参考意义不大,不会用于训练,非要比对的话,有可能590好一点,但现在没数据,要等下个月。

匿名投资者:寒武纪/海光/昇腾/昆仑这几家后续竞争力,需要担心软件生态的问题吗?

专家:软件生态是老生常谈的问题,现在担心也没有什么意义。软件生态设备兼容性这一块来讲不是特别大的一个门槛,它是阶段性的一个瓶颈,取决于想不想做。性价比或者排序的问题现在还很难说,到最后感觉大家的同质化反而会比较严重,卡的算力差别不大,现阶段也不是充分竞争的市场,可能还是定向支持的问题。如果是定向投喂的市场,竞争可能不会很激烈。然后今年最核心的就是供应问题;明年是下单需求,哪一家公司能够在下游拿到更多公司的青睐和认可。现在看来昇腾还是值得期待的,现在很多大厂对910B的选择比较多,大家已经付出了沉没成本。

匿名投资者:字节25年推理+训练总需求,大概多少张卡?

专家:具体的量不清楚,现在还没有预估,猜的话可能跟今年差不多。

匿名投资者:相比今年增加50-60%的可能性大吗?

专家:不一定。要等年底看多模态和市场反馈这一侧是否有大量上量,如果有的话,可能还会更激进,没有的话就不好说。

匿名投资者:字节后续会做万亿以上的模型吗?

专家:目前没计划。可能要等OpenAI的情况。

匿名投资者:请教690与910C的进度,在年底可以出来吗?

专家:910C有可能,690没戏。

集成电路IC 想陪你一起,目睹这个充满变化的时代
评论
  • RDDI-DAP错误通常与调试接口相关,特别是在使用CMSIS-DAP协议进行嵌入式系统开发时。以下是一些可能的原因和解决方法: 1. 硬件连接问题:     检查调试器(如ST-Link)与目标板之间的连接是否牢固。     确保所有必要的引脚都已正确连接,没有松动或短路。 2. 电源问题:     确保目标板和调试器都有足够的电源供应。     检查电源电压是否符合目标板的规格要求。 3. 固件问题: &n
    丙丁先生 2024-12-01 17:37 83浏览
  • 概述 说明(三)探讨的是比较器一般带有滞回(Hysteresis)功能,为了解决输入信号转换速率不够的问题。前文还提到,即便使能滞回(Hysteresis)功能,还是无法解决SiPM读出测试系统需要解决的问题。本文在说明(三)的基础上,继续探讨为SiPM读出测试系统寻求合适的模拟脉冲检出方案。前四代SiPM使用的高速比较器指标缺陷 由于前端模拟信号属于典型的指数脉冲,所以下降沿转换速率(Slew Rate)过慢,导致比较器检出出现不必要的问题。尽管比较器可以使能滞回(Hysteresis)模块功
    coyoo 2024-12-03 12:20 70浏览
  • 最近几年,新能源汽车愈发受到消费者的青睐,其销量也是一路走高。据中汽协公布的数据显示,2024年10月,新能源汽车产销分别完成146.3万辆和143万辆,同比分别增长48%和49.6%。而结合各家新能源车企所公布的销量数据来看,比亚迪再度夺得了销冠宝座,其10月新能源汽车销量达到了502657辆,同比增长66.53%。众所周知,比亚迪是新能源汽车领域的重要参与者,其一举一动向来为外界所关注。日前,比亚迪汽车旗下品牌方程豹汽车推出了新车方程豹豹8,该款车型一上市就迅速吸引了消费者的目光,成为SUV
    刘旷 2024-12-02 09:32 98浏览
  • 光伏逆变器是一种高效的能量转换设备,它能够将光伏太阳能板(PV)产生的不稳定的直流电压转换成与市电频率同步的交流电。这种转换后的电能不仅可以回馈至商用输电网络,还能供独立电网系统使用。光伏逆变器在商业光伏储能电站和家庭独立储能系统等应用领域中得到了广泛的应用。光耦合器,以其高速信号传输、出色的共模抑制比以及单向信号传输和光电隔离的特性,在光伏逆变器中扮演着至关重要的角色。它确保了系统的安全隔离、干扰的有效隔离以及通信信号的精准传输。光耦合器的使用不仅提高了系统的稳定性和安全性,而且由于其低功耗的
    晶台光耦 2024-12-02 10:40 102浏览
  • 戴上XR眼镜去“追龙”是种什么体验?2024年11月30日,由上海自然博物馆(上海科技馆分馆)与三湘印象联合出品、三湘印象旗下观印象艺术发展有限公司(下简称“观印象”)承制的《又见恐龙》XR嘉年华在上海自然博物馆重磅开幕。该体验项目将于12月1日正式对公众开放,持续至2025年3月30日。双向奔赴,恐龙IP撞上元宇宙不久前,上海市经济和信息化委员会等部门联合印发了《上海市超高清视听产业发展行动方案》,特别提到“支持博物馆、主题乐园等场所推动超高清视听技术应用,丰富线下文旅消费体验”。作为上海自然
    电子与消费 2024-11-30 22:03 86浏览
  • 11-29学习笔记11-29学习笔记习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-02 23:58 51浏览
  •         温度传感器的精度受哪些因素影响,要先看所用的温度传感器输出哪种信号,不同信号输出的温度传感器影响精度的因素也不同。        现在常用的温度传感器输出信号有以下几种:电阻信号、电流信号、电压信号、数字信号等。以输出电阻信号的温度传感器为例,还细分为正温度系数温度传感器和负温度系数温度传感器,常用的铂电阻PT100/1000温度传感器就是正温度系数,就是说随着温度的升高,输出的电阻值会增大。对于输出
    锦正茂科技 2024-12-03 11:50 66浏览
  • 作为优秀工程师的你,已身经百战、阅板无数!请先醒醒,新的项目来了,这是一个既要、又要、还要的产品需求,ARM核心板中一个处理器怎么能实现这么丰富的外围接口?踌躇之际,你偶阅此文。于是,“潘多拉”的魔盒打开了!没错,USB资源就是你打开新世界得钥匙,它能做哪些扩展呢?1.1  USB扩网口通用ARM处理器大多带两路网口,如果项目中有多路网路接口的需求,一般会选择在主板外部加交换机/路由器。当然,出于成本考虑,也可以将Switch芯片集成到ARM核心板或底板上,如KSZ9897、
    万象奥科 2024-12-03 10:24 37浏览
  • 遇到部分串口工具不支持1500000波特率,这时候就需要进行修改,本文以触觉智能RK3562开发板修改系统波特率为115200为例,介绍瑞芯微方案主板Linux修改系统串口波特率教程。温馨提示:瑞芯微方案主板/开发板串口波特率只支持115200或1500000。修改Loader打印波特率查看对应芯片的MINIALL.ini确定要修改的bin文件#查看对应芯片的MINIALL.ini cat rkbin/RKBOOT/RK3562MINIALL.ini修改uart baudrate参数修改以下目
    Industio_触觉智能 2024-12-03 11:28 41浏览
  • 当前,智能汽车产业迎来重大变局,随着人工智能、5G、大数据等新一代信息技术的迅猛发展,智能网联汽车正呈现强劲发展势头。11月26日,在2024紫光展锐全球合作伙伴大会汽车电子生态论坛上,紫光展锐与上汽海外出行联合发布搭载紫光展锐A7870的上汽海外MG量产车型,并发布A7710系列UWB数字钥匙解决方案平台,可应用于数字钥匙、活体检测、脚踢雷达、自动泊车等多种智能汽车场景。 联合发布量产车型,推动汽车智能化出海紫光展锐与上汽海外出行达成战略合作,联合发布搭载紫光展锐A7870的量产车型
    紫光展锐 2024-12-03 11:38 65浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦