寒武纪专家交流纪要

集成电路IC 2024-07-31 12:05

构建AI未来，Arm计算平台无处不在 如何提升高压系统的实时性能?

以下是专家观点。

Patrick：请问专家寒武纪产品的性能表现如何？和主要竞争对手的对比情况？

专家：2月份左右拿到的卡，3月份安排了测试，590的单卡和8卡通过Llama2-7B/13B模型去跑了一下训练和推理。整体指标层面来讲，是通过了验证，在特定的7B/13B没有经过特定训练调优的情况下，参数以A100为1，在部分场景当中能够达到85-90%，在一些小场景下可以更高。在后续会在7月底或8月初入库1000多张590看其组网的情况，但是按照现在的叙事逻辑来讲，和A100的对比来说还可以，结论是寒武纪支持BF16，不支持FP8；物理机的实测数据基本上能够与寒武纪提供的性能参数对齐，相差在5%以内；寒武纪MLU590-M9端到端的训练，Llama2的性能是略低于A100，大概是相当于A100的80-85%，推理侧的表现还可以。后续展望全年590的订单，包括上周对H20的影响，590订单有可能是从4-5千张的产能预算和计划数增加到1万张，但这完全取决于寒武纪台积电版本的卡的供应情况。国产卡方面，公司已经在推动立项，应该会在今年的8月份到9月份拿到阉割版或者说国产制程的寒武纪590来测，在今年Q3还需要测完XX和910C，以及有可能会测试海光的E100。现在已经测完了海光的K100-AI，按照我们的测试指标来说，海光在K100-AI这边做一些定向的调优，在大尺寸模型的推理层面，70B的Llama做推理的性能表现是超预期的。590一定会买。910C和XX应该也会有采购量。海光的E100个人认为也是值得期待的，但市场上传闻可以跟H100做对比的话应该是做不到的，可能会比910B强一点，毕竟设计比较晚。另外补充寒武纪的一点是，目前是认可其实测单卡的结果，但是对其集群的表现不抱有太大的期待，因为本来也不用它做训练，主要可能还是在于它的供应侧的情况，如果确认供应没有问题，对它的采购量可能会再稍微多一点。对于明年的采购量现在还没有结论，按照大厂的决策链和逻辑来说，现在最多是预测，但真正确认需求一定是在10-11月份，或者等到12月份，各个部门报需求，汇总需求，然后再去做统一的测算。因为在模型端存在很大的不确定性，不确定模型这一侧的业务能够有多大的收入和体量，至少在Q4才会有一个比较明确的结论。

Patrick：如何看待今年和明年寒武纪芯片的出货量？

专家：整个市场来看，个人认为可能最多不超过6-7万张。寒武纪的卡有可能会满产满销，今年是卡缺，明年可能形势逆转，变成卡不缺但缺客户。今年对于所有国产卡的需求逻辑都差不多，只要能够量产出来，基本上都有人接盘，但明年的逻辑就变成根据业务的需求决定卡的量。现在国内英伟达的卡就明显出现了这个问题，没有下游客户。比如市场上现在H800的购买价格在230-240万，租赁价格已经跌到了6.6-6.7万。从去年年中到今年年中这一年的时间范围内，在任何的时间节点介入到GPU的租赁上，除非快进快出，否则很难赚钱。这一年的时间内，所有做智算中心运营的公司，一定要想到自己的退出方式，或者是否有长租约，例如三年租约锁死租金价格，否则可能无法收回成本。比如250万人民币一台H800来算，假设按照4年平均折旧，250万除以4再除以12就是硬性的成本，还要再加上组网的费用，但现在H800的租赁价格，有的公司报价66000人民币一个月就可以租到，以这样的逻辑来说，GPU租赁的毛利就不像23年那么高。现在整个市场英伟达的卡还是不太缺，在全球范围内，英伟达芯片的租赁价格一直在下降，不是所有的公司都像云厂商一样有议价权，很多小的资源池为了资金成本的回笼可能就会选择低价租出去，先保证稳定的现金流。现在GPU租赁市场的情况就可以映射到明年，当终端的业务需求没有那么旺盛的情况下，国产信创的智算中心的定向需求也基本被满足，真正需要去看下游需求的情况下，整个下游的模型的训练和推理还是会有一定量存在，但不确定这些量会分给哪些国产卡。因此，今年的需求问题不大，包括像昆仑在手的订单就很多，所以只要能做出来就一定能消化掉。但是明年的需求情况可能需要重点关注几个指标：第一个是已经建好的数据中心的出租的比例和价格，以及租出去的卡的GPU的利用率是多少，是不是在空跑没有业务；第二个指标是各家模型公司业务端上量的情况。所以明年对于寒武纪的压力最大的问题在于下游客户现在有没有pipeline或者明确的资源池。

匿名投资者：寒武纪590的价格是多少？

专家：公司能拿到的价格是8-9万人民币，标价可能11-12万人民币。

匿名投资者：不同代工厂版本的价格是否不同？

专家：性能肯定不同，但价格不确定，现在还没有看到三星和国产版本的报价，应该会有差别，但差别不大。

匿名投资者：海光的产品型号是什么？

专家：目前在测的是K100-AI，后面会入库测试的是E100

匿名投资者：这两个产品有什么区别？

专家：K100和K100-AI应该是二代卡（深算二号），推理为主；E100按照定义逻辑应该是深算三号。

匿名投资者：字节在采购寒武纪和昇腾上如何侧重？

专家：综合考虑供应和价格以及算子适配情况，还会多家公司比对，没有明显的侧重指标。

匿名投资者：从性能的角度，目前几款国产GPU的排序是怎样？

专家：如果不考虑690、深算四、910C这些，从现在的纸面参数来说，由于是基于三星和HBM的全套方案，在单卡中是最好的，然后E100和590可能是同级别，910B的供应链稳定，再往下是A800，然后所有的卡都没有超过H100。

匿名投资者：如果从集群的综合性能来讲，排序是怎么样的？

专家：集群角度不清楚没数据。因为不会用他们来做训练，看集群性能的意义也不大。

匿名投资者：寒武纪集群测试情况，集群是测的多少张卡，和昇腾集群性能的对比。

专家：应该是要测千卡，这个月底开始测，下个月出结果。但是这仅供参考意义不大，不会用于训练，非要比对的话，有可能590好一点，但现在没数据，要等下个月。

匿名投资者：寒武纪/海光/昇腾/昆仑这几家后续竞争力，需要担心软件生态的问题吗？

专家：软件生态是老生常谈的问题，现在担心也没有什么意义。软件生态设备兼容性这一块来讲不是特别大的一个门槛，它是阶段性的一个瓶颈，取决于想不想做。性价比或者排序的问题现在还很难说，到最后感觉大家的同质化反而会比较严重，卡的算力差别不大，现阶段也不是充分竞争的市场，可能还是定向支持的问题。如果是定向投喂的市场，竞争可能不会很激烈。然后今年最核心的就是供应问题；明年是下单需求，哪一家公司能够在下游拿到更多公司的青睐和认可。现在看来昇腾还是值得期待的，现在很多大厂对910B的选择比较多，大家已经付出了沉没成本。

匿名投资者：字节25年推理+训练总需求，大概多少张卡？

专家：具体的量不清楚，现在还没有预估，猜的话可能跟今年差不多。

匿名投资者：相比今年增加50-60%的可能性大吗？

专家：不一定。要等年底看多模态和市场反馈这一侧是否有大量上量，如果有的话，可能还会更激进，没有的话就不好说。

匿名投资者：字节后续会做万亿以上的模型吗？

专家：目前没计划。可能要等OpenAI的情况。

匿名投资者：请教690与910C的进度，在年底可以出来吗？

专家：910C有可能，690没戏。

登录阅读全文

