【光电智造】DeepSeek利空算力?

今日光电 2025-02-07 16:38

今日光电

     有人说,20世纪是电的世纪,21世纪是光的世纪;知光解电,再小的个体都可以被赋能。追光逐电,光引未来...欢迎来到今日光电!


----追光逐电 光引未来----

其实具体逻辑,从12月deepseek v3到这周的r1,我们前前后后分析过很多次了,不妨总结梳理下

1. 海外广泛引用的550万美金是v3,而不是r1的训练成本,且550万只是v3实际训练成本的零头。v3论文原话:上述成本仅包括DeepSeek-V3 的正式训练,不包括与架构、算法、数据相关的前期研究、消融实验的成本。社群内一位算法工程师就曾说“v3用了幻方自己的r1模型生成数据,这个部分的反复尝试要不要算在成本里呢?”一个意思。

2. 前沿探索和后发追赶,所需要的算力本就不是一个量级。表现为训练同一代模型所需算力每隔N个月就是指数级降低。原因包括算法本身的进步(FP8、混合MoE)、算力的持续通缩、复现方法如蒸馏等对数据的浓缩。最关键的是,探索就意味着会有浪费,而后发追赶“站在巨人肩膀上”本就可以规避浪费。就比如o1的训练成本肯定远超GPT-4,幻方r1的训练成本肯定也超过v3。而从o3到o4/o5,从r1到r2/r3,训练算力只会更多。

3. 单次训练降本了,不代表整体训练成本会下降。训练效率提高,实验室就减少投入吗?不会,真实逻辑是:基于更高效率,榨干算力,去攫取更大收益。就拿幻方来说,infra优化降本能力这么强、提前囤卡也挺多、没怎么扩张API服务专注于研究与训练的情况下,依然还在缺卡。横向对比之下,北美某些花了更多钱的实验室,的确显得很尴尬...但他们之后就降本增效吗?不会。消化吸收幻方开源的方法+比幻方多得多的算力=攫取智能的更大提升。训练算力最应该担心的是撞墙,算力使用效率提高,反而可能是提高了模型本身的天花板。

4. 幻方代表的是整个开源相对闭源的一次胜利。对社区的贡献会快速转化为整个开源社区的繁荣。如果真的说利空的Loser,那可能是闭源模型。中国这一点已经提前经历了,被Llama支配的恐惧,跑不过Llama3的中国闭源模型公司被迫倒闭、转应用、转开源。而今天中国开源打到了北美闭源...如果现在还不如r1(以及即将到来的r2 r3),那这家公司的API价值基本归0。但说实话这个过程的确会让模型训练参与方快速缩减。

5. 最关键的,以上讨论都是训练,而未来显然更大需求来自推理。有一点被大家忽略了,幻方对推理成本的消减,比训练来的更为震撼。今天大家都看到了AMD宣布支持幻方v3,用我们嘉宾Y博的话就是:DeepSeek架构的优雅之处就在于,和标准的transformer架构比较起来, 并没有引入特殊的算子。理论上可以相对轻松支持各种类型卡...(这也是被GPU禁运逼出来的)大家体会下这句话的分量,以及对于CUDA的启示...幻方这帮人都是手撸算子的天才...

推理成本降低,对算力是利好还是利空?比训练更好理解。请对比:刚推出来贵到没人用的o1,以及掀起API价格战之后的豆包。推理成本的降低大概率会带来应用的繁荣,反而会拉动更大的算力需求。

这里再引用下星球Y博的评论,现在回头看非常前瞻:DeepSeek-V3将支持私有部署和自主微调,为下游应用提供远大于闭源模型时代的发展空间。未来一两年,大概率将见证更丰富的推理芯片产品、更繁荣的LLM应用生态。

6. 如何平衡北美仍在疯狂的基建,和过去浪费的投资?美国的确CSP仍在疯狂抢电,都抢到2030年去了。其实各大CSP过去2年千亿美金砸下去,没有一家单纯是为了训练,基本都是自身业务需求+推理业务增长驱动。只有微软为OpenAI准备的算力credit、AWS算力租赁给了下游客户用于训练、Meta/xAI部分算力用于自身训练,但算力大头都是因为自身的推荐系统业务/自动驾驶业务本身需求。以及微软已经相当于拒绝了Sam Altman继续All in的诉求,转而聚焦回报更确定的推理(Satya亲口这么说)。

因此幻方这件事对北美CSP来说,客观来讲,过去某些训练投入的确是打水漂了。为冒险、探索新市场付出的必要成本。但看未来,开源的整体繁荣一定最终是利好这些“中间商”。之前我们阐述过,他们其实不是亲自冒险的矿工,他们只是铲子的搬运工,以及基于这些模型(无论开源or闭源)建立更具商业价值的应用生态。卡并不只是用于训练,越来越大比例会挪到推理。假如训练的高效让模型更快进步,应用生态更加繁荣,他们怎么可能不继续投呢?

最后,继续引用下《the bitter lesson》:长远来看,算力才是真正的决胜因素。历史的经验一次又一次地告诫我们,AI研究者常常试图将人类的知识灌输到AI算法中,这种做法在短期内通常有效,并且带来个人成就感和虚荣心。但长远来看,它会造成瓶颈,甚至阻碍进一步发展。最终的突破性进展往往源于一种截然不同的思路,即通过搜索学习来扩展算力规模。而那些最终的成功往往伴随着苦涩,难以被下咽,因为算力的成功,意味着对我们以人类为中心的固有思维和虚荣心,是一记响亮的耳光

来源:新机器视觉


申明:感谢原创作者的辛勤付出。本号转载的文章均会在文中注明,若遇到版权问题请联系我们处理。


 

----与智者为伍 为创新赋能----


【说明】欢迎企业和个人洽谈合作,投稿发文。欢迎联系我们
诚招运营合伙人 ,对新媒体感兴趣,对光电产业和行业感兴趣。非常有意者通过以下方式联我们!条件待遇面谈
投稿丨合作丨咨询

联系邮箱:uestcwxd@126.com

QQ:493826566



评论 (0)
  •        随着人工智能算力集群的爆发式增长,以及5.5G/6G通信技术的演进,网络数据传输速率的需求正以每年30%的速度递增。万兆以太网(10G Base-T)作为支撑下一代数据中心、高端交换机的核心组件,其性能直接决定了网络设备的稳定性与效率。然而,万兆网络变压器的技术门槛极高:回波损耗需低于-20dB(比千兆产品严格30%),耐压值需突破1500V(传统产品仅为1000V),且需在高频信号下抑制电磁干扰。全球仅有6家企业具备规模化量产能力,而美信科
    中科领创 2025-03-13 11:24 49浏览
  • 一、行业背景与用户需求随着健康消费升级,智能眼部按摩仪逐渐成为缓解眼疲劳、改善睡眠的热门产品。用户对这类设备的需求不再局限于基础按摩功能,而是追求更智能化、人性化的体验,例如:语音交互:实时反馈按摩模式、操作提示、安全提醒。环境感知:通过传感器检测佩戴状态、温度、压力等,提升安全性与舒适度。低功耗长续航:适应便携场景,延长设备使用时间。高性价比方案:在控制成本的同时实现功能多样化。针对这些需求,WTV380-8S语音芯片凭借其高性能、多传感器扩展能力及超高性价比,成为眼部按摩仪智能化升级的理想选
    广州唯创电子 2025-03-13 09:26 39浏览
  • 一、行业背景与需求痛点智能电子指纹锁作为智能家居的核心入口,近年来市场规模持续增长,用户对产品的功能性、安全性和设计紧凑性提出更高要求:极致空间利用率:锁体内部PCB空间有限,需高度集成化设计。语音交互需求:操作引导(如指纹识别状态、低电量提醒)、安全告警(防撬、试错报警)等语音反馈。智能化扩展能力:集成传感器以增强安全性(如温度监测、防撬检测)和用户体验。成本与可靠性平衡:在复杂环境下确保低功耗、高稳定性,同时控制硬件成本。WTV380-P(QFN32)语音芯片凭借4mm×4mm超小封装、多传
    广州唯创电子 2025-03-13 09:24 69浏览
  • 在海洋监测领域,基于无人艇能够实现高效、实时、自动化的海洋数据采集,从而为海洋环境保护、资源开发等提供有力支持。其中,无人艇的控制算法训练往往需要大量高质量的数据支持。然而,海洋数据采集也面临数据噪声和误差、数据融合与协同和复杂海洋环境适应等诸多挑战,制约着无人艇技术的发展。针对这些挑战,我们探索并推出一套基于多传感器融合的海洋数据采集系统,能够高效地采集和处理海洋环境中的多维度数据,为无人艇的自主航行和控制算法训练提供高质量的数据支持。一、方案架构无人艇要在复杂海上环境中实现自主导航,尤其是完
    康谋 2025-03-13 09:53 59浏览
  • 前言在快速迭代的科技浪潮中,汽车电子技术的飞速发展不仅重塑了行业的面貌,也对测试工具提出了更高的挑战与要求。作为汽车电子测试领域的先锋,TPT软件始终致力于为用户提供高效、精准、可靠的测试解决方案。新思科技出品的TPT软件迎来了又一次重大更新,最新版本TPT 2024.12将进一步满足汽车行业日益增长的测试需求,推动汽车电子技术的持续革新。基于当前汽车客户的实际需求与痛点,结合最新的技术趋势,对TPT软件进行了全面的优化与升级。从模型故障注入测试到服务器函数替代C代码函数,从更准确的需求链接到P
    北汇信息 2025-03-13 14:43 63浏览
  • 北京时间3月11日,国内领先的二手消费电子产品交易和服务平台万物新生(爱回收)集团(纽交所股票代码:RERE)发布2024财年第四季度和全年业绩报告。财报显示,2024年第四季度万物新生集团总收入48.5亿元,超出业绩指引,同比增长25.2%。单季non-GAAP经营利润1.3亿元(non-GAAP口径,即经调整口径,均不含员工股权激励费用、无形资产摊销及因收购产生的递延成本,下同),并汇报创历史新高的GAAP净利润7742万元,同比增长近27倍。总览全年,万物新生总收入同比增长25.9%达到1
    华尔街科技眼 2025-03-13 12:23 69浏览
  • DeepSeek自成立之初就散发着大胆创新的气息。明明核心开发团队只有一百多人,却能以惊人的效率实现许多大厂望尘莫及的技术成果,原因不仅在于资金或硬件,而是在于扁平架构携手塑造的蜂窝创新生态。创办人梁文锋多次强调,与其与大厂竞争一时的人才风潮,不如全力培养自家的优质员工,形成不可替代的内部生态。正因这样,他对DeepSeek内部人才体系有着一套别具一格的见解。他十分重视中式教育价值,因而DeepSeek团队几乎清一色都是中国式学霸。许多人来自北大清华,或者在各种数据比赛中多次获奖,可谓百里挑一。
    优思学院 2025-03-13 12:15 70浏览
  • 曾经听过一个“隐形经理”的故事:有家公司,新人进来后,会惊讶地发现老板几乎从不在办公室。可大家依旧各司其职,还能在关键时刻自发协作,把项目完成得滴水不漏。新员工起初以为老板是“放羊式”管理,结果去茶水间和老员工聊过才发现,这位看似“隐形”的管理者其实“无处不在”,他提前铺好了企业文化、制度和激励机制,让一切运行自如。我的观点很简单:管理者的最高境界就是——“无为而治”。也就是说,你的存在感不需要每天都凸显,但你的思路、愿景、机制早已渗透到组织血液里。为什么呢?因为真正高明的管理,不在于事必躬亲,
    优思学院 2025-03-12 18:24 84浏览
  • 文/杜杰编辑/cc孙聪颖‍主打影像功能的小米15 Ultra手机,成为2025开年的第一款旗舰机型。从发布节奏上来看,小米历代Ultra机型,几乎都选择在开年发布,远远早于其他厂商秋季主力机型的发布时间。这毫无疑问会掀起“Ultra旗舰大战”,今年影像手机将再次被卷上新高度。无意臆断小米是否有意“领跑”一场“军备竞赛”,但各种复杂的情绪难以掩盖。岁岁年年机不同,但将2-3年内记忆中那些关于旗舰机的发布会拼凑起来,会发现,包括小米在内,旗舰机的革新点,除了摄影参数的不同,似乎没什么明显变化。贵为旗
    华尔街科技眼 2025-03-13 12:30 83浏览
  • 在追求更快、更稳的无线通信路上,传统射频架构深陷带宽-功耗-成本的“不可能三角”:带宽每翻倍,系统复杂度与功耗增幅远超线性增长。传统方案通过“分立式功放+多级变频链路+JESD204B 接口”的组合试图平衡性能与成本,却难以满足实时性严苛的超大规模 MIMO 通信等场景需求。在此背景下,AXW49 射频开发板以“直采+异构”重构射频范式:基于 AMD Zynq UltraScale+™ RFSoC Gen3XCZU49DR 芯片的 16 通道 14 位 2.5GSPS ADC 与 16
    ALINX 2025-03-13 09:27 43浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦