产业丨DeepSeek的压力给到华尔街,掀起蝴蝶效应

AI芯天下 2025-02-06 20:30

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言
传统AI训练对算力的需求巨大,而英伟达的芯片作为算力的核心,其重要性不言而喻。

然而,DeepSeek的问世使市场认识到,AI对算力的需求并非如先前所预期的那样庞大。



作者 | 方文三
图片来源 |  网 络 


DeepSeek打开大模型新思路


20241月20日,DeepSeek公司正式发布了其推理模型DeepSeek-R1的完整版本。


该模型以较低的训练成本实现了与OpenAI推理模型o1相媲美的性能,并且完全免费开源,这一举措在业界引起了巨大反响。


众多开发者表示,他们正在考虑利用DeepSeek技术对现有系统进行彻底的重构。


在这一趋势的推动下,DeepSeek推出的移动端应用在一周内迅速发酵,并在发布仅一个月后,跃升至美区苹果应用商店免费应用排行榜首位,不仅超越了ChatGPT,也超越了其他热门应用。


2025年1月28日,DeepSeek进一步开源了其多模态模型Janus-Pro-7B,并宣称在GenEval和DPG-Bench基准测试中胜过了DALL-E 3(由OpenAI开发)和Stable Diffusion。


在本次DeepSeek Janus Pro与DALL-E 3的对比分析中,DALL-E 3的参数量先前公布为120亿,而Janus Pro的大模型参数量仅为70亿。


R1的问世不仅打破了科技巨头独占推动旗舰开源模型的传统行业共识,还颠覆了去年形成的另一个行业共识,即通用大型模型正逐渐演变成大型企业间资本竞争的领域。



硬件媒体Tom's Hardware发布了开年最受关注的报道:DeepSeek甚至绕过了CUDA,转而使用更为基础的编程语言进行优化。


DeepSeek R1与OpenAI o1在技术上的关键区别在于其创新的训练方法,例如在数据训练阶段采用的R1-Zero方法,直接将强化学习(RL)应用于基础模型,而无需依赖监督微调(SFT)和已标注数据。


根据DeepSeek官方技术文档,R1模型利用数据蒸馏技术(Distillation)生成的高质量数据,提升了训练效率。


数据蒸馏是指通过一系列算法和策略,对原始、复杂的数据进行去噪、降维、提炼等处理,从而得到更为精炼、有用的数据。


这也是DeepSeek能够以更少的参数量实现与OpenAI o1模型性能相当的关键所在。


DeepSeek并非传统意义上的科技企业,却以远低于美国大型模型公司所使用的GPU资源和成本,成功研发出极具创新性的模型。


其R1模型的训练成本仅为560万美元,这一数额甚至不及Meta GenAI团队中任何一位高层管理人员的年薪。



背后幻方量化的投资布局考量


梁文锋,作为两家资产规模达百亿的量化私募机构——浙江九章资产管理有限公司和宁波幻方量化投资管理合伙企业(有限合伙)的实际控制人,同时也是DeepSeek的创始人。


梁文锋自浙江大学电子工程系AI专业毕业后,曾涉足与专业不直接相关的金融科技行业,专注于私募基金和量化投资领域多年。


作为量化投资领域的资深私募公司,幻方量化自2015年成立以来迅速崛起,成为行业的领头羊,管理规模一度突破千亿人民币。


作为私募公司,幻方量化必须通过量化投资业务实现盈利,以保障公司的持续运营和发展,包括为DeepSeek的研发提供资金支持。


在量化投资领域,公司运用先进的量化策略,结合AI技术对大量金融数据进行分析和建模,制定精确的投资决策,在过去的市场表现中取得了显著的业绩。


在2016年,幻方量化推出了首个基于深度学习的交易模型,并开始将GPU引入计算交易仓位。


此后,梁文峰不断扩大AI算法研究团队,将AI技术深度融入金融投资量化策略中,逐步取代了所有传统模型。


至2017年,幻方宣布其投资策略已全面AI化。


至2019年,幻方量化成为中国首家募资超过1000亿元人民币的量化基金。


幻方量化自2019年起开始囤积GPU,至2021年,在中国拥有1万张GPU的企业寥寥无几,而拥有1万张英伟达A100芯片的公司仅幻方量化一家。


随着幻方量化囤积GPU规模的不断扩大,幻方开始成立专门的AI研究公司。


2019年推出萤火一号AI集群,2021年又投资10亿人民币,研发萤火二号以提供算力支持,可见在技术层面,幻方量化把握住了市场机遇。


在美国于2022年对中共实施芯片制裁之前,幻方量化已大规模购买英伟达芯片,为后续产品的面世奠定了重要基础。


2023年7月,梁文峰宣布正式进军通用AIAPI领域,创办了DeepSeek,仅用10个月时间,至2024年5月,DeepSeek推出了version2模型。


DeepSeek的成立标志着幻方量化从量化投资向AI技术的深度转型。


通过DeepSeek,梁文锋不仅在AI领域取得了显著成就,还为幻方量化在量化投资领域提供了更强大的技术支持。


作为国内领先的量化投资机构,幻方量化自成立以来,一直致力于运用机器学习和全自动量化交易推动国内量化投资的发展。


随着AI大模型在国内的迅速崛起,业界流传着一种说法:在中国,拥有最多高性能GPU的机构并非AI公司,而是幻方量化。


资金雄厚、不吝啬的幻方量化在背后支持DeepSeek进行模型研究,其研究路线坚持开放源代码,且并不急于将研究成果商业化应用。


据接近DeepSeek管理层的内部人士介绍,梁文锋已个人投资于一些未来可能在DeepSeek模型基础上发展起来的下游AI应用企业项目。


这表明梁文锋正在为DeepSeek未来构建一个小型生态系统而提前进行布局。



对英伟达等科技巨头的潜在影响


美国财经杂志《财富》发出警告,指出DeepSeek正对英伟达在AI领域的主导地位构成威胁。


正如先前所述,DeepSeek已经推出了采用性能较低、成本更为经济的芯片的最新产品系列,此举对英伟达施加了压力。


有观点认为,这可能导致其他大型科技公司减少对英伟达更高端产品的采购。


AvaTrade的首席市场分析师凯特·利曼在接受《财富》杂志采访时指出:[投资者对DeepSeek利用性能较弱的AI芯片的能力表示担忧,这可能会影响英伟达在AI硬件市场的主导地位,尤其是考虑到其估值在很大程度上依赖于AI领域的需求。]


值得注意的是,据tomshardware的报道,DeepSeek在AI技术上的突破并未采用英伟达的CUDA平台,而是选择了类似汇编语言的PTX编程方式,这在一定程度上加剧了业界对英伟达未来发展的忧虑。


由于受到DeepSeek的冲击,美国芯片行业巨头英伟达的股价在当日暴跌约17%,博通公司的股价也下跌了17%,AMD的股价下跌了6%,微软的股价下跌了2%。


美国联合能源公司的股价下跌了21%,而Vistra的股价更是下跌了29%。


幻方量化,一家专注于量化投资的公司,早已洞察到AI算力需求的潜在泡沫。


传统AI训练对算力的需求巨大,而英伟达的芯片作为算力的核心,其重要性不言而喻。


然而,DeepSeek的问世使市场认识到,AI对算力的需求并非如先前所预期的那样庞大。


DeepSeek的开源旨在向公众证明,AI实际上仅需原先算力的十分之一。


这一举措进一步加剧了英伟达股价的下跌风险。



若DeepSeek未能达到预期效果,或市场反应不及预期,英伟达的股价可能不会下跌,甚至可能上涨。


从技术竞争角度看,DeepSeek的低成本、高效能技术路径如果被广泛应用,可能会减少市场对英伟达高端GPU的依赖,理论上存在促使幻方量化做空英伟达以获取利益的动机。


但幻方量化此前囤积了上万张英伟达 A100 和 H800 芯片,这些芯片是其技术研发的重要基础,与英伟达也存在着一定的合作关系,这又使得其做空英伟达的行为存在诸多矛盾之处。


尽管目前缺乏明确证据证明幻方量化对英伟达进行了做空操作,但DeepSeek在技术上的突破对英伟达市场地位可能产生的影响,无疑已经引起了市场的广泛关注。


根据券商中国的报道,摩根士丹利在其最新研究报告中宣布,将2025年英伟达GB200的预期出货量从先前的3万至3.5万件大幅削减至2万至2.5万件,最悲观的预测显示出货量可能不足2万件。


此次预期下调可能会对GB200供应链市场造成300亿至350亿美元的影响,给相关供应链及半导体行业带来沉重压力。


摩根士丹利指出,市场对于大型语言模型(LLM)的效率存在争议,例如DeepSeek与微软之间的分歧,预计这些争议在2025年仍将持续,这将使得市场难以对这些股票的价值进行重新评估。


此外,依据周期性规律,云计算行业的资本支出增长速度可能在2025年第四季度减缓至个位数百分比。


尽管如此,摩根士丹利预测,如果历史周期性规律重演,这一增长周期可能会持续至2025年上半年。


随着市场逐渐接近周期顶峰,预计2025年第四季度,同比增长速度将减缓至个位数。


投资者对GB200供应链股票的预期增长过高,可能会对高市盈率的云计算股票产生负面影响。



结尾:技术革新的路径预计将产生影响


①AI初创企业的运营模式将经历转变:那些依赖昂贵GPU集群的AI企业可能会因为成本上的不利地位而面临破产风险。


这将导致二手市场GPU供应量的大幅增加,而中小规模的AI企业则更可能倾向于采购价格更为低廉的低端GPU。


②硬件需求也将经历结构性的转变:自去年以来,以训练为主导的算力需求已经开始向推理侧转移。


未来这种趋势预计将会持续,众多中小AI企业将不再致力于训练基础模型,而是转向采用DeepSeek这类开源模型。


此外,英伟达在训练市场的主导地位也将面临重新评估。


部分资料参考:极客公园:《Deepseek又出连招:刚发布了超越DALL-E3的多模态模型》,字母榜:《DeepSeek推翻两座大山》,量子位:《[DeepSeek甚至绕过了CUDA],工程师灵魂提问:英伟达护城河还在吗?》,Meta财经:《关于幻方私募:当AI算法走进量化世界,无痛[躺赢]?》,私募排排网:《DeepSeek背后的百亿私募大佬基金业绩如何?》,经济观察报:《雷军都来挖人,这家公司想把1%的AI天才藏起来》,半导体行业观察:《成就DeepSeek奇迹的芯片,敲响英伟达警钟》,贝壳财经:《DeepSeek崛起,英伟达暴跌》,华尔街见闻:《DeepSeek最强国产大杀器?英伟达一家就没了近4.3万亿》,甲子光年:《英伟达市值蒸发创纪录,DeepSeek掀起AI算力革命意味着什么?》


本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。



END


推荐阅读:


商务合作请加微信勾搭:
18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论 (0)
  •   后勤实验仿真系统平台深度解析   北京华盛恒辉后勤实验仿真系统平台依托计算机仿真技术,是对后勤保障全流程进行模拟、分析与优化的综合性工具。通过搭建虚拟场景,模拟资源调配、物资运输等环节,为后勤决策提供数据支撑,广泛应用于军事、应急管理等领域。   应用案例   目前,已有多个后勤实验仿真系统平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润后勤实验仿真系统平台。这些成功案例为后勤实验仿真系统平台的推广和应用提供了有力支持。   一、核心功能   (一)后勤资源模拟
    华盛恒辉l58ll334744 2025-04-23 15:39 168浏览
  •   陆地装备体系论证与评估综合平台系统解析   北京华盛恒辉陆地装备体系论证与评估综合平台系统是契合现代军事需求而生的专业系统,借助科学化、智能化手段,实现对陆地装备体系的全方位论证与评估,为军事决策和装备发展提供关键支撑。以下从功能、技术、应用及展望展开分析。   应用案例   目前,已有多个陆地装备体系论证与评估综合平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润陆地装备体系论证与评估综合平台。这些成功案例为陆地装备体系论证与评估综合平台的推广和应用提供了有力支持。
    华盛恒辉l58ll334744 2025-04-24 10:53 104浏览
  •   航空兵训练与战术对抗仿真平台系统解析   北京华盛恒辉航空兵训练与战术对抗仿真平台系统是现代军事训练的关键工具,借助计算机技术构建虚拟战场,支持多兵种协同作战模拟,为军事决策、训练及装备研发提供科学依据。   应用案例   目前,已有多个航空兵训练与战术对抗仿真平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润航空兵训练与战术对抗仿真平台。这些成功案例为航空兵训练与战术对抗仿真平台的推广和应用提供了有力支持。   一、系统架构与核心功能   系统由模拟器、计算机兵力生
    华盛恒辉l58ll334744 2025-04-24 16:34 102浏览
  •   海上训练与保障调度指挥平台系统解析   北京华盛恒辉海上训练与保障调度指挥平台系统是现代海上作战训练的核心枢纽,融合信息技术、GIS、大数据及 AI 等前沿技术,旨在实现海上训练高效组织、作战保障科学决策。以下从架构功能、应用场景、系统优势及发展挑战展开解读。   应用案例   目前,已有多个海上训练与保障调度指挥平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润海上训练与保障调度指挥平台。这些成功案例为海上训练与保障调度指挥平台的推广和应用提供了有力支持。   一
    华盛恒辉l58ll334744 2025-04-24 15:26 84浏览
  • 前言本文主要演示基于TL3576-MiniEVM评估板HDMI OUT、DP 1.4和MIPI的多屏同显、异显方案,适用开发环境如下。Windows开发环境:Windows 7 64bit、Windows 10 64bitLinux开发环境:VMware16.2.5、Ubuntu22.04.5 64bitU-Boot:U-Boot-2017.09Kernel:Linux-6.1.115LinuxSDK:LinuxSDK-[版本号](基于rk3576_linux6.1_release_v
    Tronlong 2025-04-23 13:59 141浏览
  •   高海拔区域勤务与装备保障调度系统平台解析   北京华盛恒辉高海拔区域勤务与装备保障调度系统平台专为高海拔特殊地理环境打造,致力于攻克装备适应、人员健康保障、物资运输及应急响应等难题。以下从核心功能、技术特点、应用场景及发展趋势展开全面解读。   应用案例   目前,已有多个高海拔区域勤务与装备保障调度系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润高海拔区域勤务与装备保障调度系统。这些成功案例为高海拔区域勤务与装备保障调度系统的推广和应用提供了有力支持。   一、核心
    华盛恒辉l58ll334744 2025-04-24 10:13 97浏览
  •   有效样本分析决策系统平台全面解析   一、引言   北京华盛恒辉有效样本分析决策系统在当今数据驱动的时代,企业、科研机构等面临着海量数据的处理与分析挑战。有效样本分析决策系统平台应运而生,它通过对样本数据的精准分析,为决策提供有力支持,成为提升决策质量和效率的关键工具。   应用案例   目前,已有多个有效样本分析决策系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润有效样本分析决策系统。这些成功案例为有效样本分析决策系统的推广和应用提供了有力支持。   二、平台概述
    华盛恒辉l58ll334744 2025-04-24 11:13 92浏览
  •   通用装备论证与评估系统平台解析   北京华盛恒辉通用装备论证与评估系统平台是服务军事装备全生命周期管理的综合性信息化平台,通过科学化、系统化手段,实现装备需求论证、效能分析等核心功能,提升装备建设效益。   应用案例   目前,已有多个通用装备论证与评估系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润通用装备论证与评估系统。这些成功案例为通用装备论证与评估系统的推广和应用提供了有力支持。   一、系统分层架构   (一)数据层   整合装备性能、作战、试验等多源异
    华盛恒辉l58ll334744 2025-04-24 16:14 86浏览
  •   无人机结构仿真与部件拆解分析系统平台解析   北京华盛恒辉无人机结构仿真与部件拆解分析系统无人机技术快速发展的当下,结构仿真与部件拆解分析系统平台成为无人机研发测试的核心工具,在优化设计、提升性能、降低成本等方面发挥关键作用。以下从功能、架构、应用、优势及趋势展开解析。   应用案例   目前,已有多个无人机结构仿真与部件拆解分析系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机结构仿真与部件拆解分析系统。这些成功案例为无人机结构仿真与部件拆解分析系统的推广和应用提
    华盛恒辉l58ll334744 2025-04-23 15:00 201浏览
  •   电磁频谱数据综合管理平台系统解析   一、系统定义与目标   北京华盛恒辉电磁频谱数据综合管理平台融合无线传感器、软件定义电台等前沿技术,是实现无线电频谱资源全流程管理的复杂系统。其核心目标包括:优化频谱资源配置,满足多元通信需求;运用动态管理与频谱共享技术,提升资源利用效率;强化频谱安全监管,杜绝非法占用与干扰;为电子战提供频谱监测分析支持,辅助作战决策。   应用案例   目前,已有多个电磁频谱数据综合管理平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁频谱数
    华盛恒辉l58ll334744 2025-04-23 16:27 192浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦