一夜爆火全球的DeepSeek,自从其发布DeepSeek-R1大模型之后,震撼了全球人工智能撼动了美国科技界。更是凭借一己之力拉崩了纳斯达克,致使英伟达暴跌17%。但被美国大V们一顿猛夸之后,发现常规的科技竞争打不过了,于是只能再次祭出所谓“国家安全”的幌子。根据财联社消息,美国于1月29日确认正在准备对DeepSeek进行所谓的安全调查。当然, 除了美国之外,意大利隐私监管机构(Garante)于2025年1月28日晚宣布,已向DeepSeek的中国公司发送了正式的信息请求,要求其说明如何处理用户数据。1月29日意大利下架DeepSeek应用,已不能在意大利苹果Store 和谷歌的Play Store 上下载了。另外,爱尔兰、澳大利亚等国也对DeepSeek的下载和应用开始使用设限。与这些国家行为截然相反的是,全球科技巨头集体“着急”接入DeepSeek,如微软、英伟达、亚马逊等都已接入DeepSeek。而英伟达直接的竞争对手AMD更是第一个站出来支持DeepSeek,希望通过DeepSeek的背刺进一步参与到全球高端GPU市场,提升自身的市场份额。这意味着,美国科技巨头们已经站队DeepSeek,与当局政府背道而驰,这足以说明DeepSeek在全球市场的号召力与影响力。然而飙叔认为,这些全球巨头的站队固然重要;但让人振奋的无疑还是国产巨头——华为正式接入DeepSeek。当然,最让人意想不到的是,DeepSeek直接用上了华为昇腾910B芯片,据说已经将部分算力迁移到华为昇腾910B上,采用的是精准动态调节技术,虽然性能损耗5%,但成本降低一半以上。也就是说,华为与DeepSeek正式合体了;飙叔认为两者的合体,超越了单纯的市场价值,而具有超越行业的巨大价值和意义;同时也是英伟达以及美国人工智能产业最为担心和害怕的!为何这么说呢?我们知道2024年美国对于中国半导体的打压和限制,其中最为严格的就在于人工智能领域,如其要求英伟达出口中国的GPT连续两次降频,从H100到H800,再到H20;阉割两次后,从特定的计算任务或性能指标来看,H20综合算力仅相当于H100的20%左右。对于DeepSeek而言,直接使用华为昇腾910B,不仅是可以绕过美国的芯片管制;更重要的是其性能接近英伟达A800水平,已实现了从设计到量产的全国产化链条。当然,大家可能会担心昇腾910芯片的产能问题,从供应链相关消息来看,目前国产芯片制造的技术和能力7nm工艺良率已经达到90%以上,这意味着同样是7nm制程的昇腾910系列芯片产能将不会有问题。从而,DeepSeek的这一选择不仅打破了一流AI大模型非得使用英伟达GPU不可的神话;同时也给予了国产AI芯片更大的市场机会。当然,不可否认的是目前国产AI芯片与英伟达主流产品依然差距不小;如华为的昇腾910B,与英伟达的A100还存在代差。
但这种硬件层面的代差,DeepSeek通过软件层面进行了弥补;而且非常关键的是DeepSeek甚至绕过了CUDA,使用更底层的编程语言做优化。
根据Mirae Asset Securities Research(韩国未来资产证券)的分析:DeepSeek V3的硬件效率之所以能比Meta等高出10倍,可以总结为“他们从头开始重建了一切”。即DeepSeek绕过了CUDA,使用的是PTX(Parallel Thread Execution)语言实现的;PTX在接近汇编语言的层级运行,允许进行细粒度的优化,如寄存器分配和Thread/Warp级别的调整。
这对英伟达来说,几乎是致命的,CUDA是英伟达经过几十年的积累和沉淀而来的,现在CUDA已经做到了从开发者到用户的全产业链绑定。无论是训练大模型还是进行实时推理,CUDA都提供了无与伦比的工具链支持。详细可参看:破局!调查英伟达,一步险棋,但国产GPU还有更好选择?因而,DeepSeek绕过CUDA不仅在技术上实现了突破;更重要的是全球第一次真正意义上冲破了CUDA的束缚。这意味着,强大而近乎完美CUDA生态被撕开了一个口子;这或许才是英伟达老黄“仰天长叹”的最主要原因吧。一直以来,由于美国打压和市场的双重压力,国产AI生态从硬件到软件,以致整个AI生态都是被英伟达为代表的全球巨头所定义。而此次DeepSeek开源AI模型,使用昇腾910芯片,绕过CUDA生态;这给国产AI大模型,甚至是其他后发国家的AI发展提供了“第二条发展路径”。DeepSeek大模型与昇腾平台的深度融合,则提供了“算法+芯片”一站式解决方案。当然,这不是说直接颠覆了CUDA生态,但对于相当一部分的开发者而言有了一个新的选择——从CUDA生态迁移到新的国产平台。同时鉴于DeepSeek从底层重构了代码,直接绕过了英伟达的CUDA架构生态,避免被英伟达技术绑架;也就是说其他国产AI大模型迁移到各个国产算力芯片平台将变得可能,甚至将变得轻而易举。如上所述,底层代码的AI大模型、华为昇腾AI芯片,以及绕过CUDA的工具链;这意味着国产AI生态正在形成闭环,甚至未来将形成国产AI技术标准。
因此,飙叔认为纵然DeepSeek技术确实有过人之处,但仅仅是单个大模型并不足以撼动美国在人工智能产业上的绝对优势;而当与华为昇腾合体之后产生的生态效应将无限放大国产AI产业在全球的模仿效应,成为其他国家AI产业发展的模版,这意味着不仅英伟达AI产业垄断地位的丧失,同时也动摇了美国人工智能新科技霸权的地位。飙叔感谢您花时间关注与分享,感谢在我的人生道路中多了这么多志同道合的朋友,一起关注国产光刻机、国产芯片、国产半导体艰难突破之路;一起分享华为海思、华为鸿蒙及华为手机等华为产业为代表的中国ICT产业崛起的点点滴滴;从此生活变得不再孤单,不再无聊!
| 勾搭飙叔,请扫码 |