用大白话,讲一下最近爆火的Deepseek

原创 星海情报局 2025-01-27 15:06

1957年10月4日,苏联成功发射了"斯普特尼克1号"人造卫星。消息传出后,从华盛顿到伦敦,整个西方都陷入了震惊和恐慌——因为这意味着:西方国家开始在技术上落后于非西方的国家。

从此之后,"斯普特尼克时刻"也就成了一个专有词汇,特指那些使得西方国家陷入技术落后局面的事件。

现在,"斯普特尼克时刻"又来了:顶着各种制裁,用着远低于美国科技企业的预算,一家中国企业开发的AI大模型,竟然实现了近似于GPT-4o大模型的效果。

更重磅的是:就在今天中午时分,DeepSeek已经登顶了中国和美国的应用商店,拆过了ChatGPT,成为了最受欢迎的AI应用。这个历史性的时刻,至少在目前十年内绝无仅有。

这家中国企业,叫幻方量化。他们开发的AI大模型,就是这几天爆火的Deepseek(深度求索)。《黑神话:悟空》背后的那个男人,Yocar冯骥将其称为“国运级别的科技成果”。

今天,我们就来聊聊Deepseek,看它为何能成为AI界的"斯普特尼克"。

底层技术路线的突破

从技术原理上来说,Deepseek的成功,尤其是最新一代deepseek R1的成功,来自于它所采用的RL强化学习策略,这是它以极低的成本却可以实现和GPT-4o差不多效果的根本原因。

要理解这种颠覆性,得先看清传统AI的局限。

在之前的文章里,我们就认为当下AI的故事很可能已经讲不下去了——因为以GPT为代表的传统AI,其策略的本质是"在人类监督下的猜字谜游戏"——GPT们其实并不会思考,它们虽然会生成看上去还挺靠谱的回答,但它们做出这些回答并不是它们了解事物运行的原理,而是这样回答有更大概率被人类所接受。

这种猜字谜的游戏,最多也就是生成一些"看似靠谱实则无法深究"的东西,根本没有办法投入现实、转化为生产力工具。早期绘画AI经常把人画出六个指头也是类似的原因——AI根本不知道人的手掌上应该有几个指头,它只是生成一个"乍一看还可以"的东西。

但deepseek不一样,deepseek是真的会思考的。

以现在爆火的deepseek R1来说,它完全抛弃了那种"猜字谜"的训练方式,转而采用了之前在围棋和智能驾驶领域常用的RL策略(强化学习)。

如果说以前的策略是人类告诉AI什么是对的什么是错的,AI只是在人类的指导下对人类进行模仿。那么RL就是人类仅仅起一个"引进门"的作用,剩下的"修行"就全部靠AI自己慢慢学习了。

这种"修行"在最初阶段或许很笨拙,但越训练AI的能力就越强——关键在于AI不需要遵循人类的生理极限。人类要吃饭睡觉,但AI不用,在高性能芯片的加持下,AI训练一年所见识过的棋局、游戏,往往比一个职业棋手、职业电竞玩家十辈子见过的都多——老司机哪怕开一辈子车,最多也就开个几百万公里。但自动驾驶AI只要开始训练,公里数就是以亿为单位计算了。

简而言之就是:RL策略,是真正地让AI学会认识世界、了解事物规律,而不是亦步亦趋地迎合人类的口味——这也就是为什么很多人在看到deepseek的成功后都认为2025年将会是RL强化学习的元年。

没办法,RL策略现在看来确实是太诱人了。

技术突破带来的降本增效

当技术路线换道超车,成本结构就会发生核爆式变革。

因为底层的技术路线上颠覆了以GPT为代表的传统AI,所以deepseek R1把性价比拉高到了一个不可思议的程度——相比起硅谷那群人动辄数亿数十亿美金的投资和数万张显卡的超级集群,我们仅仅靠着2000多张显卡和600万美元左右的成本就实现了近似乃至更好的效果。

用美国META公司一位匿名员工的话来说:"META内部一个负责AI项目的高管年薪拿出来,就足够训练deepseek了,而这样高薪的高管,META有几十个。"

......我只能说:跟着这群虫豸在一起,怎么能搞好AI呢?

同时,这波操作直接改写了游戏规则。deepseek的颠覆式创新也向外界传播了一个信息:不需要那么高的投入,也不需要那么多英伟达的GPU,你也可以做出很棒的大模型——OpenAI训练GPT-4耗费约6300万美元和25000张A100显卡,而Deepseek R1仅用600万美元达到可比效果,甚至可能用的还是国产显卡。

数据最能说明问题:RL策略使模型在对话轮次、任务复杂度等维度实现80%的收敛速度提升,数据利用率提高5倍以上。

黄仁勋一觉醒来,感觉自己家的地基被人刨了,因为AI的泡沫眼看着就要被戳破了——在传统技术路径下,90%的算力消耗在试错过程中,而Deepseek的自主学习机制能将无效训练降低60%。RL策略对并行计算的需求较传统架构下降40%,这使得国产显卡在特定计算任务中能达到英伟达GPU 75%的能效比。

这就带来了更大的打击:算力市场上的格局将会被重构——随着华为昇腾910B等国产芯片在RL框架中表现持续优化,美国试图通过A100/H100禁运遏制中国AI发展的策略正加速失效——国产显卡又不是不能用,那我为啥还要高价进口呢?既然如此,那么美国的"小院高墙"的制裁路线还有意义吗?靠芯片靠GPU还能卡住东方大国的脖子吗?

deepseek的爆火背后的几点观察

毫无疑问,deepseek确实是取得了巨大的成功,而且使用体验的确远超GPT系列的大模型,尤其是R1版本特有的思考过程,真的不再是单纯模仿人类,而是真的有自己的想法,甚至比人类更全面、更周密。

综上所述,老局有这么几点观察:

第一,RL路线的含金量已经不再需要怀疑,必然会是下一个阶段AI大模型的核心策略。这也意味着我们向着真正的“人工智能”开始了前进。

第二,靠着堆显卡、堆资本来发展AI的“Scaling law”的价值需要被重新审视,这不意味着Scaling law的崩盘,反而可能是Scaling law的二阶段形态。因为虽然定价已经虚高了,并不需要这么多钱也可以实现很棒的效果,但不意味着英伟达就是割韭菜——不得不承认,如果有更好的条件,AI必然会有更大的进步。

第三,AI行业可能真的没有什么核心的护城河,模型技术的超越将会是常态。今天deepseek超越了OpenAI,明天指不定有人也能超越deepseek——整个行业的格局没有固化,中美AI竞争的大局还早着呢。

第四,deepseek的成功确实意味着之前一个阶段里美国的“小院高墙”制裁策略失效了。但对我们来说,硬件上的突破和国产替代之路远未结束。国产GPU还要继续发力,这是基础性的力量,不能因为deepseek的成功,就觉得咱们已经不需要再警惕英伟达的技术优势了。
····· End ·····
星海情报局 系统研究
中国制造与国产替代
专注中国产业崛起故事
关注产业资讯,破解科技密码
追赶先进技术风口,看中国制造的星辰大海
入驻媒体平台
36Kr/ 观察者网风闻社区/ 网易
虎嗅/ 雪球/ 腾讯新闻


星海情报局 关注国产替代和中国品牌出海,每年写100个中国品牌案例,见证中国产业崛起!
评论
  • 不让汽车专美于前,近年来哈雷(Harley-Davidson)和本田(Honda)等大型重型机车大厂的旗下车款皆已陆续配备车载娱乐系统与语音助理,在路上也有越来越多的普通机车车主开始使用安全帽麦克风,在骑车时透过蓝牙连线执行语音搜寻地点导航、音乐播放控制或免持拨打接听电话等各种「机车语音助理」功能。客户背景与面临的挑战以本次分享的客户个案为例,该客户是一个跨国车用语音软件供货商,过往是与车厂合作开发前装车机为主,且有着多年的「汽车语音助理」产品经验。由于客户这次是首度跨足「机车语音助理」产品,因
    百佳泰测试实验室 2025-01-24 17:00 113浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 252浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 198浏览
  • 前篇文章中『服务器散热效能不佳有解吗?』提到气冷式的服务器其散热效能对于系统稳定度是非常重要的关键因素,同时也说明了百佳泰对于散热效能能提供的协助与服务。本篇将为您延伸说明我们如何进行评估,同时也会举例在测试过程中发现的问题及改善后的数据。AI服务器的散热架构三大重点:GPU导风罩:尝试不同的GPU导风罩架构,用以集中服务器进风量,加强对GPU的降温效果。GPU托盘:改动GPU托盘架构,验证出风面积大小对GPU散热的影想程度。CPU导风罩:尝试封闭CPU导风罩间隙,集中风流,验证CPU降温效果。
    百佳泰测试实验室 2025-01-24 16:58 81浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 337浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 199浏览
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 190浏览
  • 随着AI大模型训练和推理对计算能力的需求呈指数级增长,AI数据中心的网络带宽需求大幅提升,推动了高速光模块的发展。光模块作为数据中心和高性能计算系统中的关键器件,主要用于提供高速和大容量的数据传输服务。 光模块提升带宽的方法有两种:1)提高每个通道的比特速率,如直接提升波特率,或者保持波特率不变,使用复杂的调制解调方式(如PAM4);2)增加通道数,如提升并行光纤数量,或采用波分复用(CWDM、LWDM)。按照传输模式,光模块可分为并行和波分两种类型,其中并行方案主要应用在中短距传输场景中成本
    hycsystembella 2025-01-25 17:24 174浏览
  • 书接上回:【2022年终总结】阳光总在风雨后,启航2023-面包板社区  https://mbb.eet-china.com/blog/468701-438244.html 总结2019,松山湖有个欧洲小镇-面包板社区  https://mbb.eet-china.com/blog/468701-413397.html        2025年该是总结下2024年的喜怒哀乐,有个好的开始,才能更好的面对2025年即将
    liweicheng 2025-01-24 23:18 180浏览
  • 项目展示①正面、反面②左侧、右侧项目源码:https://mbb.eet-china.com/download/316656.html前言为什么想到要做这个小玩意呢,作为一个死宅,懒得看手机,但又想要抬头就能看见时间和天气信息,于是就做个这么个小东西,放在示波器上面正好(示波器外壳有个小槽,刚好可以卡住)功能主要有,获取国家气象局的天气信息,还有实时的温湿度,主控采用ESP32,所以后续还可以开放更多奇奇怪怪的功能,比如油价信息、股票信息之类的,反正能联网可操作性就大多了原理图、PCB、面板设计
    小恶魔owo 2025-01-25 22:09 253浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦