算法定义芯片!DeepSeek自研芯片,打破国产AI芯片的双重魔咒!

原创 飙叔科技洞察 2025-02-19 18:09
2月18日马斯克正式发布其最新人工智能模型Grok3。马斯克称:Grok3是“地球上最聪明的人工智能”,具有极强推理能力,在迄今为止所做的测试中,其表现优于我们所知的任何已发布产品。
同时称超越了创造国产“AI大模型”神话的DeepSeek;可见人工智能(AI)领域的竞争已进入白热化。可就当马斯克极度兴奋超越DeepSeek之际,DeepSeek已走向另外一个更为广阔的天空。
一、推理芯片应用将达85%
据知情人士透露,DeepSeek正广泛招募芯片设计人才,加速自研芯片布局,其芯片应用于端侧或云侧尚不明朗。
我们知道训练与推理,是人工智能(AI)大语言模型两大核心能力的坚固基石。2024年12月底DeepSeek发布DeepSeek-V3模型,之所以一夜爆红,其中一个重要原因在于V3模型整个训练仅使用了2048块英伟达H800 GPU,不仅极大的降低了AI大模型训练的成本,更重要的是DeepSeek打破了需要使用最尖端GPU才能训练AI大模型的魔咒;更准确地说就是打破了对英伟达GPU的迷信。
但随着AI模型的广泛应用,需要进行推理计算的硬件日益增多,对推理芯片的需求也将“水涨船高”。根据国际数据公司(IDC)数据,未来几年,推理端的AI服务器占比将持续攀升。预计到2027年,用于推理的工作负载将占据七成以上。同时,根据业内机构测算,到2028年人工智能的推理负载占比有望达到85%,考虑到云端和边缘侧巨大的推理需求,未来推理芯片的预期市场规模将是训练芯片的4~6倍。
也就是说,全球AI大模型在训练端的竞争已经告一段落,在接下来的3-5年随着AI应用的爆发,推理芯片才是王道。
二、自研芯片,破除第二重魔咒
如上所述推理芯片将是未来AI应用时代的主角;而我们知道,目前全球AI芯片市场多被英伟达等全球巨头所垄断,再加上美国对华芯片出口管制升级,供应链安全问题凸显。
刚晋升为AI大模型新贵的DeepSeek不得不面对,于是DeepSeek选择广泛适配国产AI芯片,截止到2月15日已有超过20家国产芯片厂商宣布适配DeepSeek,包括国产主流AI芯片厂商华为昇腾、龙芯、摩尔、燧原、沐曦、海光信息等等。从目前实际使用效果来看,采用这些芯片所获得的DeepSeek-R1模型推理性能不亚于英伟达GPU的效果这为DeepSeek自研芯片打下了草稿。
如上所述,无论是从成本角度考虑,或是实际AI应用普及和性能角度出发,DeepSeek自研推理芯片也就成为了必然。同时,DeepSeek有着对架构更深层次的理解,如若自研芯片,发挥其软硬件结合的能力,那么研发更具性价比的训练或推理芯片,进一步降低成本,或许将在更大程度上促进端侧AI的应用爆发,以及带动AI芯片的多样性发展。
因而,可以说正是DeepSeek的出现,为国产AI芯片破除了第二重魔咒——国产推理芯片不适合大规模应用;此次确实为国产推理芯片正名了,同时也意味着国产推理芯片规模化应用时代即将来临。
三、自研芯片,全球AI巨头的选择
自研推理芯片当然不是DeepSeek的首创,早在去年10月,OpenAI就与芯片制造商博通合作开发首款专注于推理的人工智能芯片。双方还在与台积电进行磋商,以推进这一项目。

根据外媒的最新消息,OpenAI将在未来几个月内完成其首款内部芯片的设计,并计划将其送往台积电制造,台积电将使用3nm技术制造OpenAI 芯片,该芯片有望在2025年底进行测试以及在2026年开始大规模生产,预计该芯片将具有“高带宽内存”和“广泛的网络功能”。

实际上,为了摆脱对英伟达GPU的依赖,谷歌、亚马逊、微软和Meta等科技巨头也都在自研芯片。
如去年12月亚马逊宣布,基于其内部团队所开发AI训练芯片Trainium2的 Trn2 实例广泛可用,并推出了Trn2 UltraServer大型AI训练系统,同时还发布了下代更先进的3nm制程 Trainium3芯片
另外,Cerebras、Groq和d-Matrix等初创公司,以及超威半导体公司(AMD)和英特尔等传统巨头,纷纷推出了AI推理芯片。如早在去年2月,Groq公司就发布了自己的AI推理芯片GroqCloud它在Llama 3.1 70B模型上实现了250token/秒的推理服务,速度比GPU几乎提升了一个量级。
2024年8月28日Cerebras官宣,推出了Cerebras推理芯片。这款芯片在Llama 3.1-8B模型上实现了1800token/秒的推理速度;在Llama 3.1 70B上实现了450token/秒的推理速度,约是英伟达GPU推理速度的20倍。
也就是说,随着AI模型的广泛应用,需要进行推理计算的硬件正在暴涨,这导致对推理芯片的需求也“水涨船高”。
因此,随着AI技术发展,高算力需求爆发,而现有芯片方案在性能与成本上的局限,必将导致英伟达垄断全球AI芯片的时代终结
而在未来市场一片混沌之中,DeepSeek为代表的国产AI大模型有望凭借其在NLP、多模态领域积累了深厚的算法优势,凭借这一技术底气,有望通过定制化指令集与内存架构,实现“算法定义芯片”的全新模式,从而突破通用GPU的能效瓶颈,将技术自主权牢牢掌握在自己手中。

飙叔感谢您花时间关注与分享,感谢在我的人生道路中多了这么多志同道合的朋友,一起关注国产光刻机、国产芯片、国产半导体艰难突破之路;一起分享华为海思、华为鸿蒙及华为手机等华为产业为代表的中国ICT产业崛起的点点滴滴;从此生活变得不再孤单,不再无聊!

勾搭飙叔,请扫码

飙叔科技洞察 一起关注国产光刻机、国产芯片、国产半导体艰难突破之路;一起分享华为海思、华为鸿蒙等华为产业点点滴滴!
评论 (0)
  •   军事仿真推演系统平台核心解析   北京华盛恒辉军事仿真推演系统平台以计算机仿真技术为基石,在功能、架构、应用及效能上展现显著优势,成为提升军事作战与决策能力的核心工具。   应用案例   目前,已有多个仿真推演系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润仿真推演系统。这些成功案例为仿真推演系统的推广和应用提供了有力支持。   一、全流程功能体系   精准推演控制:覆盖推演启动至结束全流程。   智能想定管理:集成作战信息配置、兵力部署功能。   数据模型整合
    华盛恒辉l58ll334744 2025-05-14 17:11 58浏览
  • 感谢面包板论坛组织的本次测评活动,本次测评的对象是STM32WL Nucleo-64板 (NUCLEO-WL55JC) ,该测试板专为LoRa™应用原型构建,基于STM32WL系列sub-GHz无线微控制器。其性能、功耗及特性组合经过精心挑选,支持通过Arduino® Uno V3连接,并利用ST morpho接头扩展STM32WL Nucleo功能,便于访问多种专用屏蔽。STM32WL Nucleo-64板集成STLINK-V3E调试器与编程器,无需额外探测器。该板配备全面的STM
    无言的朝圣 2025-05-13 09:47 176浏览
  •   舰艇电磁兼容分析与整改系统平台解析   北京华盛恒辉舰艇电磁兼容分析与整改系统平台是保障海军装备作战效能的关键技术,旨在确保舰艇电子设备在复杂电磁环境中协同运行。本文从架构、技术、流程、价值及趋势五个维度展开解析。   应用案例   目前,已有多个舰艇电磁兼容分析与整改系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润舰艇电磁兼容分析与整改系统。这些成功案例为舰艇电磁兼容分析与整改系统的推广和应用提供了有力支持。   一、系统架构:模块化智能体系   电磁环境建模:基
    华盛恒辉l58ll334744 2025-05-14 11:22 70浏览
  • 在当下的商业版图中,胖东来宛如一颗璀璨的明星,散发着独特的光芒。它以卓越的服务、优质的商品以及独特的企业文化,赢得了消费者的广泛赞誉和业界的高度关注。然而,近期胖东来与自媒体博主之间的一场激烈对战,却如同一面镜子,映照出了这家企业在光环背后的真实与挣扎,也引发了我们对于商业本质、企业发展以及舆论生态的深入思考。​冲突爆发:舆论场中的硝烟弥漫​2025年4月,抖音玉石博主“柴怼怼”(粉丝约28万)突然发难,发布多条视频直指河南零售巨头胖东来。他言辞犀利,指控胖东来在玉石销售方面存在暴利行为,声称其
    疯人评 2025-05-14 13:49 41浏览
  • 在当下竞争激烈的 AI 赛道,企业高层的变动往往牵一发而动全身,零一万物近来就深陷这样的动荡漩涡。近日,零一万物联合创始人、技术副总裁戴宗宏离职创业的消息不胫而走。这位在大模型基础设施领域造诣颇深的专家,此前在华为云、阿里达摩院积累了深厚经验,在零一万物时更是带领团队短期内完成了千卡 GPU 集群等关键设施搭建,其离去无疑是重大损失。而这并非个例,自 2024 年下半年以来,李先刚、黄文灏、潘欣、曹大鹏等一众联创和早期核心成员纷纷出走。
    用户1742991715177 2025-05-13 21:24 126浏览
  • 一、蓝牙射频电路设计的核心价值在智能穿戴、智能家居等物联网设备中,射频性能直接决定通信质量与用户体验。WT2605C等蓝牙语音芯片的射频电路设计,需在紧凑的PCB空间内实现低损耗信号传输与强抗干扰能力。射频走线每0.1dB的损耗优化可使通信距离提升3-5米,而阻抗失配可能导致30%以上的能效损失。二、射频走线设计规范1. 阻抗控制黄金法则50Ω标准阻抗实现:采用4层板时,顶层走线宽度0.3mm(FR4材质,介电常数4.3)双面板需通过SI9000软件计算,典型线宽1.2mm(1.6mm板厚)阻抗
    广州唯创电子 2025-05-13 09:00 25浏览
  • 一、量子自旋态光学操控1、‌拓扑量子态探测‌磁光克尔效应通过检测拓扑磁结构(如磁斯格明子)的磁光响应,实现对量子材料中非平庸拓扑自旋序的非侵入式表征。例如,二维量子磁体中的“拓扑克尔效应”可通过偏振光旋转角变化揭示斯格明子阵列的动态演化,为拓扑量子比特的稳定性评估提供关键手段。2、‌量子态调控界面‌非厄米磁光耦合系统(如法布里-珀罗腔)通过耗散调控增强克尔灵敏度,可用于奇异点附近的量子自旋态高精度操控,为超导量子比特与光子系统的耦合提供新思路。二、光子量子计算架构优化1、‌光子内存计算器件‌基于
    锦正茂科技 2025-05-13 09:57 33浏览
  • 在全球能源结构转型加速推进与政策驱动的双重作用下,油气输送、智慧水务及化学化工等流体计量场景正面临效率革命与智能化升级的迫切需求。传统机械式流量计虽在工业初期有效支撑了基础计量需求,但其机械磨损、精度衰减与运维困难等固有缺陷已难以适应现代工业对精准化、智能化与可持续发展的多维诉求。在此背景下,超声波流量计则凭借着高精度探测、可实时监测、无侵入式安装、无阻流部件、易于维护与绿色环保等优势实现了突破性发展,成为当代高精度流体计量体系中不可或缺的重要一环。该技术不仅是撬动能源利用效率提升、支撑智慧管网
    华普微HOPERF 2025-05-14 11:49 35浏览
  •   电磁数据展示系统平台解析   北京华盛恒辉电磁数据展示系统平台是实现电磁数据高效展示、分析与管理的综合性软件体系,以下从核心功能、技术特性、应用场景及发展趋势展开解读:   应用案例   目前,已有多个电磁数据展示系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据展示系统。这些成功案例为电磁数据展示系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与预处理   智能分析处理   集成频谱分析、时频变换等信号处理算法,自动提取时域频域特征;
    华盛恒辉l58ll334744 2025-05-13 10:20 375浏览
  •   军事领域仿真推演系统的战略价值与发展前瞻   北京华盛恒辉仿真推演系统通过技术创新与应用拓展,已成为作战效能提升的核心支撑。以下从战略应用与未来趋势展开解析:   应用案例   目前,已有多个仿真推演系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润仿真推演系统。这些成功案例为仿真推演系统的推广和应用提供了有力支持。   一、核心战略应用   1. 作战理论创新引擎   依托低成本仿真平台,军事人员可高效验证新型作战概念。   2. 装备全周期优化   覆盖武器
    华盛恒辉l58ll334744 2025-05-14 16:41 66浏览
  •   电磁数据管理系统深度解析   北京华盛恒辉电磁数据管理系统作为专业的数据处理平台,旨在提升电磁数据的处理效率、安全性与可靠性。以下从功能架构、核心特性、应用场景及技术实现展开分析:   应用案例   目前,已有多个电磁数据管理系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据管理系统。这些成功案例为电磁数据管理系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与接入:实时接收天线、频谱仪等设备数据,兼容多协议接口,确保数据采集的全面性与实时性
    华盛恒辉l58ll334744 2025-05-13 10:59 282浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦