刚刚,马斯克发布“地表最强”AI,Grok3疯狂狙击OpenAI,后院却起火了

原创 超电实验室 2025-02-18 17:14

20万块GPU炼出Grok 3

作者|王磊
编辑|秦章勇

地球上最聪明的人工智能来了。(马斯克自己说的)


刚刚,马斯克旗下的人工智能公司xAI举行了一场技术演示,正式发布了其最新的大模型——Grok 3

这是人类历史上,第一个在20万块GPU上训练出的模型,而且其训练计算量是Grok-2的10倍。

马斯克在忙着深挖美国各机构财务账单之余,也现身直播间,亲自为其站台。

也正因为老马亲自站台,爱拖延的老毛病又犯了,原计划在中午12点开始的发布会,拖到了中午12点20才正式开始。

这场技术演示的内容,也可以说相当的硬。现场直接展示各项基准测试数据,从测试数据来看,Grok 3的确像马斯克说的那样,是“地球上最聪明的AI”。


在美国AIME数学竞赛、GPQA、代码编程方面,成绩超过了目前主流智能大模型,比如Gemini 2 Pro、Claude 3.5 Sonnet、GPT-4o 以及国内爆火的DeepSeek R1等模型。

不过有意思的是,在Grok 3发布之前,身为Grok 数据团队工程师Benjamin De Kraker在自家媒体 X 表示,Grok 3只能排第四

不过现在这个工程师似乎已经被解雇了....

01
 变态的推理能力

加上马斯克,发布会一共四个人,中间两位是华人。


Grok 3最大的亮点,是引入了“思维链(Chain Of Thought)”能力

简单来说,它就像人类一样,能够一步一步地思考复杂问题。当你问它一个复杂的科学问题时,它不会直接给出答案,而是像老师一样,一步步分析,最后给出清晰、准确的解答,让用户能够窥见 AI 在解决问题时的内部推理过程

比如,在解决数学问题时,模型会展示中间推导步骤,而非直接输出结果。不过,因为目前Grok 3 还未开源,为了防止核心算法被复制,xAI 会对思考过程进行一定程度的遮蔽处理。

Grok 3和国内的DeepSeek一样,采用了深度学习和强化学习相结合的方法。通过深度学习,模型能够从大量数据中提取特征和模式。强化学习使Grok 3能够在训练过程中不断调整自身的策略,以获得更高的奖励信号。

在推理任务中,Grok 3通过多次尝试和验证,不断优化自身的推理路径,从而找到最优解。 

为了全面评估Grok 3的性能,xAI团队在直播上展示多个领域的基准测试,涵盖了一般数学推理、STEM和科学的一般知识以及计算机科学编程等方面。


根据官方公布的测试数据,Grok-3和Grok-3 mini在数学、科学、代码等性能上都超过或媲美Gemini、DeepSeek和ChatGPT等对手。

为了展示其性能,马斯克还在线实操,让Grok-3现场生成了一段太空发射的3D动画的代码,随后成功运行。

画面上出现了飞船在地球和火星间往返的动画。xAI团队表示,这不是一段简单的动画,这需要AI模型首先能理解复杂物理知识,比如开普勒定律等相关问题,才能实现合理的轨迹规划。


现场还要求Grok 3现场创造一个融合《俄罗斯方块》和《宝石迷阵》的新游戏。

现场展示中,Grok 3生成的Python脚本定义了游戏中的常量、颜色、方块形状等元素。

在实际运行中,也呈现出了融合性的玩法:当连接至少三个相同颜色的方块时,重力机制启动,方块消失,其他方块随之掉落,类似《宝石迷阵》的消除机制;同时,游戏也保留了《俄罗斯方块》的基本元素。


值得一提的是,Grok 3还有可能将被集成到Tesla车辆中,允许通过语音命令与其互动。这意味着Tesla车主可以使用Grok获取实时信息,如天气状况和交通更新。马斯克还暗示Tesla驾驶者很快就能在驾驶过程中使用Grok处理更复杂的任务。

Grok 3是xAI公司发布的第三代人工智能模型,xAI公司成立于2023年7月,公司团队成员主要来自OpenAI、DeepMind以及其他顶级AI研究公司。马斯克创立xAI公司的目的很简单,就是和OpenAI竞争。

xAI成立不到半年,就发布了第一款大模型Grok-1,参数量高达3140亿,这一参数量远超OpenAI GPT-3.5的1750亿,成为当时参数量最大的开源大语言模型。2024年8月,xAI发布了更新一代的Grok 2大模型,主要应用于训练AI聊天机器人。


从去年8月到今年的2月,半年时间就能成功迭代的背后,马斯克下了不少本钱,为了训练Grok 3,xAI动用了超过20万块英伟达H100 GPU集群组成的全球最大AI超算Colossus进行训练,仅用了214天便完成了大规模模型的训练。

而Grok 3与第二代相比,Grok 3使用的算力提升了310倍,性能提升了15倍,训练量也高了10倍,在硬件基础上相当的猛。

为了维持算力优势,马斯克还打算筹集100亿美元资金,采购新一代GB200 GPU芯片来训练。

毕竟在发布前不久,马斯克曾放出豪言:“我们有信心Grok 3会比其他任何AI都强,而且很有可能,再也不会有比Grok(系列)更强的AI了”。

总之一句话,就是要做地表最强AI

02
 马斯克人红是非多

马斯克最近也是真的忙,不光忙着为自家AI大模型站台,喊话收购Open AI,还得作为新任“政府效率部” 牵头人,忙着对美国政府机构的 “大刀阔斧” 改革。

自古“人红是非多”,马斯克忙于政坛和AI战场之际,也招惹了不少麻烦。


首先就是后院要起火了,据华盛顿邮报报道,特斯拉内部会议的一段录音被曝光,特斯拉某一部门最近举行了一次员工会议,在这场会议上,有特斯拉员工和高级管理人员公开表达了对CEO马斯克与特朗普结盟的担忧,认为马斯克深入政治,会伤害特斯拉公司的长期目标

因此,就有人提出建议,马斯克如果辞职,特斯拉公司的情况可能会更好。

特斯拉作为马斯克亲自一手打造出的亲儿子,竟然想把亲爹扫地出门,这对于马斯克来说,绝对不是一个好消息。


然而,基于现实情况,还真不怪特斯拉内部会出现这样的抗议,马斯克走马上任以来,特斯拉的股价和基本盘都开始式微。

自马斯克“美国变法”开始,特斯拉股价已经累计下跌了16.6%,市值蒸发2273亿美元(约合人民币1.65万亿元)

销量方面,2025年1月,特斯拉在美国的注册量同比下降10.8%;在加州,下降幅度更是达到了12%。欧洲市场的情况更糟,1月份特斯拉在法国的销量下降了63%,德国下降了59%。

除此之外,不少特斯拉用户开始抵制马斯克,甚至有人患上了“特斯拉羞耻症”。

来自加拿大魁北克的车主阿兰·罗伊(Alain Roy)就表示,就因为马斯克在就职日上做的那个手势,让他不想再支持他了,决定把家里两台特斯拉全卖掉,还把准备买的Cybertruck的订单取消了。


根据荷兰时事节目EenVandaag对 26,000 名特斯拉车主的调查,显示曾经的“特斯拉骄傲”已经变成“特斯拉羞耻症”了,很多人打算和马斯克划清界限。

其中31% 的受访特斯拉车主表示,由于马斯克的行为,他们正在考虑出售或已经出售了他们的汽车,40%的人表示,这位首席执行官的行为和立场让他们羞于开特斯拉


最初,还只是一些特斯拉车主通过个人行为来表达不满, 但现在已经升级为了规模更大的公众抵制活动。

根据英国《金融时报》报道,上个周末,有大量的抗议者聚集在北美数十家特斯拉门店外,抗议马斯克对政府开支的激进削减措施,敦促展厅内的人不要购买汽车。

不过似乎没人能阻止马斯克,他当然也知道自己面临怎样的舆论,现在他在X平台有一条置顶推文:

I am endlessly amused by the infinite indignities I suffer on the very platform that I own.

我对自己在自己拥有的平台上遭受的无尽侮辱,感到无比好笑。







































































































































































































看到这里说明您已用心读完本篇文章,有任何想法欢迎在评论区留言。另外,因微信改版,需要设置星标才能及时看到推送,请关注并点击星标“超电实验室”,我们一起研究车圈大小事~

推荐阅读



‍‍‍‍‍‍‍

回归单身的日产:不靠本田,也能蹚出一条路

车企抱团接入,DeepSeek却是这么看的....


评论 (0)
  •   无人机蜂群电磁作战仿真系统全解析   一、系统概述   无人机蜂群电磁作战仿真系统是专业的仿真平台,用于模拟无人机蜂群在复杂电磁环境中的作战行为与性能。它构建虚拟电磁环境,模拟无人机蜂群执行任务时可能遇到的电磁干扰与攻击,评估作战效能和抗干扰能力,为其设计、优化及实战应用提供科学依据。   应用案例   目前,已有多个无人机蜂群电磁作战仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机蜂群电磁作战仿真系统。这些成功案例为无人机蜂群电磁作战仿真系统的推广和应用提
    华盛恒辉l58ll334744 2025-04-17 16:29 152浏览
  •   无人机电磁环境效应仿真系统:深度剖析   一、系统概述   无人机电磁环境效应仿真系统,专为无人机在复杂电磁环境下的性能评估及抗干扰能力训练打造。借助高精度仿真技术,它模拟无人机在各类电磁干扰场景中的运行状态,为研发、测试与训练工作提供有力支撑。   应用案例   目前,已有多个无人机电磁环境效应仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁环境效应仿真系统。这些成功案例为无人机电磁环境效应仿真系统的推广和应用提供了有力支持。   二、系统功能  
    华盛恒辉l58ll334744 2025-04-17 15:51 148浏览
  •   无人机电磁兼容模拟训练系统软件:全方位剖析   一、系统概述   北京华盛恒辉无人机电磁兼容模拟训练系统软件,专为满足无人机于复杂电磁环境下的运行需求而打造,是一款专业训练工具。其核心功能是模拟无人机在电磁干扰(EMI)与电磁敏感度(EMS)环境里的运行状况,助力用户评估无人机电磁兼容性能,增强其在复杂电磁场景中的适应水平。   应用案例   目前,已有多个无人机电磁兼容模拟训练系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁兼容模拟训练系统。这些成功案例为
    华盛恒辉l58ll334744 2025-04-17 14:52 64浏览
  •   无人机蜂群电磁作战仿真系统软件,是专门用于模拟、验证无人机蜂群在电磁作战环境中协同、干扰、通信以及对抗等能力的工具。下面从功能需求、技术架构、典型功能模块、发展趋势及应用场景等方面展开介绍:   应用案例   目前,已有多个无人机蜂群电磁作战仿真系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机蜂群电磁作战仿真系统。这些成功案例为无人机蜂群电磁作战仿真系统的推广和应用提供了有力支持。   功能需求   电磁环境建模:模拟构建复杂多样的电磁环境,涵盖各类电磁干扰源与
    华盛恒辉l58ll334744 2025-04-17 16:49 123浏览
  • 1. 在Ubuntu官网下载Ubuntu server  20.04版本https://releases.ubuntu.com/20.04.6/2. 在vmware下安装Ubuntu3. 改Ubuntu静态IP$ sudo vi /etc/netplan/00-installer-config.yaml# This is the network config written by 'subiquity'network:  renderer: networkd&nbs
    二月半 2025-04-17 16:27 143浏览
  •     CTI是Comparative Tracking Indices的缩写,在GB 4207中被译作“比较追踪指数”,我认为还是“漏电起痕指数”更容易理解。    CTI表述了材料的绝缘特性——阻止不希望出现的电流。CTI的单位是V,在绝缘物表面添加一定量的电解液并施加电场,观察在绝缘物表面既不会持续产生火焰,也不会因为热、介质击穿、湿气或者污染物产生电弧放电留下痕迹(起痕)的最高电压。CTI的测量方法见IEC 60112 (GB 4207)。&nbs
    电子知识打边炉 2025-04-19 21:20 0浏览
  • 置信区间反映的是“样本均值”这个统计量的不确定性,因此使用的是标准误(standard error),而不是直接用样本标准差(standard deviation)。标准误体现的是均值的波动程度,而样本标准差体现的是个体数据的波动程度,两者并非一回事,就如下图所显示的一样。下面优思学院会一步一步解释清楚:一、标准差和标准误,究竟差在哪?很多同学对“标准差”和“标准误”这两个概念傻傻分不清楚,但其实差别明显:标准差(Standard Deviation,σ或s):是衡量单个数据点相对于平均值波动的
    优思学院 2025-04-17 13:59 30浏览
  • 现阶段,Zigbee、Z-Wave、Thread、Wi-Fi与蓝牙等多种通信协议在智能家居行业中已得到广泛应用,但协议间互不兼容的通信问题仍在凸显。由于各协议自成体系、彼此割据,智能家居市场被迫催生出大量桥接器、集线器及兼容性软件以在不同生态的设备间构建通信桥梁,而这种现象不仅增加了智能家居厂商的研发成本与时间投入,还严重削减了终端用户的使用体验。为应对智能家居的生态割裂现象,家居厂商需为不同通信协议重复开发适配方案,而消费者则需面对设备入网流程繁琐、跨品牌功能阉割及兼容隐患等现实困境。在此背景
    华普微HOPERF 2025-04-17 17:53 112浏览
  •   北京华盛恒辉无人机电磁兼容模拟训练系统软件是专门用于模拟与分析无人机在复杂电磁环境中电磁兼容性(EMC)表现的软件工具。借助仿真技术,它能帮助用户评估无人机在电磁干扰下的性能,优化电磁兼容设计,保障无人机在复杂电磁环境中稳定运行。   应用案例   目前,已有多个无人机电磁兼容模拟训练系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机电磁兼容模拟训练系统。这些成功案例为无人机电磁兼容模拟训练系统的推广和应用提供了有力支持。   系统功能   电磁环境建模:支持三维
    华盛恒辉l58ll334744 2025-04-17 15:10 107浏览
  • 一、行业背景与需求智能门锁作为智能家居的核心入口,正从单一安防工具向多场景交互终端演进。随着消费者对便捷性、安全性需求的提升,行业竞争已从基础功能转向成本优化与智能化整合。传统门锁后板方案依赖多颗独立芯片(如MCU、电机驱动、通信模块、语音模块等),导致硬件复杂、功耗高、开发周期长,且成本压力显著。如何通过高集成度方案降低成本、提升功能扩展性,成为厂商破局关键。WTVXXX-32N语音芯片通过“单芯片多任务”设计,将语音播报、电机驱动、通信协议解析、传感器检测等功能整合于一体,为智能门锁后板提供
    广州唯创电子 2025-04-18 09:04 173浏览
  •     爬电距离指的是两个带电体之间、带电体和大地之间,沿着绝缘材料表面的最短距离。与爬电距离有关的标准有IEC 61010-1。PCB设计方面,可以参照IPC-2221B。        (图源TI)    任何情况下,爬电距离不允许小于电气间隙。当绝缘材料是空气时,爬电距离可以和电气间隙相等。电气间隙的简介见协议标准第011篇。        一般情况下
    电子知识打边炉 2025-04-19 20:54 0浏览
  • 近日,全球6G技术与产业生态大会(简称“全球6G技术大会”)在南京召开。紫光展锐应邀出席“空天地一体化与数字低空”平行论坛,并从6G通信、感知、定位等多方面分享了紫光展锐在6G前沿科技领域的创新理念及在空天地一体化技术方面的研发探索情况。全球6G技术大会是6G领域覆盖广泛、内容全面的国际会议。今年大会以“共筑创新 同享未来”为主题,聚焦6G愿景与关键技术、安全可信、绿色可持续发展等前沿主题,汇聚国内外24家企业、百余名国际知名高校与科研代表共同商讨如何推动全行业6G标准共识形成。6G迈入关键期,
    紫光展锐 2025-04-17 18:55 193浏览
  • 一、行业背景与需求随着智能化技术的快速发展和用户对便捷性需求的提升,电动车行业正经历从传统机械控制向智能交互的转型。传统电动车依赖物理钥匙、遥控器和独立防盗装置,存在操作繁琐、功能单一、交互性差等问题。用户期待通过手机等智能终端实现远程控制、实时数据监控及个性化交互体验。为此,将蓝牙语音芯片集成至电动车中控系统,成为推动智能化升级的关键技术路径。二、方案概述本方案通过在电动车中控系统中集成WT2605C蓝牙语音芯片,构建一套低成本、高兼容性的智能交互平台,实现以下核心功能:手机互联控制:支持蓝牙
    广州唯创电子 2025-04-18 08:33 187浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦