电子工程专辑刚刚介绍了《谷歌发布多模态大模型Gemini》,这是谷歌自称强于OpenAI技术的目前最强大的AI,然而据彭博社报道称,Google在关于"双子座"的性能视频演示中作假了。

电子工程专辑在昨日刚刚介绍了《谷歌发布多模态大模型Gemini》,这是谷歌自称强于OpenAI技术的目前最强大的AI,然而据彭博社报道称,Google在关于"双子座"的性能视频演示中作假了。

视频来源:Google Gemini AI演示

这段六分钟的视频展示了 Gemini 的多模态功能(例如,口语对话提示与图像识别相结合)。双子座似乎能快速识别图像(甚至是连线图片),在几秒钟内做出反应,并实时跟踪杯球游戏中的纸团。当然,人类可以做到所有这些,但这是一个能够识别并预测接下来会发生什么的人工智能。

彭博社专栏作家帕米-奥尔森(Parmy Olson)说,Google的"What the AI quack"视频中,Gemini 看起来能力非凡,也许能力太强了。

不过,视频描述中,Google有一个重要的免责声明:"为了演示的目的,延迟已经减少,双子座的输出已经缩短,以求简洁"。

这正是奥尔森不满意的地方。根据她在彭博社发表的文章,Google在被要求发表评论时承认,视频演示并不是通过语音提示实时进行的,而是使用了原始镜头中的静止图像帧,然后写出文字提示,让双子座做出回应。奥尔森写道:"这与Google似乎在暗示的内容大相径庭:人可以与双子座进行流畅的语音对话,同时双子座会实时观察并回应周围的世界。公平地说,Google公司经常编辑演示视频,尤其是许多公司希望避免现场演示带来的任何技术故障。稍作调整是常有的事。但是,Google在视频演示方面一直存在问题。人们曾怀疑Google的 Duplex 演示(还记得 Duplex 吗?Duplex 是一款人工智能语音助手,可以打电话给发廊和餐馆预订房间。而预先录制的人工智能模型视频往往会让人更加怀疑。"

在这种情况下,奥尔森认为Google是在"作秀",目的是误导人们,让他们不知道 Gemini 仍然落后于 OpenAI 的 GPT。

不过Google对此并不认同。当被问及演示的真实性时,Google指出了Google DeepMind 研究副总裁兼深度学习负责人 Oriol Vinyals(也是 Gemini 的联合负责人)的一篇文章,其中解释了团队是如何制作视频的。

Vinyals 说:"视频中的所有用户提示和输出都是真实的,为了简洁起见进行了缩短。视频展示了使用 Gemini 构建的多模式用户体验。我们制作它是为了激励开发人员。"

他补充说,团队给双子座提供了图片和文本,并要求它预测接下来会发生什么。

其他质疑

1、MMLU测试中,Gemini结果下面灰色小字标称CoT@32,展开来代表使用了思维链提示技巧、尝试了32次选最好结果。而作为对比的GPT-4,却是无提示词技巧、只尝试5次,这个标准下Gemini Ultra其实并不如GPT-4。

2、对于那段精彩视频,也有人从开篇的文字免责声明中发现了问题。机器学习讲师Santiago Valdarrama认为声明可能暗示了展示的是精心挑选的好结果,而且不是实时录制而是剪辑的。后来谷歌在一篇博客文章中解释了多模态交互过程,几乎承认了使用静态图片和多段提示词拼凑,才能达成这样的效果。

Gemini vs ChatGPT,谁是真正的强者?

虽然ChatGPT所用的大语言模型来自谷歌实验室,相当于对于AI来说,谷歌是最早投入,在模型方面,他是鼻祖。然而,AI的成熟度除了模型之外,还需要算力和时间。算力方面,相信谷歌不会输给OpenAI,但是时间方面,OpenAI已经从最初的ChatGPT3.0进化到了4.0,这其中成长了一年的时间,对于快速进化的AI来说,一年是非常非常重要的,而Gemini AI还是刚刚发布。

同时,目前Gemini Pro版本,还只能对标GPT-3.5,对标GPT-4的大杯Gemini Ultra,要明年才出。

此外,Gemini仅支持英文,中文和其他语言也需要明年了。

 

然而,更多人关心的是,Gemini AI是否一直免费?能否抛弃ChatGPT Plus每月20美元的账单?

这就引发另一个问题,谷歌能否创立一种新的AI商业模式,但是,目前来说,由于AI需要大量的算力投入,成本非常巨大,除非在性能上有了数个数量级的突破,否则人工智能技术依然没法像互联网一样采用免费模式。

责编:Challey
阅读全文,请先
您可能感兴趣
近年来,AWS还积极投资于人工智能(AI)、机器学习(ML)、大数据分析和边缘计算等前沿技术,以保持其在这些领域的竞争优势。
有鉴于电动汽车、自动驾驶和人工智能业务等未来增长潜力,以及在马斯克在当选总统特朗普政府中的“特殊地位”,多家分析机构认为,马斯克的财富未来还将进一步增长。
今年初的GTC上,黄仁勋就说机器人的“ChatGPT时刻”要来了。也就是说这波AI驱动的机器人热潮要来了...最近的ROSCon China 2024大会似乎也能看到这种迹象...
据悉,此次交易是通过马斯克亲自与英伟达CEO黄仁勋进行沟通促成的。这批GB200 AI芯片将被用于强化其旗舰级超级计算集群——Colossus(巨人)。Colossus作为xAI的技术基石,将借此机会实现计算能力的飞跃。
Arm预计,到2025年将会有1,000亿台基于Arm架构的设备可具备人工智能功能,包括由Cortex-A、Cortex-M驱动的设备。
人工智能(AI)功能已经在各种移动设备中变得至关重要。尤其是2024年,AI PC陆续推向市场,甚至可以称为“边缘设备AI元年”。 这次我们就来盘点一下2024年下半年发布的主要AI PC和处理器。
目前,智能终端NFC功能的使用频率越来越高,面对新场景新需求,ITMA多家成员单位一起联合推动iTAP(智能无感接近式协议)标准化项目,预计25年上半年发布1.0标准,通过功能测试、兼容性测试,确保新技术产业应用。
中科院微电子所集成电路制造技术重点实验室刘明院士团队提出了一种基于记忆交叉阵列的符号知识表示解决方案,首次实验演示并验证了忆阻神经-模糊硬件系统在无监督、有监督和迁移学习任务中的应用……
C&K Switches EITS系列直角照明轻触开关提供表面贴装 PIP 端子和标准通孔配置,为电信、数据中心和专业音频/视频设备等广泛应用提供创新的多功能解决方案。
投身国产浪潮向上而行,英韧科技再获“中国芯”认可
来源:苏州工业园区12月17日,江苏路芯半导体技术有限公司掩膜版生产项目迎来重要进展——首批工艺设备机台成功搬入。路芯半导体自2023年成立以来,专注于半导体掩膜版的研发与生产,掌握130nm至28n
‍‍12月18日,深圳雷曼光电科技股份有限公司(下称“雷曼光电”)与成都辰显光电有限公司(下称“辰显光电”)在成都正式签署战略合作协议。双方将充分发挥各自在技术创新、产品研发等方面的优势,共同推进Mi
来源:观察者网12月18日消息,自12月2日美国发布新一轮对华芯片出口禁令以来,不断有知情人士向外媒透露拜登政府在卸任前将采取的下一步动作。美国《纽约时报》12月16日报道称,根据知情人士以及该报查阅
投资界传奇人物沃伦·巴菲特,一位94岁的亿万富翁,最近公开了他的遗嘱。其中透露了一个惊人的决定:他计划将自己99.5%的巨额财富捐赠给慈善机构,而只将0.5%留给自己的子女。这引起了大众对于巴菲特家庭
来源:IT之家12 月 18 日消息,LG Display 韩国当地时间今日宣布,已将自行开发的“AI 生产系统”投入到 OLED 生产线的日常运行之中,该系统可提升 LG Display 的 OLE
阿里资产显示,随着深圳柔宇显示技术有限公司(下称:“柔宇显示”)旗下资产一拍以流拍告终,二拍将于12月24日开拍,起拍价为9.8亿元。拍卖标的包括位于深圳市龙岗区的12套不动产和一批设备类资产,其中不
又一地,新型储能机会来了?■ 印度:2032储能增长12倍,超60GW据印度国家银行SBI报告,印度准备大幅提升能源存储容量,预计到2032财年将增长12 倍,超60GW左右。这也将超过可再生能源本身
LG Display  12月18日表示,为加强OLED制造竞争力,自主开发并引进了“AI(人工智能)生产体系”。“AI生产体系”是AI实时收集并分析OLED工艺制造数据的系统。LG Display表
在上海嘉定叶城路1688号的极越办公楼里,最显眼的位置上,写着一句话:“中国智能汽车史上,必将拥有每个极越人的名字。”本以为这句话是公司的企业愿景,未曾想这原来是命运的嘲弄。毕竟,极越用一种极其荒唐的
上个月,亿万富翁埃隆·马斯克谈到了年轻一代的生育问题。他强调生育的紧迫性,认为无论面临何种困难,生育后代都是必要的,否则人类可能会在无声中走向消亡。他认为人们对于生育的担忧有些过头,担心经济压力等问题