电子工程专辑刚刚介绍了《谷歌发布多模态大模型Gemini》,这是谷歌自称强于OpenAI技术的目前最强大的AI,然而据彭博社报道称,Google在关于"双子座"的性能视频演示中作假了。

电子工程专辑在昨日刚刚介绍了《谷歌发布多模态大模型Gemini》,这是谷歌自称强于OpenAI技术的目前最强大的AI,然而据彭博社报道称,Google在关于"双子座"的性能视频演示中作假了。

视频来源:Google Gemini AI演示

这段六分钟的视频展示了 Gemini 的多模态功能(例如,口语对话提示与图像识别相结合)。双子座似乎能快速识别图像(甚至是连线图片),在几秒钟内做出反应,并实时跟踪杯球游戏中的纸团。当然,人类可以做到所有这些,但这是一个能够识别并预测接下来会发生什么的人工智能。

彭博社专栏作家帕米-奥尔森(Parmy Olson)说,Google的"What the AI quack"视频中,Gemini 看起来能力非凡,也许能力太强了。

不过,视频描述中,Google有一个重要的免责声明:"为了演示的目的,延迟已经减少,双子座的输出已经缩短,以求简洁"。

这正是奥尔森不满意的地方。根据她在彭博社发表的文章,Google在被要求发表评论时承认,视频演示并不是通过语音提示实时进行的,而是使用了原始镜头中的静止图像帧,然后写出文字提示,让双子座做出回应。奥尔森写道:"这与Google似乎在暗示的内容大相径庭:人可以与双子座进行流畅的语音对话,同时双子座会实时观察并回应周围的世界。公平地说,Google公司经常编辑演示视频,尤其是许多公司希望避免现场演示带来的任何技术故障。稍作调整是常有的事。但是,Google在视频演示方面一直存在问题。人们曾怀疑Google的 Duplex 演示(还记得 Duplex 吗?Duplex 是一款人工智能语音助手,可以打电话给发廊和餐馆预订房间。而预先录制的人工智能模型视频往往会让人更加怀疑。"

在这种情况下,奥尔森认为Google是在"作秀",目的是误导人们,让他们不知道 Gemini 仍然落后于 OpenAI 的 GPT。

不过Google对此并不认同。当被问及演示的真实性时,Google指出了Google DeepMind 研究副总裁兼深度学习负责人 Oriol Vinyals(也是 Gemini 的联合负责人)的一篇文章,其中解释了团队是如何制作视频的。

Vinyals 说:"视频中的所有用户提示和输出都是真实的,为了简洁起见进行了缩短。视频展示了使用 Gemini 构建的多模式用户体验。我们制作它是为了激励开发人员。"

他补充说,团队给双子座提供了图片和文本,并要求它预测接下来会发生什么。

其他质疑

1、MMLU测试中,Gemini结果下面灰色小字标称CoT@32,展开来代表使用了思维链提示技巧、尝试了32次选最好结果。而作为对比的GPT-4,却是无提示词技巧、只尝试5次,这个标准下Gemini Ultra其实并不如GPT-4。

2、对于那段精彩视频,也有人从开篇的文字免责声明中发现了问题。机器学习讲师Santiago Valdarrama认为声明可能暗示了展示的是精心挑选的好结果,而且不是实时录制而是剪辑的。后来谷歌在一篇博客文章中解释了多模态交互过程,几乎承认了使用静态图片和多段提示词拼凑,才能达成这样的效果。

Gemini vs ChatGPT,谁是真正的强者?

虽然ChatGPT所用的大语言模型来自谷歌实验室,相当于对于AI来说,谷歌是最早投入,在模型方面,他是鼻祖。然而,AI的成熟度除了模型之外,还需要算力和时间。算力方面,相信谷歌不会输给OpenAI,但是时间方面,OpenAI已经从最初的ChatGPT3.0进化到了4.0,这其中成长了一年的时间,对于快速进化的AI来说,一年是非常非常重要的,而Gemini AI还是刚刚发布。

同时,目前Gemini Pro版本,还只能对标GPT-3.5,对标GPT-4的大杯Gemini Ultra,要明年才出。

此外,Gemini仅支持英文,中文和其他语言也需要明年了。

 

然而,更多人关心的是,Gemini AI是否一直免费?能否抛弃ChatGPT Plus每月20美元的账单?

这就引发另一个问题,谷歌能否创立一种新的AI商业模式,但是,目前来说,由于AI需要大量的算力投入,成本非常巨大,除非在性能上有了数个数量级的突破,否则人工智能技术依然没法像互联网一样采用免费模式。

责编:Challey
阅读全文,请先
您可能感兴趣
由此可见,荣耀Magic7系列搭载的AI功能,并非是简单的“小模型”,也不单纯是上一个版本的升级,更像是手机智能化的“跨越性”进步。
由于成本和时间问题,路透社报道称,OpenAI公司暂时放弃了雄心勃勃的代工计划,转而计划专注于内部芯片设计工作。作为芯片的最大买家之一,OpenAI 在开发定制芯片时决定从不同的芯片制造商处采购,这可能会对科技行业产生更广泛的影响......
Credo公布了2025财年第一个季度的业绩,营业收入同比增长了70%左右。随着AI时代的兴起,Credo开始关注如何把AEC更好的应用在国内的数据中心市场中。此外,在当今的数据中心领域,网络正在经历巨大的变革......
根据SemiAnalysis公司首席分析师Dylan Patel的说法,目前SK海力士在HBM市场的整体份额超过70%,其中HBM3的市场份额超过85%。
Gartner高级首席分析师 Rajeev Rajput 在一份声明中表示:“人工智能相关半导体需求的持续激增和电子产品生产的复苏推动了这一增长,而汽车和工业部门的需求仍然疲软。短期内,存储市场和图形处理单元(GPU)将推动全球半导体收入。”
这些趋势反映了当前AI领域对于模型的可解释性、伦理监督、跨模态学习以及实际应用场景的重视。同时,随着生成式AI技术的成熟,AI的应用范围正在不断扩大,从科学研究到日常生活的各个领域都有其身影。此外,随着AI能力的增长,相关的监管和技术伦理问题也变得越来越重要。
微电子和软件技术的快速发展正在深刻地改变车载娱乐中控和安全系统设计,重新定义驾驶体验。
本系列文章从数字芯片设计项目技术总监的角度出发,介绍了如何将芯片的产品定义与设计和验证规划进行结合,详细讲述了在FPGA上使用硅知识产权(IP)内核来开发ASIC原型项目时,必须认真考虑的一些问题。
在即将到来的慕尼黑国际电子元器件博览会(electronica 2024)上,英飞凌科技股份公司将展示其创新的解决方案如何推动全球低碳化和数字化进程,充分展现半导体产品如何为实现净零经济铺平道路,并释放人工智能的全部潜力。
vivo旗下品牌iQOO正式发布了年度性能旗舰iQOO 13,除了高通骁龙8芯片、vivo自研的电竞芯片Q2外,最值得一提的是还采用了汇顶科技提供的多项创新技术,包括超声波指纹识别、新一代屏下光线传感器以及智能音频放大器与软件方案。
8月30日晚,欧菲光披露2024年第三季度报告。           数据显示,今年第三季度,欧菲光实现营收49.35亿元,同比增长9.56%;归属于上市公司股东的净利润为797.47万元,同比减少8
近日,网友爆料曾经厦门最大的宝马经销商厦门中宝已停产停工!公司通告称,由于2024年9月宝马取消了对我司的经销授权,公司面临着极其严峻的经营困境,公司的业务受到了多方面重大挑战,资金流紧张,市场环境变
本文来源:智能通信定位圈10月24日,全球领先的物联网(IoT)解决方案提供商Silicon Labs(下称“芯科科技“)在上海成功举办2024年“Works With开发者大会”。本届大会以“创新结
10月30日,备受瞩目的iQOO最新旗舰机——被誉为“性能之光”的iQOO 13在深圳震撼发布。该款机型由BOE(京东方)独供6.82英寸超旗舰2K LTPO直屏,行业首发搭载全新一代Q10发光器件,
01周价格表02周价格观察硅料环节本周硅料价格:单晶复投料主流成交价格为37元/KG,单晶致密料的主流成交价格为35元/KG;N型料报价为41元/KG。交易情况上下游交易延续低迷情绪,拉晶端尚处艰难去
10月30日,上汽集团发布第三季度财报。财报显示,第三季度上汽集团营业收入1425.60亿元,同比下滑25.58%;净利润仅2.80亿元,同比下降93.53%。归属于上市公司股东的扣除非经常性损益的净
GIPHY平台于2023年被Shutterstock收购,每天触达超过10亿用户。美通社消息,作为全球最大的GIF和贴纸库,GIPHY与领先的移动短视频平台TikTok达成合作,旨在通过人工智能技术驱
10月30日,据多家媒体报道,大运集团旗下高端新能源品牌远航汽车被自家员工曝出人员流失较为严重、延迟发放工资等情况。有自称是远航汽车研发部人士表示,底盘研发部门人员流失速度快,目前仅剩十余名员工坚守岗
市场传出消息称,荣耀公司近期引入了包括中国电信、中金资本旗下基金、基石旗下基金、特发基金及新一轮代理商投资平台(金石星耀)等在内的多个投资者。           对于本轮融资,荣耀表示始终坚持公开透
市场传出消息称,国内模拟IC上市公司思瑞浦(3PEAK)近日解散了其MCU团队。预计约80名员工受影响,其中一些员工曾是2022年德州仪器裁撤的中国区MCU研发团队的成员。据称,MCU整个部门调整,包