热点丨谷歌VSOpenAI,大模型Gemini有多拼?

AI芯天下 2023-12-11 20:30

·聚焦:人工智能、芯片等行业

欢迎各位客官关注、转发






前言
为了与OpenAI和微软在人工智能领域展开竞争,谷歌采取了果断的措施。

他们从PaLM 2切换到了Gemini上,并决定将谷歌大脑和DeepMind合并,以进一步加强对大模型的研发能力。

合并后的Google DeepMind将集两个实验室的力量,全力攻关Gemini。这充分展示了谷歌在大模型军备竞赛中孤注一掷的心态。


作者 | 方文三
图片来源 |  网 络 

谷歌大模型Gemini正式发布


近日,谷歌公司宣布推出新型大型语言模型Gemini。


Gemini是一个多模态大模型,意味着它可以泛化并无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频。


谷歌表示,Gemini还是他们迄今为止最灵活的模型,能够高效地运行在数据中心和移动设备等多类型平台上。


Gemini提供的SOTA能力将显著增强开发人员和企业客户构建和扩展AI的方式。


Gemini将作为首个直接在手机上运行的大型模型,应用于谷歌Pixel 8 Pro智能手机和聊天机器人Bard。


谷歌计划通过谷歌云向客户提供Gemini授权,并将在未来几个月内将其与其他谷歌服务产品进行集成。



为了比较Gemini与OpenAI的GPT-4的性能,谷歌运行了32个完善的多模态基准测试,结果显示Gemini在32项基准测试中的30项中均领先于GPT-4。


在MMLU(大规模多任务语言理解)测试中,Gemini首次在MMLU得分率达到90.0%,成为第一个在MMLU测试中超越人类专家的模型。


Gemini包括了三种不同规模的模型:


①Gemini Ultra为最大、功能最强大的类别,定位为GPT-4的竞争对手;


②Gemini Pro为中端型号,性能优于GPT-3.5,可扩展多种任务;


③Gemini Nano则适用于特定任务和移动设备。


利用移动手机的算力来运行生成式AI,而不是通过由大型科技公司运营的云端服务器,这将大大降低运营这类系统的成本。


对于那些希望将私人数据限制在设备上的人来说,这也提供了一层保障。


然后,在面临有关宣传方面可能存在夸大的质疑下,谷歌在一篇官方博客文章中,谷歌的回应基本上承认了。


在实现演示视频中所展示的效果时,必须依赖于使用静态图片以及多段提示词的组合。


以视频为例,其中展示了向Gemini系统轮流展示拳头、剪刀手和张开的手掌,而Gemini系统能够立刻理解这是在玩猜拳游戏。


然而,谷歌在文章中明确指出,只有当同时向Gemini系统展示这三个手势,并给予提示这是游戏时,系统才会得出猜拳游戏的结论。


从投资者角度来看,至少这是一个积极的开端。上周四,谷歌的股价出现了暴涨,市值增加了800亿美元。



谷歌 VS OpenAI:从失利的首败走出来

在今年2月的巴黎活动中,谷歌因聊天机器人Bard的一次失误,导致市值蒸发了1000亿美元,引发了外界对Bard准确性的担忧。


同时,随着竞争对手OpenAI推出的ChatGPT以及在必应搜索中整合的GPT技术,谷歌在应用程序下载量上被超越,人们开始质疑谷歌是否在人工智能领域落后于竞争对手。


其实谷歌才是提出2017年Transformer模型、为当今人工智能领域制定规则的先行者。


2021年,谷歌推出了1.6万亿参数的Switch Transformer,强调稀疏多模态结构的潜力。


此外,谷歌还提出了Flan-T5模型,通过更多监督数据降低了模型规模,比GPT-3模型参数更少但性能更佳。


测试结果显示,谷歌AI在数学问题上表现更佳,但ChatGPT在常识问题上更准确。


谷歌在AI领域取得了不少研究进展,但尚未将这些成果部署和变现,类似于微软在过去的某些时期。


这可能是因为谷歌低估了微软和OpenAI的竞争实力,或者过于自信于自己在搜索引擎领域的主导地位。


在Sam Altman领导下的OpenAI专注于产品为导向的工作,致力于扩展和优化模型,主要关注细节精调方法。


而谷歌则在技术发展的方向上始终保持着积极和前瞻的态度,不过在整体战略规划上却屡次调整。


在谷歌[选择困难症]期间,OpenAI已经完成了对ChatGPT的训练。



GPT-4 VS Gemini:多模态的性能优势凸显


作为谷歌应对GPT-4的[重要武器],Gemini在32个多模态基准测试中取得了30个SOTA(即当前最优效果)的记录,凸显了其在多模态任务中的卓越性能。


它是第一个在MMLU(大规模多任务语言理解)测评上超越人类专家的模型,其成绩达到了90.0%,相比之下,人类专家的成绩为89.8%,GPT-4的成绩为86.4%。


在多选问题、数学问题、Python代码任务、阅读等方面,Gemini的性能都超过了此前最先进的水平。


与GPT-4相比,谷歌提供的数据显示Gemini Ultra全面超越GPT-4,而Gemini Pro在大多数指标上超越了GPT-3.5。


总体来说,Gemini在运算效能和任务性能方面都展现出了卓越的表现,成功应对了GPT-4的挑战。


Gemini模型最初强调了其生成文本和图像的能力,以与GPT-4区分开来。


具体而言,Gemini可以理解正式和非正式语言之间的差异,捕捉文本的语气和情感,并识别其他文本或来源的引用和暗示。


现在,两者之间的关键差异可能在于谷歌丰富的专有训练数据集。


Gemini能够处理来自各种服务(包括Google搜索、YouTube、Google Books和Google Scholar等)的数据。


这些服务包含了来自不同领域和语言的大量丰富信息,有助于Gemini从各种来源和语境中学习。


Gemini的培训数据量是GPT-4的两倍,这可能使其在从数据集中产生更复杂的见解和推断方面具有优势。


当然GPT-4也有其独特的优势,GPT-4作为OpenAI开发的大语言模型,在语言理解和生成方面具有很强的能力。


GPT-4采用Transformer架构和无监督学习技术,能捕捉长距离依赖关系和上下文信息,展现出卓越的语言理解和生成能力。


此外,GPT-4还具有强大的推理能力,适应各种复杂场景并提供更智能高效的服务。



结尾:


与OpenAI的方法不同,谷歌从一开始就构建了一个多感官模型。


多模态是生成式AI下一步的重点方向,有待继续探索的应用场景非常广泛。


下一阶段的重点攻克方向是多模态技术。


短期来看,Gemini的发布将进一步激发市场对多模态模型的期待,对产业而言,多模态将带动算力需求的提升。


中长期来看,预计多模态模型的升级将丰富相关产品的使用场景,叠加硬件升级、算法优化带来的成本优化,2C产品的进展值得期待。


部分资料参考:机器之心:《谷歌大杀器终于来了,最大规模Gemini震撼发布》,甲子光年:《优等生归来,谷歌最强大模型Gemini能否打败GPT4?》,财经E法:《Gemini发布仅一天就遭质疑,谷歌追赶OpenAI太过心急?》

本公众号所刊发稿件及图片来源于网络,仅用于交流使用,如有侵权请联系回复,我们收到信息后会在24小时内处理。



END


推荐阅读:


商务合作请加微信勾搭:

18948782064

请务必注明:

「姓名 + 公司 + 合作需求」


AI芯天下 聚焦人工智能,AI芯片,5G通讯等行业动态
评论 (0)
  • 【拆解】+CamFi卡菲单反无线传输器拆解 对于单反爱好者,想要通过远程控制自拍怎么办呢。一个远程连接,远程控制相机拍摄的工具再合适不过了。今天给大伙介绍的是CamFi卡菲单反无线传输器。 CamFi 是专为数码单反相机打造的无线传输控制器,自带的 WiFi 功能(无需手机流量),不但可通过手机、平板、电脑等设备远程连接操作单反相机进行拍摄,而且还可实时传输相机拍摄的照片到 iPad 和电视等大屏设备进行查看和分享。 CamFi 支持大部分佳能和尼康单反相机,内置可充电锂离子电池,无需相机供电。
    zhusx123 2025-05-11 14:14 389浏览
  •         信创产业含义的“信息技术应用创新”一词,最早公开信息见于2019年3月26日,在江苏南京召开的信息技术应用创新研讨会。本次大会主办单位为江苏省工业和信息化厅和中国电子工业标准化技术协会安全可靠工作委员会。        2019年5月16日,美国将华为列入实体清单,在未获得美国商务部许可的情况下,美国企业将无法向华为供应产品。       2019年6
    天涯书生 2025-05-11 10:41 196浏览
  • 在印度与巴基斯坦的军事对峙情境下,歼10C的出色表现如同一颗投入平静湖面的巨石,激起层层涟漪,深刻印证了“质量大于数量”这一铁律。军事领域,技术优势就是决定胜负的关键钥匙。歼10C凭借先进的航电系统、强大的武器挂载能力以及卓越的机动性能,在战场上大放异彩。它能够精准捕捉目标,迅速发动攻击,以一敌多却毫不逊色。与之形成鲜明对比的是,单纯依靠数量堆砌的军事力量,在面对先进技术装备时,往往显得力不从心。这一现象绝非局限于军事范畴,在当今社会的各个领域,“质量大于数量”都已成为不可逆转的趋势。在科技行业
    curton 2025-05-11 19:09 250浏览
  •   电磁数据管理系统深度解析   北京华盛恒辉电磁数据管理系统作为专业的数据处理平台,旨在提升电磁数据的处理效率、安全性与可靠性。以下从功能架构、核心特性、应用场景及技术实现展开分析:   应用案例   目前,已有多个电磁数据管理系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据管理系统。这些成功案例为电磁数据管理系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与接入:实时接收天线、频谱仪等设备数据,兼容多协议接口,确保数据采集的全面性与实时性
    华盛恒辉l58ll334744 2025-05-13 10:59 257浏览
  • 递交招股书近一年后,曹操出行 IPO 进程终于迎来关键节点。从 2024 年 4 月首次递表,到 2025 年 4 月顺利通过中国证监会境外发行上市备案,并迅速更新招股书。而通过上市备案也标志着其赴港IPO进程进入实质性推进阶段,曹操出行最快有望于2025年内完成港股上市,成为李书福商业版图中又一关键落子。行路至此,曹操出行面临的挑战依然不容忽视。当下的网约车赛道,早已不是当年群雄逐鹿的草莽时代,市场渐趋饱和,竞争近乎白热化。曹操出行此时冲刺上市,既是背水一战,也是谋篇布局。其招股书中披露的资金
    用户1742991715177 2025-05-10 21:18 104浏览
  •   舰艇电磁兼容分析与整改系统平台解析   北京华盛恒辉舰艇电磁兼容分析与整改系统平台是保障海军装备作战效能的关键技术,旨在确保舰艇电子设备在复杂电磁环境中协同运行。本文从架构、技术、流程、价值及趋势五个维度展开解析。   应用案例   目前,已有多个舰艇电磁兼容分析与整改系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润舰艇电磁兼容分析与整改系统。这些成功案例为舰艇电磁兼容分析与整改系统的推广和应用提供了有力支持。   一、系统架构:模块化智能体系   电磁环境建模:基
    华盛恒辉l58ll334744 2025-05-14 11:22 39浏览
  • ‌磁光克尔效应(Magneto-Optic Kerr Effect, MOKE)‌ 是指当线偏振光入射到磁性材料表面并反射后,其偏振状态(偏振面旋转角度和椭偏率)因材料的磁化强度或方向发生改变的现象。具体表现为:1、‌偏振面旋转‌:反射光的偏振方向相对于入射光发生偏转(克尔旋转角 θK)。2、‌椭偏率变化‌:反射光由线偏振变为椭圆偏振(克尔椭偏率 εK)。这一效应直接关联材料的磁化状态,是表征磁性材料(如铁磁体、反铁磁体)磁学性质的重要非接触式光学探测手段,广泛用于
    锦正茂科技 2025-05-12 11:02 293浏览
  • 在全球供应链紧张和国产替代需求推动下,国产存储芯片产业快速发展,形成设计到封测一体化的完整生态。北京君正、兆易创新、紫光国芯、东芯股份、普冉股份和佰维存储等六大上市公司在NOR/NAND Flash、DRAM、嵌入式存储等领域布局各具特色,推动国产替代提速。贞光科技代理的品牌紫光国芯,专注DRAM技术,覆盖嵌入式存储与模组解决方案,为多领域客户提供高可靠性产品。随着AI、5G等新兴应用兴起,国产存储厂商有望迎来新一轮增长。存储芯片分类与应用易失性与非易失性存储芯片易失性存储芯片(Volatile
    贞光科技 2025-05-12 16:05 193浏览
  • 在当下竞争激烈的 AI 赛道,企业高层的变动往往牵一发而动全身,零一万物近来就深陷这样的动荡漩涡。近日,零一万物联合创始人、技术副总裁戴宗宏离职创业的消息不胫而走。这位在大模型基础设施领域造诣颇深的专家,此前在华为云、阿里达摩院积累了深厚经验,在零一万物时更是带领团队短期内完成了千卡 GPU 集群等关键设施搭建,其离去无疑是重大损失。而这并非个例,自 2024 年下半年以来,李先刚、黄文灏、潘欣、曹大鹏等一众联创和早期核心成员纷纷出走。
    用户1742991715177 2025-05-13 21:24 80浏览
  •   定制软件开发公司推荐清单   在企业数字化转型加速的2025年,定制软件开发需求愈发多元复杂。不同行业、技术偏好与服务模式的企业,对开发公司的要求大相径庭。以下从技术赛道、服务模式及行业场景出发,为您提供适配的定制软件开发公司推荐及选择建议。   华盛恒辉科技有限公司:是一家专注于高端软件定制开发服务和高端建设的服务机构,致力于为企业提供全面、系统的开发制作方案。在部队政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,部队软件、工业软件、数字化转
    华盛恒辉l58ll334744 2025-05-12 15:55 319浏览
  • 感谢面包板论坛组织的本次测评活动,本次测评的对象是STM32WL Nucleo-64板 (NUCLEO-WL55JC) ,该测试板专为LoRa™应用原型构建,基于STM32WL系列sub-GHz无线微控制器。其性能、功耗及特性组合经过精心挑选,支持通过Arduino® Uno V3连接,并利用ST morpho接头扩展STM32WL Nucleo功能,便于访问多种专用屏蔽。STM32WL Nucleo-64板集成STLINK-V3E调试器与编程器,无需额外探测器。该板配备全面的STM
    无言的朝圣 2025-05-13 09:47 142浏览
  •   电磁数据展示系统平台解析   北京华盛恒辉电磁数据展示系统平台是实现电磁数据高效展示、分析与管理的综合性软件体系,以下从核心功能、技术特性、应用场景及发展趋势展开解读:   应用案例   目前,已有多个电磁数据展示系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据展示系统。这些成功案例为电磁数据展示系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与预处理   智能分析处理   集成频谱分析、时频变换等信号处理算法,自动提取时域频域特征;
    华盛恒辉l58ll334744 2025-05-13 10:20 343浏览
  • 文/Leon编辑/cc孙聪颖‍2025年1月至今,AI领域最出圈的除了DeepSeek,就是号称首个“通用AI Agent”(智能体)的Manus了,其邀请码一度被炒到8万元。很快,通用Agent就成为互联网大厂、AI独角兽们的新方向,迅速地“卷”了起来。国外市场,Open AI、Claude、微软等迅速推出Agent产品或构建平台,国内企业也在4月迅速跟进。4月,字节跳动、阿里巴巴、百度纷纷入局通用Agent市场,主打复杂的多任务、工作流功能,并对个人用户免费。腾讯则迅速更新腾讯元器的API接
    华尔街科技眼 2025-05-12 22:29 141浏览
  • 在 AI 浪潮席卷下,厨电行业正经历着深刻变革。AWE 2025期间,万得厨对外首次发布了wan AiOS 1.0组织体超智能系统——通过AI技术能够帮助全球家庭实现从健康检测、膳食推荐,到食材即时配送,再到一步烹饪、营养总结的个性化健康膳食管理。这一创新之举并非偶然的个案,而是整个厨电行业大步迈向智能化、数字化转型浪潮的一个关键注脚,折射出全行业对 AI 赋能的热切渴求。前有标兵后有追兵,万得厨面临着高昂的研发成本与技术迭代压力,稍有懈怠便可能被后来者赶
    用户1742991715177 2025-05-11 22:44 177浏览
  •   基于 2025 年行业权威性与时效性,以下梳理国内知名软件定制开发企业,涵盖综合型、垂直领域及特色技术服务商:   华盛恒辉科技有限公司:是一家专注于高端软件定制开发服务和高端建设的服务机构,致力于为企业提供全面、系统的开发制作方案。在部队政企开发、建设到运营推广领域拥有丰富经验,在教育,工业,医疗,APP,管理,商城,人工智能,部队软件、工业软件、数字化转型、新能源软件、光伏软件、汽车软件,ERP,系统二次开发,CRM等领域有很多成功案例。   五木恒润科技有限公司:是一家专业的部队信
    华盛恒辉l58ll334744 2025-05-12 16:13 243浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦