谷歌再更新Gemini大模型，立足MoE架构性能更卓越

智能计算芯世界 2024-02-24 07:41 1262浏览 0评论 0点赞

从清华教授到企业高管，这场大会把 MATLAB/Simulink 前沿应用讲透了 超低功耗CW32L083系列

谷歌多模态大模型再更新，推出Gemini 1.5 Pro版本。Gemini系列大模型是谷歌的多模态（multimodality）大模型，能够处理跨越文本、图片、音频、视频、代码等多模态信息。

此前，谷歌推出的Gemini 1.0总共有Nano、Pro、Ultra三个版本。2024年2月15日，谷歌再次更新其Gemini大模型至Gemini 1.5代，并推出Gemini 1.5 Pro版本。

下载链接：

技术复盘与产业分析：Sora是如何成功的？

Sora模型横空出世，AIGC行业又一里程牌

谷歌再更新Gemini大模型，立足MOE架构性能更加卓越

Sora划时代：算力应用再加速

计算机行业研究：Sora开启创意领域iPhone时刻，关注全球文视频领域机会

Sora实现文生视频跨越式突破，AIGC持续正反馈

《OpenAI新工具Sora，文字秒生短片》

1、OpenAI推新工具Sora，一句话生成60秒短片 2、OpenAI Sora存缺陷易穿帮，暂未对公众开放使用

OpenAI发布首款文生视频大模型Sora，训练算力需求大幅提升

多模态，AI大模型新一轮革命

AIGC行业趋势：Sora横空出世，向多模态应用加速迈进

Text to Video的GPT3时刻已来：OpenAI的Sora模型引领新技术突破

2024量子人工智能技术白皮书

2024全球量子计算产业发展展望

Gemini 1.5 Pro的性能水平与谷歌至今为止最大的模型Gemini 1.0 Ultra类似。与Gemini 1.0代对比，Gemini 1.5 Pro的性能大大超过了Gemini 1.0 Pro，在绝大多数（27/31）的基准测试（benchmarks）中表现更好；而在与Gemini 1.0 Ultra的对比中，Gemini 1.5 Pro在超过一半的基准测试上表现更好。

Gemini 1.5大模型建立在对sparse稀疏混合专家（mixture-of-expert，MoE）架构及Transformer架构领先的研究上，其训练和服务更为高效。传统的Transformer是一个大型神经网络，而MoE模型则被划分为更小的“专家”神经网络。混合专家模型（MoE）主要由两个关键部分组成：

1）稀疏MoE层:这些层代替了传统Transformer模型中的前馈网络(FFN)层。MoE层包含若干“专家”，每个“专家”本身是一个独立的神经网络;

2）门控网络或路由:这个部分用于决定每个token被发送到哪个“专家”。例如，在下图中，“More”这个token被发送到第二个专家，而“Parameters”这个token被发送到第一个专家。这种“术业有专攻”的架构，能够极大的提高模型的效率，让MoE能够在远少于稠密模型所需的计算资源下进行有效的预训练,基于MoE架构的Gemini 1.5在训练和服务上也更为高效。

Gemini 1.5 Pro是中等规模的多模态模型，具有超大容量的上下文窗口。谷歌现在推出的Gemini 1.5 Pro是一种中等规模（mid-size）的多模态模型，引入了在上下文理解方面的突破性实验特征。Gemini 1.5 Pro除了配有标准的128,000token的上下文窗口，少数开发人员和企业客户还可以通过AI Studio和Vertex AI的私人预览版在最多1,000,000个token的上下文窗口中进行尝试和体验。100万个token的上下文窗口容量相当于Gemini 1.5 Pro可以一次性处理1小时视频/11小时音频/超过30,000行代码/超过700,000个单词（word）的信息库。

Gemini 1.5 Pro能够对大量的信息进行复杂推理，可以在给定提示内无缝分析、分类和总结大量内容。

Gemini 1.5 Pro能够更好地理解和推理跨模态，可以针对包括视频在内的不同模式执行高度复杂的理解和推理任务。例如，当给定一部44分钟的巴斯特·基顿无声电影时，该模型可以准确分析各种情节点和事件，甚至推理出电影中容易被忽略的小细节。当给出简单的线条图作为现实生活中物体的参考材料时，Gemini 1.5 Pro可以识别44分钟的巴斯特基顿无声电影中的场景。

Gemini 1.5 Pro能够使用较长的代码块解决相关问题。例如，当给出超过100,000行代码的提示时，它可以更好地推理示例、建议有用的修改并解释代码不同部分的工作原理。

下载链接：

《算力时代关键技术报告汇总》

2023中国电源芯片行业研究报告

2023 LUG大会Day3技术集合

2023 LUG大会Day2技术集合

2023 LUG大会Day1技术集合

《中国电源芯片行业研究报告合集》

1、详解电源管理芯片

2、电源管理芯片行业概览及研究框架
3、中国半导体系列报告：电源管理芯片行业概览
4、电源管理芯片研究框架

《HotChips 2023及历年技术合集（汇总）》

500+份重磅ChatGPT专业报告（合集）

AI服务器催化HBM需求爆发，核心工艺变化带来供给端增量（2024）

2024计算机行业策略：落地为王

2023年度全球十大技术关键词报告

多样性算力技术愿景白皮书

《AI算力芯片产业链及全景图》

1、AI算力产业链梳理（2023）
2、国产AI算力芯片全景图

芯片未来可期：数据中心、国产化浪潮和先进封装（精华）

通用CPU性能基准测试研究综述（2023）

2023全球半导体与集成电路产业发展研究专题报告

中国智能汽车车载芯片发展研究报告

《海光CPU+DCU技术研究报告合集（上）》

1、海光信息：国产巨无霸，引领“中国芯”

2、国产CPU厂商领军者，进入快速增长期

3、国产CPU领军，加速突破高端市场

4、国产CPU领军，受益于行业信创加速，成长空间广阔

5、国产高端处理器龙头，CPU+DCU齐赋能

6、国产微处理器产业的领军者"

《海光CPU+DCU技术研究报告合集（下）》

1、达梦与海光：聚焦信创新股中的软硬龙头

2、计算机行业深度报告：曙光很近，海光不远，国产x86算力生态崛起

3、进击的国产CPU和GPU领航者

4、信创硬件龙头

5、行业信创龙头，国产 CPU 之光

6、专注服务器与数据中心，高端处理器企业乘风国产替代

本号资料全部上传至知识星球，更多内容请登录智能计算芯知识（知识星球）星球下载全部资料。

免责申明：本号聚焦相关技术分享，内容观点不代表本号立场，可追溯内容均注明来源，发布文章若存在版权等问题，请留言联系删除，谢谢。

温馨提示：

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享，点击“阅读原文”获取更多原创技术干货。

登录阅读全文



免责声明：该内容由专栏作者授权发布或作者转载，目的在于传递更多信息，并不代表本网赞同其观点，本站亦不保证或承诺内容真实性等。若内容或图片侵犯您的权益，请及时联系本站删除。侵权投诉联系： nick.zong@aspencore.com！

智能计算芯世界聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.

进入专栏

智能计算芯世界聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.

文章：1691篇粉丝：209人

关注  私信

谷歌再更新Gemini大模型，立足MoE架构性能更卓越

最近文章

热门文章

推荐

最新资讯