苹果升级300亿参数多模态AI大模型MM1.5-电子工程专辑



 0

 收藏

 分享

扫码分享到微信好友

 扫一扫

扫码查看更多文章

MM1.5模型不仅提升了OCR能力，支持任意图像长宽比和高达4M像素的分辨率，还擅长理解富含文本的图像。此外，通过额外的高质量多图像数据进行监督微调，进一步提高了模型的上下文学习和开箱即用的能力......

电子工程专辑讯苹果公司于2024年10月13日发布了最新版本的多模态AI大模型MM1.5，这一升级版在前代MM1的基础上进行了显著改进。

多模态AI是指能够处理和理解多种类型数据（如文本、图像、音频等）的AI技术。据悉，MM1.5模型拥有300亿参数规模，能够处理图像识别和自然语言推理任务。该模型继续遵循数据驱动的训练原则，重点研究在不同训练周期中混合不同类型数据对模型性能的影响。

MM1.5模型不仅提升了OCR（光学字符识别）能力，支持任意图像长宽比和高达4M像素的分辨率，还擅长理解富含文本的图像。此外，通过额外的高质量多图像数据进行监督微调（SFT），进一步提高了模型的上下文学习和开箱即用的能力。这一版本还增强了对文本密集型图像的理解、视觉指代和定位以及多图像推理的能力。

苹果公司在MM1.5模型中改进了数据混合策略，显著提升了模型在多文本图像处理方面的表现。该模型提供了从10亿到300亿多种参数规模，能够应对各种复杂任务。相关模型文档已在Hugging Face上发布，供研究人员和开发者参考。

苹果的AI战略包括对多模态大模型MM1的开发。在人工智能领域，苹果公司的发展历程可以分为几个重要阶段，从早期的硬件布局到后来的软件和生态系统整合，再到最近推出的Apple Intelligence系统，从封闭到开放、从硬件到软件的转变。

苹果公司正在加大对AI领域的投入，特别是在生成式AI的应用上。例如，苹果计划每年投资10亿美元，将生成式AI应用于iOS、Siri、Apple Music和Xcode等一系列产品和服务中。2024年的全球开发者大会（WWDC）上，苹果推出了名为Apple Intelligence的新个人智能系统。该系统集成了生成式大模型，并深度整合到iOS、iPadOS、macOS等操作系统中，未来还将拓展到watchOS、tvOS以及visionOS。Apple Intelligence提升了设备端的AI能力，还通过端云结合架构优化了数据处理和用户体验。

在硬件方面，苹果专注于AI芯片与AI硬件创新。苹果公司于2023年12月发布了新的机器学习框架MLX，这是一个专为Apple Silicon芯片设计的开源框架，旨在优化在苹果芯片上的机器学习模型训练和部署。同时，苹果也在自主研发AI服务器，计划在未来三年内生产7万至8万台，大部分将使用Nvidia的芯片。

在软件层面，苹果正在重新设计其Siri数字助手，以更智能的方式提供查询服务，并将AI聊天机器人融入其软件生态。此外，苹果还与OpenAI合作，重点关注其自研的Ajax大模型的进展。

AI布局上，苹果公司除了自研还有收购，苹果公司在今年年初就收购了DarwinAI，以组建其人工智能团队。据市场调研，从2017年至2023年，苹果共收购了32家AI初创公司，这一数字超过了谷歌、Meta和微软。这些收购包括专注于语音识别、图像识别和面部表情识别的公司。

苹果在AI领域的战略调整体现在多个方面，公司放弃了持续十年的电动汽车项目“Titan计划”，并将资源转向生成式AI项目。

责编：Amy.wu

阅读全文，请先

您可能感兴趣

2025年中国PC显示器市场十大洞察

对于未来行业发展的增长趋势、行业特征和渠道特点等方面，IDC 总结并给出了2025年中国PC 显示器市场十大洞察……

中科院微电子所在SRAM存内计算领域取得新进展

该存内计算芯片采用全数字设计，能够保证不同位宽配置下的精确计算。为实现不同位宽配置下的高利用率和高能效，团队提出了一种……

西门子获评IDC MarketScape制造执行系统领导厂商

西门子数字化工业软件在IDC MarketScape发布的《2024 – 2025全球制造执行系统供应商报告》中被评为MES领导厂商，该报告针对制造业的MES软件厂商进行了综合性评估。

Arm发布芯粒系统架构首个公开规范，加速芯片技术演进

Arm宣布其芯粒系统架构 (CSA) 正式推出首个公开规范，进一步推动芯粒技术的标准化，并减少行业的碎片化。

丰田中国区人事大调整，传两汽合资品牌将迎来融合

近日，据36氪报道，进入2025年，丰田汽车针对中国区业务进行了一系列重要的人事调整。丰田中国已正式任命李晖为首位中国籍总经理。同时，广汽丰田现任总经理藤原宽行将被调任至一汽丰田，担任总经理一职。这一

字节调整员工福利明年起停发春节红包；苹果手表被诉表带含有潜在有害物质；谷歌2.5亿美元收购部分HTCXR业务|日报

互联网与科技企业每日重点资讯文 | 苏丁巨头动向字节跳动调整员工福利字节跳动发布内部邮件，对员工福利政策进行微调。包括：2026年将停止发放春节红包（今年发放）；2025年度不再发放端午、中秋节礼品；

超3.2GWh！多企又获储能订单

插播：汇聚南网科技、天合光能、新能安、华友能源、皇鼎储能、住友商社、永光新能源、厦门国贸，以及南瑞继保、智光储能、精控能源、钧能科技等业内20位重量级嘉宾，行家说储能·2025新型储能趋势与工商储应用

北汽集团：今年陆续在所有车型上布局自动驾驶技术

据央视新闻报道，北京汽车集团有限公司党委书记、董事长张建勇 1 月 23 日介绍，2024 年中国新能源汽车产销量超过了 1000 万辆，连续 10 年保持了全球第一的位置。在自动驾驶方面，北汽集团今

维信诺联合APSYSTEMS业内首创：固态激光退火技术驱动AMOLED量产新变革

近日，维信诺在显示技术领域取得重大突破，在业界率先采用固态激光退火（SLA）技术，成功实现非晶硅薄膜向多晶硅薄膜的转化，并实现量产品成功点亮，预计在今年2月底将实现SLA技术的大规模量产。这一创举标志

三星显示申请OLEDoS商标，准备量产

有猜测称，三星显示器将很快开始采用红、绿、蓝 (RGB) OLEDoS（硅基 OLED）方法商业化下一代显示器。据专利信息搜索服务Kipris 1月24日报道，三星显示器近期申请了一个名为Arcpix

芯片巨头，豪发15个月年终奖！

去年有望创下历来最佳业绩的SK海力士，已决定向员工发放每月本薪1,500%的绩效奖金，相当于15个月的年终，创下自家有史以来最高的奖金水准，显示其高频宽存储器（HBM）业务正得益于人工智能（AI）热潮

寒假旅游，Brother DCP-T426W为你记录美好瞬间

寒假到来，你是否已经计划好带着孩子来一场说走就走的旅行？无论是山川湖海，还是古城小镇，每一次旅行都充满了未知和惊喜。在这场旅行中，相机或手机将成为你记录美好瞬间的得力助手。当旅行结束，面对着一堆照片，

赛力斯扭亏为盈，造车新势力分化加剧

近日，赛力斯发布2024 年年度业绩预盈公告，预计 2024 年度实现营业收入1442亿元到1467亿元，同比增长302.32%到309.30%；归属于上市公司股东的净利润预计将达到55亿元至60亿元

又一家！储能688Ah阵营再添猛将

此前，行家说储能在《688Ah电芯下线！储能“双6时代”的悬念》（.点这里）中提及，楚能新能源发布了625Ah储能电芯，近日楚能新能源688Ah储能电芯也取得新进展。据行家说储能最新消息，首批由楚能新

文章评论

最新
热门

换一换

EE直播

更多>

苹果升级300亿参数多模态AI大模型MM1.5

杂志声明