MM1.5模型不仅提升了OCR能力,支持任意图像长宽比和高达4M像素的分辨率,还擅长理解富含文本的图像。此外,通过额外的高质量多图像数据进行监督微调,进一步提高了模型的上下文学习和开箱即用的能力......

电子工程专辑讯 苹果公司于2024年10月13日发布了最新版本的多模态AI大模型MM1.5,这一升级版在前代MM1的基础上进行了显著改进。

多模态AI是指能够处理和理解多种类型数据(如文本、图像、音频等)的AI技术。据悉,MM1.5模型拥有300亿参数规模,能够处理图像识别和自然语言推理任务。该模型继续遵循数据驱动的训练原则,重点研究在不同训练周期中混合不同类型数据对模型性能的影响。

MM1.5模型不仅提升了OCR(光学字符识别)能力,支持任意图像长宽比和高达4M像素的分辨率,还擅长理解富含文本的图像。此外,通过额外的高质量多图像数据进行监督微调(SFT),进一步提高了模型的上下文学习和开箱即用的能力。这一版本还增强了对文本密集型图像的理解、视觉指代和定位以及多图像推理的能力。

苹果公司在MM1.5模型中改进了数据混合策略,显著提升了模型在多文本图像处理方面的表现。该模型提供了从10亿到300亿多种参数规模,能够应对各种复杂任务。相关模型文档已在Hugging Face上发布,供研究人员和开发者参考。

苹果的AI战略包括对多模态大模型MM1的开发。在人工智能领域,苹果公司的发展历程可以分为几个重要阶段,从早期的硬件布局到后来的软件和生态系统整合,再到最近推出的Apple Intelligence系统,从封闭到开放、从硬件到软件的转变。

苹果公司正在加大对AI领域的投入,特别是在生成式AI的应用上。例如,苹果计划每年投资10亿美元,将生成式AI应用于iOS、Siri、Apple Music和Xcode等一系列产品和服务中。2024年的全球开发者大会(WWDC)上,苹果推出了名为Apple Intelligence的新个人智能系统。该系统集成了生成式大模型,并深度整合到iOS、iPadOS、macOS等操作系统中,未来还将拓展到watchOS、tvOS以及visionOS。Apple Intelligence提升了设备端的AI能力,还通过端云结合架构优化了数据处理和用户体验。

在硬件方面,苹果专注于AI芯片与AI硬件创新。苹果公司于2023年12月发布了新的机器学习框架MLX,这是一个专为Apple Silicon芯片设计的开源框架,旨在优化在苹果芯片上的机器学习模型训练和部署。同时,苹果也在自主研发AI服务器,计划在未来三年内生产7万至8万台,大部分将使用Nvidia的芯片。

在软件层面,苹果正在重新设计其Siri数字助手,以更智能的方式提供查询服务,并将AI聊天机器人融入其软件生态。此外,苹果还与OpenAI合作,重点关注其自研的Ajax大模型的进展。

AI布局上,苹果公司除了自研还有收购,苹果公司在今年年初就收购了DarwinAI,以组建其人工智能团队。据市场调研,从2017年至2023年,苹果共收购了32家AI初创公司,这一数字超过了谷歌、Meta和微软。这些收购包括专注于语音识别、图像识别和面部表情识别的公司。

苹果在AI领域的战略调整体现在多个方面,公司放弃了持续十年的电动汽车项目“Titan计划”,并将资源转向生成式AI项目。

责编:Amy.wu
阅读全文,请先
您可能感兴趣
对于未来行业发展的增长趋势、行业特征和渠道特点等方面,IDC 总结并给出了2025年中国PC 显示器市场十大洞察……
该存内计算芯片采用全数字设计,能够保证不同位宽配置下的精确计算。为实现不同位宽配置下的高利用率和高能效,团队提出了一种……
西门子数字化工业软件在IDC MarketScape发布的《2024 – 2025全球制造执行系统供应商报告》中被评为MES领导厂商,该报告针对制造业的MES软件厂商进行了综合性评估。
Arm宣布其芯粒系统架构 (CSA) 正式推出首个公开规范,进一步推动芯粒技术的标准化,并减少行业的碎片化。
近日,据36氪报道,进入2025年,丰田汽车针对中国区业务进行了一系列重要的人事调整。丰田中国已正式任命李晖为首位中国籍总经理。同时,广汽丰田现任总经理藤原宽行将被调任至一汽丰田,担任总经理一职。这一
互联网与科技企业每日重点资讯文 | 苏丁巨头动向字节跳动调整员工福利字节跳动发布内部邮件,对员工福利政策进行微调。包括:2026年将停止发放春节红包(今年发放);2025年度不再发放端午、中秋节礼品;
插播:汇聚南网科技、天合光能、新能安、华友能源、皇鼎储能、住友商社、永光新能源、厦门国贸,以及南瑞继保、智光储能、精控能源、钧能科技等业内20位重量级嘉宾,行家说储能·2025新型储能趋势与工商储应用
据央视新闻报道,北京汽车集团有限公司党委书记、董事长张建勇 1 月 23 日介绍,2024 年中国新能源汽车产销量超过了 1000 万辆,连续 10 年保持了全球第一的位置。在自动驾驶方面,北汽集团今
近日,维信诺在显示技术领域取得重大突破,在业界率先采用固态激光退火(SLA)技术,成功实现非晶硅薄膜向多晶硅薄膜的转化,并实现量产品成功点亮,预计在今年2月底将实现SLA技术的大规模量产。这一创举标志
有猜测称,三星显示器将很快开始采用红、绿、蓝 (RGB) OLEDoS(硅基 OLED)方法商业化下一代显示器。据专利信息搜索服务Kipris 1月24日报道,三星显示器近期申请了一个名为Arcpix
去年有望创下历来最佳业绩的SK海力士,已决定向员工发放每月本薪1,500%的绩效奖金,相当于15个月的年终,创下自家有史以来最高的奖金水准,显示其高频宽存储器(HBM)业务正得益于人工智能(AI)热潮
寒假到来,你是否已经计划好带着孩子来一场说走就走的旅行?无论是山川湖海,还是古城小镇,每一次旅行都充满了未知和惊喜。在这场旅行中,相机或手机将成为你记录美好瞬间的得力助手。当旅行结束,面对着一堆照片,
近日,赛力斯发布2024 年年度业绩预盈公告,预计 2024 年度实现营业收入1442亿元到1467亿元,同比增长302.32%到309.30%;归属于上市公司股东的净利润预计将达到55亿元至60亿元
此前,行家说储能在《688Ah电芯下线!储能“双6时代”的悬念》(.点这里)中提及,楚能新能源发布了625Ah储能电芯,近日楚能新能源688Ah储能电芯也取得新进展。据行家说储能最新消息,首批由楚能新