OntheRadar:百度智能云千帆大模型平台加速企业多模态生成式AI应用落地

原创 Omdia 2024-12-11 12:00

摘要

全球生成式人工智能(AI)市场仍处于起步阶段。根据最新预测,该市场将在五年内增长五倍,从2024年的146亿美元增长到2029年的728亿美元。顶尖的应用领域包括消费类、企业服务、零售业、媒体娱乐业以及医疗保健业。


作为生成式AI的下一个前沿领域,多模态生成式AI技术凭借其日益增强的多样化功能,正在推动各行业的应用案例,例如客户服务、企业知识管理、3D数字分身以及制造业等。


目前,专注于多模态生成服务的生成式AI基础模型厂商的能力主要面向通用用途,缺乏针对特定用例的定制化选项,无法重新训练以满足特定需求,尤其是在高度监管的行业或业务关键的应用场景中。尽管这些模型在用户中很受欢迎,但对于希望构建企业级多模态生成式AI应用的企业来说,这些模型的限制性很高。


相反,企业始终需要寻求基于最适合企业数据和业务目标的模型来开发多模态生成式AI应用。这些模型需要具备高度的定制化能力、准确性、安全性,并符合市场的数据安全法规。由于并非所有开发者和企业都精通多模态生成式AI,因此他们需要一个开发平台,该平台能够提供多样化的多模态生成式AI模型选择,同时易于部署、优化和维护,以及满足高标准的AI治理和安全要求。


百度智能云在多模态生成式AI上已经在支持广泛的开发者和企业,从生成式AI模型厂商,如生数科技,到系统集成商如软通动力和大型企业如蔚来汽车,协助他们推动多模态生成式AI的应用。与此同时,百度智能云其强大的开发者社区与用户积极互动,也有助于其持续优化其产品与服务。


Omdia 观点


生成式AI已在各行各业得到广泛应用。在开源和专有大型语言模型(LLM)的推动下,生成式AI已应用于所有行业的120个应用场景中。虽然基于LLM的应用程序越来越受欢迎,但其本身仍存在固有的局限性。LLM主要针对文本和语音数据的理解、处理和生成进行了优化,无法进行多模态学习,也无法生成除文本和语音之外的其他输出。


为了解决上述问题,越来越多的厂商和开发者开始采用多模态生成式AI技术。该技术能够处理多种输入形式,包括文本、图像和音频,并将这些提示转换为几乎任意类型的输出。这将进一步提升用户体验,因为模型可以实现多模态的理解和生成。


一方面,凭借其理解能力,用户可以通过文本、语音、图像和视频与应用程序自然交互。通过多模态数据理解上下文,多模态生成式AI应用能够以更全面的方式作出响应,帮助企业从其他数据类型中获取情景感知的见解。


另一方面,多模态生成式AI技术的多模态生成能力允许用户生成从文本到语音、图像、视频、音频、音乐、点云数据、遥测数据、3D模型和数字孪生等各种类型的输出。通过充分的预训练和微调,这些模型可以生成高保真且物理准确的输出,非常适合企业应用场景。


希望部署多模态生成式AI应用的企业可以与两类厂商合作。


• 第一类:专注于多模态生成服务的生成式AI基础模型厂商。这类厂商以提供多模态生成服务为主,例如,OpenAI推出了Sora,这是一项文本到视频的生成服务,能够生成超逼真的视频,主要面向消费、媒体和娱乐行业。


• 第二类:提供多模态的生成式AI模型和应用的生成式AI开发平台厂商。这些厂商通常是拥有深厚生成式AI基础设施、工程和服务专业知识的超大规模企业。例如,百度智能云支持文心大模型、多模态模型系列和多模态生成式AI应用,如百度智能云曦灵(数字人),能帮助企业快速构建多模态生成式AI应用。


与这两类厂商合作各有利弊:


第一类厂商提供的模型对于不熟悉该技术的开发者和企业提供了一个甚佳的起点。由于多模态生成能力是通过服务方式提供的,用户可以轻松访问并使用该能力。这种使用便利性也为个人开发者降低开发门槛。然而,这类模型的多模态生成能力主要面向通用的应用场景,缺乏针对特定用例的定制化选项,无法重新训练以满足特定需求,尤其是在高度监管的行业或业务关键的应用场景中。尽管这些模型在用户中很受欢迎,但对于希望构建企业级多模态生成式AI应用的企业来说,这些模型的限制性很高。


相反,企业始终需要寻求基于最适合企业数据和业务目标的模型来开发多模态生成式AI应用。这些模型需要具备高度的定制化能力、准确性、安全性,并符合市场的数据安全法规。由于并非所有开发者和企业都精通多模态生成式AI,因此他们需要一个开发平台,该平台能够提供多样化的多模态生成式AI模型选择,同时易于部署、优化和维护,以及满足高标准的AI治理和安全要求。


为了创建真正符合业务目标的多模态生成式AI应用,提供全面多模态生成式AI解决方案的全栈厂商更适合企业。鉴于该领域缺乏专业知识和资源,企业难以期望仅提供基础模型的厂商(第一类厂商)提供完全可定制的模型以及相关服务。全栈生成式AI解决方案厂商的核心业务并非仅销售生成式AI模型及服务,而是致力于推动企业落地。他们不会将自己局限于单一模型,而是会帮助客户挑选最合适的生成式AI模型。企业和开发者可以使用其云产品和服务开发、部署和优化这些模型,从而实现业务目标。


为何要将百度智能云千帆大模型平台纳入您的关注焦点?


随着越来越多的企业和开发者意识到多模态生成式AI的潜力,一款从模型开发到智能体的端到端解决方案,同时具备无缝开发和集成能力的多模态生成式AI开发平台,将对技术的普及至关重要。


百度智能云已经注意到了上述市场需求,并正在迅速行动以抓住机遇。该云服务提供商已经推出了一系列多模态生成式AI产品和服务,即文心系列基础模型以及千帆生成式AI开发平台。多模态生成式AI对百度智能云而言已是驾轻就熟,因为该云服务提供商早在2023年初就推出了其大语言模型文心一言,并通过百度智能云千帆大模型平台为客户和开发者提供了全面的应用开发工具、丰富的大模型、完善的模型开发工具链以及易用的应用模板,用于多模态生成式AI应用开发,使百度智能云成为企业在构建多模态生成式AI应用时,无论处于哪个阶段,都能信赖的理想合作伙伴。


虽然百度智能云将继续在中国引领多模态生成式AI应用的部署和实施。不过,其需要进一步巩固其行业领导地位,必须向市场传达其多模态专业知识,创造更多超越日常用例的多模态生成式AI应用模板,并加大对多模态多智能体开发框架和解决方案的投入。


 咨询购买报告请扫码联系我们 



本文作者

苏廉节

首席分析师 - AI&IoT

文章版权和解释权归微信平台Omdia所有

Omdia是一家专注于科技行业的领先研究和咨询集团。凭借对科技市场的深入了解,结合切实可行的洞察力,Omdia将赋能企业做出明智的增长决策。要了解更多信息,请访问www.omdia.com。


如您想了解更多有关Omdia的最新研究成果,请浏览Omdia官方网站或通过电子邮件联系我们。


omdia.com

rina.zhang@Omdia.com


Omdia Omdia是全球通信、数字媒体与IT行业中富有权威的独立研究机构,为各国运营商、设备供应商等TMT行业参与者提供客观和极具商业价值的市场研究与咨询服务。此平台致力于分享Omdia与TMT行业最新发展动态的深入分析。
评论
  • 【萤火工场CEM5826-M11测评】OLED显示雷达数据本文结合之前关于串口打印雷达监测数据的研究,进一步扩展至 OLED 屏幕显示。该项目整体分为两部分: 一、框架显示; 二、数据采集与填充显示。为了减小 MCU 负担,采用 局部刷新 的方案。1. 显示框架所需库函数 Wire.h 、Adafruit_GFX.h 、Adafruit_SSD1306.h . 代码#include #include #include #include "logo_128x64.h"#include "logo_
    无垠的广袤 2024-12-10 14:03 68浏览
  •         在有电流流过的导线周围会感生出磁场,再用霍尔器件检测由电流感生的磁场,即可测出产生这个磁场的电流的量值。由此就可以构成霍尔电流、电压传感器。因为霍尔器件的输出电压与加在它上面的磁感应强度以及流过其中的工作电流的乘积成比例,是一个具有乘法器功能的器件,并且可与各种逻辑电路直接接口,还可以直接驱动各种性质的负载。因为霍尔器件的应用原理简单,信号处理方便,器件本身又具有一系列的du特优点,所以在变频器中也发挥了非常重要的作用。  &nb
    锦正茂科技 2024-12-10 12:57 69浏览
  • 习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习笔记&记录学习习笔记&记学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记录学习学习笔记&记
    youyeye 2024-12-10 16:13 93浏览
  • 全球知名半导体制造商ROHM Co., Ltd.(以下简称“罗姆”)宣布与Taiwan Semiconductor Manufacturing Company Limited(以下简称“台积公司”)就车载氮化镓功率器件的开发和量产事宜建立战略合作伙伴关系。通过该合作关系,双方将致力于将罗姆的氮化镓器件开发技术与台积公司业界先进的GaN-on-Silicon工艺技术优势结合起来,满足市场对高耐压和高频特性优异的功率元器件日益增长的需求。氮化镓功率器件目前主要被用于AC适配器和服务器电源等消费电子和
    电子资讯报 2024-12-10 17:09 81浏览
  • 天问Block和Mixly是两个不同的编程工具,分别在单片机开发和教育编程领域有各自的应用。以下是对它们的详细比较: 基本定义 天问Block:天问Block是一个基于区块链技术的数字身份验证和数据交换平台。它的目标是为用户提供一个安全、去中心化、可信任的数字身份验证和数据交换解决方案。 Mixly:Mixly是一款由北京师范大学教育学部创客教育实验室开发的图形化编程软件,旨在为初学者提供一个易于学习和使用的Arduino编程环境。 主要功能 天问Block:支持STC全系列8位单片机,32位
    丙丁先生 2024-12-11 13:15 15浏览
  • 时源芯微——RE超标整机定位与解决详细流程一、 初步测量与问题确认使用专业的电磁辐射测量设备,对整机的辐射发射进行精确测量。确认是否存在RE超标问题,并记录超标频段和幅度。二、电缆检查与处理若存在信号电缆:步骤一:拔掉所有信号电缆,仅保留电源线,再次测量整机的辐射发射。若测量合格:判定问题出在信号电缆上,可能是电缆的共模电流导致。逐一连接信号电缆,每次连接后测量,定位具体哪根电缆或接口导致超标。对问题电缆进行处理,如加共模扼流圈、滤波器,或优化电缆布局和屏蔽。重新连接所有电缆,再次测量
    时源芯微 2024-12-11 17:11 17浏览
  • 我的一台很多年前人家不要了的九十年代SONY台式组合音响,接手时只有CD功能不行了,因为不需要,也就没修,只使用收音机、磁带机和外接信号功能就够了。最近五年在外地,就断电闲置,没使用了。今年9月回到家里,就一个劲儿地忙着收拾家当,忙了一个多月,太多事啦!修了电气,清理了闲置不用了的电器和电子,就是一个劲儿地扔扔扔!几十年的“工匠式”收留收藏,只能断舍离,拆解不过来的了。一天,忽然感觉室内有股臭味,用鼻子的嗅觉功能朝着臭味重的方向寻找,觉得应该就是这台组合音响?怎么会呢?这无机物的东西不会腐臭吧?
    自做自受 2024-12-10 16:34 133浏览
  • 智能汽车可替换LED前照灯控制运行的原理涉及多个方面,包括自适应前照灯系统(AFS)的工作原理、传感器的应用、步进电机的控制以及模糊控制策略等。当下时代的智能汽车灯光控制系统通过车载网关控制单元集中控制,表现特殊点的有特斯拉,仅通过前车身控制器,整个系统就包括了灯光旋转开关、车灯变光开关、左LED前照灯总成、右LED前照灯总成、转向柱电子控制单元、CAN数据总线接口、组合仪表控制单元、车载网关控制单元等器件。变光开关、转向开关和辅助操作系统一般连为一体,开关之间通过内部线束和转向柱装置连接为多,
    lauguo2013 2024-12-10 15:53 67浏览
  • 近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球商务人士带来高效、自然、稳定的跨语言交流体验。 INMO GO2内置的W517芯片,是紫光展锐4G旗舰级智能穿戴平台,采用四核处理器,具有高性能、低功耗的优势,内置超微高集成技术,采用先进工艺,计算能力相比同档位竞品提升4倍,强大的性能提供更加多样化的应用场景。【视频见P盘链接】 依托“
    紫光展锐 2024-12-11 11:50 17浏览
  •         霍尔传感器是根据霍尔效应制作的一种磁场传感器。霍尔效应是磁电效应的一种,这一现象是霍尔(A.H.Hall,1855—1938)于1879年在研究金属的导电机构时发现的。后来发现半导体、导电流体等也有这种效应,而半导体的霍尔效应比金属强得多,利用这现象制成的各种霍尔元件,广泛地应用于工业自动化技术、检测技术及信息处理等方面。霍尔效应是研究半导体材料性能的基本方法。通过霍尔效应实验测定的霍尔系数,能够判断半导体材料的导电类型、载流子浓度及载流子
    锦正茂科技 2024-12-10 11:07 64浏览
  • RK3506 是瑞芯微推出的MPU产品,芯片制程为22nm,定位于轻量级、低成本解决方案。该MPU具有低功耗、外设接口丰富、实时性高的特点,适合用多种工商业场景。本文将基于RK3506的设计特点,为大家分析其应用场景。RK3506核心板主要分为三个型号,各型号间的区别如下图:​图 1  RK3506核心板处理器型号场景1:显示HMIRK3506核心板显示接口支持RGB、MIPI、QSPI输出,且支持2D图形加速,轻松运行QT、LVGL等GUI,最快3S内开
    万象奥科 2024-12-11 15:42 18浏览
  • 概述 通过前面的研究学习,已经可以在CycloneVGX器件中成功实现完整的TDC(或者说完整的TDL,即延时线),测试结果也比较满足,解决了超大BIN尺寸以及大量0尺寸BIN的问题,但是还是存在一些之前系列器件还未遇到的问题,这些问题将在本文中进行详细描述介绍。 在五代Cyclone器件内部系统时钟受限的情况下,意味着大量逻辑资源将被浪费在于实现较大长度的TDL上面。是否可以找到方法可以对此前TDL的长度进行优化呢?本文还将探讨这个问题。TDC前段BIN颗粒堵塞问题分析 将延时链在逻辑中实现后
    coyoo 2024-12-10 13:28 93浏览
  • 一、SAE J1939协议概述SAE J1939协议是由美国汽车工程师协会(SAE,Society of Automotive Engineers)定义的一种用于重型车辆和工业设备中的通信协议,主要应用于车辆和设备之间的实时数据交换。J1939基于CAN(Controller Area Network)总线技术,使用29bit的扩展标识符和扩展数据帧,CAN通信速率为250Kbps,用于车载电子控制单元(ECU)之间的通信和控制。小北同学在之前也对J1939协议做过扫盲科普【科普系列】SAE J
    北汇信息 2024-12-11 15:45 19浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦