李彦宏内部讲话曝光:谈大模型三大认知误区,未来模型间差距会变大

手机技术资讯 2024-09-12 08:01

9月11日消息,AI大模型经历了波澜壮阔大发展的2023年。2024年以来,全球基础大模型的更新速度均出现放慢,相伴随的,行业中各种质疑声音也开始涌现。

“大模型之间的能力已经没有壁垒”、“还应该继续投入基础模型的研究”、“大模型是不是一场新的科技泡沫?”

近日,百度CEO李彦宏的一则内部讲话曝光。在这次与员工的交流中,李彦宏谈到了“三个大模型认知误区”,涵盖了大模型竞争、开源模型效率、智能体趋势等热点话题。可以说回答了当前大模型行业从业者的一些普遍问题,厘清了行业迷惘。

李彦宏认为,未来大模型的之间的差距可能会越来越大,大模型的天花板很高,大模型要不断快速迭代、更新和升级,需要能几年、十几年如一日地投入。同时,大模型应用需要不断满足用户需求,关注大模型成本的降低和效率的提升。大模型应用落地也将经历从辅助工具、到智能体、再到Al Worker的三个阶段。

事实上,Gartner最新发布的“2024年新兴技术成熟度曲线”中关于生成式人工智能(GenAI)技术的发展趋势也与李彦宏的大模型更要关注实际应用中的降本增效判断相契合。

Gartner “2024 年新兴技术成熟度曲线”中,生成式人工智能已处于越过“期望膨胀期”阶段。

当一个新技术处于“期望膨胀期”时,市场中会有很多的声音,并不代表着这项技术已经很成熟或部署普及率达到高峰,实际上它反映的更多是市场炒作的热度达到了高峰。但是,当一项技术越过期望膨胀期,实际上对于一项技术来说是一个好事。

2024年生成式人工智能(GenAI)已越过“期望膨胀期”,意味着不管是在供应端还是在需求侧都会更理性思考。只有真正经历了理性的思考和市场的重新洗牌之后,这项技术才真正开始进入到稳步的爬升期。

那么,一起来看看李彦宏这场内部讲话中关于大模型、生成式AI的详细观点,如下:

误区一:大模型之间的能力已经不存在壁垒?

“每次新模型发布,都要和GPT-4o做比较,说我的得分已经跟它差不多了,甚至某些单项上得分已经超过它了。” 李彦宏明确表示:“但这并不表明和最先进的模型就没有差距了。”

李彦宏说“从榜单或者测试集上看,你觉得能力已经很接近了,但到实际应用中还是有明显差距的。”

这背后,有大模型公司刷榜似乎已经成为“潜规则”的原因。为了让为了让自家模型得高分,这里面很多厂商会刷榜,有的会让数据标注员把评测题做一遍,有的会让GPT-4做一遍再把答案喂给自家模型,相当于让模型“刷题”考高分,但在实际应用场景中,就出现高分低能。

李彦宏指出,模型之间的差距是多维度的。很多公司或者用户对于模型能力的评价是片面的,往往只看基础能力的对比数据,这就导致了对于单一榜单的过度迷恋。行业往往更关注理解、生成、逻辑、记忆等能力的差距,但却忽视了成本、推理速度等维度。有些模型虽能达到同样效果,但成本高、推理速度慢,还是不如先进模型。

“模型天花板很高,你今天做到的跟你实际想要做到的、跟理想状态还差得非常远,所以模型还需要不断快速地去迭代、去更新、去升级。”李彦宏表示, 如果大模型公司不能持续投入和满足用户需求,很快就会被拉开差距。“哪怕你能保证永远领先竞争对手6个月,那就赢了,你的市场份额可能是70%,而对手可能仅为20%甚至10%的份额。”

“在实际使用过程当中,我不允许我们的技术人员去打榜,真正衡量文心大模型能力的是,你在具体应用场景当中到底有没有能够满足用户的需求,有没有能够产生价值的增益,这是我们真正在乎的。”李彦宏强调。

误区二:开源缩小闭源模型的差距,
闭源大模型没有优势?

“一个模型除了能力之外还要看效率,效率上开源模型是不行的。”李彦宏再次强调了他一贯的观点。“大模型时代算力是决定大模型成败的一个关键因素”。

他详细解释道:在大模型时代之前,大家习惯了开源意味着免费、意味着成本低。比如买一个电脑装开源操作系统Linux,因为已经有了电脑,所以使用Linux是免费的。由于Linux是开源的,所有程序员都可以看到代码,哪儿做的不好我可以去更新,更新了再check in,大家众人拾柴火焰高,你在巨人的肩膀上可以不断地进步。

但这些在大模型时代不成立,大模型推理是很贵的,开源模型也不会送算力,还得自己买设备,怎么能够让算力高效地被利用?开源模型解决不了这个问题。

“闭源模型准确讲应该叫商业模型,是无数用户分摊研发成本、分摊推理用的机器资源和GPU,GPU的使用效率是最高的,百度文心大模型3.5、4.0的GPU使用率都达到了90%多。”

因此,李彦宏认为,在教学科研等领域,要想搞清楚大模型的工作原理,开源模型是有价值的;但在商业领域,当追求的是效率、效果和最低成本时,开源模型是没有优势的。



误区三:AI应用难以落地,
找不到商业化路径?

对于这个问题,李彦宏明确指出了大模型应用发展的几个必经阶段:

首先,是对人进行辅助,即Copilot阶段。大模型产出的“结果”需要人把最后一道关、确定它的效果是OK的,各方面都不错才会让它出去;

接着,是Agent智能体阶段。李彦宏表示,外界对于Agent有各种各样不同的定义,最主要是它有了一定的自主性,具备自主使用工具、反思、自我进化等能力;

再往下就是Al Worker阶段。能够像人一样做各种各样的脑力和体力劳动,各方面的工作都可以独立完成。

基于这样的判断,百度提出了“智能体是大模型最重要的发展方向”。

不过,李彦宏也强调,“这是一个非共识。到今天为止智能体还不是共识,像百度这样把智能体作为大模型最重要的战略、最重要的发展方向的公司并不多。”

今年百度Create大会上百度发了三个产品,AgentBuilder、AppBuilder、ModelBuilder,其中AgentBuilder和AppBuilder都是帮助开发者用来快速构建智能体的工具。

为什么我们这么强调智能体?因为智能体的门槛确实很低,我们去年说要卷应用、大家都去做应用,其实很多人还是说不知道该怎么做,不知道这个方向能不能做出来,我到底要用到什么能力才能够在这个场景下产生价值,这里面有无数不确定性,大家不知道怎么从模型变成应用。”李彦宏表示,但是智能体提供了一个非常直接、非常高效、非常简单的方式,在模型之上构建智能体是相当方便的。

从某种意义上来是,对于开发者而言,“构建各种智能体”可以说是一种超低成本的构建大模型应用的试错方式:开发出来用户喜欢就成功了,用户不喜欢也没损失。

李彦宏表示,这也是为什么今天每周都有上万个新的智能体在文心平台上被创造出来。

今年7月,百度宣布在文心智能体平台AgentBuilder上免费开放文心大模型4.0,开发者在文心智能体平台上制作智能体时,可灵活选择文心大模型3.5或4.0版本。公开数据显示,在百度文心智能体平台AgentBuilder上,已有20 万开发者、6.3 万企业入驻。

除了方便开发者构建智能体外,还需要能帮开发者“测试”这个智能体是不是用户需要的、是不是成功的。

因此,李彦宏称:“智能体方面我们已经看到了趋势,也有比较好的先决条件,除了模型本身的能力比较强大之外,我们也有很好的分发通路。百度的APP,尤其是百度搜索一天有好几亿人在用,用户的需求主动向我们表达了,哪一个智能体能更好地去回答他这些问题,去满足他这些需求,这是一个自然匹配的过程,所以我们是最能够帮助这些开发者分发他们智能体的。”

根据百度2024年Q2季度财报数据,目前,在百度开发智能体的商户已达1.6万家,覆盖教育、法律和B2B等行业。智能体在百度生态的分发量正在快速上升,7月日均分发次数超800万,为5月的两倍,最常用的智能体包括内容创作、性格测试、日程规划等类型。用户、开发者、服务商、商户均为智能体生态的重要参与方。 

手机技术资讯 介绍手机的器件技术、行业热点、发展趋势
评论
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 75浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 44浏览
  • 光耦合器,也称为光隔离器,是一种利用光在两个隔离电路之间传输电信号的组件。在医疗领域,确保患者安全和设备可靠性至关重要。在众多有助于医疗设备安全性和效率的组件中,光耦合器起着至关重要的作用。这些紧凑型设备经常被忽视,但对于隔离高压和防止敏感医疗设备中的电气危害却是必不可少的。本文深入探讨了光耦合器的功能、其在医疗应用中的重要性以及其实际使用示例。什么是光耦合器?它通常由以下部分组成:LED(发光二极管):将电信号转换为光。光电探测器(例如光电晶体管):检测光并将其转换回电信号。这种布置确保输入和
    腾恩科技-彭工 2025-01-03 16:27 180浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 85浏览
  • 自动化已成为现代制造业的基石,而驱动隔离器作为关键组件,在提升效率、精度和可靠性方面起到了不可或缺的作用。随着工业技术不断革新,驱动隔离器正助力自动化生产设备适应新兴趋势,并推动行业未来的发展。本文将探讨自动化的核心趋势及驱动隔离器在其中的重要角色。自动化领域的新兴趋势智能工厂的崛起智能工厂已成为自动化生产的新标杆。通过结合物联网(IoT)、人工智能(AI)和机器学习(ML),智能工厂实现了实时监控和动态决策。驱动隔离器在其中至关重要,它确保了传感器、执行器和控制单元之间的信号完整性,同时提供高
    腾恩科技-彭工 2025-01-03 16:28 170浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 114浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 170浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 68浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦