透过全球首个知识增强千亿大模型,看到中国AI差异化发展之路

脑极体 2021-12-09 20:23


几年来,预训练大模型逐渐从一个AI领域内的技术语言,变成了强势出圈的产业热点与社会关注话题。但如果大家关注这一话题,会很容易注意到越来越多的声音开始反思大模型的发展之路。比如,大模型是不是应该一味追求庞大的训练参数?在发展路径上我们是不是只能严格对标GPT-3等国际著名大模型产品?


当中国科技企业与研究机构纷纷投入大模型竞争时,是不是有可能探索出一条属于自己的道路?


在科技自立的需求愈发严峻与明确时,透过大模型竞赛,我们可以看到更多关于AI的产业启示与战略思考。



12月8日,鹏城实验室与百度联合召开发布会,正式发布双方共同研发的全球首个知识增强千亿大模型——鹏城-百度·文心。这一大模型参数规模达到2600亿,并且在全球60多项NLP任务中取得了最佳效果。同时,百度产业级知识增强大模型“文心”家族也首次亮相。


早在2019年,百度就开始布局文心预训练模型,如今它也率先走向了差异化拐点。当大众对知识增强这一概念的熟稔远不如大模型本身时,百度文心选择了这条听上去陌生,但却至关重要的产业新径。


大模型为什么重要?为什么我们应该在大模型上探索出新的方向?透过百度文心大模型,我们看到的是科技自立的远方,看到的是中国AI的飞翔之地。


大模型不是军备竞赛,

而是教育竞赛


首先来看大模型本身的行业意义与发展背景。


如今,似乎每家AI企业和研究机构都在做大模型。这种火热局面经常被称为“大模型的军备竞赛”。但如果我们要理解的是,大模型本身是一种产业基础设施和辅助工具,并不是企业与机构的“不传之秘”。


AI产业发展大模型,就像是国家发展教育事业,本身是为了培养更多人才和创新能力,增强整个社会的能动性。


通过海量数据的预训练集成,大模型可以有效降低个体企业与具体行业的AI应用门槛,解决数据标注与行业差异化适配的问题。大模型就像一间间学校,培养了具有通识能力与高素质的人才,从而避免了企业需要从小学知识开始重新培养人才。



这也就将引出一个关键问题:既然大模型是一种“教育系统”,那么教育就应该贴合社会的实际需求。学校肯定不是以用掉了多少书本来评价质量,就像大模型不能仅以训练参数定优劣,更重要的是教育方法是不是与社会适配,能否培育出具有强大能力的人才。


从这个维度上思考,中国AI产业要一直跟随GPT-3等大模型的脚步,一味在训练参数上标榜自身吗?


中国的产业底座、应用需求、技术领导力,是否有可能培育出自己的差异化大模型之路?


此次百度发布的鹏城-百度·文心,以及亮相的百度文心大模型,或许就是答案的方向。


跳出藩篱:

知识增强大模型的差异化之路


2019年3月,在全球大模型的刚刚开始起步的时候,百度就发布了ERNIE 1.0版本,提出了知识增强的语义表示模型。2019年7月,ERNIE 2.0 则构建了持续学习语义理解框架,在中英文 16 个任务上取得了业界最佳效果。


面向NLP领域AI的探索,文心大模型跳出了以往大模型的窠臼,采用了知识增强这一全新技术路径。知识增强将百度在知识图谱、跨模态学习等领域的技术能力,与模型训练学习方面的产业积累结合,实现了更高效率的学习,令模型的理解与生成能力显著增强。



这也很像人类学习的过程,具体信息的学习固然重要,同时知识与逻辑的学习也必不可少。知识既构成了人的通识能力基础,也可以显著提升具体能力的学习与应用。在大模型领域,知识与深度学习的结合起到了事半功倍的效果。


与此同时,文心大模型还强化了跨语言、跨模态的学习能力。在技术的不断迭代之下,文心大模型的泛化能力更强,可以适应更具体真实的任务应用,尤其是处理小样本学习任务的能力。


(鹏城-百度·文心模型结构图)


这条差异化之路,让鹏城-百度·文心千亿大模型可以实现更高效率的学习,并在同等参数空间下实现效果更优,并且符合真实场景的应用需求。而能够实现知识增强这条新路的开拓,得益于百度在知识、深度学习、以及模型开发训练并行且长期的布局积累,也得益于鹏城云脑提供的强大算力。


中国AI的积累、实力与需求,共同构成了差异化之路的起点。从这个意义上来看,知识增强大模型的价值并不仅仅在大模型本身。


走向通用:

百度文心的应用拓展空间


BERT、GPT-3等大模型确实取得了惊人的效果,但大模型也经常因为应用上的滞后性引发质疑。其原因主要来自两方面:一是大模型的算力需求过大,成本高昂;二是大模型的泛化能力欠佳,经常难以解决应用场景中复杂多变的实际问题。


面对这些问题,鹏城-百度·文心实现了更强的应用能力。在场景化应用方案中,鹏城-百度·文心可以实现多尺寸的模型蒸馏,甚至以极小尺寸适配具体需求,降低大模型使用门槛与成本。


在通用能力上,通过与知识的结合加上跨语言、跨模态能力的融入,文心大模型可以适配更加多样化、通用化的任务,在通信、金融、医疗等领域具备广泛的应用前景与想象空间。


鹏城-百度·文心在60多项国际著名任务上取得了领先优势,其中有30多项是小样本、零样本学习的任务,表明了鹏城-百度·文心的泛化应用能力更强,可以低门槛适配行业需求与行业能力。


(鹏城-百度·文心小样本学习效果)

(鹏城-百度·文心零样本学习效果)


在金融领域,文心大模型赋能可以结合百度全流程AI开发平台BML提供的模型再训练能力,基于定制的保险合同条款“智能解析模型”,完成一份合同内近40个类目条款的智能分类,让业务员处理单份合同文本的时长缩短到1分钟,速度提升几十倍。在智能客服领域,文心大模型可以有效提升服务的精准性。这一能力目前已经在浦发银行、中国联通等国内众多企业中得到应用。


整体而言,文心大模型在相对复杂、有考验性的应用场景具备更加强大的表现。比如媒体创作、医疗文本分析、金融信息研判、合同分析等等,这些应用空间非常广阔,并且能够适配的AI技术净值很高,具有明确的商业化动力。


AI正在走向工业大生产,其中核心就是让实验室中的强大AI能力,走入产业,拥抱真实需求。而这就需要大模型具备更强的通用化能力,鹏城-百度·文心正是踏出了这样的关键一步。


文心之路,自立之路:

中国AI的飞翔之地


从技术差异和应用场景出发,我们其实可以从鹏城-百度·文心和百度文心大模型里看到更远。如今,科技自立成为了时代潮流与企业责任,而到底什么是真正的科技自立呢?从鹏城-百度·文心中,我们或许能找到一些新的经验与标准。


在全球瞩目的大模型领域中,知识增强大模型成功打破了固有边界,跳出了“质变没有就拼量变”的传统逻辑。科技自立不是你有什么我也要照猫画虎,你有千亿参数我有万亿参数,而是结合自己的特点与需求,走出能够引领潮流,有独特发展空间的差异化之路。


此次百度的大模型最新发布亮相,可以看到中国AI厚积薄发,学中能变的时代脚步。


在前沿探索上,百度文心大模型在知识增强这个关键点上打破了大模型的产业壁垒,探索全新的技术可能与应用特性,并且将跨语言、跨模态等前沿技术融入其中,构筑更具领导力的技术创新,让中国AI不再仅仅成为模仿者。



在产业协作,百度与鹏城云脑Ⅱ的合作,可以说是集合了中国AI的“最强实力组合”。“鹏城云脑Ⅱ”是自主研发的E级AI算力平台,曾在多个国际性能测试比赛中夺冠。鹏城-百度·文心将基础设施与前沿产业探索进行了有效适配。这种产学一体,软硬件协作,有效利用鹏城云脑Ⅱ作为创新底座的方式可以说是中国AI所独有,在未来很长一段时间将是中国AI产业的特殊优势。


在战略协同中,鹏城-百度·文心可以有效融入百度云智一体的战略架构,大模型通过飞桨的技术创新特性带来高效的训练结果,同时大模型也天然与百度智能云结合,构成了开发者和企业选择百度的动力。云智一体,指向泛化应用与产业需求的AI发展策略,也是中国AI的独特一面。


从源头技术创新,到大模型的知识增强之路;从飞桨核心技术的有效利用,到与鹏城云脑的软硬件合作,鹏城-百度·文心千亿大模型的每一步都根基于自主,每一个选择都趋向于自立。这种既能破壁求变,也能务实协同的发展方法,就是中国AI的飞翔之地。


最近有个话题频频登上热搜,叫做“中国有伟大的知识宝库”。在知识增强的创新之路中,鹏城-百度·文心指向的,就是中国AI这样一个伟大的知识宝库。


脑极体 从技术协同到产业革命,从智能密钥到已知尽头
评论
  • 发明阶段(20世纪80年代至90年代)起源:当时ASIC设计成本高,周期长,流片失败率高,业界需要一种通用的半导体器件进行流片前测试和验证,可编程逻辑器件就此产生。诞生:1980年,Xilinx公司成立。1985年,Ross Freeman制造了第一片PFGA芯片XC2064,采用4输入,1输出的LUT和FF结合的基本逻辑单元。发展阶段(1992年至1999年)容量提升:FPGA容量不断上涨,芯片面积逐渐增大,为架构穿心提供空间,复杂功能可以实现。布线问题凸显:缩着芯片复杂度增加,片上资源的互连
    Jeffreyzhang123 2024-12-27 10:26 69浏览
  • 引言工程师作为推动科技进步和社会发展的核心力量,在各个领域发挥着关键作用。为深入了解工程师的职场现状,本次调研涵盖了不同行业、不同经验水平的工程师群体,通过问卷调查、访谈等方式,收集了大量一手数据,旨在全面呈现工程师的职场生态。1. 工程师群体基本信息行业分布:调研结果显示,工程师群体广泛分布于多个行业,其中制造业占比最高,达到 90%,其次是信息技术、电子通信、能源等行业。不同行业的工程师在工作内容、技术要求和职业发展路径上存在一定差异。年龄与经验:工程师群体以中青年为主,30 - 45 岁年
    Jeffreyzhang123 2024-12-27 17:39 20浏览
  • 图森未来的“夺权之争”拉扯了这么久,是该画上句号了。大约9年前,侯晓迪、陈默、郝佳男等人共同创立了图森未来,初衷是以L4级别的无人驾驶卡车技术为全球物流运输行业赋能。此后,先后获得了5轮融资,累计融资额超过6.5亿美元,并于2021年成功在美国纳斯达克上市,成为全球自动驾驶第一股。好景不长,2023年市场屡屡传出图森未来裁员、退市的消息。今年1月份,图森未来正式宣布退市,成为了全球首个主动退市的自动驾驶公司。上市匆匆退市也匆匆,其背后深层原因在于高层的频繁变动以及企业的转型调整。最近,图森未来的
    刘旷 2024-12-27 10:23 45浏览
  • 在当今这个数字化的时代,电子设备无处不在,从我们手中的智能手机、随身携带的笔记本电脑,到复杂的工业控制系统、先进的医疗设备,它们的正常运行都离不开一个关键的 “幕后英雄”—— 印刷电路板(Printed Circuit Board,简称 PCB)。PCB 作为电子设备中不可或缺的重要部件,默默地承载着电子元件之间的连接与信号传输,是整个电子世界的基石。揭开 PCB 的神秘面纱PCB,简单来说,就是一块由绝缘材料制成的板子,上面通过印刷、蚀刻等工艺形成了导电线路和焊盘,用于固定和连接各种电子元件。
    Jeffreyzhang123 2024-12-27 17:21 23浏览
  • 在当今这个科技飞速发展的时代,物联网(IoT)已经不再是一个陌生的概念,它正以一种前所未有的速度改变着我们的生活和工作方式,像一股无形的力量,将世界紧密地连接在一起,引领我们步入一个全新的智能时代。物联网是什么简单来说,物联网就是通过感知设备、网络传输、数据处理等技术手段,实现物与物、人与物之间的互联互通和智能化管理。想象一下,你的家里所有的电器都能 “听懂” 你的指令,根据你的习惯自动调节;工厂里的设备能够实时监测自身状态,提前预警故障;城市的交通系统可以根据实时路况自动优化信号灯,减少拥堵…
    Jeffreyzhang123 2024-12-27 17:18 24浏览
  •       在科技日新月异的今天,智能手机已不再仅仅是通讯工具,它更成为了我们娱乐、学习、工作的核心设备。特别是在游戏体验方面,用户对于手机的性能要求愈发严苛,追求极致流畅与沉浸感。正是基于这样的市场需求,一加品牌于2024年12月26日正式推出了其最新的游戏性能旗舰——一加 Ace 5系列,包括一加 Ace 5与一加 Ace 5 Pro两款力作。这一系列深度聚焦于性能与游戏体验,旨在为用户带来前所未有的游戏盛宴。骁龙8系旗舰平台,性能跃升新高度
    科技财经汇 2024-12-26 22:31 70浏览
  • 在当今科技飞速发展的时代,工业电子作为现代制造业的中流砥柱,正以前所未有的速度推动着各个行业的变革与进步。从汽车制造到航空航天,从智能家居到工业自动化,工业电子的身影无处不在,为我们的生活和生产带来了巨大的改变。工业电子的崛起与发展工业电子的发展历程可谓是一部波澜壮阔的科技进化史。追溯到上世纪中叶,电子技术开始逐渐应用于工业领域,最初主要是简单的电子控制装置,用于提高生产过程的自动化程度。随着半导体技术、计算机技术和通信技术的不断突破,工业电子迎来了爆发式的增长。集成电路的发明使得电子设备的体积
    Jeffreyzhang123 2024-12-27 15:40 48浏览
  • 在科技飞速发展的今天,医疗电子作为一个融合了医学与电子技术的交叉领域,正以前所未有的速度改变着我们的医疗模式和健康生活。它宛如一颗璀璨的明珠,在医疗领域绽放出耀眼的光芒,为人类的健康福祉带来了诸多惊喜与变革。医疗电子的神奇应用医疗电子的应用范围极为广泛,深入到医疗的各个环节。在诊断方面,各种先进的医学成像设备堪称医生的 “火眼金睛”。X 光、CT、MRI 等成像技术,能够清晰地呈现人体内部的结构和病变情况,帮助医生准确地发现疾病。以 CT 为例,它通过对人体进行断层扫描,能够提供比传统 X 光更
    Jeffreyzhang123 2024-12-27 15:46 46浏览
  • 一、引言无人机,作为近年来迅速崛起的新兴技术产物,正以前所未有的速度改变着众多行业的运作模式,从民用领域的航拍、物流,到工业领域的测绘、巡检,再到军事领域的侦察、打击等,无人机的身影无处不在。为了深入了解无人机的现状,本次调研综合了市场数据、行业报告、用户反馈等多方面信息,全面剖析无人机的发展态势。二、市场规模与增长趋势随着技术的不断进步和成本的逐渐降低,无人机市场呈现出爆发式增长。近年来,全球无人机市场规模持续扩大,预计在未来几年内仍将保持较高的增长率。从应用领域来看,消费级无人机市场依然占据
    Jeffreyzhang123 2024-12-27 17:29 22浏览
  • 起源与基础20 世纪 60 年代:可编程逻辑设备(PLD)的概念出现,一种被称为 “重构能力” 的芯片的可编程性吸引了许多工程师和学者。20 世纪 70 年代:最早的可编程逻辑器件 PLD 诞生,其输出结构是可编程的逻辑宏单元,它的硬件结构设计可由软件完成,设计比纯硬件的数字电路更灵活,但结构简单,只能实现小规模电路。诞生与发展20 世纪 80 年代中期:为弥补 PLD 只能设计小规模电路的缺陷,复杂可编程逻辑器件 CPLD 被推出,它具有更复杂的结构,能够实现较大规模的电路设计。1988 年:
    Jeffreyzhang123 2024-12-27 10:41 63浏览
  • 在科技飞速发展的今天,汽车不再仅仅是一种交通工具,更是一个融合了先进技术的移动智能空间。汽车电子作为汽车产业与电子技术深度融合的产物,正以前所未有的速度推动着汽车行业的变革,为我们带来更加智能、安全、舒适的出行体验。汽车电子的发展历程汽车电子的发展可以追溯到上世纪中叶。早期,汽车电子主要应用于发动机点火系统和简单的电子仪表,功能相对单一。随着半导体技术的不断进步,集成电路被广泛应用于汽车领域,使得汽车电子系统的性能得到了显著提升。从电子燃油喷射系统到防抱死制动系统(ABS),从安全气囊到车载导航
    Jeffreyzhang123 2024-12-27 11:53 68浏览
  • 在当今竞争激烈的商业世界中,供应链管理已成为企业生存与发展的核心竞争力之一。它就像一条无形的纽带,将供应商、制造商、分销商、零售商直至最终消费者紧密相连,确保产品和服务能够高效、顺畅地流转。今天,就让我们一同深入探索供应链管理的奥秘。供应链管理是什么简单来说,供应链管理是对从原材料采购、生产制造、产品配送直至销售给最终用户这一整个过程中,涉及的物流、信息流和资金流进行计划、协调、控制和优化的管理活动。它不仅仅是对各个环节的简单串联,更是一种通过整合资源、优化流程,实现整体效益最大化的管理理念和方
    Jeffreyzhang123 2024-12-27 17:27 15浏览
  • 采购与分销是企业运营中至关重要的环节,直接影响到企业的成本控制、客户满意度和市场竞争力。以下从多个方面介绍如何优化采购与分销:采购环节优化供应商管理供应商评估与选择:建立一套全面、科学的供应商评估体系,除了考虑价格因素,还要综合评估供应商的产品质量、交货期、信誉、研发能力、售后服务等。通过多维度评估,选择那些能够提供优质产品和服务,且与企业战略目标相契合的供应商。建立长期合作关系:与优质供应商建立长期稳定的合作关系,这种合作模式可以带来诸多好处。双方可以在信任的基础上进行深度沟通与协作,共同开展
    Jeffreyzhang123 2024-12-27 17:43 18浏览
我要评论
23
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦