大模型走向产业的一小步,AI走向普惠的一大步

原创 脑极体 2022-05-20 22:10


蒸汽机,在工业革命中扮演着怎样的角色?


保尔·芒图在《十八世纪产业革命》中是这样形容蒸汽机的:“蒸汽机并不创造大工业。但是它却为大工业提供了动力,更重要的是使大工业具有统一性。使用蒸汽机,使一切工业的发展都要服从一般的法则,工业世界成为一个巨大的工厂。”


可以说,蒸汽机是工业革命的心脏,是手工生产走向模块化、标准化的通道。此后每一次产业革新中,世界的优先任务都是寻找那部“蒸汽机”。当深度学习推动AI技术又一次复兴,人类对它的最高期待,就是让AI成为第四次产业革命中的“蒸汽机”。而近几年身处智能革命前沿的,就是预训练大模型。


然而必须正视的是,全球大模型竞赛中,我们看到大模型的参数越来越大,数据集记录不断被刷新。但真正的产业空间里,却很难看到大模型规模化、标准化应用。这可能是因为大模型与行业知识不相匹配,行业算力基础难以负载大模型部署等等问题。我们似乎一直都在造一台不能走进工厂的“蒸汽机原型机”。


在中学课本里,我们都知道是瓦特改良了蒸汽机,却没有提是谁发明了蒸汽机。其原因在于,瓦特真正解决了蒸汽机走向应用的问题,从技术、产品、商业模式等问题上让蒸汽机具有与行业结合的可行性。


就在刚刚,似乎大模型也跨出了这历史性的一步。


百度与国家电网、浦发银行等行业头部企业联合研发,融合了通用数据和行业特有知识,推出知识增强能源行业NLP大模型国网-百度·文心,和知识增强的金融行业NLP大模型浦发-百度·文心,显著提升了大模型在行业任务上的应用效果。


“行业大模型”,这个我们从没听说过的概念背后,是大模型走向应用化的开端,是百度多年探索深度学习技术走向产业的又一次瓜熟蒂落。



5月20日,由深度学习技术及应用国家工程研究中心主办、百度飞桨承办的WAVE SUMMIT 2022深度学习开发者峰会在线上举行。期间,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士发表主题演讲,提出“产业级深度学习开源开放平台飞桨助力人工智能越来越普惠,赋能千行百业,惠及千家万户”。



2019年的WAVE SUMMIT,王海峰提出深度学习技术已经具备通往工业大生产的条件,并且明确了标准化、模块化、自动化的三大特征。彼时开始,百度与AI开发者、各行业AI应用者共同开始了一场在21世纪筑造蒸汽机的旅程。如今,王海峰指出在AI工业大生产阶段,深度学习技术的通用性越来越强,深度学习平台的标准化、自动化和模块化特征越来越显著,深度学习应用越来越广泛且深入,已经遍地开花。


技术、平台、应用三层标准,是一项技术走向产业普适的核心。回到蒸汽机的故事,瓦特也是改写了蒸汽机的这三大要素。在技术上实现了气缸恒热,确保了机械效率;在平台上实现了器件的标准化,工厂能买到可维护、可换新的产品;在应用上则与大量工厂主合作,让蒸汽机走进经济生产。就这样,原本昂贵、效率差、损坏率高的蒸汽机,变成了高效、低门槛的工业化代名词。


今天,百度和中国AI产业也在进行这样的探索。大模型让深度学习的技术效能不断增强,飞桨实现了AI工业大生产所需的平台化支撑,百度与各行业开发者的合作,让AI应用之花开遍了中国原野。


在WAVE SUMMIT 2022,我们可用清晰看到深度学习技术,预训练大模型,是如何一步步变成那台“蒸汽机”的。



大模型做实,

从无尽跑分转向全面可用


预训练大模型是近几年AI产业最火热的技术名词。拼模型参数,拼任务集完成效果,是厂商推出大模型后最喜欢做的几件事。换个角度看,大模型依旧处在“无尽跑分”的初级阶段。


从高分到高能,大模型距离现实中的产业场景还有不短的路程要走。比如很多产业需求无法用通用模型来处理,技术与使用场景之间存在代沟。再比如超大规模模型在部署时会面临一系列问题,比如算力、调参难度、硬件兼容性等。


让大模型从“跑分考场”走向千行百业,需要一场全面的转向。而这就是今年WAVE SUMMIT最亮眼的一个发布和升级。



百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,今年是大模型产业落地的关键年,飞桨文心大模型通过搭建更适配场景需求的大模型体系,提供全流程支持应用落地的工具、平台和方法,建设激发创新的开放生态,解决大模型技术与场景需求匹配的关键问题。



面向行业智能化需求,百度围绕大模型产业级与知识增强两大关键词,公布了全新的飞桨文心大模型全景图。在模型方面,形成基础大模型、任务大模型、行业大模型的三级体系,以更有效地支持应用需求,并发布10个全新的大模型;为促进大模型惠及最广泛的行业与开发者,还配套发布大模型套件、API、平台,并建设大模型创意和探索社区旸谷,来帮助开发者更低门槛地应用。


文心大模型家族新增的十个大模型,基础大模型包括融合任务相关知识的千亿大模型ERNIE 3.0 Zeus、多任务视觉表征学习VIMER-UFO 2.0、商品图文搜索表征学习VIMER-UMS、文档图像表征学习VIMER-StrucTexT 2.0、语音-语言跨模态大模型ERNIE-SAT和地理-语言跨模态大模型ERNIE-GeoL,任务大模型包括面向生物计算领域的化合物表征HELIX-GEM、蛋白质结构分析HELIX-Fold。


尤其值得注意的,还有文心大模型在业界首次打造发布的两个行业大模型,实现了通用模型为主干,任务模型面向具体需求,行业模型面向具体产业的“三元化结构”,从而使得不同需求、不同行业的开发者可以第一时间找寻到大模型的落地方案,不再“望大模型而兴叹”。


最新发布的行业大模型,包括国网-百度·文心电力行业大模型和浦发-百度·文心金融行业大模型。背后是百度与国家电网、浦发银行等行业头部企业进行了联合研发与创新,更好地融合了通用数据和行业特有知识,从而有效提升了大模型在电力、金融领域的行业任务应用效果。


行业大模型可以说是一个业界期待了很久的转折点。从拼数值到效果落地,大模型需要一个转向应用化,强联接产业的范式与方法,而行业大模型的正填补了这一空白。


除此之外,百度还发布了围绕大模型的全新开发套件,让开发者可用高效率应用大模型开发,同时提供相应的平台功能与API服务,进一步降低大模型使用门槛;在生态建设方面,文心大模型将共享飞桨生态,通过基于文心大模型推出的创意社区——文心·旸谷大模型创意与探索社区,让更多用户感受到文心大模型的应用潜力。


2022年,欧美科技公司依旧执着在大模型参数上不断强化,再强化;而百度AI则将大模型转向了行业场景与真实需求。这个分叉路口的交错,会给未来提供太多可能性。



飞桨做深,支撑大模走向产业


无论是传统的深度学习模型还是大模型,都离不开开发平台的有效支撑。百度能够推动大模型快速走向产业化落地,从产业需求中真实吸收和提炼大模型的升级方向,本质上离不开深度学习平台飞桨,已经建立了与开发者、产业界、学界的高效沟通通道。


在飞桨的生态基础上,百度可以最快速看到中国AI场景与开发者的需求,以高速的频率做出回馈,最终组成产业需求与平台供给之间的急速互动。放眼全球AI产业,这可能是技术、平台、产业之间互动的最佳范式。


每次WAVE SUMMIT,我们都能看到飞桨进行巨量的技术升级,让人感觉似乎已经不可能有新的升级空间,然后又一次次完成突破。这背后就是最懂中国需求,与产业智能同在的飞桨范式。


在技术、场景、生态的三大领域,飞桨完成了进一步深化。深挖技术方面,飞桨框架v2.3正式发布。沿着动静统一的框架设计理念,继续将开发效率与灵活性结合到一起,让开发平台突破性达到了更加成熟的状态。同时也将模型压缩技术进行了升级,提升了深度学习模型的自动化部署能力。



在平台层面,飞桨推出了最懂中国AI场景的训推一体导航图,打通了全流程的智能导航,更新了产业模型库和产业实践,让开发者可以更低门槛获得开发经验与开发能力。与此同时,支撑科学计算的PaddleScience赛桨,以及便携式AI工作站,也解决了现实场景中最迫切的AI开发需求。


在生态领域,飞桨提出了共建硬件生态圈的新行动。AI落地行业场景,是不可能离开硬件适配与算力底座的。这可能是很多算法为核心的AI企业很少提到的话题,却是产业智能化不能规避的一面。在飞桨一步步走向AI工业大生产平台的过程里,也在一步步探索与硬件厂商合作、互补,组成生态。在2020年,飞桨还是更多去寻找硬件合作伙伴,达成兼容性合作,也就是共聚阶段。那一年,百度与13家伙伴联合发起了飞桨硬件生态圈,促进AI产业链的适配升级;2021年,硬件伙伴开始与飞桨共同创新,共同研发更好的AI落地方式,共同创新开始成为飞桨硬件生态的推动力;时间来到今天,飞桨的硬件生态已经初具规模,合作进一步深化,实现了全面共创。如今,百度已经和硬件伙伴一起推出厂商版飞桨框架、建设模型库、开发课程,共同加速产业智能化升级。



至此,飞桨已经可以从架构、硬件、行业场景、开发特殊需求等等维度,实现由最深处支撑大模型落地,AI工业化开发。截至目前,飞桨平台已凝聚477万开发者,服务18万家企事业单位,累计创建了56万个模型。


飞桨,正在像蒸汽机、电力、燃油一样,成为可以低门槛、高效率应用的千行百业生产底座。



百度AI,

正在分子化融入中国大地


文心大模型成为首个全面转向应用的大模型序列;飞桨成为了最了解中国经济需求,最深入中国AI场景的开发平台。这不是一场魔法,不是什么突然实现的黑科技,而是一段一脉相承,步步为营的故事。


几年前,有太多企业面对着AI许下了宏大的心愿,但今天他们再也不提起AI了。画几页PPT,宣布一个庞大愿景很容易。但在大浪褪去后,坚定实践每一个诺言却很难。在WAVE SUMMIT上,我们能看到百度依旧扛着深度学习的旗帜,向技术的无人区,向产业的战略高地,向中国大地最深层智能化需求冲过去。


面向让AI开发标准化、自动化、模块化的目标,百度AI将自己一步步解耦,再以最小的分子化形态融入中国无比广泛的开发需求。在远离喧嚣的乡村角落,在最严苛的工业核心,在最前沿的科学研究,百度的AI技术都能渗透进去。他们把深度学习的铁杵磨成了针,深入那些真正需要智能的产业缝隙里。


你可能不会想到,AI能够在牧区的农贸市场完成“相牛”师傅的工作,推动畜牧业走向市场标准化,现代化。这背后是飞桨的低门槛特性作为支撑。


你可能不会想到,在数据不能出车间的工厂里,飞桨可以通过便携式AI工作站抵达生产核心,带来工业智能化的无穷想象。而这只是飞桨产业级特性的一个缩影。


你可能不会想到,飞桨已经在与中国所有主流的超算中心进行适配,为了帮助前沿科学研究项目走向智能化。这只是飞桨在跨领域、跨学科探索的一个侧面。


从2019年正式提出工业化大生产目标,百度AI依托飞桨连绵不绝的升级,开始伴随各行业一起步入深度学习赋能产业的深水区。2020年,突如其来的疫情带来了一系列变化,各行业开始加速拥抱数字化、智能化,这也让飞桨更加高效地肩负起支撑产业的责任。2021年,瞄准AI技术降低门槛,融合创新的新特点,百度持续打造了低门槛的飞桨使用体验,推出了知识增强大模型的关键创新。


伴随着百度AI的步步深入,一次次降低门槛,提升技术支撑力,各行业也开启了更加积极的AI探索。从少量先行者探索AI,到大量企业开始“工坊”式尝试AI,再到企业开始以大规模资源协同的方式,启动AI工业化大生产。千行百业的智能化、数字化需求逐年深入,随之而来的智能需求也不断加强。为此,百度打造了以云计算为基础,以AI为引擎的赋能形态,支撑企业数字化、智能化升级一步到位。


在技术供给与产业需求同步提升的同时,百度此前提出培养500万AI人才的目标也在持续进展。各种各样的产学研联合培养方式与AI技术社区,保障了智能化过程中的人才基础。


王海峰认为,在深度学习技术及平台的支撑下,人工智能呈现出融合创新、降低门槛的特点,将继续推动科技革命和产业变革,加快产业智能化升级。


这些特点并不是凭空浮现,而是一步步探索出来,一点点锤炼出来。在技术研发、平台打造、生态培育、应用落地的一重重探索下,真正的普惠AI正在实现。


时间来到2022年,面对大模型走向实用化,各行业开始以AI重构和升级生产力核心,我们会有点惊奇地发现,那个把AI技术变成21世纪的蒸汽机,让第四次工业革命发生在中国的诺言,似乎开始一步步,一点点地实现了?


那些听起来稚嫩的希望,


那些看上去荒唐的梦想,


那些迟迟不敢说出口的诺言,


就去试试吧。


就去一次次调参那些模型,去在深夜里回复每个开发者的疑问,就去深入车间,深入牧场,深入实验室。去直面需求,升级技术,锤炼平台,共创生态,去实现那个关于大模型,关于深度学习技术的,最深的,最大的,也是最美好的梦。


中国AI不是一张空头支票。而是真的有人在把大模型、把AI技术变成一个机会,一个撬动产业变革,撬动智能革命的机会。



还记得年少时的梦吗?


像朵永远不凋零的花。


让第四次工业革命发生在中国,又为什么不能实现呢?


脑极体 从技术协同到产业革命,从智能密钥到已知尽头
评论
  • 前篇文章中『服务器散热效能不佳有解吗?』提到气冷式的服务器其散热效能对于系统稳定度是非常重要的关键因素,同时也说明了百佳泰对于散热效能能提供的协助与服务。本篇将为您延伸说明我们如何进行评估,同时也会举例在测试过程中发现的问题及改善后的数据。AI服务器的散热架构三大重点:GPU导风罩:尝试不同的GPU导风罩架构,用以集中服务器进风量,加强对GPU的降温效果。GPU托盘:改动GPU托盘架构,验证出风面积大小对GPU散热的影想程度。CPU导风罩:尝试封闭CPU导风罩间隙,集中风流,验证CPU降温效果。
    百佳泰测试实验室 2025-01-24 16:58 192浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 187浏览
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 821浏览
  • 飞凌嵌入式基于瑞芯微RK3562系列处理器打造的FET3562J-C全国产核心板,是一款专为工业自动化及消费类电子设备设计的产品,凭借其强大的功能和灵活性,自上市以来得到了各行业客户的广泛关注。本文将详细介绍如何启动并测试RK3562J处理器的MCU,通过实际操作步骤,帮助各位工程师朋友更好地了解这款芯片。1、RK3562J处理器概述RK3562J处理器采用了4*Cortex-A53@1.8GHz+Cortex-M0@200MHz架构。其中,4个Cortex-A53核心作为主要核心,负责处理复杂
    飞凌嵌入式 2025-01-24 11:21 295浏览
  • 临近春节,各方社交及应酬也变得多起来了,甚至一月份就排满了各式约见。有的是关系好的专业朋友的周末“恳谈会”,基本是关于2025年经济预判的话题,以及如何稳定工作等话题;但更多的预约是来自几个客户老板及副总裁们的见面,他们为今年的经济预判与企业发展焦虑而来。在聊天过程中,我发现今年的聊天有个很有意思的“点”,挺多人尤其关心我到底是怎么成长成现在的多领域风格的,还能掌握一些经济趋势的分析能力,到底学过哪些专业、在企业管过哪些具体事情?单单就这个一个月内,我就重复了数次“为什么”,再辅以我上次写的:《
    牛言喵语 2025-01-22 17:10 501浏览
  • 故障现象 一辆2007款日产天籁车,搭载VQ23发动机(气缸编号如图1所示,点火顺序为1-2-3-4-5-6),累计行驶里程约为21万km。车主反映,该车起步加速时偶尔抖动,且行驶中加速无力。 图1 VQ23发动机的气缸编号 故障诊断接车后试车,发动机怠速运转平稳,但只要换挡起步,稍微踩下一点加速踏板,就能感觉到车身明显抖动。用故障检测仪检测,发动机控制模块(ECM)无故障代码存储,且无失火数据流。用虹科Pico汽车示波器测量气缸1点火信号(COP点火信号)和曲轴位置传感器信
    虹科Pico汽车示波器 2025-01-23 10:46 326浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 241浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 465浏览
  • 项目展示①正面、反面②左侧、右侧项目源码:https://mbb.eet-china.com/download/316656.html前言为什么想到要做这个小玩意呢,作为一个死宅,懒得看手机,但又想要抬头就能看见时间和天气信息,于是就做个这么个小东西,放在示波器上面正好(示波器外壳有个小槽,刚好可以卡住)功能主要有,获取国家气象局的天气信息,还有实时的温湿度,主控采用ESP32,所以后续还可以开放更多奇奇怪怪的功能,比如油价信息、股票信息之类的,反正能联网可操作性就大多了原理图、PCB、面板设计
    小恶魔owo 2025-01-25 22:09 624浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 998浏览
  • 不让汽车专美于前,近年来哈雷(Harley-Davidson)和本田(Honda)等大型重型机车大厂的旗下车款皆已陆续配备车载娱乐系统与语音助理,在路上也有越来越多的普通机车车主开始使用安全帽麦克风,在骑车时透过蓝牙连线执行语音搜寻地点导航、音乐播放控制或免持拨打接听电话等各种「机车语音助理」功能。客户背景与面临的挑战以本次分享的客户个案为例,该客户是一个跨国车用语音软件供货商,过往是与车厂合作开发前装车机为主,且有着多年的「汽车语音助理」产品经验。由于客户这次是首度跨足「机车语音助理」产品,因
    百佳泰测试实验室 2025-01-24 17:00 197浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 247浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 1230浏览
  • 随着AI大模型训练和推理对计算能力的需求呈指数级增长,AI数据中心的网络带宽需求大幅提升,推动了高速光模块的发展。光模块作为数据中心和高性能计算系统中的关键器件,主要用于提供高速和大容量的数据传输服务。 光模块提升带宽的方法有两种:1)提高每个通道的比特速率,如直接提升波特率,或者保持波特率不变,使用复杂的调制解调方式(如PAM4);2)增加通道数,如提升并行光纤数量,或采用波分复用(CWDM、LWDM)。按照传输模式,光模块可分为并行和波分两种类型,其中并行方案主要应用在中短距传输场景中成本
    hycsystembella 2025-01-25 17:24 480浏览
  • 书接上回:【2022年终总结】阳光总在风雨后,启航2023-面包板社区  https://mbb.eet-china.com/blog/468701-438244.html 总结2019,松山湖有个欧洲小镇-面包板社区  https://mbb.eet-china.com/blog/468701-413397.html        2025年该是总结下2024年的喜怒哀乐,有个好的开始,才能更好的面对2025年即将
    liweicheng 2025-01-24 23:18 357浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦