AI-Native的路要怎么走?一群技术“老炮儿”指明了方向

原创 Alter聊科技 2024-12-20 15:18

解答了AI原生的算力困境、疏通了原生应用的开发路径,照亮了一个个创新案例后,AI-Native的“星星之火”从此刻开始燎原。

撰文张贺飞
编辑沈菲菲

上世纪70年代,沃兹尼亚克、乔布斯、费尔森斯坦、比尔·盖茨、约翰·德雷珀等人成立了名为Homebrew Computer Club的组织,他们在聚会中展示创意、交换想法,希望开创一个每个人都有电脑的世界。

后来的故事大家都很熟悉,沃兹尼亚克和乔布斯在Homebrew Computer Club的会议上展示了Apple I,并在第二年成立了苹果公司。同时推动了开源文化的兴起、个人电脑的普及,成了科技史上最具影响力的技术社群之一。

当世界进入到智能化时代,创新的种子在全球遍地开花,类似Homebrew Computer Club的社群也开始在更大范围内萌芽。

其中就有2020年12月30日成立的创原会,由CNCF执行董事Priyanka Sharma、中国信通院云大所副所长栗蔚和华为云CTO张宇昕作为创始会员构建的全球技术创新交流平台,希望通过探索前沿的云原生、AI等技术,共享产业落地实践经验的方式,共创技术与业务融合的无限可能。

经过四年时间的发展,创原会已经吸纳了来自学术研究、汽车出行、能源制造、互联网、金融投资、货运物流等行业的三百多位技术骨干,不乏衔远科技创始人周伯文、面壁智能CEO李大海、吉利汽车数字中心主任郑金伟、小红书云原生基础平台负责人黄玉奇等懂行的技术“老炮儿”。

正是在这样的背景下,每年一次的创原会年度技术峰会,作为会员们年度相聚、思想碰撞、互动交流的“舞台”,已成为洞察行业创新趋势、落地实践经验的风向标。

比如刚刚结束的2024创原会年度技术峰会,达成了“全面拥抱AI-Native”的共识,并为AI-Native的落地指明了方向。

01.
走向AI-Native,
先要解决算力资源的挑战

根据咨询机构Gartner的预测,2026年将有超过80%的企业在生产环境中落地大模型或调用API,并部署启用生成式AI应用。

比研究报告更加直观的,是创原会年度技术峰会上的热烈讨论:技术“老炮儿”谈论的不再是“怎么使用AI”,而是怎么将AI作为业务和生产的核心支撑,用AI重塑流程与创新产品,实现更高效与智能的运作。

创原会的会员们一致认为,算力挑战是普遍现象。

大模型的训练和推理,都需要强大的算力资源,而国内的很多企业无力承担庞大的硬件采购成本。即使有了算力,由于大规模分布式计算、弹性扩展和模型调优等技术的要求较高,常常出现算力浪费或利用率不足的问题。

图:华为云CTO、创原会荣誉理事长张宇昕

华为云CTO、创原会荣誉理事长张宇昕在演讲中表示:“我们期望每个企业都能实时按需获取AI算力,构建弹性、高效、多元算力的AI-Native基础设施是关键。”

传统的数据中心是CPU为中心的主从架构,所有资源的交互和信息传递都以CPU调度为主,CPU性能提升和网络带宽等都成为瓶颈。比如在AI训练推理的场景中,CPU为中心的架构无法完全满足业务所需的超大网络总线带宽、内存带宽和显存容量,直接限制了训练推理效率,并导致NPU算力和其它资源的闲置。

华为云的解题思路是将数据中心演进到多元算力对等全互联的架构,通过高速互联网络协议,将CPU、NPU、内存等算力资源全部互联,实现资源全池化、全对等互连、资源按需组合,从单体算力进化到矩阵算力。

张宇昕举了一个真实的例子:在使用万亿参数的盘古S模型运行训练任务时,采用多元算力对等架构的华为云CloudMatrix,计算效率比传统架构提升了68%;千亿参数的盘古U模型的推理效率提升了30%。


解决算力瓶颈只是第一步,存储也是制约AI发展的关键要素:32GB的显存仅能装下70亿参数的模型,且随着模型参数规格的增长,推理的显存需求并发变大。

针对AI落地应用过程中遇到的存储、数据等问题,华为云早已给出了一整套成熟的解决方案:

通过用池化架构来扩展显存的方式,解决了推理过程中的内存墙限制;通过将KV计算任务卸载到虚拟显存和CPU上,让单卡的并发数大幅提升;通过数据库领域大模型+场景小模型的多模型协同,打造了智能的数据库引擎,并利用智能开发助手和智能运维助手,全面提升开发和运维效率;以及在安全合规、隐私保护、可靠可控等方面的全盘布局。

走向AI-Native的过程,也是重新定义基础设施的过程。就像打开水龙头时,我们不需要知道水是从哪条河里来的;当我们调用AI算力的时候,不需要知道算力是怎么来的,背后的技术和运维有多复杂。

02.
AI原生应用开发,
有了“流水线”般的新范式

回答了算力资源的问题后,AI-Native就不再是一道选择题,而是千行万业数智化转型升级的必答题。

华为云副总裁、战略与产业发展部总裁黄瑾讲述了自己的判断:

相对历史上所有重大技术变革和创新,不管是云计算、移动互联网时代,其商业生态链都呈倒金字塔结构——应用和内容为王。同时坦言AI正在重塑IT的方方面面,包括重新定义基础设施、重塑软件开发过程、重塑软件交互体验,甚至在重塑软件生态。

图:华为云副总裁、战略与产业发展部总裁黄瑾

新的时代序幕已经拉开,身在局中的创原会会员们感同身受,他们的态度体现在讨论的议题上:《根据企业自身业务需求,如何识别和选择AI在开发领域的价值场景?》《如何选择智能化研发相关的关键技术?》《AI时代下的效能双引擎联动,如何实现确定性增长?》

面对如何高效打造AI原生应用的疑问,张宇昕结合华为云将大模型落地到30多个行业的400多个场景的经验,给出了三个建议:

第一,企业应用要基于AI-Native的云服务来开发和构建。

每个企业都需要持续思考如何把AI能力融入到自己的产品和应用中去,通过用以知识为中心的数据湖来构筑数据底座,用自主智能的工具链来开发应用,用AIGC+CG融合的数字内容生产线来创作内容等等。这样的产品和应用将具备自主学习、持续迭代、适应变化的能力。

第二,用基础大模型+工具链+企业经验,构建企业自己的专属模型。

大模型落地应用的过程中,也产生了“不可能三角”问题——需要在专业性、泛化性、经济性三者中做好权衡:通用大模型缺乏行业Know-how,在专业性上无法胜任企业的业务需要;训练大量专业数据,又会引发大模型的泛化能力下降;模型参数规模越大,性能和精度效果越好,但是训练成本会很高。


张宇昕的答案是:“模型不是越大越好,也不是一个大模型可以打遍天下,企业要结合自身经验和行业Know-how来打造自己专属的模型。”

比如将不同行业专属的高质量数据,结合行业Know-how训练通用大模型,并针对不同行业对模型能力的偏好进行通用数据增强,打造行业场景的大模型。各个企业在行业大模型的基础上,增训自己的私有数据、企业Know-how,调度企业专用工具和插件,构建出企业自己的专属模型。

第三,用大模型系统构建AI原生应用,实现企业智能升级。

大模型的训练不应该重复造轮子,大模型的落地也不应该一次次从0到1,而是将模型与工程化能力相结合,实现模型接入与对外接口标准化,开发者可以按照相应的规则调用,直接创建AI原生应用。

相对应的正是华为云的大模型系统,包含行业数据和知识组成的知识中心,企业专属大模型、开源大模型以及传统小模型构成的模型中心,搜索引擎、代码执行器整合而成的组件中心等等。

开发者可以通过大模型系统的增强插件,譬如安全护栏保障模型的安全性、RAG检索增强来消除大模型幻觉,利用标准的API接口,协同配合多种模型,以取长补短的方式快速实现企业的智能化升级。

打一个比方的话:如果说传统的应用开发是“手工作坊”,有了完善的工具链、大模型系统和独立处理复杂任务的AI Agent,AI原生应用的开发已经进入到了“流水线生产”的模式,为数智化转型按下了“加速键”。

03.
大模型平民化,
在场景中看见新质生产力

当AI-Native的路径被跑通,大模型不再是少数头部企业的“特权”,AI将和千行万业的真实场景碰撞出什么样的火花?

就历史经验来看,相较于数据上的宏观论述,可以触摸的落地案例更有说服力。2024创原会年度技术峰会上有一个特别的环节,评选出了“2024年度AI-Native十大先锋实践”,也为外界提供了窥探落地现状的窗口。

图:“AI-Native十大先锋实践”案例

我们筛选出了三个有代表性的例子。

一是借助AIGC优化内容生产流程的喜马拉雅。

作为国内规模领先的在线音频分享平台,喜马拉雅在2023年专门成立了“珠峰实验室”,着手研发了“珠峰音频AI模型”。

为了解决大模型训练和推理的算力需求,喜马拉雅构建了自建AI基础设施与公有云AI资源池的混合架构,让资源利用效率提升了20%、资源成本降低了10%。目前“珠峰音频AI模型”已经生产了数万本有声书,包括模仿单田芳声音的AI合成音频专辑,极大降低了平台的成本投入。

内容生产的流程被重塑后,喜马拉雅进一步研发了AI智能推送系统、国内首个全内容智能AI音箱小雅等产品,不仅提升了内容推送精准度和效率,也为听众带来了更加沉浸式、定制化的音频体验。

二是用AI大模型打造零售智能体的美宜佳。

深耕零售行业近30年的美宜佳,开启了创办以来“最具创新”的一次转型,联合华为云盘古大模型打造了AI+IoT+美宜佳业务平台的零售智能体,并将其落地到3.7万家门店,探索零售行业的新业态。


数字店员可以随场随身解答顾客的问题,播放音乐缓解顾客的压力,像一座智慧化的“城市灯塔”,点亮了深夜归家的路。

值得一提的是,美宜佳的智能化探索,不仅为品牌商、门店店主、消费者提供了服务成本更低、效率更高、体验更好的集成生态服务,沉淀下来的经验和能力还将外溢到整个行业,驱动零售行业服务升级。

三是北京市政一卡通的人工智能创新实践。

基于华为云的AI原生基础设施,北京市政一卡通依托AI技术完成了一卡通支付的智能化改造,有效支撑了一卡通公司在公共交通、商业消费、政府管理、创新应用4大领域28个行业的广泛落地。

目前北京市政一卡通已经覆盖国内330多个城市,每天为数千万用户提供持续、稳定、高效、安全的支付服务。同时人工智能还在用卡安全等方面发挥了重要作用,为公共服务与社会治理提供了创新示范,连续多年被列入北京市政府“为市民办实事工程”。

正如张宇昕所说:“中国的AI产业有着巨大的机遇,我们可以充分发挥在行业场景和行业数据领域的优势,让AI深入到企业核心生产系统,真正发挥产业价值和商业价值,推动产业升级和转型。”

三个跨越互联网、零售、政企的例子,仅仅是AI原生应用图景的一隅,却用事实印证了张宇昕的判断,让外界看到了实实在在的新质生产力,看到了行业生产力的跃迁。

04.
写在最后

Homebrew Computer Club在50年前点燃了个人计算机革命,为人类的生活和工作方式产生了颠覆性改变。

承袭了这种精神的创原会,为技术先锋和产业创新者搭建了沟通的桥梁,正在将创新的力量扩散到更多的行业和场景中。

也许多年后再来审视2024创原会年度技术峰会,人们会惊讶地发现:解答了AI原生的算力困境、疏通了原生应用的开发路径,照亮了一个个创新案例后,AI-Native的“星星之火”从此刻开始燎原。

往期推荐


01

“芯片围城”下国产AI要放缓?答案或截然相反

02

大模型的现在进行时:走出对话框,走向产业端



主理人 | 张贺飞(Alter)


前媒体人、公关,现专职科技自媒体


钛媒体、36kr、创业邦、福布斯中国等专栏作者


转载、商务、开白以及读者交流,请联系个人微信「imhefei」

Alter聊科技 探究产业兴衰,专注商业解读。
评论
  • 2024年是很平淡的一年,能保住饭碗就是万幸了,公司业绩不好,跳槽又不敢跳,还有一个原因就是老板对我们这些员工还是很好的,碍于人情也不能在公司困难时去雪上加霜。在工作其间遇到的大问题没有,小问题还是有不少,这里就举一两个来说一下。第一个就是,先看下下面的这个封装,你能猜出它的引脚间距是多少吗?这种排线座比较常规的是0.6mm间距(即排线是0.3mm间距)的,而这个规格也是我们用得最多的,所以我们按惯性思维来看的话,就会认为这个座子就是0.6mm间距的,这样往往就不会去细看规格书了,所以这次的运气
    wuliangu 2025-01-21 00:15 153浏览
  • 本文介绍瑞芯微开发板/主板Android配置APK默认开启性能模式方法,开启性能模式后,APK的CPU使用优先级会有所提高。触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。源码修改修改源码根目录下文件device/rockchip/rk3562/package_performance.xml并添加以下内容,注意"+"号为添加内容,"com.tencent.mm"为AP
    Industio_触觉智能 2025-01-17 14:09 159浏览
  • 数字隔离芯片是一种实现电气隔离功能的集成电路,在工业自动化、汽车电子、光伏储能与电力通信等领域的电气系统中发挥着至关重要的作用。其不仅可令高、低压系统之间相互独立,提高低压系统的抗干扰能力,同时还可确保高、低压系统之间的安全交互,使系统稳定工作,并避免操作者遭受来自高压系统的电击伤害。典型数字隔离芯片的简化原理图值得一提的是,数字隔离芯片历经多年发展,其应用范围已十分广泛,凡涉及到在高、低压系统之间进行信号传输的场景中基本都需要应用到此种芯片。那么,电气工程师在进行电路设计时到底该如何评估选择一
    华普微HOPERF 2025-01-20 16:50 70浏览
  •  万万没想到!科幻电影中的人形机器人,正在一步步走进我们人类的日常生活中来了。1月17日,乐聚将第100台全尺寸人形机器人交付北汽越野车,再次吹响了人形机器人疯狂进厂打工的号角。无独有尔,银河通用机器人作为一家成立不到两年时间的创业公司,在短短一年多时间内推出革命性的第一代产品Galbot G1,这是一款轮式、双臂、身体可折叠的人形机器人,得到了美团战投、经纬创投、IDG资本等众多投资方的认可。作为一家成立仅仅只有两年多时间的企业,智元机器人也把机器人从梦想带进了现实。2024年8月1
    刘旷 2025-01-21 11:15 239浏览
  • 随着消费者对汽车驾乘体验的要求不断攀升,汽车照明系统作为确保道路安全、提升驾驶体验以及实现车辆与环境交互的重要组成,日益受到业界的高度重视。近日,2024 DVN(上海)国际汽车照明研讨会圆满落幕。作为照明与传感创新的全球领导者,艾迈斯欧司朗受邀参与主题演讲,并现场展示了其多项前沿技术。本届研讨会汇聚来自全球各地400余名汽车、照明、光源及Tier 2供应商的专业人士及专家共聚一堂。在研讨会第一环节中,艾迈斯欧司朗系统解决方案工程副总裁 Joachim Reill以深厚的专业素养,主持该环节多位
    艾迈斯欧司朗 2025-01-16 20:51 191浏览
  • 高速先生成员--黄刚这不马上就要过年了嘛,高速先生就不打算给大家上难度了,整一篇简单但很实用的文章给大伙瞧瞧好了。相信这个标题一出来,尤其对于PCB设计工程师来说,心就立马凉了半截。他们辛辛苦苦进行PCB的过孔设计,高速先生居然说设计多大的过孔他们不关心!另外估计这时候就跳出很多“挑刺”的粉丝了哈,因为翻看很多以往的文章,高速先生都表达了过孔孔径对高速性能的影响是很大的哦!咋滴,今天居然说孔径不关心了?别,别急哈,听高速先生在这篇文章中娓娓道来。首先还是要对各位设计工程师的设计表示肯定,毕竟像我
    一博科技 2025-01-21 16:17 94浏览
  • 日前,商务部等部门办公厅印发《手机、平板、智能手表(手环)购新补贴实施方案》明确,个人消费者购买手机、平板、智能手表(手环)3类数码产品(单件销售价格不超过6000元),可享受购新补贴。每人每类可补贴1件,每件补贴比例为减去生产、流通环节及移动运营商所有优惠后最终销售价格的15%,每件最高不超过500元。目前,京东已经做好了承接手机、平板等数码产品国补优惠的落地准备工作,未来随着各省市关于手机、平板等品类的国补开启,京东将第一时间率先上线,满足消费者的换新升级需求。为保障国补的真实有效发放,基于
    华尔街科技眼 2025-01-17 10:44 221浏览
  • 现在为止,我们已经完成了Purple Pi OH主板的串口调试和部分配件的连接,接下来,让我们趁热打铁,完成剩余配件的连接!注:配件连接前请断开主板所有供电,避免敏感电路损坏!1.1 耳机接口主板有一路OTMP 标准四节耳机座J6,具备进行音频输出及录音功能,接入耳机后声音将优先从耳机输出,如下图所示:1.21.2 相机接口MIPI CSI 接口如上图所示,支持OV5648 和OV8858 摄像头模组。接入摄像头模组后,使用系统相机软件打开相机拍照和录像,如下图所示:1.3 以太网接口主板有一路
    Industio_触觉智能 2025-01-20 11:04 141浏览
  • 嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大学伯克利分校的研究团队弄出来的,目的就是想搞个新的、开放的指令集架构,能跟上现代计算的需要。到了2015年,专门成立了个RISC-V基金会,让这个架构更标准,也更好地推广开了。这几年啊,这个RISC-V的生态系统发展得可快了,好多公司和机构都加入了RISC-V International,还推出了不少RISC-V
    丙丁先生 2025-01-21 12:10 100浏览
  • 80,000人到访的国际大展上,艾迈斯欧司朗有哪些亮点?感未来,光无限。近日,在慕尼黑electronica 2024现场,ams OSRAM通过多款创新DEMO展示,以及数场前瞻洞察分享,全面展示自身融合传感器、发射器及集成电路技术,精准捕捉并呈现环境信息的卓越能力。同时,ams OSRAM通过展会期间与客户、用户等行业人士,以及媒体朋友的深度交流,向业界传达其以光电技术为笔、以创新为墨,书写智能未来的深度思考。electronica 2024electronica 2024构建了一个高度国际
    艾迈斯欧司朗 2025-01-16 20:45 378浏览
  •  光伏及击穿,都可视之为 复合的逆过程,但是,复合、光伏与击穿,不单是进程的方向相反,偏置状态也不一样,复合的工况,是正偏,光伏是零偏,击穿与漂移则是反偏,光伏的能源是外来的,而击穿消耗的是结区自身和电源的能量,漂移的载流子是 客席载流子,须借外延层才能引入,客席载流子 不受反偏PN结的空乏区阻碍,能漂不能漂,只取决于反偏PN结是否处于外延层的「射程」范围,而穿通的成因,则是因耗尽层的过度扩张,致使跟 端子、外延层或其他空乏区 碰触,当耗尽层融通,耐压 (反向阻断能力) 即告彻底丧失,
    MrCU204 2025-01-17 11:30 176浏览
  • 电竞鼠标应用环境与客户需求电竞行业近年来发展迅速,「鼠标延迟」已成为决定游戏体验与比赛结果的关键因素。从技术角度来看,传统鼠标的延迟大约为20毫秒,入门级电竞鼠标通常为5毫秒,而高阶电竞鼠标的延迟可降低至仅2毫秒。这些差异看似微小,但在竞技激烈的游戏中,尤其在对反应和速度要求极高的场景中,每一毫秒的优化都可能带来致胜的优势。电竞比赛的普及促使玩家更加渴望降低鼠标延迟以提升竞技表现。他们希望通过精确的测试,了解不同操作系统与设定对延迟的具体影响,并寻求最佳配置方案来获得竞技优势。这样的需求推动市场
    百佳泰测试实验室 2025-01-16 15:45 334浏览
  • Ubuntu20.04默认情况下为root账号自动登录,本文介绍如何取消root账号自动登录,改为通过输入账号密码登录,使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、Android等操作系统,接口丰富,开发评估快人一步!添加新账号1、使用adduser命令来添加新用户,用户名以industio为例,系统会提示设置密码以及其他信息,您可以根据需要填写或跳过,命令如下:root@id
    Industio_触觉智能 2025-01-17 14:14 118浏览
  •     IPC-2581是基于ODB++标准、结合PCB行业特点而指定的PCB加工文件规范。    IPC-2581旨在替代CAM350格式,成为PCB加工行业的新的工业规范。    有一些免费软件,可以查看(不可修改)IPC-2581数据文件。这些软件典型用途是工艺校核。    1. Vu2581        出品:Downstream     
    电子知识打边炉 2025-01-22 11:12 35浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦