北京市科委权威发布:企业应用大模型的特征和挑战

原创 爱分析ifenxi 2024-05-13 18:49

在北京市科学技术委员会、中关村科技园区管理委员会的指导和组织下,由北京信息科技发展中心、北京爱分析科技有限公司等单位编写完成《北京市人工智能大模型行业应用分析报告》,展现北京市大模型相关技术产品在各领域各行业的应用发展态势,并提出有关建议,为未来决策提供参考。
今日先行发布报告的“企业应用大模型的特征和挑战”部分,以供企业用户前瞻。

注:长按扫描下图二维码或点击文末左下角“阅读原文”,可下载完整版《北京市人工智能大模型行业应用分析报告》。


应用特征1:由浅入深,大模型穿越边缘场景,向核心场景挺进
2023年,大模型落地集中于边缘场景。大模型兴起于2023年初,经过近一年的高速发展,其在政务、金融、产业升级等各个领域均有落地应用。大模型在政务领域,以政务问答、文件生成等场景为主;在金融领域,以智能客服、售前助理等场景为主;在产业升级领域,以知识问答、代码补全等场景为主;在医疗领域,以医疗文书生成、智能医药问答等场景为主;在文化教育领域,以内容润色、内容纠错等场景为主;在智慧城市领域,以公共安全监测、城市运行报告生成等场景为主。但上述场景大多为所属领域的边缘场景,不涉及生产、运营的核心环节,也不面向公众或外部客户使用,仅面向内部员工使用。
2024年,大模型逐步向核心场景挺进。得益于大模型在边缘场景价值的成功验证及其技术演进,大模型在深耕边缘场景的同时开始向核心区挺进。在场景价值验证方面,多数需求方认可大模型价值,将计划追加投入。例如某运营商在2023年研发客服大模型并试点上线,由数万名员工内测试用,该运营商计划2024年开始在集团范围内加快规模化商用推广。大模型技术演进主要指检索增强生成(RAG)、智能体(AI Agent)和多模态,他们对扩大大模型应用范围有明显作用。检索增强生成技术是指大模型在回答问题时,会先从大量的文档中检索出相关信息,然后将这些检索出的信息作为提问的上下文构建提示词,大模型再基于提示词进行归纳总结,生成答案,检索增强生成技术主要用于解决大模型幻觉问题。智能体技术则可以实现大模型应用的能力升级,例如,类似ChatGPT的大模型应用仅能起辅助作用,而智能体技术可以赋予大模型感知、规划、记忆和使用工具的能力,实现独当一面。多模态技术使得交互模态不局限于单一的文本模态,而是扩展至文本、图片、音频、视频等多种模态,可显著提升大模型应用的产品功能和交互体验,推动大模型应用从可用向好用转变。
图1:大模型穿越边缘场景,向核心场景挺进
应用特征2:守正创新,央国企拥抱新技术,加快大模型在产业升级、金融等领域的落地步伐
大模型在各个领域均有落地应用,其中在产业升级和金融领域的落地步伐最快。2023年公开招投标统计数据显示,产业升级相关大模型项目招标金额最多,占比高达32.5%,金融占比紧随其后,占比为28.2%。

图2:2023年各领域大模型公开招标金额占比

央国企需求旺盛,引领大模型在两大领域快速落地。央国企守正创新,有较强意愿自上而下推进大模型应用。同时,央国企通常具有较强的数据基础设施、算力投入和AI应用基础,为大模型成功落地提供先决条件。在央国企引领下,大模型在产业升级和金融领域快速落地。
应用特征3:百花齐放,大模型应用搭建难度下降,“动态行业大数据”成为落地新关键
大模型基础能力提升、开发工具逐渐完善,为培育大模型应用提供肥沃土壤。大模型持续迭代,语义理解、上下文长度、多模态等能力愈发完善,有利于开发上层应用。同时,随着行业发展,大模型生态也在逐渐成熟,各类便捷的AI开发工具陆续推出,应用开发难度显著下降。例如百度于2024年推出的智能体开发工具AgentBuilder、AI原生应用开发工具AppBuilder、各种尺寸的模型定制工具ModelBuilder,可以帮助不具备代码编程能力的人员完成大模型应用开发。
动态行业数据成为大模型落地新关键。基础大模型一般是基于广泛的公开文献与网络信息来训练的,属于“泛行业”,没有特定行业属性,导致基于其搭建的上层应用在专业和细分领域难以提供高价值服务。因此,打造行业大模型成为需求方和技术企业的共同关注点。具体而言,“动态行业大数据”是打造行业大模型的核心,其是指为保证行业大模型的持久生命力,技术企业应具备动态更新行业大数据的能力,而非只掌握一批“静态数据”。拥有“动态行业大数据”的技术企业更容易获得需求方青睐。
图3:大模型应用搭建难度下降,“动态行业大数据”成为落地关键
应用特征4:量体裁衣,需求方情况各异,在采购、部署大模型时特色鲜明
需求方IT能力越强,越倾向采购基础大模型,反之则倾向采购大模型应用。需求方IT能力差异显著,这会直接影响他们的采购行为。强IT能力的需求方倾向能力建设,较弱IT能力需求方倾向应用建设。聚焦大模型,强IT能力的需求方通常倾向采购基础大模型,通过自行微调来开发各类上层应用。IT能力稍弱的需求方通常倾向采购“企业大模型”,即由技术企业基于需求方数据对基础大模型进行微调。IT能力更弱的需求方通常倾向采购大模型应用,实现“开箱即用”,由技术企业对基础大模型进行调整和封装,需求方无需关心。
需求方IT能力越强,越具备在智算中心私有化部署大模型的条件,反之则更依赖大模型一体机和公有云部署。强IT能力需求方通常已自建智算中心,其具备高端GPU资源,支持大模型的训练和推理工作。IT能力稍弱的需求方通常采用大模型一体机,其仍为私有化部署模式,由技术企业对大模型、应用、算力资源进行整合,形成端到端解决方案,便于大模型在需求方快速落地。IT能力更弱的需求方通常倾向公有云部署,此种方式更省心且初始投入较低,有利于需求方低成本快速试错。
图4:需求方IT能力对采购和部署方式的影响
应用特征5:保驾护航,大模型安全逐渐受到重视,为可持续发展提供保障
大模型训练及应用通常涉及四类参与主体,均存在安全需求。大模型开发及应用全流程通常涉及数据提供方、大模型应用使用方、基础大模型提供方、大模型应用提供方四类参与主体。它们在合作过程中需要解决信任及隐私安全保护问题。数据提供方面临数据使用过程中的各种不安全因素;大模型应用使用方担心在使用过程中泄露核心业务数据,该担心并非空穴来风,例如2023年三星设备解决方案部门因使用ChatGPT导致半导体设备测量、良品率/缺陷、内部会议内容等相关信息被上传到ChatGPT服务器中,造成广泛负面舆论;基础大模型提供方面临模型产权被窃取风险,特别是对于初创企业而言,基础模型是公司的核心资产;大模型应用提供方面临微调参数成果泄露风险。
图5:各类主体面临的安全风险

大模型安全逐渐受到重视,为可持续发展提供保障。在大模型行业发展初期,各参与方聚焦大模型、算力等方面,对安全性重视程度不足。随着行业发展逐渐深入,各参与方的安全呼声越来越高。反映到技术企业端,已有一批企业推出大模型安全类产品,为可持续发展提供保障。

应用挑战1:算力需求持续增长,掣肘大模型落地应用
大模型被认为是建立在充沛算力之上的“暴力美学”,随着大模型兴起,市场上算力需求剧增。不论是公共算力还是企业自建算力,尚无法完全满足大模型企业对于智能算力的需求。随着
大模型应用地更深更广,算力紧张情况预计仍将延续。特别是大模型在训练环节需要大型算力集群,但市场上存在较多分散算力,难以用于大模型训练,加剧了算力紧张情况。
图6:算力供需趋势
应用挑战2:知识产权、数据隐私与大模型应用之间的最佳平衡点仍在探索中
知识产权保护与大模型应用之间的法律平衡点仍在探索中。大模型训练涉及的数据可能包括一些版权保护的作品,从知识产权保护的角度而言,可能需要禁止使用,避免生成侵权回答。但是,这些作品数量众多、来源各异、权属不同,若采用事先授权许可的方式,这一过程漫长、复杂且几乎无法落地操作。一是技术企业需要精准地将受保护的作品从海量数据中进行分离、提取;二是技术企业需要找到每一部版权作品对应的权利人与之协商授权,并支付价格不一的授权费用。
数据隐私保护与大模型应用之间的技术平衡点仍在探索中。对于数据隐私保护和大模型效率之间存在着一个两难的矛盾——既要最大限度地保护数据隐私,又要最大限度地发挥模型的效果。在政务、医疗和金融领域,该矛盾尤为突出。通过开发可信的框架,从而在数据隐私保护、模型效果和训练效率之间取得一种平衡,是业内的重点讨论方向,但仍在探索中。
应用挑战3:大模型幻觉问题有所改善,但距离规模落地尚有差距
大模型幻觉问题是影响行业大模型在部分领域落地应用的关键。政务、金融、医疗等领域对大模型输出内容的专业性、准确性有较高要求,对不准确回答的容忍度较低。例如在政务领域,面向公众的政务问答一旦生成错误的答案,将给工作人员带来额外的解释成本。
当前缺乏“根治”幻觉的方法,大模型规模化落地受阻。尽管当前较多大模型技术企业采取引入提示词工程或外挂知识库等方式进行内容校准,在一定程度上可以缓解大模型幻觉问题。但是,这种方式一定程度上限制了大模型的通用泛化能力,难以从根本上解决幻觉问题。
应用挑战4:部分大模型应用处于“可用阶段”,需求方和技术企业协同发力让“可用”迈向“好用”
需求方在输出内容的专业性、准确性等方面要求较高,特别是在政务、教育、医疗等领域,尤为明显。当前大模型落地的各类应用大多处于可用阶段。这也导致需求方主要让内部员工使用大模型应用,而不对外服务。虽然现阶段大模型应用不能完全符合需求方实际业务要求,但需求方已经从早期试点过程中看到了大模型价值和可持续优化的潜力。因此,多数需求方有意愿携手技术企业继续深耕大模型应用,推动其从可用迈向好用,让大模型的价值在员工群体和客户群体中得到“全量释放”。
应用挑战5:部分领域积极响应监管需要,对大模型落地提出特殊要求
金融、医疗、教育等领域在政策、数据隐私、伦理安全等方面有较高监管需要,需求方和技术企业积极响应,在凝练场景、开放数据、模型训练等过程中考虑监管因素,在项目交付时考虑所属领域可能存在的特殊要求。例如部分需求方为了保证数据不出域,可能要求技术企业采用驻场微调的方式。
注:点击左下角阅读原文”,下载完整《北京市人工智能大模型行业应用分析报告》

爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论 (0)
  •   电磁频谱数据综合管理平台系统解析   一、系统定义与目标   北京华盛恒辉电磁频谱数据综合管理平台融合无线传感器、软件定义电台等前沿技术,是实现无线电频谱资源全流程管理的复杂系统。其核心目标包括:优化频谱资源配置,满足多元通信需求;运用动态管理与频谱共享技术,提升资源利用效率;强化频谱安全监管,杜绝非法占用与干扰;为电子战提供频谱监测分析支持,辅助作战决策。   应用案例   目前,已有多个电磁频谱数据综合管理平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁频谱数
    华盛恒辉l58ll334744 2025-04-23 16:27 142浏览
  • 前言本文主要演示基于TL3576-MiniEVM评估板HDMI OUT、DP 1.4和MIPI的多屏同显、异显方案,适用开发环境如下。Windows开发环境:Windows 7 64bit、Windows 10 64bitLinux开发环境:VMware16.2.5、Ubuntu22.04.5 64bitU-Boot:U-Boot-2017.09Kernel:Linux-6.1.115LinuxSDK:LinuxSDK-[版本号](基于rk3576_linux6.1_release_v
    Tronlong 2025-04-23 13:59 97浏览
  •   复杂电磁环境模拟系统平台解析   一、系统概述   北京华盛恒辉复杂电磁环境模拟系统平台是用于还原真实战场或特定场景电磁环境的综合性技术平台。该平台借助软硬件协同运作,能够产生多源、多频段、多体制的电磁信号,并融合空间、时间、频谱等参数,构建高逼真度的电磁环境,为电子对抗、通信、雷达等系统的研发、测试、训练及评估工作提供重要支持。   应用案例   目前,已有多个复杂电磁环境模拟系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润复杂电磁环境模拟系统。这些成功案例为复杂电
    华盛恒辉l58ll334744 2025-04-23 10:29 150浏览
  • 一、行业背景与市场需求高血压作为全球发病率最高的慢性病之一,其早期监测与管理已成为公共卫生领域的重要课题。世界卫生组织数据显示,全球超13亿人受高血压困扰,且患者群体呈现年轻化趋势。传统血压计因功能单一、数据孤立等缺陷,难以满足现代健康管理的需求。在此背景下,集语音播报、蓝牙传输、电量检测于一体的智能血压计应运而生,通过技术创新实现“测量-分析-管理”全流程智能化,成为慢性病管理的核心终端设备。二、技术架构与核心功能智能血压计以电子血压测量技术为基础,融合物联网、AI算法及语音交互技术,构建起多
    广州唯创电子 2025-04-23 09:06 137浏览
  • 一、技术背景与市场机遇在智能家居高速发展的今天,用户对家电设备的安全性、智能化及能效表现提出更高要求。传统取暖器因缺乏智能感知功能,存在能源浪费、安全隐患等痛点。WTL580-C01微波雷达感应模块的诞生,为取暖设备智能化升级提供了创新解决方案。该模块凭借微波雷达技术优势,在精准测距、环境适应、能耗控制等方面实现突破,成为智能取暖器领域的核心技术组件。二、核心技术原理本模块采用多普勒效应微波雷达技术,通过24GHz高频微波信号的发射-接收机制,实现毫米级动作识别和精准测距。当人体进入4-5米有效
    广州唯创电子 2025-04-23 08:41 123浏览
  • 故障现象一辆2016款奔驰C200L车,搭载274 920发动机,累计行驶里程约为13万km。该车组合仪表上的防侧滑故障灯、转向助力故障灯、安全气囊故障灯等偶尔异常点亮,且此时将挡位置于R挡,中控显示屏提示“后视摄像头不可用”,无法显示倒车影像。 故障诊断用故障检测仪检测,发现多个控制单元中均存储有通信类故障代码(图1),其中故障代码“U015587 与仪表盘的通信存在故障。信息缺失”出现的频次较高。 图1 存储的故障代码1而组合仪表中存储有故障代码“U006488 与用户界
    虹科Pico汽车示波器 2025-04-23 11:22 77浏览
  •   陆地边防事件紧急处置系统平台解析   北京华盛恒辉陆地边防事件紧急处置系统平台是整合监测、预警、指挥等功能的智能化综合系统,致力于增强边防安全管控能力,快速响应各类突发事件。以下从系统架构、核心功能、技术支撑、应用场景及发展趋势展开全面解读。   应用案例   目前,已有多个陆地边防事件紧急处置系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润陆地边防事件紧急处置系统。这些成功案例为陆地边防事件紧急处置系统的推广和应用提供了有力支持。   一、系统架构   感知层:部
    华盛恒辉l58ll334744 2025-04-23 11:22 110浏览
  • 在科技飞速发展的当下,机器人领域的每一次突破都能成为大众瞩目的焦点。这不,全球首届人形机器人半程马拉松比赛刚落下帷幕,赛场上的 “小插曲” 就掀起了一阵网络热潮。4月19日,北京亦庄的赛道上热闹非凡,全球首届人形机器人半程马拉松在这里激情开跑。20支机器人队伍带着各自的“参赛选手”,踏上了这21.0975公里的挑战之路。这场比赛可不简单,它将机器人放置于真实且复杂的动态路况与环境中,对机器人在运动控制、环境感知和能源管理等方面的核心技术能力进行了全方位的检验。不仅要应对长距离带来的续航挑战,还要
    用户1742991715177 2025-04-22 20:42 96浏览
  •   后勤实验仿真系统平台深度解析   北京华盛恒辉后勤实验仿真系统平台依托计算机仿真技术,是对后勤保障全流程进行模拟、分析与优化的综合性工具。通过搭建虚拟场景,模拟资源调配、物资运输等环节,为后勤决策提供数据支撑,广泛应用于军事、应急管理等领域。   应用案例   目前,已有多个后勤实验仿真系统平台在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润后勤实验仿真系统平台。这些成功案例为后勤实验仿真系统平台的推广和应用提供了有力支持。   一、核心功能   (一)后勤资源模拟
    华盛恒辉l58ll334744 2025-04-23 15:39 111浏览
  •   无人机结构仿真与部件拆解分析系统平台解析   北京华盛恒辉无人机结构仿真与部件拆解分析系统无人机技术快速发展的当下,结构仿真与部件拆解分析系统平台成为无人机研发测试的核心工具,在优化设计、提升性能、降低成本等方面发挥关键作用。以下从功能、架构、应用、优势及趋势展开解析。   应用案例   目前,已有多个无人机结构仿真与部件拆解分析系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润无人机结构仿真与部件拆解分析系统。这些成功案例为无人机结构仿真与部件拆解分析系统的推广和应用提
    华盛恒辉l58ll334744 2025-04-23 15:00 148浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦