在北京市科学技术委员会、中关村科技园区管理委员会的指导和组织下,由北京信息科技发展中心、北京爱分析科技有限公司等单位编写完成《北京市人工智能大模型行业应用分析报告》,展现北京市大模型相关技术产品在各领域各行业的应用发展态势,并提出有关建议,为未来决策提供参考。今日先行发布报告的“金融、医疗、文化教育类企业落地大模型的研判和建议”部分,以供企业用户前瞻。注:长按扫描下图二维码或点击文末左下角“阅读原文”,可下载完整版《北京市人工智能大模型行业应用分析报告》。
金融领域应用大模型的市场驱动力较强,且结合点较多。金融属于高工作效率可以带来高回报的行业,金融机构为了追求更高的工作效率,更及时的决策分析,往往愿意为能显著提高效能的大模型产品买单。从实际落地角度来看,大模型可以和金融机构现有的软件系统、模型较好融合,相辅相成。目前,金融领域应用主要集中在保险售前助理、智能投研助理、招股书生成编写、智能研报合规审查、智能客服等方向。除此以外,部分企业深挖需求,带来了新颖的应用场景方向,如大模型保险理赔受理、大模型智能数据治理、个人/企业信用偿贷能力审查监控等,大模型在金融领域的商业价值将会逐步释放。除商业价值之外,大模型在金融领域的社会价值也开始显露,某银行将大模型与消费者权益保护审查平台结合,利用大模型对理财产品宣传材料实现自动生成审查意见,推荐优秀相似案例作为参考,辅助审查人员开展审查,能有效解决基层审查能力不足的问题,银行方审查速度和审查准确性得到大幅提升。大模型在金融领域落地尚面临行业监管和算力资源等诸多挑战。金融行业监管严格,对大模型的输出结果准确性、安全性、合规性都具有较高要求,且金融机构数据隐私性较强,难以在机构间共享,大模型产品往往需要进行私有化训练及部署,这对于金融机构的算力资源提出新的挑战。同时,金融机构对私有化部署的依赖会引发大模型知识持续学习等问题。一是建立完善的政策和监管环境。制定明确的政策框架和监管指导原则,确保大模型技术在金融领域的应用,既促进创新,又保障金融系统的稳定性和安全性。设立监管沙箱,允许金融机构在一定条件下测试大模型技术的应用,通过实践探索合理的监管框架,为未来的监管政策提供依据。二是鼓励金融机构完善大模型基础配置。当前,金融机构已经逐步开展数字化,具备独立的信息数据平台,应持续提升金融机构在大模型应用方向的数字化基础,依托自身数据平台,构建安全高质量金融数据集,保证数据准确有效,数据来源可追溯,生成内容专业、权威。同时,鼓励金融机构加大在人工智能算力上的投入,引入平台级安全算力底座,为技术企业快速安全部署大模型应用提供渠道。三是可以尝试在对公业务中探索大模型应用。当前大模型在金融领域的应用主要集中在对私业务,可以尝试向对公业务探索。例如将大模型与企业信贷业务进行结合,利用AI Agent技术将大模型、OCR、RPA等技术及组件进行调用,打造信贷助手,协助信贷经理完成资料收集、风险分析等工作。医疗领域核心场景重视准确性及可解释性。诊断场景作为医疗领域的核心场景,需要大模型结果准确,同时给出判断依据,还应支持生成结果可回溯、可验证,这对技术企业的医疗业务积累以及技术方案的设计都提出了更高的要求,不少技术企业将大模型尝试应用于科研及教学环节,推动医疗领域更快实现大模型应用落地。医疗数据治理面临隐私及标准化的挑战。当前医疗人工智能产品训练所需的基础数据,均来源于医疗机构在不同时期逐步部署的异构信息系统,不同的医疗机构之间医疗数据仍难以互联互通、共享共用,这阻碍了医疗数据在大模型甚至多模态大模型上的进一步分析利用。同时医院内部对数据管理严格,对数据安全与用户隐私保护要求很高,只支持大模型在医院内部私有化部署训练,无法出域训练,这种方式一定程度上限制了大模型在医疗领域的商业化落地。医疗机构私有化落地成本较高。大模型在资金、时间、算力、硬件设施和环境等方面具有高昂的开发和运营成本。大模型训练与推理对算力要求大,科研单位及医疗机构自建算力所需的前期购买与后期维护的人员与资金成本极高,在当前算力短缺的情况下,医疗机构私有化部署医疗大模型难度加大。一是从医疗全流程入手,开放有价值业务场景。从加快场景落地考虑,在持续推进医疗诊断等核心业务的同时,拓展医疗行业全领域业务场景,从互联网诊疗、诊前诊后全流程管理、科研场景、民营医院入手,鼓励本市大模型团队找准行业或场景数据优势错位发展,探索大模型在医疗领域的商业化模式和产业化发展路径。二是推动构建北京市医疗大模型公共数据集。协同各类主体加快构建高质量的医疗领域公共训练数据集,推动医疗数据泛知情同意,按照尽职免责原则实现数据出院。研究制定数据集规范格式和使用标准,组织医疗数据治理能力强的企业进行医疗数据标准化治理,利用医学知识图谱技术,识别医疗实体并建立关联,形成结构化知识网络,针对病历文本进行语义分析,抽取症状、疾病等概念,有效提升医疗数据的质量,为训练更准确、可解释的医疗辅助模型奠定基础。三是大模型技术企业与医院IT解决方案供应商加强合作。医院通常有固定合作的IT解决方案供应商,其他技术企业全新建立与医院的合作关系较为困难。大模型技术企业需要结合自身的技术特征、目标场景等要素,选择合适的医院IT解决方案供应商进行合作。文娱领域是大模型应用最容易落地的场景。需求方面,影视、短视频、电竞直播等文娱方向在国内具有快速发育的土壤,而大模型在为文娱产品提供多样化、创造性的素材内容的同时,极大降低制作的成本和门槛。技术方面,文娱领域对大模型生成素材的准确度要求不高,而且当前文娱领域的监管相对宽松,大模型落地的试错空间较大。并且,随着以Sora为代表的多模态大模型的发展,将会明显加速大模型在文娱领域的落地步伐。文化领域创作过程独特,对大模型创作的使用道德边界提出挑战。部分业内专家认为,内容创作需要基于人的情感需求,与阅读者达成共鸣。使用大模型进行创作的作品能否在质量上与人为创作的作品媲美、能否为阅读者提供正向情绪价值、是否能够区分是“创作”或“效仿”、是否能有效规避伦理等问题,仍需对创作的边界进行界定。教育行业大模型落地面临伦理安全、部署条件、教学方式转变等多样挑战。教育领域在实际推广大模型应用中面临诸多挑战,一是教育领域对于伦理等问题容忍度较低,大模型可能会复制其训练数据中存在的偏见,这可能导致不公平的教育结果,目前对于大模型应用缺乏统一的标准指引,学校准入标准尚未形成。二是教育资源的数字化、标准化程度不足,算力资源的投入和成本控制或将制约大模型在教育领域广泛应用。三是教师和学生对人工智能大模型技术的接受程度和适应能力不同,如何有效增强教师与学生的数字素养和对未来技术的适应能力,是推广大模型应用的关键。一是充分挖掘文化教育领域数据资源。鼓励文化机构开放数据资源,挖掘文化数据价值,通过政策激励、资金支持等方式,推动相关版权数据、音视频数据汇聚共享,为大模型提供丰富的训练和测试数据。二是完善大模型伦理监管手段。将伦理监管制度与大模型应用情景相结合,健全大模型伦理审查清单,完善伦理审查复核机制,开展常态化科技伦理审查,同时做好大模型伦理监管制度宣贯,提醒企业将科技伦理的审查流程纳入产品规划。三是选取部分学校优先试用大模型开展教学活动。推动在部分学校中开展先行先试,开展大模型辅助教学模范教师评选,激发教师使用大模型的积极性。在示范试点的建设过程中针对教师及学生在教学关键环节中面临的问题,在教案设计、命题助手、作业批改、智能助教等方面优先推广应用。注:点击左下角“阅读原文”,下载完整版《北京市人工智能大模型行业应用分析报告》。