本文来自“模型即服务:MaaS框架与应用研究报告(2024年)”,MaaS能够解决大模型规模化落地难题,同时满足传统人工智能模型的使用需求,提供更加高效的模型触达方式。信通院和行业专家结合产业实践对MaaS开展研究,围绕模型落地的全生命周期,分析和总结框架体系及能力要求,并对服务的质量保障进行研究,阐述模型服务协议框架。
(一)MaaS框架说明
MaaS框架由三部分组成,分别包括模型平台层、模型服务层和模型应用开发层,每层可作为单独服务供用户调取,也可搭载下层设施提供更完整的服务。
在人工智能体系架构中,MaaS处于应用层和基础设施层之间,与云计算架构相比,对其原有的平台层和应用层进行了增强与补充。
一方面,云计算架构下的平台层将操作系统、中间件等软件栈通过服务模式提供给用户,用户只需关注应用程序的开发和管理,减少了开发过程中基础设施相关问题的考虑。而MaaS在其基础上增强了平台层能力,首先通过对模型训练框架、工具等进行抽象和服务化,使得用户可以直接构建、使用或基于模型再次调优;同时MaaS补充了模型层能力,对模型及服务进行集约化管理,为用户提供可直接调取的AI能力。
另一方面,云计算架构下的应用层通过SaaS的方式使用户可直接在线使用应用程序,无需安装及维护本地软件。而MaaS对应用层进行了补充,支持用户基于多种模型服务及组件进行编排或开发,创造更加个性化更加便捷的AI应用。以下将对MaaS各层能力架构和模块进行介绍。
(二)模型平台层
模型平台层为模型定制开发提供全套的工具链及全流程管理能力,包括数据处理、模型开发交付和运营等能力。基于该层,一方面通过全套的工具链帮助企业降低模型定制开发的技术门槛,另一方面通过全流程的运营管理提高多团队协作效率,并实时监控线上模型运行情况,保障业务效果。
模型平台层包括数据工程、模型开发、模型交付、服务运营。该层以基础大模型、算法、私有数据集等为输入,以企业专属模型为输出。
(三)模型层
模型层以模型为主体,是MaaS的核心AI能力,为用户提供可直接调取的模型服务,降低了用户使用各类模型的难度,推动了大模型普惠化发展,同时为上层个性化智能应用的开发提供AI能力支持。
模型层包括丰富的模型库、数据集和服务管理等能力,提供API、SDK、模型文件、在线推理服务等形式。
(四)应用开发层
应用开发层基于各类模型服务和知识库、插件等能力,通过自然语言、工作流编排、界面配置等方式,完成基于模型的AI应用开发和集成,同时对应用从创建到使用的全生命周期进行管理,提高应用开发效率。
应用开发层包括支撑能力、应用开发集成、应用生命周期管理三部分。支撑能力是构建AI应用所需的基础能力,如模型服务、插件、知识库、Prompt(提示)、RAG、Agent等;应用开发集成根据不同用户技术水平和场景的需求分为自然语言、界面配置、工作流编排以及代码开发等方式,满足不同开发难度和灵活度的需求。
(五)模型服务协议框架
当前诸多MaaS产品集成了大量模型服务,但在服务水平协议(SLA)方面仍存在要求不统一等问题,使得用户难以获得满意的性能和质量体验,从而阻碍了MaaS规模化落地进程。
为此,信通院联合产业各界对模型服务协议框架进行总结,为用户获取模型服务时如何衡量服务质量提供参考。模型服务协议框架的目标是规范和提升模型服务质量,适用于人工智能领域包括大模型和传统AI模型在内的所有模型服务。该协议框架对服务范围及服务内容进行明确,并对于如何从多个维度衡量模型服务的水平提供参考,包括服务可用性、隐私安全性、计量准确性及权责条款等部分(如图12所示),帮助用户筛选符合相关需求的模型服务。
权责条款:从服务赔偿条款、约束及免责条款和知识产权保护等方面考虑,对服务商和用户双方的权益、责任进行了约束。
在大模型时代发展的浪潮下,各行业面临着前所未有的数智化转型挑战与机遇。而MaaS作为模型服务灵活供给的新模式,为行业转型变革带来新路径。
MaaS概念在大模型时代得以重塑,助力大模型规模化落地。MaaS围绕技术门槛低、模型可共享、应用易适配三大特性,一方面有助于解决模型服务规模化生产面临的成本高、技术门槛高等问题,另一方面帮助提升基于大模型的AI应用开发效率。
MaaS框架组成逐渐清晰,但落地挑战不一而足。中国信通院联合产业专家对MaaS框架做出系统性归纳,包括模型平台层、模型层和应用开发层,并对MaaS能力建设要求进行梳理,同时将MaaS与云计算架构进行比对分析,明确其在人工智能体系架构中的定位。但MaaS在模型服务质量规范性、服务易用性、风险合规及生态建设等方面存在诸多挑战。
MaaS应用日趋广泛,落地效果逐渐显现。在外需和内驱双向推动下,金融、电信等行业率先涌现出诸多优秀的MaaS落地实践,将模型服务更加便捷地提供给用户,使其在使用大模型等AI技术时能够达到多快好省的效果。同时MaaS在生产经营等各环节的落地日渐增多,如基于模型的AI应用,在调研案例中覆盖了百余个场景。
《半导体行业深度报告合集(2024)》
《70+篇半导体行业“研究框架”合集》
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。
免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。