金融科技已成为推动金融行业创新发展的新动力,引领着未来金融业的发展方向。不过,科技带来金融业务愈加便利的同时,也带来了新的合规风险与监管压力。各国对探索利用生成式人工智能推动监管正如火如荼展开,以求最大限度地发挥AIGC的效益,提升金融领域的监管科技水平。
中国人民银行在2017年5月设立了金融科技(FinTech)委员会,旨在加强金融科技工作的研究规划和统筹协调,强调央行应强化监管科技(RegTech)应用实践,积极利用大数据、人工智能、云计算等技术丰富金融监管手段,提升跨行业、跨市场交叉性金融风险的甄别、防范和化解能力。监管科技的参与主体既包括金融监管机构又包括金融机构,此外还有一类是为监管科技提供技术和服务的第三方科技公司。
按照国际清算银行监管工作分类,如图1所示,监管科技应对的主要监管问题包括:针对操纵市场、内幕交易的市场监管;针对反洗钱、恐怖主义融资、反欺诈、违规销售等不端行为的监管;针对信用风险、流动性风险的微观审慎监管;针对风险预测、紧急风险识别、金融稳定、政策评估方面的宏观审慎监管。
图1:国际清算银行监管科技工作分类
[资料来源:中国人民银行党校 2021 春季学期局处级干部进修班第六调研组,《坚持新发展 理念,推动监管科技高质量发展》。]
本文我们将分别从监管机构端和金融机构端介绍监管科技发展的现状。
近年来,以中国人民银行、原银保监会、证监会、外汇管理局为代表的金融监管部门,不断探索通过大数据、人工智能等技术建立与金融监管相匹配的监管科技工具,逐步构建了中国金融监管科技生态体系。
伴随着监管科技的不断升级,从金融机构角度看,监管部门数据需求呈现如下几个特点:一是数据范围持续扩充;二是数据粒度方面更重视使用明细数据进行监管检查;三是报送渠道由部分线上化转向全面线上化;四是报送时效性和监管检查频度不断提升;五是逐步加强指标与明细间、明细与明细间的交叉校验;六是实行穿透式监管,将监管检查穿透到每一笔交易明细和每一个客户;七是不断加强数据校验,对监管报送数据质量要求越来越高。[资料来源:薛羽,《监管驱动下的数据治理敏捷实践》,金融电子化。]
对金融机构来说,通过使用监管科技工具,能够更好地对接监管系统,将自身业务数据与监管部门的数据进行对接和交互,实现数据的实时共享和传输,从而提高监管检查的效率和准确性。同时,对接监管系统还可以帮助金融机构建立完善的数据治理机制,规范数据的采集、存储、处理和使用流程,确保数据质量和安全性。运用监管科技工具帮助金融机构实现业务合规,也是金融机构自身实现高质量发展的需要。比如银行业常用的风险管理系统,既属于监管科技工具,也是银行自身必不可少的数字化风险防控手段。通过对客户信息、交易行为等数据的分析和建模,银行能够及时发现潜在的风险隐患,并提供相应的预警和控制措施。此外,反洗钱系统、反欺诈系统也有着双重作用,既满足监管要求,又是日常经营必不可少的工具。金融机构需要根据自身的实际发展状况,通过自研或向第三方采购的方式来选择监管科技工具。
相关技术的创新和研发,是推进我国监管科技发展的重要力量。制定科学的数据标准,确保数据的准确性和有效性,以及信息安全保护也是至关重要的。
按照各类技术对监管科技工具发挥的不同作用,可以将其分为基础设施、主要技术和前端应用场景,如图2所示。
图2: 监管科技的技术体系
在这一技术体系框架图中,基础设施是支撑监管科技发展的基本条件。保证算力的芯片、畅通的移动网络,能够保证监管科技工具的研发能够快速迭代,更加适应监管要求。主要技术是指监管科技常用的技术,包括云计算、大数据、人工智能、区块链、语音图像识别等,能够有针对性地解决各种监管需求。前端应用场景则是监管科技的实际应用领域。
一方面,云计算、大数据、人工智能和区块链等技术之间的融合与创新,为监管科技提供丰富的应用场景和解决方案。例如,结合大数据和人工智能技术,监管部门构建的智能监测系统,能够实时识别异常交易模式;结合区块链和隐私保护技术,可以帮助监管机构建立安全的数据共享平台,促进跨机构的合作和信息共享。另一方面,技术的发展会提升监管科技的自动化和智能化水平,倒逼金融机构从数据治理角度重构自身的数据资产体系,提升数据的质量,从而实现更好的数字化改革。
监管科技在金融监管部门和金融机构有许多应用场景。其中,合规管理是监管科技的首要应用场景。此外,反洗钱和反恐融资作为金融行业的重要风险防控领域,其背后的网络复杂、资金的流转隐秘性高,所以也是监管科技重点攻克的监管难题。通过知识图谱的关联分析等技术,监管机构能够较大程度地还原资金往来的路线以及真实的金融业务场景。提前发现潜在的洗钱及恐怖主义融资风险,提升监管的精准度,有效打击犯罪。
监管数据报送也是监管科技的重要应用方向。金融机构需要按照相关监管要求,向人民银行、金融监督管理总局、证监会等部门进行反洗钱、征信、EAST、1104等多类监管数据的填报与提交。以原银保监会的EAST(Examination and Analysis System Technology)系统为例,最新的EAST5.0版本,对报送的主题域、数据表结构等内容进行了全面的调整和升级,金融机构每个月需要提交的报表数量约70个。[资料来源:《中国银保监会银行业金融机构监管数据标准化规范(2021 版)》。] 如此庞大的数据量,必然面临着数据统计的维度和口径不一致的瓶颈,漏报、数据存在偏差、错报等更成为常见的问题。因此,原银保监会也要求银行业金融机构和理财公司搭建数据检核平台,在数据报送前参照检核规则对当期报送数据质量进行评估。[资料来源:《监管标准化数据检核规则(2021 版)》。] 这一举措反向推动了金融机构的数据质量建设。
交易监控是金融机构为实现合规而采取的一项必要措施。以证券市场为例,随着投资者数量与交易规模的不断增长,非法场外配资、违规交易等行为愈加隐秘化,程序化交易、高频交易的速度越来越快,这些现象给证券市场交易秩序带来了挑战。针对证券市场投资者异常交易行为建立监测信息系统,通过监管科技实现对经纪、自营、资管等业务的交易监测,是证券监管部门和证券公司都极为关注的问题。
金融压力测试是银行业进行风险管理和监管分析的工具,用于分析假定的、极端但可能发生的不利情景对银行整体或资产组合的冲击程度,进而评估这些情景对银行资产质量、盈利能力、资本水平和流动性的负面影响。
在监管科技的应用场景中,监管机构可以利用AIGC的技术优势,快速处理大规模的监管数据,加快风险识别和决策过程,进一步提高风险预测的准确性和精度,提高监管效率和反应速度,增强监管的智能化和针对性。
本文我们将分别从身份识别、数据采集、监管数据报送、风险监测及预警等4个场景出发,展望AIGC在监管科技中的应用前景,如图3所示。
图3:AIGC在监管科技中的应用方向
前面我们提到过,客户身份识别是监管科技应用最多、发展最成熟的场景。尽管如此,当前通过科技手段在进行客户的身份识别时,仍然存在部分难点。AIGC技术可以在一定程度上优化客户身份识别中存在的部分问题。
在提升身份验证系统的性能时,通过使用AIGC技术中的生成模型,如GAN、VAE和自回归模型等,可以生成具有用户身份特征的合成数据,生成大量的虚拟人物或建立虚拟身份,这些虚拟人物能够模拟不同身份的特征和行为,具有与真实客户高度相似的特点,能够代替真实的客户资料,测试身份验证系统的鲁棒性和准确性,降低使用客户真实资料进行测试的风险。
此外,尽管生物识别技术的验证成功率很高,但生物特征数据也容易被复制、盗用。AIGC可以结合多种数据源,包括图像、声音和文本等,进行多模态身份验证,从而提升客户身份识别的准确度。例如,语言预训练模型(如GPT模型),可以通过大规模文本数据的预训练来学习语言模式和语义理解。可用于用户身份文本信息的处理和分析,监管部门和金融机构可以更准确地提取和理解用户身份相关的文本信息。而基于多模态的交叉验证,能够综合判断该用户的身份是否一致。
AIGC技术中的增强学习模型则可以用于优化用户身份识别系统的决策过程。监管部门和金融机构可以利用增强学习算法,通过与环境的交互来优化身份识别系统的决策策略,使其在不断学习和优化中逐渐提升身份识别的准确性和效率。
通过以上应用,AIGC可以帮助监管部门和金融机构提高身份验证和识别的准确性、效率和自动化程度。它能够辅助监管部门和金融机构在面对大量身份验证需求时,更快速地进行验证和识别,减少人为错误,降低欺诈风险。
数据采集既是监管科技的一个应用场景,也是绝大部分应用场景中都不可或缺的步骤。
在强监管驱动下,金融机构监管数据治理项目具有如下几个特点:一是问题导向,数据治理需求的来源为数据问题,数据问题由监管检查和自查自纠产出,而监管检查的时间、频度、标准的不确定性,导致数据治理项目需求的范围和交付时间具有不确定性;二是快速交付,为了能够尽快使用合格数据,监管数据治理需求通常要求立查立改,交付时效性要求很高;三是数据复杂,监管报送数据通常为跨系统整合数据,数据整合规则复杂,且存在历史业务数据问题、过渡账务、打包账务、交易对手追溯流程复杂等数据加工难点,需反复进行数据治理需求的研制和验证,需求验证迭代次数较多。[资料来源:薛羽,《监管驱动下的数据治理敏捷实践》,金融电子化。]
尽管使用流程自动化、数据挖掘等技术,能够提升数据采集的效率与质量,但面对日益强化的监管要求,金融机构仍需在优化数据采集流程、改进数据质量控制和清洗方法、加强数据安全和隐私保护、提升大数据处理能力等方面继续努力。
AIGC能够在一定程度上对金融机构现有的数据采集能力进行优化。
例如,由于金融机构需要从各种不同的数据源采集数据,这些数据源具有不同的数据格式、接口和安全要求等,导致数据采集过程复杂、难度大。AIGC的多模态数据处理能力不仅限于文本数据生成,还包括图像、音频和视频等多模态数据的生成。它能够处理不同数据源的数据,包括处理不同的数据格式和接口,并根据数据的特征和模式进行自适应学习和处理,从而降低数据采集的复杂性。AIGC技术可以用于自动标注和增强数据集。通过训练AIGC模型,可以将其应用于数据标注任务,自动识别和标记金融数据中的关键信息。金融机构可以节省大量的人力和时间,同时提高数据标注的效率和准确性。
AIGC技术还具有高效处理大规模数据的能力。由于AIGC模型的并行化和分布式计算优势,金融机构可以利用AIGC技术快速处理和分析海量的数据,从而加快数据采集和处理的速度,并实时更新相关的数据指标和报告。
在解决数据质量的问题上,AIGC模型可以通过学习数据的正常模式和分布来检测和纠正异常值。通过训练模型,它可以识别数据中与正常模式显著不符的数据点,并将其标记为异常。这有助于发现和纠正数据中的异常或离群值,从而提高数据的准确性和完整性。
AIGC模型还可以用于填充数据中的缺失值。通过训练模型,它可以学习数据的内在结构和模式,并根据已有的数据推断缺失值的可能取值。这可以帮助补全缺失的数据,提高数据的完整性和可用性。
AIGC模型可以校验数据的一致性和正确性。通过训练模型,它可以学习数据的预期模式和关联规则,并用于检查数据是否符合这些规则。如果数据与预期模式不一致,模型可以发现并指出问题所在,以帮助改善数据的质量。
通过大规模的数据训练和模型优化,AIGC可以学习并提取数据的特征、模式和规律,从而实现自动的数据清洗、校验和纠错等功能,提高数据的质量和可靠性。但数据质量的改进不仅依赖于AIGC技术本身,还需要结合合适的数据预处理、特征工程和领域知识等方面的方法。此外,模型的训练数据质量也对结果产生重要影响,因此需要确保训练数据的准确性和一致性,以避免错误的模型学习和推断。
金融机构传统的监管报送系统存在系统壁垒、数据孤岛、取数升级难、数据管控难等情况;金融机构还存在缺乏监管数据的管理体系,数据治理偏泛化,没有长期的运营效果;缺乏统一的指标口径;缺乏系统的支撑,时效性不强;质量更高的监管数据没有被很好的应用或对外提供一些服务;很多原系统无法提供合适的明细业务数据,需要手工台账补录,以及补录数据的质量问题等。[资料来源:《应对 EAST 5.0 新挑战!索信达推出灵矩全景式监管合规平台》,索信达官网。]
AIGC技术的使用可以在一定程度上帮助解决金融机构优化监管数据报送过程。
在提升数据的一致性和准确性方面,AIGC的生成技术可以用于自动化生成符合监管要求的数据报送内容。监管部门通常有特定的数据格式和要求,使用AIGC可以训练模型生成符合这些要求的数据报送内容,减少手工编制报表的工作量和人为错误的风险。生成的数据报送内容可以高度准确、规范化,并且符合监管部门的需求。
AIGC的模型和生成技术可以通过预训练方法和大规模数据训练来提高数据的质量。它可以自动识别和纠正数据中的错误、缺失或异常值,确保报送的数据准确性和完整性。通过使用AIGC技术,监管部门和金融机构可以提高数据报送的质量,减少数据质量问题带来的风险。
在应对数据报送的复杂性方面,通过学习和应用监管部门的数据规范和标准,AIGC可以自动识别数据中的特征、模式和规律,并将数据转化为符合监管要求的标准格式,确保报送数据的一致性和规范化。这将有助于提高数据的可比性、一致性和可解释性,简化监管部门对数据的处理和分析。
AIGC的技术可以对数据进行自动提取和摘要。监管数据通常包含大量的信息,但监管部门和金融机构可能只对其中的关键信息感兴趣。AIGC可以训练模型来自动提取和摘要数据中的重要信息,减少人工筛选和处理的工作量,提高数据报送的效率和精确性。
金融风险是影响金融行业健康发展的首要因素。金融风险的监测和预警无疑成为金融监管的核心,也是监管科技最重要的应用场景。传统的风险监测和预警往往是基于历史数据和规则定义的,对于快速变化的市场和风险环境,无法及时捕捉到新的风险信号,从而降低了监测和预警的效果。此外,风险模型是风险监测和预警的基础,但模型的准确性仍然是一个关键问题。
AIGC技术在风险监测及预警场景中的应用,证明该技术有潜力帮助金融机构克服上述挑战。
AIGC的预训练和迁移学习方法可以使模型快速适应新的监管要求和政策变化。监管部门经常更新和调整监管规定,使用AIGC技术,可以通过微调预训练模型或在新数据上进行训练来适应新的要求,减少系统升级和调整的时间和成本。
AIGC能够处理大规模的数据,包括结构化和非结构化数据。在风险监测及预警中,监管部门和金融机构需要处理大量的数据源,例如市场数据、交易记录、新闻报道等。AIGC的技术能够高效分析和处理这些数据,提取有用的信息,加速风险识别和预警的过程。
多模态数据分析是AIGC的重要优势。它可以处理多模态数据,包括文本、图像、语音等。在风险监测及预警中,不同类型的数据都可能包含风险信号,例如新闻报道中的关键词、图像中的可疑行为等。AIGC可以通过结合不同模态的数据进行分析,发现更全面和准确的风险指标,提高监测的效果。
在风险监测及预警中,AIGC可以训练模型来自动识别潜在的风险信号和异常模式,帮助监管部门和金融机构更准确地预测和识别风险事件。同时,AIGC模型可以与实时数据流集成,快速分析和识别风险信号,并生成相应的预警信息。能够帮助监管部门和金融机构及时采取行动,降低风险造成的损失。
AIGC的生成技术可以用于自动生成风险监测及预警的报告。监管部门和金融机构通常需要定期生成风险报告,通过训练模型,能够生成符合要求的报告内容,减少人工编制报告的工作量,提高报告的撰写效率。
不产生系统性金融风险是金融行业进行风险管理的底线。所谓系统性金融风险,是指可能对正常开展金融服务产生重大影响,进而对实体经济造成巨大负面冲击的金融风险。监管科技的使用,能够帮助监管部门和金融机构识别潜在风险并提供早期预警,从而使整个金融体系的韧性得到强化。而AIGC通过发挥特有的优势,能够提升监管科技在预防系统性金融风险中的作用。
从时间维度看,AIGC通过学习海量的时间序列数据,能够进行预测建模,从中识别金融活动的风险顺周期及逆周期行为,通过对比期间金融杠杆的扩张或收缩,从而预测系统性风险的累积趋势,帮助监管部门和金融机构及时采取措施避免风险的自我强化和自我放大。
基于AIGC的模型开发和预训练,监管部门和金融机构可以搭建出系统性风险预警系统。通过监控金融市场数据和相关指标,对异常模式进行自动识别,同时关联风险事件,进行风险等级的判断,并发出预警信号,方便监管部门和金融机构及时了解风险状况,采取相应的监管和风险管理措施,降低系统性风险的影响。
从结构维度看,AIGC的技术和模型具备强大的数据分析和预测能力。通过预训练方法,AIGC可以学习大量金融数据的特征和模式,从而提高对系统性金融风险的识别和预测能力。它可以横向分析各类市场、要素、机构的健康状况等多维数据,将其与金融机构、金融市场和金融基础设施之间的表现进行关联,分析与系统性风险相关的经济指标和事件。通过纵向的时间维度上的海量数据学习,AIGC可以识别出特定机构或市场的不稳定因素,并找到每一条风险的扩散路径,以及破坏力的情况。监管部门和金融机构通过对风险扩散的路径进行建模,生成系统性风险预测模型,帮助监管部门和金融机构预测风险的累积趋势,及时发现可能引发系统性风险的因素,以便及时采取遏制措施,防止风险的跨机构、跨部门、跨市场、跨境传染。
综合而言,通过对不同领域知识的融合,AIGC可以更好地理解系统性金融风险的结构性特征和传导机制,有助于监管部门和金融机构制定综合性的监管政策和风险管理措施,减少因不当的政策或业务操作而引发系统性风险的概率。随着金融数字化的进一步加深,生成式人工智能也必将迎来更广泛的应用,它将为监管科技的发展释放出更多的能力,值得我们关注和期待。
作者:林建明
来源:IT阅读排行榜
本文摘编自《AIGC重塑金融:AI大模型驱动的金融变革与实践》,机械工业出版社出版,经出版方授权发布,转载请标明文章来源。
▼
延伸阅读
《AIGC重塑金融:AI大模型驱动的金融变革与实践》
林建明 著
阿里达摩院院长张建锋作序推荐
萨摩耶云科技集团董事长林建明撰写
金融业大模型实践指南
为金融业实现数字化和智能化加速
本文来源:原创,图片来源:原创
责任编辑:王莹,部门领导:宁姗
发布人:白钰