山西证券总经理分享:AI与大模型在金融领域的创新应用实践

原创 爱分析ifenxi 2024-02-05 22:17






1月9日,爱分析成功举办2024 爱分析·AI与大模型高峰论坛,邀请了各领域的专家学者、企业代表、大模型厂商和实践专家,分享前沿的技术进展和领先企业的落地场景与实践经验。

今天为大家带来金融领域对于大模型的思考以及相关应用实践。

分享嘉宾|林永峰 山证科技(深圳)有限公司 总经理

内容已做精简,如需和专家交流&获取专家完整版视频,请扫码。


01 金融领域AI与大模型的尝试

大模型自问世就得到了广泛关注,并迅速引发了业内的热潮。从行业应用的角度来看,金融行业的渗透率应该是最高的。对于券商行业而言,传统业务模式存在诸多瓶颈,尤其在提升工作效率、服务效率、服务质量及降低人力成本等方面存在较大改善空间。此外,作为受监管极其严格的行业,提高企业风险控制水平,确保合规性也是我们关注的重点。因此,我们期望借助大模型的能力突破这些瓶颈。

对于大模型可以提供的帮助,我们主要有以下几个需求。

第一,借助大模型的能力,实现更为智能化的信息处理与理解,这也是我们的首要目标。

第二,期望大模型能够在客户服务场景下,提供更为复杂的交流与互动,从而更好地理解客户的需求和利益。

第三,期望大模型自动化地生成报告和文件,提供个性化的投资建议和资产配置方案,为用户制定投资决策提供有力支持。

第四,在中后台业务中期望大模型能协助有效管理风险并确保合规性。

然而经过一年的深度研究和实践,我们不得不承认大模型的实施并未达到我们的预期目标。尽管GPT模型优点明显,但在实际运用中仍面临诸多挑战。大模型所提供的结果尚未完全符合预期,未能达到理想中的优越表现。那么说到底大模型究竟是一种有效的工具,还是只能说是一种“玩具”呢?当我们在讨论大模型的潜力与可能性时,实际上是否等同于其实际应用能力?针对这个问题我们做了深入思考,同时借鉴了许多专家的分析意见。

大模型可以划分为两大类别。首先是通用大模型,像这样的模型通常由大型科技公司开发。通用大模型旨在一个模型中解决多种问题,然而在回答许多专业性问题及与我们的业务相结合时,可能会存在一定的误导性。因此,为了更好地应用于真实业务场景,我们希望整个生态系统或合作伙伴能够更多地关注和研究垂直大模型,这才是能够与业务需求相匹配而且更为紧密贴合的方向。
相比之下,垂直大模型专注于捕捉特定领域中更为复杂的特征和关系,包含大量专业性的语料,以及专业的微调和优化。我们希望将这个大模型运用到垂直领域进行深度整合,使其应用更加贴近我们的行业,使其更加契合我们的应用,进而实现大模型从创意工具向真正生产工具的转变。
回到金融领域,这个领域下的垂直大模型,运行速度最快的是BloombergGPT,因为它有着海量的金融市场数据,因此无论是从综合评价还是用户试用反馈来看,BloombergGPT在金融领域的表现最为出色,但很可惜的是它并不开源。
除此之外,FinGPT、FinBERT、聚宝盆等开源垂直领域的模型都各具特色,但相较于BloombergGPT还有显著的差距。

02 山西证券AI与大模型应用实践

了解了金融市场的大模型情况后,我们再来看看山西证券推进大模型过程中的尝试和探索。从2022年11月30日ChatGPT的发布,到2023年3月13日,我们内部进行了一次关于大模型的汇报,也认为证券行业落地大模型是一项极具创新性,甚至可能引发生产力革命的事情。
为此,我们一直在跟踪、学习和调研。八月份随着通用大模型的开源,百模大战就此打响。这对于开展垂直领域的大模型是一个极好的机会,我们不需要重新构建一个垂直领域的大模型,可以立足于现有的通用大模型之上,将我们的金融数据灌输其中。
正式开始实践后,我们将自身的优势业务与之相结合。山西证券在固收业务方面在整个金融行业内表现得相当出色,因此我们首先在固定收益领域开启了大模型的探索之旅,十一月份,我们又开启了合规领域的探索。
下面重点讲两个案例。第一个案例是关于FICC的场景。对于固收债券交易,只有在双方达成共识后才能进行交易。因此,该市场的主要业务模式还是依赖于声讯与电讯等途径,且以电讯为主,通过这种业务模式达成交易目的。为提高交易量及服务质量,山西证券推出了AI数字助理(AI固收债券交易机器人)。
这是一个可以进行债券交易的数字化机器人,能够为我们的客户群体,自动推送服务信息。基于这些服务信息,我们还能推送山证自己的报价,从而与客户建立起在线交易的意愿。在此过程中,我们发现大模型的引入可以有效地协助我们提升交易效率。实际上,我们就是希望大模型能帮助我们做出精准的判断,了解交易对手方的真实意图,以便确定他们是想要获取信息、进行交易,还是目标在于了解我们的报价。
判断意图之后,为了符合合规要求,我们不能直接地自动完成这笔交易,而需要实时地向我们本方及对方交易员反馈相关情况,以便进行后续交易操作。在此过程中,由于整个流程都有电子化的记录,过去因为合规要求的存在,在没有大模型介入的情况下,该流程常常会被某些合规审查因素所打断,从而导致一些效率低下的环节出现。因此,我们期望大模型能够在确保合规要求得到满足的前提下,快速构建起合规屏障,以保障系统安全。
正如前文所述,我们的主要目标是从客户以及交易对手方的角度出发,让用户输入某些业务场景下的文本信息,而后通过大模型分析出客户的真实意图,进而自动提供客户所需的答案。在此过程中,无论用户是享受了服务或是完成了交易,都是我们进行设计的主要动机。我们使用的是开源的ChatGLM的最新版本,因为这个版本在同等效果下对资源的占用较为合理。
第二个是一个关于合规的案例。在开展这项工作之前,我们内部已经围绕着员工如何合规地拓展业务进行了讨论。我们创建了一个名为合规宝典的工具,这实际上是集合了我们的合规数据库以及合规知识库。我们让知识库对大模型进行学习训练,并基于Langchain与ChatGLM等大语言模型的本地知识库进行了问答应用的实现。
我们将知识库内容通过大模型呈现给员工,针对他们提出的问题机器人会以对话的形式展示出答案,而且答案后还配有一个指针,只需点击便可了解该答案源自哪个数据,以及知识库中相关的具体内容和相应的法规规定。这样的工作模式实际上大大节约了员工大量的检索时间,极大地提升了工作效率。
它采用本地对话模型ChatGLM2与Embedding,以此来生成相对准确的答案。通过查看答案所对应的原有知识库内容,确保了答案的精确性,使用人可以进行初步的判断,避免虚假答案的出现,进一步满足了合规部门的需求。
通过这两个实例我们可以看到,虽然距离理想状态仍有距离,但与人工手动检索相比,效果确实有所改善。

03 AI与大模型问题和思考

最后聊聊我们关于AI与大模型的一些思考。
对于我们整个金融行业领域,无论是作为大模型的使用方,还是站在合作伙伴的角度而言,都将面临三个重要的考量因素,分别是算力、模型以及数据。
算力、模型及数据是一个类三角形的关系,模型优化程度越高,其依赖的数据和算力越少,其余两者也是同样的逻辑。因此,在这个过程中,我们必须处理好算力、数据和模型之间的平衡。
我们期望能够在某些方面找到突破口,例如BloombergGPT那样,在数据类别方向上具备独特的优势;或者可以如同开源的ChatGLM那样,在模型性能方面、原创性方面投入更多,在这种情况下也能具有优势。

这三个考量因素涉及我们对大模型价值来源的看法。首先,由于大模型本身的特点,它能够利用人来反馈,但这也使得它很容易受到意见领袖的影响。因此,如何区分长尾客群的真实意图非常重要,这也是我们需要注意的一个问题,所以保证价值取向其实涉及各方面的工作。一个大模型只有在性能优秀的基础上且能妥善解决伦理问题,才能从竞争中脱颖而出。
最后我们归纳出这五个问题,也是在业务场景下,垂直大模型要解决的五个问题。
第一,如何在细分领域做好高智能性大模型的微调;第二,如何提高问答质量;第三,如何保证大模型知识的持续学习,这也牵扯到第四个问题,如何做好本地部署私有化。通常情况下,我们需要交付本地化部署的产品,在金融行业更是如此。目前,大多数垂直领域的模型在实现本地化部署后并不具备持续学习能力;第五,如何保证企业对于大模型的独立性与可控性。
以上就是我们在大模型方面的一些思考,以及长期以来的探索与实践介绍。

长按二维码,领取完整版视频实录和课件

2010年毕业于清华大学物理系,博士,先后在腾讯、百度、国信证券从事大数据平台架构、算法挖掘、用户研究、智能投顾等工作,具有丰富的大型互联网及金融从业经验,在山西证券建立行业领先的大数据智能中心和数据中台,领导实施数据治理、机构知识图谱、RPA、全面风控等多个金融科技创新项目,推进山西证券的数字化建设。
注:点击左下角“阅读原文”,领取完整版回放

爱分析ifenxi 爱分析是一家中国领先的数字化市场研究与咨询机构。
评论
  • 随着市场需求不断的变化,各行各业对CPU的要求越来越高,特别是近几年流行的 AIOT,为了有更好的用户体验,CPU的算力就要求更高了。今天为大家推荐由米尔基于瑞芯微RK3576处理器推出的MYC-LR3576核心板及开发板。关于RK3576处理器国产CPU,是这些年的骄傲,华为手机全国产化,国人一片呼声,再也不用卡脖子了。RK3576处理器,就是一款由国产是厂商瑞芯微,今年第二季推出的全新通用型的高性能SOC芯片,这款CPU到底有多么的高性能,下面看看它的几个特性:8核心6 TOPS超强算力双千
    米尔电子嵌入式 2025-01-03 17:04 55浏览
  • 大模型的赋能是指利用大型机器学习模型(如深度学习模型)来增强或改进各种应用和服务。这种技术在许多领域都显示出了巨大的潜力,包括但不限于以下几个方面: 1. 企业服务:大模型可以用于构建智能客服系统、知识库问答系统等,提升企业的服务质量和运营效率。 2. 教育服务:在教育领域,大模型被应用于个性化学习、智能辅导、作业批改等,帮助教师减轻工作负担,提高教学质量。 3. 工业智能化:大模型有助于解决工业领域的复杂性和不确定性问题,尽管在认知能力方面尚未完全具备专家级的复杂决策能力。 4. 消费
    丙丁先生 2025-01-07 09:25 80浏览
  • 这篇内容主要讨论三个基本问题,硅电容是什么,为什么要使用硅电容,如何正确使用硅电容?1.  硅电容是什么首先我们需要了解电容是什么?物理学上电容的概念指的是给定电位差下自由电荷的储藏量,记为C,单位是F,指的是容纳电荷的能力,C=εS/d=ε0εrS/4πkd(真空)=Q/U。百度百科上电容器的概念指的是两个相互靠近的导体,中间夹一层不导电的绝缘介质。通过观察电容本身的定义公式中可以看到,在各个变量中比较能够改变的就是εr,S和d,也就是介质的介电常数,金属板有效相对面积以及距离。当前
    知白 2025-01-06 12:04 170浏览
  •     为控制片内设备并且查询其工作状态,MCU内部总是有一组特殊功能寄存器(SFR,Special Function Register)。    使用Eclipse环境调试MCU程序时,可以利用 Peripheral Registers Viewer来查看SFR。这个小工具是怎样知道某个型号的MCU有怎样的寄存器定义呢?它使用一种描述性的文本文件——SVD文件。这个文件存储在下面红色字体的路径下。    例:南京沁恒  &n
    电子知识打边炉 2025-01-04 20:04 100浏览
  • 根据环洋市场咨询(Global Info Research)项目团队最新调研,预计2030年全球无人机锂电池产值达到2457百万美元,2024-2030年期间年复合增长率CAGR为9.6%。 无人机锂电池是无人机动力系统中存储并释放能量的部分。无人机使用的动力电池,大多数是锂聚合物电池,相较其他电池,锂聚合物电池具有较高的能量密度,较长寿命,同时也具有良好的放电特性和安全性。 全球无人机锂电池核心厂商有宁德新能源科技、欣旺达、鹏辉能源、深圳格瑞普和EaglePicher等,前五大厂商占有全球
    GIRtina 2025-01-07 11:02 66浏览
  • 村田是目前全球量产硅电容的领先企业,其在2016年收购了法国IPDiA头部硅电容器公司,并于2023年6月宣布投资约100亿日元将硅电容产能提升两倍。以下内容主要来自村田官网信息整理,村田高密度硅电容器采用半导体MOS工艺开发,并使用3D结构来大幅增加电极表面,因此在给定的占位面积内增加了静电容量。村田的硅技术以嵌入非结晶基板的单片结构为基础(单层MIM和多层MIM—MIM是指金属 / 绝缘体/ 金属) 村田硅电容采用先进3D拓扑结构在100um内,使开发的有效静电容量面积相当于80个
    知白 2025-01-07 15:02 73浏览
  • 每日可见的315MHz和433MHz遥控模块,你能分清楚吗?众所周知,一套遥控设备主要由发射部分和接收部分组成,发射器可以将控制者的控制按键经过编码,调制到射频信号上面,然后经天线发射出无线信号。而接收器是将天线接收到的无线信号进行解码,从而得到与控制按键相对应的信号,然后再去控制相应的设备工作。当前,常见的遥控设备主要分为红外遥控与无线电遥控两大类,其主要区别为所采用的载波频率及其应用场景不一致。红外遥控设备所采用的射频信号频率一般为38kHz,通常应用在电视、投影仪等设备中;而无线电遥控设备
    华普微HOPERF 2025-01-06 15:29 125浏览
  • PLC组态方式主要有三种,每种都有其独特的特点和适用场景。下面来简单说说: 1. 硬件组态   定义:硬件组态指的是选择适合的PLC型号、I/O模块、通信模块等硬件组件,并按照实际需求进行连接和配置。    灵活性:这种方式允许用户根据项目需求自由搭配硬件组件,具有较高的灵活性。    成本:可能需要额外的硬件购买成本,适用于对系统性能和扩展性有较高要求的场合。 2. 软件组态   定义:软件组态主要是通过PLC
    丙丁先生 2025-01-06 09:23 83浏览
  • 彼得·德鲁克被誉为“现代管理学之父”,他的管理思想影响了无数企业和管理者。然而,关于他的书籍分类,一种流行的说法令人感到困惑:德鲁克一生写了39本书,其中15本是关于管理的,而其中“专门写工商企业或为企业管理者写的”只有两本——《为成果而管理》和《创新与企业家精神》。这样的表述广为流传,但深入探讨后却发现并不完全准确。让我们一起重新审视这一说法,解析其中的矛盾与根源,进而重新认识德鲁克的管理思想及其著作的真正价值。从《创新与企业家精神》看德鲁克的视角《创新与企业家精神》通常被认为是一本专为企业管
    优思学院 2025-01-06 12:03 114浏览
  • By Toradex 秦海1). 简介嵌入式平台设备基于Yocto Linux 在开发后期量产前期,为了安全以及提高启动速度等考虑,希望将 ARM 处理器平台的 Debug Console 输出关闭,本文就基于 NXP i.MX8MP ARM 处理器平台来演示相关流程。 本文所示例的平台来自于 Toradex Verdin i.MX8MP 嵌入式平台。  2. 准备a). Verdin i.MX8MP ARM核心版配合Dahlia载板并
    hai.qin_651820742 2025-01-07 14:52 42浏览
  • 本文介绍Linux系统更换开机logo方法教程,通用RK3566、RK3568、RK3588、RK3576等开发板,触觉智能RK3562开发板演示,搭载4核A53处理器,主频高达2.0GHz;内置独立1Tops算力NPU,可应用于物联网网关、平板电脑、智能家居、教育电子、工业显示与控制等行业。制作图片开机logo图片制作注意事项(1)图片必须为bmp格式;(2)图片大小不能大于4MB;(3)BMP位深最大是32,建议设置为8;(4)图片名称为logo.bmp和logo_kernel.bmp;开机
    Industio_触觉智能 2025-01-06 10:43 87浏览
  • 根据Global Info Research项目团队最新调研,预计2030年全球封闭式电机产值达到1425百万美元,2024-2030年期间年复合增长率CAGR为3.4%。 封闭式电机是一种电动机,其外壳设计为密闭结构,通常用于要求较高的防护等级的应用场合。封闭式电机可以有效防止外部灰尘、水分和其他污染物进入内部,从而保护电机的内部组件,延长其使用寿命。 环洋市场咨询机构出版的调研分析报告【全球封闭式电机行业总体规模、主要厂商及IPO上市调研报告,2025-2031】研究全球封闭式电机总体规
    GIRtina 2025-01-06 11:10 104浏览
  • 在智能家居领域中,Wi-Fi、蓝牙、Zigbee、Thread与Z-Wave等无线通信协议是构建短距物联局域网的关键手段,它们常在实际应用中交叉运用,以满足智能家居生态系统多样化的功能需求。然而,这些协议之间并未遵循统一的互通标准,缺乏直接的互操作性,在进行组网时需要引入额外的网关作为“翻译桥梁”,极大地增加了系统的复杂性。 同时,Apple HomeKit、SamSung SmartThings、Amazon Alexa、Google Home等主流智能家居平台为了提升市占率与消费者
    华普微HOPERF 2025-01-06 17:23 141浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦