作者|陶光明「招商银行总行风险管理部总经理助理」
文章|《中国金融》2020年第1期
大数据时代已然到来,数据渗透至每一个行业以及每一个业务职能领域,成为相关组织极为重要的资产。在这个时候,大数据和人工智能被各企业纷纷抢占,产业格局正经历着巨大的变化,互联网巨头对金融服务的冲击越发明显。面对当下的这种变化局势,在银行的风险管理方面,怎样借助金融科技去应对挑战呢?
痛点凸显:传统风险管理弊端亟待解决
近几年,国内外的经济金融形势处于动荡且反复的状态。金融市场的反应极为剧烈。国家的产业行业政策在持续进行调整。各类银行客户的经营风险以及道德风险变得更加复杂且多样。信贷风险管理的难度持续增大。传统风险管理的弊端集中性地暴露了出来。
一是银行在风险信号采集方面缺乏有效的工具。目前,对于银行客户的财务报表以及生产经营情况等关键信息的采集,主要是依靠分支机构对客户进行现场调查以及客户自身提供。客户财报数据存在滞后性,存在财报粉饰的情况,客户会隐瞒经营实质或者存在信息披露缺失等信息不对称的因素。同时,客户的经营具有跨区域化和交叉化的特点。基于这些情况,银行凭借有限的人力,难以对信贷业务的贷前、贷中和贷后风险信息进行有效收集和精准识别。
一是客户识别存在困难。企业融资产品日益多样化,客户发展呈现集团化态势。部分企业为获取更多融资,自身融资产品不单变得更加多元,还借助关联企业,尤其是隐性关联企业来进行融资。然而,银行传统的风险管理手段,难以对企业间的关联关系进行有效识别,这使得企业过度融资的可能性大幅增加,同时银行的风险管理措施也难以切实落实。一旦企业发生风险就会涉及巨额融资,从而给银行带来重大损失。
三是传统风险模型遭遇瓶颈。在国内商业银行对客户授信审批、评级以及风险预警管理等传统模型的运用期间,主要借助专家经验、黑名单,或是通过人工方式来制定监测规则等办法。一旦客户的申请或交易信息与这些规则相匹配,就会触发相应的业务策略。这种模式存在局限性,具体表现为:枚举的场景较为有限,指标的维度比较单一,精准度不够,无法对客户的风险事件进行全方位的覆盖。传统模型的升级换代周期通常比较长。它的指标不能灵活地进行调整。客户会依据已有的规则来进行回避。这些情况会致使银行风险预警模型的效果降低。
一是信息难以有效整合,与客户及其风险相关的信息多为非结构化,其中有意义的信息难以被及时发现和挖掘。二是人工无法识别这些信息,传统计算机技术也难以处理,它们被淹没在高熵无序的信息海洋中。三是这些被淹没的信息对实际的风险管理基本没有意义。
为解决传统风险管理模式存在的弊端,我们需要强化金融科技和监管科技的成果在银行风险控制中的应用,比如大数据以及机器学习和深度学习等。同时,要集中力量推动银行风险管理的科技创新和数字化转型。
建构基础:建设风险大数据平台、计算框架和AI设施
互联网快速普及,全球数据开始爆发式增长。每次进行浏览网页的行为,每次进行搜索,每次用智能手机上网,几乎都会使数据增加数十亿字节之多。这些数据结构多样,逻辑也很复杂。传统的关系型数据库渐渐无法满足风险管理在数据分析方面的需求。在此背景之下,招商银行构建了一个风险大数据离线平台。这个平台由关系型数据库构成,也有非关系型数据库,还包含集群、计算框架以及机器学习服务器。
利用关系型数据库来存储和处理结构化数据。使用 HDFS 作为分布式存储的基础,这样既解决了巨量数据的存储问题,又保证了数据的安全性。同时,利用架设在 HDFS 之上的 Hive 来处理数据文件的映射关联和列式数据,用于存储文档。在准实时的分布式计算层面,使用基于内存的计算框架来进行高效的数据处理。
风险大数据 AI 基础设施架构以大数据平台为基础,运用语言,借助和-等开源库,开展随机森林等机器学习工作,同时也进行 SVM 以及朴素贝叶斯等方面的机器学习,之后在其之上构建谷歌的神经网络模型。借助这些“神兵利器”,AI 风控领域的探索能涵盖多个方面。其一,利用高维机器学习模型和集成学习模型来量化企业的风险;其二,结合图计算与关联分析,构建网络关系特征,以识别企业间的关联关系;其三,运用自然语言处理技术训练 LSTM 网络等多种模型,从而精准识别企业风险舆情信息;其四,借助分词工具和 TF-IDF 算法,提取授信报告的文本特征,再利用短文本分类工具中的三分类模型,实现授信报告风险点的智能提取;其五,使用机器学习并结合大数据,持续迭代训练,完成新预警模型和新评级系统的开发。
场景应用:在风险预警、评级、政策、审批等多方面突破
招商银行以风险大数据平台为基础,结合业务场景,运用机器学习、深度学习以及其他分析工具,促使智慧风控体系的相关功能模块依次进入开发阶段、上线阶段以及迭代阶段,并且在客户知识图谱建设方面实现突破,在风险预警方面实现突破,在风险评级方面实现突破,在信贷政策制定方面实现突破。
融合企业客户内外部的数据,从而建立起客户知识图谱。企业的股东背景属于贷款审查的关键要素之一,集团关系也是如此,上下游情况同样是关键要素。了解借款人的关联企业风险,这是信贷作业的重要内容。此前,客户关联信息是依靠人工来进行维护的,这样的工作方式工作量比较大,并且无法保证信息的完整、及时以及准确。招商银行借助大数据和人工智能工具,将外部数据与内部数据进行融合,成功地建设了客户关联图谱,达成了对包括股权投资关系、对外投资关系、控制人关系、集团关系、交易关系、担保关系、诉讼关系等在内的十大企业关联关系的自动识别。
招商银行在 2017 年末启动了人工智能在风险预警领域的应用。随后研发完成了基于机器学习算法的对公智能预警体系。该体系通过大数据来降低客户“信息不对称”的水平,并且建立了中台直接甄别客户风险的路径。智能预警的设计首要目标是“准”。它与行内外传统的预警手段有所不同。在智能算法部署方面采用了新技术,在指标工程构建上采用了新思路,在运行迭代频率上采用了新技术,在预警触发机制上也采用了新思路,从而推动了预警准确率迈上了新台阶。2018 年智能预警正式推广应用,经过一年的检验,首期发布的预警名单中,出现风险信号的准确率达到 75%以上。
建设新的基于机器学习的智能评级系统。新一代对公客户评级系统基于大数据和机器学习,它与传统评级相比具有诸多优势。其一,算法更为有效。因为采用了机器学习算法,所以对规律的学习更加准确,处理信息的效率也更高。其二,迭代更加快速。每月能够根据最新数据重新学习规则,进而自动形成新版模型,以此来适应客户不断变化的风险规律。四是评级的波动性变小了,同时抗干扰的能力也更强了。系统不会轻易因单一指标而受影响,导致评级大幅波动。并且,对于部分指标的错误录入,能够在一定程度上减少对评级结果的干扰。
建设基于具体场景的风险分析能力。不同的业务以及不同的客群各自具有不同的风险特征,针对具体场景构建相应的风险特征模型对于风险判别有着极为重要的意义。其一,要进行担保圈风险的识别。担保圈通常是指因借贷担保关系而形成的网络,圈内的成员常常通过亲朋好友、区域、行业、客群、银行产品等因素相互关联。圈内的担保关系结构较为复杂,潜在的风险也非常巨大。近三年里,招商银行因担保代偿而产生的不良客户数量占不良总量的 12%。从数量方面来看,担保代偿是导致不良生成的第三大原因。并且,保证类业务的不良率要比平均水平高很多。对于保证类业务,招商银行依据担保数据,通过利用图计算技术,构建了担保关系图谱,同时建设了担保风险监控工具体系。目前,招商银行已研发出担保圈自动梳理算法,梳理出了多个担保圈。机器梳理取代了之前担保圈繁琐的人工梳理工作。并且,机器识别在范围、准确性和及时性这三个方面都远远超出了人工识别,极大地提高了银行对担保圈的风险管理能力。其二是金融司法纠纷。司法诉讼属于重要的外部风险信息,客户涉及诉讼能够在一定程度上反映其信用状况。司法信息涵盖了法院公告、开庭公告、裁判文书、行政处罚、执行信息、失信人等诸多文书。为了从数量庞大且持续增多的司法文书里找出切实能体现客户还款能力与还款意愿的有效信息,招商银行依据司法数据,借助 NLP 技术,构建起文本极性分类模型,将无效信息剔除掉,提升了司法数据揭示风险的效率。
在此基础上,构建针对有效信息的文本多分类模型,以实现司法文书的案由分类,包含银行借款、民间借贷、权属纠纷、劳务纠纷等。对不同类型的司法信息进行分析后,主动触发重大风险类型的风险提示。同时,对司法文书中的重要信息,像涉案金额、判决结果等,通过结构化自动提取来提升司法文书表达信息的效率。一是客户发生违约存在自身经营问题,二是外部风险不容忽视。近年来,关联企业风险冲击、股东纠纷、上下游行业萧条、担保公司倒闭等外部因素导致违约的案例很多。由于外部关联风险具有多样性和复杂性,所以外部风险传导的规律一直难以有效预测。在互联网时代,企业舆情已经成为企业形象和企业盈利的重要影响因素,突然出现的舆情危机事件往往会给一个企业带来“生死攸关”的影响。然而企业舆情信息分布在各类网站中,人工逐一去筛选浏览的话效率十分低下。因为文本批量处理是 NLP 技术的优势所在,所以招商银行借助 NLP 技术,成功建成了企业负面舆情信息自动化监控平台,能够实现对新闻舆情的标题、正文以及日期信息进行自动抽取和分类,并且还能实时与预警系统相连接,推送预警信号。
一是涉小贷公司融资,客户融资行为是风险关注的重点。二是若客户融资渠道涉及小额贷款公司,这往往表明其资金情况不容乐观。三是若客户融资渠道涉及信托公司,这往往表明其资金情况不容乐观。四是若客户融资渠道涉及民间借贷,这往往表明其资金情况不容乐观。招商银行为了对涉小贷公司的融资风险进行量化,通过对交易数据进行大数据分析,筛选出了与小贷公司有交易的客户。结果表明,这部分客户出现预警和违约的概率比一般客户要高很多(约占 30.9%)。并且,其中与小贷公司发生过转贷交易的客户,其出现预警和违约的概率更高。
宏观政策进行智能化的研读与制定。银行开展公司业务需要重要依据,其中行业信贷政策就是其一。招商银行把客户所处的行业划分成优先支持、适度支持、审慎介入和压缩退出这四类,同时明确了行业白名单以及行业准入标准。行业信贷政策内容较为丰富。银行在定制以及宣导贯彻信贷政策时,因系统化程度较低,所以效率不高。行业政策定制既费时又费力,并且政策意图较难传递到前端业务人员那里。招商银行搭建了行业线上化研究平台,丰富了行业政策线上化工具,逐步实现了宏观政策智能化研读与制定的目标。二是上线了客户行业分析以及智能问答功能,该功能可以支持用户关于信贷政策相关问题的快速回答,从而提升信贷政策的查询效率。
数据质量需要进行检查和提升。银行风险量化与风险管理是以数据质量为基础的,保证数据的正确性、有效性以及及时性,这是银行风控的一项关键工作。基于此,招商银行把金融科技手段当作突破口,构建了数据质量管理系统以及配套的检查工具,借助科技的力量来对数据质量进行管理。一是利用系统来实现手工检查的规则,这样既能减少人工操作,又能保证检测标准的统一,还能缩短发现问题数据的时效。通过持续积累和完善数据检查规则,能够及时分析并发现数据质量问题,并且可以持续跟进、监测执行过程,直到问题得到修复。二是借助大数据技术,把行内和行外的客户信息数据予以匹配,对那些疑似有误的信息加以校验,促使系统用户核实客户资料,从而能够及时察觉客户的风险。
数据驱动:强化金融科技研发应用和人才培养
金融科技赋能风险管理是一个系统工程。长期以来,它在理念、基础、技术和人才等方面不断面临着制约,同时也在这些方面不断寻求突破。
创导理念并拓展方法,能让金融科技理念更加深入人心。金融科技以信息和数据为基础,银行业需顺应其趋势,将“以数据创造价值”作为着眼点并牢牢树立,以数据管理为立足点。要培育数据文化,树立起数据意识和数据思维,从数据角度看问题,从数据角度分析、理解和解决问题。逐步打破以传统经验为主的决策模式,进而建立以数据驱动为核心的判断决策流程,如此便能真正做到利用数据进行论证,利用数据进行管理,利用数据进行决策。
大力推进金融科技成果的研发,将其应用于日常风险管理工作。积极探索金融科技新工具与新思路,加快金融科技成果的推广应用。以提升效率、发现风险和洞察商机为目标,重点推进对公智能预警体系、客户知识图谱、政策和行业知识图谱等金融科技的应用研究。在集团的风险识别领域,要进一步强化金融科技研究和应用;在高风险担保圈方面,也要如此;基于机器学习算法的客户评级方面同样如此;财务报表欺诈识别方面也不例外;企业风险特征提取方面需继续加强;风险传导方面也得加大力度。在“基础统一管理、应用全面开花”的思路引领下,建立起包括系统建设、数据汇集、处理和分析等在内的基础机制,以及应用支持机制和应用机制。
金融科技能够赋能风险管理,这也使得风险管理人才队伍面临更高要求。当下,风险管理队伍在知识结构、专业背景以及能力素质等方面,还难以满足银行数字化转型的需求。未来,需要大力持续投入,积极培育具备数据处理分析能力、新技术应用能力、数据模型研发能力以及风险管理能力的复合型金融科技人才。
版权声明:本文为 “博览广文网” 原创文章,转载请附上原文出处链接及本声明;

工作时间:8:00-18:00
客服电话
0755-88186625
电子邮件
admin@lanyu.com
扫码二维码
获取最新动态
