【大数据在银行领域的应用】
【演讲主题】大数据驱动智慧银行建设
【演讲内容】江苏银行信息科技部总经理助理林凌向我们分享了江苏银行这些年来的大数据应用与实践。演讲内容主要包括以下五个方面:
一、先发优势,打造自主品牌;
二、安全可控,掌握核心技术;
三、锐意进取,技术保障金融创新;
四、外部协作,跨界推动大数据合作。
1先发优势,打造自主品牌
感谢星环科技给我们在座各位这次学习和交流的机会,我今天也学习到很多知识。我是今天最后一位做分享,我们演讲室里面还是座无虚席。我们现在处于最好的时代,处于非常好的产业链里,就是大数据产业链。在座各位嘉宾,包括金融机构,包括各个金融科技公司,我们都有幸能够为中国,为中国大数据产业来贡献自己的力量。
我本人大概是从2002年开始做数据仓库,做这部分工作也做了十几年。我觉得经过这十几年发展,终于到了做数据,特别是做大数据产业里面每一个成员扬眉吐气时代来了。我们所在的这个产业处于蓬勃发展期,所以我想在座每一位都会有更好前程。
今天分享是从背景开始,2015年以来国家发布一系列指导意见,规划大数据产业发展细节。这里要提一下2015年8月份,国务院通过一个关于大数据发展的行动纲要,这是我们国家第一次系统的权威性定义大数据发展的行动路线。有两点不得不提,第一,明确提出来政府的数据要开放、共享。第二,提出来政府的数据要进行整合。有了这样的行动纲要以后,上面列出了明确时间表,到2018年要求必须有节奏开放各地政府的政府数据。
党的十九大报告当中,习总书记指出着力加快建设实体经济,科技创新,现代金融和人力资源协同发展人力体系,推动互联网大数据人工智能和实体经济深度结合。江苏银行要紧跟新一代互联网大数据、人工智慧主体科技发展方向,抢占先机,并且以此为基础推动服务实体经济,推动进一步落地普惠金融。
首先,江苏银行大数据应用领域起步比较早,从2014年开始确定利用大数据弯道超车战略目标。2014年下半年开始我们自己开始各个平台建设,2015年上半年开始有风控类产品,网贷产品输出开发出来。经过四年的努力,江苏银行虽然作为中小银行,人少,机构少,但是有了金融科技的加持,作为中小银行也有能力和股份制银行,乃至国有大行一较高低。四年来我们申请22个商标,这是一个基础型商标融创智库,智库是一个国家或者是企业的智囊团,所有的经营类决策,希望有一个智库支持。这里面就离不开数据的应用,融创智库是江苏银行最基础的大数据平台,它强调并不是有一个技术平台,而是强调行内行外各类数据进行有效整合,整合数据之上会做一些主题的甄别,也会做客户标签,指标层,为今后大数据应用打下坚实基础,所以这个品牌是融创智库。在融创智库基础上做第一个风控类产品品牌叫月光宝盒,这个名字主要是来源于大话西游,至尊宝打开月光宝盒变成穿越时空神奇人物,我们希望通过打开宝盒展现各类风控类产品,所以我们叫做月光宝盒。筋斗云是近两年做的对公营销产品起的名字,希望通过筋斗云产品加持,让对公业务实现一日千里发展。
在大数据以及人工智能领域我们江苏银行在不停实践,在一些国家工作组里面,也指定江苏银行作为牵头银行,在银监会银行业金融科技研究和促进工作组,江苏银行就是是牵头行牵头人工智能专题组工作。江苏省法人银行业金融机构信息科技风险管理指导委员会下面,我们作为牵头行做江苏省大数据实验室一些日常工作。我们在银监会银行业信息科技风险管理高层委员会里每年都举办风险类科技成果评估,我们连续四年获得二类成果奖,这是我们在大数据和人工智能不断实践,所获得的一些荣誉。
下面是我想介绍一下具体的智慧银行相关研究成果。主要智慧风控、智慧营销、智慧管理三个方面。首先提到月光宝盒的大数据风控平台,这个平台里面提供了包括贷前、贷中、贷后全生命周期风控体系和风控产品。贷前阶段强调有欺诈识别,我们设计了完整实时反欺诈风控系统,通过这样的风控系统,我们能够有效识别这个设备是不是一个被人为操控的设备。这个人是不是一个有欺诈风险的人,通过这样大数据的识别我们让贷前风险得到有效控制。
第二,贷中最强调是审批模型。审批模型是各个银行业最传统,比如说评分卡,除了利用评分卡,也利用机器学习技术,来对我们借款人借款能力,还款意愿做综合评估,通过数据分析我们有效能够判断客户是不是具备审批条件
第三,贷后做预警管理系统。设计一些预警规则,例如看看如果工商登记信息法人发生变革情况下,是不是出现信用类风险。比如他在做结算流水的时候,每一个月结算流水开始出现不稳定下降,这个就可以作为预警信号。不光这样,单个预警信号不够,还需要把不同预警信号组合在一起考虑。我们会酌情选择是单因素分析还是多因素分析。
举一个例子,江苏银行曾经在发行贷款产品的时候,出现过预警信号。是我们在一个论坛网站上面发现的有一个人提到他的一个同事出现赌博情况。仅仅这样一条信息,我们顺藤摸瓜查到这个人在我们行数据库内的社交关系什么样。我们发现他本人在我们行没有贷款,但是他父亲经营一家小型超市,此前经营状况非常正常。基于这个信息发现,可能他父亲的这笔贷款会出现问题,果不其然一个半月以后发现这笔贷款真的出现问题。这个例子也说明如果利用数据是可以把传统风控手段不能触及的事件挖掘出来,通过数据的连接,通过爬虫技术,涉及语义分析数据,涉及内外部数据关联技术,数据综合利用这些数据就可以发现预警事件,从而降低我们贷款损失风险。
有了这样的风控体系,江苏银行才敢大胆发展网贷业务,江苏银行从2015年开始推出税e融开始我们推出一系列贷款业务。我们利用公积金缴存数据给个人发放信用贷款,这些数据不能单一应用,应用数据会发现单一维度再强数据也会出现偏差,所以我们在综合利用数据的时候,会考虑到综合利用行内结算类数据,金融账户类数据,也要利用行外的工商登记类数据,个人征信类数据,这些数据综合融汇一起,可以更好描绘客户综合画像,综合画像指引下才能决定这笔贷款能不能放。e融贷款不单单江苏银行自己用,我们也和同业一起合作,在江苏银行不能覆盖网点地方进行联合贷款,去年为止在11个省成功落地税e融产品,今年一季度税e融受信109亿,累计放款17.58亿。
智慧管理,我们强调江苏银行当时发现一个问题,我们到分行乃至支行调研,发现到月底两天我们同事准备各种报表,报表需求方来自各个业务条线,我们想如果我们每一个月每个支行能省下这两个人力,对于银行来讲是很大的收益,所以我们做了一个智多星产品。智多星产品本身来讲看上去只是把数据用商业智能工具展现出来,其实我们发现仅仅做到这样远远不能满足用户要求,用户总说这个工具看上去能够拖拉拽,但是我不知道数据是什么样,我不知道怎么样出这样的报表。这给我们一个提示,往往科技人员做一个系统的时候,他认为这个系统功能达到就可以了,但是没有按产品化思想设计。根据客户的这种痛点,我们做了一个小的提升,我们根据不同主题设计了不同数据包,而且设计数据包的时候,我们会跟业务部门一起来设计,这个过程中间我们的业务应用者,他会发现他开始逐渐了解这些数据。通过这样的设计,业务部门发现,他通过这样的BI工具,或者是挖掘工具可以做一些动态的、临时的数据分析,也解决了当时每一个月提供数据繁琐的工作,真正产生效益。
我们做系统的时候,一般强调平台化,要集中化做设计,但是做应用的时候,我们希望数据使用者越多越好,不光考虑到总行各个业务部门对数据需求,建模人员对业务需求,要考虑到分行乃至支行各个管理者对数据需求是什么。只有你了解最终用户需求,你设计出来才叫产品,否则只是IT系统而已。
接下来产品是智能化营销,这在每一个商业银行来讲都是比较重点的问题,我们现在有这么多客户,以江苏银行为例子,我们2017年直销银行新增一千万客户,这么多客户如何激活,如何重复购买,我们设计了一个指南针的零售大数据营销平台。这个大数据营销平台做的最有意思件事情是做智能推荐,我们提出来互联网化语言描述客户需求。我们拆客户、产品、渠道。什么是拆客户?就是假设我是客户经理,或者我是营销人员,我去新建营销活动,我首先拆一下适合我这个营销活动客户群是什么,他有什么特征。拆产品是针对客户来讲,一个客户我们给了他做营销,到底营销哪一类产品,渠道意思是说客户最喜欢哪种渠道推荐,是电话推荐还是面对面推荐,还是发短信推荐,每一个客户对每一个渠道偏好程度,对时间点偏好程度不一样,这样的需求指导下,我们利用机器学习技术,来完成智能推荐模型,智能推荐模型上线以后,发现我们对某一个理财产品推荐产品,机器学习推荐成功率能够达到63%,已经远远高于人工筛选推荐成功率。人工筛选推荐成功率是25%,高那么多也不一定是好事情,每次业务部门任务应该这么高,所以其实我们还做了专门了比对,我们认为机器学习模型,我们筛选出一部分客户,传统人工筛选模型我们筛选同样数量客户,我们打散掉,打散掉以后分为AB测试组,发名单下去的时候,各个营销经理是并不知道哪一个名单是机器筛选出来,哪一个名单是人工筛选出来,最后通过统计回来发现机器筛选出来成功率确实高,这个高并不是说客户有买的意愿就算,而是客户最终有没有购买这一类产品,我们才算真正转化率,正是因为有价值传导,或者是每一次产品决策的时候,会考虑到这个产品、场景,最终真正为银行带来创造价值吗?如果有创造价值就坚持,如果不能有创造价值,我们也调头承认错误,再换另外一条路走,这是精准营销。
对公营销也存在类似问题,这个是筋斗云对公大数据营销平台,这个平台最主要想解决是精准营销问题,面临痛点是对公客户经营。首先不知道周围有哪些客户,我找到周围有哪些客户以后,并不知道客户需要什么,我应该推荐什么方案。对这个痛点我们做精准筛选客户,精准挖掘需求,精准定制服务方案,这三个精准服务目标。这个跟数据有什么关系?对公业务并不是像大家想像就不能用数据驱动,对公营销也不是完全靠人和人之间关系。如果我想精准筛选客户,我们可以从两个方向思考这个问题。第一,从存量客户中间。第二,从新增客户里面筛选客户。对公企业提供服务一定有上下游概念,对公企业授信的时候,很可能有担保企业在里面,这些关联企业,无论是上下游关联还是什么关联都是你潜在客户群,你通过这个挖掘方式就可能找到更大客户群。通过这样的方式你找我们的客户群,以江苏银行为例子,第一期发现客户群已经超过现在江苏银行所有对公客户规模,所以搞得客户经理来不及跑。另外一个方向是从源头上面获取,这个像网站导流一样,我们做了产品,企业工商注册就可以做代缴税账号,很多新兴企业没有开始运营,注册的时候就已经抓取这个客户信息。为进一步分析他的需求打下基础。
谈到想精准挖掘客户需求,传统做法一般根据自己的产品快到期了,判断一下可能会续一下贷款,或者是续一下理财类业务,除此以外还可以考验用网络爬虫技术,看看企业需要什么,考虑需要什么的时候,先不要考虑你能否提供相应服务。他说我做IPO,他说我中标一个项目,有了这个需求分析以后,你再考虑和本行一些金融服务如何对接。通过顺藤摸瓜的模式,我们有可能通过数据和非结构化数据精确挖掘客户需求,从而为下一步定制有针对性服务方打下基础。
2 安全可控,掌握核心技术
谈到技术,到底什么样的技术我们要作为核心技术掌握,江苏银行也感觉我们有几项技术必须作为核心技术进行引进并且掌握。首先,融创智库这样的技术平台,但是它里面装的是大量数据,江苏银行目前来讲光引进外部数据就有43大类,这么多数据我们内部数据想办法打通,可以形成企业画像或者是个人画像,打通方向一个是通过客户身份证或者是企业社会信用统一代码关联,通过内外部关联发现以后在这之上可以做很多关于精准营销或者是风控上面的事情。
数据用得好一定要强调数据治理工作,作为中小银行来讲,数据治理一直是难点,大行业也是难点。为什么?因为我们不可能把系统推翻重建,在新建过程当中重新制定我们的数据标准,重新定义原数据,重新用教练规则定义,这些重新都不存在,作为中小银行,作为大银行你都有大量系统,你都是运动当中实现数据治理,所以数据治理上面我们始终坚持价值导向。到底什么样的数据在今后应用当中发挥更大价值,我们分析你常用分析几个维度,机构维度肯定分析、客户维度会分析,客户经理维度会分析,包括产品维度、条线维度,常用维度作为优先治理对象,不管客户统一,客户经理统一,机构统一,每一个统一做的事情很多,所以必须全行上下一起推动治理工作,而且这个事情不是只有科技部做,往往很多推动需要业务条线推动,每一个行都会形成数据治理工作机制,而且必须要上升到全行高度来推动数据治理工作。有了数据治理加持,后面任何数据应用,才会有比较好的基础。这是数据治理方面。
下面就是谈建模,建模因为现在每一次的不管营销也好,还是风控也好,我们现在做的事情是把每一个简单决策用模型方式展现出来。我们把决策模型嵌入每一个业务流程当中,嵌入每一个运营模式当中,这样才能充分发挥我们数据价值。所以江苏银行把整个模型管理起来,模型和模型之间有的时候也有相通之处。零售条件做的模型,在消费金融公司也可以用,往往原来各个条线自我建模,没有想到这个资源可以全行业范围有效管理。每一个模型做出来要定期迭代,最好自动化迭代,达到模型自学习这种能力以后,我们会想着把模型有效完成,所以我们建立统一的建模管理平台,把建模全生命周期管理起来,能够让模型活起来,就是能不断自学习,不断向前演进,从而达到更好效果。
智慧引擎概念其实是配合精准营销来设计。刚才前面提到现在决策越来越实时化方面发展,现在数据一定是流动数据。流动数据下面要做实时决策,我们考虑建立一个智慧引擎平台,通过智慧引擎平台,我们希望做的决策模型执行,都在智慧引擎解释下动态执行,不管风控类模型,还是精准营销类模型,都可以通过智慧引擎来执行。
3 锐意进取,技术保障金融创新
再谈一下新兴技术,再提一个观念,我们现在看到新兴技术,不管互联网还是人工智能,最本质还是大数据应用。原来没有技术加持你会发现数据量大你分析不了,如果没有这种图像分析技术,计算机视觉技术加持,你会发现一些非结构化数据用不了。有了这些新兴技术发展以后,最本质还是把原来一些不能使用数据应用起来,这才是新兴技术所带来价值。
首先看一下物联网,物联网特点是原来人和机器交流,或者是必须是信息终端不断产生信息,不断收集信息进行加工分析和应用,现在物与物相连每一个物品哪怕一个杯子,一瓶水,它的状态会通过物联网状态连接起来,这个形成了虚拟数字世界,这个信息比原来传统IT信息,这个信息要大很多,如何解决这个技术,通过物联网技术,在边缘感知一个终端配合,感知一个世界,感知物品状态。所以这种计算技术,一定要网络边缘就完成,不能把所有数据输送到后台,由后台来完成,这是物联网特点。2017年12月份上线一个动产质押融资服务,一些钢材放到仓库里面,这些钢卷有没有在监控情况下进行搬动,我们上线全线上动产质押功能。本来靠人工一两天办不完,现在通过线上流程,只要十分钟就可以完成,有效满足中小企业需求。
这是区块链技术,区块链技术本身来讲没有完全成熟,江苏银行在区块链技术方面做了尝试。我们10月1日应用自主研发平台,我们完成首单区块链跨行天线业务交易,让行与让天线业务既快速高效又透明,也是对信息技术进行了实践。
人工智能就是OCR识别,图像识别,人脸识别都有很好应用场景,这项技术是人工智能里面,计算机图像识别技术,是在人工智能领域里面技术成熟细分领域之一,所以用的场景也非常广泛,可以利用图像识别技术来完成一些风控体系的完善。比如监控我们的会员有没有收到假的凭证,另外可以提高运营效率。原来传统报表录入是靠人工,通过计算机识别技术,我们可以对一些通用报表,就是版面不是完全固定,传统OCR技术无法识别,对这样的报表现在人工智能技术也可以做到自动化识别。原来录入一个企业的资产负债表,信息流量表,损益表,这套表录下来要30分钟,现在通过人工智能报表识别系统,这个过程三分钟之内就完成,大大节约客户经理工作的负担。
4 外部协作,跨界推动大数据合作
最后想讲一下跨界合作,江苏银行作为中小银行,我们其实想自己到底怎么样发展,我们与大行相比一定没有那么多资源,包括人才资源,资金资源,我们怎么来跟随金融科技这样的潮流。所以强调是要合作,特别是跨界合作。首先可以和高校和科研院所合作,江苏银行和国内高校和国外高校都展开过合作项目。比如和南京大学建立博士后工作站,成立了大学生大数据研究基地,我们体会到作为科研院所他们有很多人才,他们具备优势就是人才优势,业务领域和科技领域都有专项人才,他们善于做课题研究和技术攻关,我们银行具备优势一个是有丰富数据资源,这一点高校不一定有。你有把科研成果转换成金融产品这种落地工程实施能力,这种双方都具有优势资源情况下,双方合作可以获得让金融科技真正在金融业务场景里面落地生根解决痛点、难点问题。
这里面也有一个例子,我们博士后工作站,当时一个课题是做行业景气指数以及行业预警研究,这个课题有研究,一个是最好有社会效应,这个课题最好能和我们的银行业具体应用是能够紧密结合。具体谈这个案例,这个图左边是我们行业景气指数和预警系统研究一个过程,包括了指标初选,指标分类,指标编制以及预警模型设计,在左边这一块。这一块来讲是我们大数据博士后工作站里面博士做的。右边这个如果做出来我们应用什么场景,应用制定行业政策准入、退出方面,可以用到行业方面,这样的合作是能够进一步推动人工智慧进一步研究和成果转换研究程度。
与政府合作,政府部门数据在各个数据里面,权威程度越高,含金量越高,江苏银行与国家信息中心签署信用信息共享合作备忘录,通过这样的合作方式,我们可以实现包括黑名单等各类信息共享共用。加快联合整治和联合激励。我们其中有一个解决中小企业融资难问题大数据应用示范扩题,获得江苏省经信委奖项,获得一定资金支持。我行中国青年诚信行动,我们和共青团一起提供费用减免甚至是提供免抵押贷款,这个合作当中会发现,一方面和一些政府合作会开拓企业眼界,也会获得优质潜在客户,所以和政府合作也是很好途径。
跨界合作这个大家都会做,包括国有大银行,股份制银行会发现,都在与互联网公司合作。我们行与苏宁、京东、阿里、腾讯等24家互联网公司签订战略合作协议,数据挖掘、模型设计、平台打造方面会展开多层次合作。真正把外部资源整合到行里面里,实现合作共生生态圈,作为中小银行你在金融科技发展上面,也具备局部优势。
我们也希望和同业展开各种各样合作,前面讲我们的月光宝盒这样的平台,我们的税e融金融产品已经在全国范围推广,包括和在座各位金融同业展开了合作。我们认为作为中小金融机构来讲,你不会每一块业务都做得很好,大家都要发展,可以把自己的最擅长的,基于大数据技术一些金融类产品和服务分享出来,在全国范围内推广,这样能够形成一个共同发展的态势。
今天就是我的分享到此为止,谢谢大家。