张为斌:金融大数据风控建模,绝不只是数据和算法

CIOAge 算法
单从金融大数据风控建模角度讲,目前很多企业已经有很多算法。张为斌认为,不仅仅需要引入自然科学建模,还需要引入基于社会科学的、人文历史的思考,把这些维度引入到算法中。

2016年3月,由中国首席数据官联盟发起,北京大学信息化与信息管理研究中心、中国新一代IT产业推进联盟协办的“影响中国大数据产业进程100人”大型人物专访活动全面启动,被采访对象分别来自政府、产、学、研、企各个领域,他们将从不同角度,不同层面向大家阐述当前大数据产业热点、难点、疑点问题,为中国大数据产业健康、持续发展探索经验、保驾护航!

受访者:张为斌

首席数据官联盟专家组成员,北京宸信征信有限公司董事长

[[184453]]

上海交通大学EMBA,具14年大数据领域的研究与探索经验,尤其是大数据链条中最核心的分析和决策行动环节,在数据仓库、多维分析、数据挖掘、人机智能交互、信息可视化分析、金融大数据、大数据征信、商业智能情报等领域具有丰富的技术积累,多次参与国家和省部级大数据课题研究,获得多项发明专利。

荣获国家科技进步奖二等奖,公安部科学技术奖三等奖;2012年中关村国际孵化软件协会“可信企业家”;2014年“中关村创业之星”。公司成立于2014年10月,是经中国人民银行核准成立的独立第三方征信机构。

首席数据官联盟:作为大数据领域的先行者,您早在2008年就成立北京宸瑞科技公司,一直为公共安全领域提供大数据应用解决方案。2014年为何又决定新成立宸信征信公司,提供征信服务?

张为斌:宸信征信确是由宸瑞股份成功孵化而来,继承了宸瑞股份的技术、文化,尤其在天使阶段,得到了很多诸如数据资源、技术团队、专家资源、市场资源方面的支持。

我最早就职于公安部第三研究所一家从事网络信息安全的公司,我在那的几年时间刚好经历了中国互联网蓬勃发展的阶段。2008年创立宸瑞股份以后,我们一直专注于公共安全领域的大数据应用,在细分领域做得比较扎实,仅公共安全领域我们在全国大概有150多家客户。因此在数据资源、数据分析挖掘技术以及落地到行业应用方面,我们团队是很有信心的,也有很扎实的业务经验。可以说,宸信的团队早在2009年就已经涉足大数据领域,数据资源以行业数据和社会基础运行数据为主;到2013年,开始了金融数据的采集应用和产品设计。

2014年成立宸信征信,是我们团队经过长时间的思考、多番论证后下的决定。一直以来,我国大数据应用占比较高的为政府、电信、金融、医疗、能源、电商、互联网行业。纵观大数据垂直领域应用扩散的历史路径,政府、电信、金融等领域是最早涉足、业务参与最深的;经过几年发展,也在医疗、电商等行业浸染颇深,形成了可观的市场空间;从应用层面看,未来变现能力走强的将是基于垂直领域的大数据应用,如政务、金融、互金等。因此,大数据企业应当抓住具有强变现能力、高成长市场空间的细分领域。

其次,我国的征信行业还处在初级阶段,与一些发达国家相比有很大的差距,在这种基础薄弱的背景下,是万亿级消费金融市场的崛起。这也是我们看准大数据征信方向的原因。去年9月全球普惠金融合作伙伴机构发布的普惠金融指标显示,中国通过金融机构借款的成年人比例仅为9.55%,低于G20国家14.87%的平均水平;在信贷市场的信息障碍方面,中国得分只有50分,也低于61.84分的世界平均水平。

首席数据官联盟:好菜更需好厨艺。在金融大数据风控的数据建模上,您有哪些心得与我们分享?

张为斌:单从金融大数据风控建模角度讲,目前很多企业已经有很多算法。但我认为,不仅仅需要引入自然科学建模,还需要引入基于社会科学的、人文历史的思考,把这些维度引入到算法中。中国五千年文化历史,各方都有着各自深厚、各具特点的风土人情,这也决定了仅靠自然科学的建模,不足以达到精准分析目标的。

这也就回答了为什么国际上的大型风控公司的业务在中国推不动、模型不灵的问题,因为他们对中国的文化、历史、风俗理解不够深,对中国现阶段的金融业态、特点把握不准,不接地气的模型很难走通。

大家都听说过“啤酒和尿布”这个案例,说的是美国奶爸买啤酒的时候顺便买尿布,这是美国家庭文化的一个体现,但在中国,这个规律就不一定适用。

讲一个我们宸信自己的心得,在做企业征信的过程中,在不同区域对人、企业的判断标准有所不同。我们从数据里看到,江浙一带的大部分小企业主、企业,生活娱乐类支出是比较少的,当地人文、氛围使得企业主之间的社交应酬不是感性交往,更多理性交往;到了北方就不一样,北方的风土人情是“酒在前”,讲究经常聚、勤走动,因此北方地区企业、企业主个人的这类支出占比就大了很多。因此我们在评估两地小企业的风险、信用的时候,也会具体问题具体分析,不一定生活十分规律、生活娱乐类支出少的南方企业、企业主,信用分就会高于生活娱乐支出高的北方企业、企业主。

因此,我一直跟我们的团队强调,不能照搬国外机构的成功算法、模型,不能拿着一个标准去“放之四海”,要有我们自己的思考,要考虑到每一个业务场景的特殊性,针对客户的区域性差异、不同业务场景的差异,把社会科学范畴的算法和大数据风控体系融合,这样的风控体系跑出来的结果才能更符合我们用户的真实需求。

另外,还要有多维数据资源。如今我们用大数据去刻画一个人,所需要的数据要扩展到利用社会运行数据、互联网开源数据和交易数据、轨迹数据。任何一种单一数据源都难以刻画出一个完整的对象,一定是结合各方的数据,才能构建出完整的画像和全面的信用评估。目前,我们客户应用比较多的有经营性的分析,一般以2c和2b为主;有金融的反欺诈;还有非法集资监管,这是我们做过的、也是最成功的的解决方案。

首席数据官联盟:好用才是硬道理,能否结合客户应用场景,分享两个已经实施的征信案例?

张为斌:目前有征信牌照的征信公司有135家,运营比较好的大多都是既有数据源,又有大数据技术平台,有专业的建模团队。我们依托多年的大数据积累、数据建模建仓经验,以及基于情报理论的多维分析维度,通过标签化的方式为我们客户提供诸如大数据风控、获客、行业监管等服务。

先谈一个金融大数据风控的案例。在我们的大数据风控平台上,有企业征信服务、专项征信核查以及企业用户画像。企业用户画像是目前应用反馈比较好的,我想重点谈谈。

企业用户画像,是先对数据进行汇集、整理,再分类,共分为主题一类、42个二类、形成三千多个标签,企业级的包括法人、个体工商数据等等,再进行多维度的特征分析。比如消费的、业务的、偏好的。这些画像信息,可以用到风控、获客;在对一些企业、机构提供企业画像服务的时候,我们不仅仅告诉他,这家企业的真实情况,还会告诉他,这家企业在区域、行业中的排行。大数据思维,是要关注相对量这个参数的,仅参考绝对量、单一客户,很难判断其抗风险能力。

例如某电子信息类企业,它属于传统行业,由于规模化要在异地设厂,因此产生资金需求,对于在上海、广州等地的互联网金融机构来说,很难在很短时间内完成综合评估,我们的大数据风控可以通过系统的监控和分析,来完成这个目标。还有融资环节,如子公司已经在异地涉法涉诉,这种情况我们系统会及时预警。

随着国家对社会信用体系建设的高度重视,政府监管部门也对大数据征信有较大需求。我们参与了几个省份的非法集资监管系统,基于采集到的数据对其行为、内容进行特征分析。

我们在几个省份的平台,每个月都会发现一些可疑团伙,去年10月份,我们曾看到个别团伙,一个月的资金流水接近几个亿,而这是仅仅是很多团伙当中的一个,至于说他这个行为是非法集资,还是电信诈骗,等移交经侦再做分析。当然这个案例,更离不开当地金融办结合当地人民银行相关部门、公安经侦三方紧密配合。

首席数据官联盟:创业本身就是一场修行。你过去一年在征信公司创业中遇到哪些困难?又是如何解决的?

张为斌:我很同意“创业是一场修行”这个说法。从宸瑞到宸信,已经走过八个年头,我能感觉到我个人、包括团队,在心境、态度方面的变化,从最早的过度鸡血、每天不知所措地繁忙进入到内心平和很多、对业务方向逐渐笃定,这是很好的变化,也是“修行”的成果。

过去遇到的困难很多,例如业务模式不清晰、市场需求、很难盈利、专业人才难找……相信这也是大多数征信公司都曾遇到、将遇到的困难。有人会认为是法律法规不够完善,有人觉得是体制滞后,有人觉得是数据共享出现问题。相比之下,我更觉得是需求侧存在问题:

社会公众对信用消费需求乏力,消费习惯没有养成,并且从体制到政府,到企业、个人,大家对征信的理解、意识相比发达国家都有很大差距。这在一定程度上影响到行业以及信用体系的发展。我们在业务推进中,经常会遇到客户很明确自己必须用大数据征信,但不知道应该怎么用,也不知道应该在组织内部建立什么样的体系去支撑它。这个问题的改善不是哪一家企业能够在短时间完成的,将是一个持续沟通、相互学习、探索实践的过程。

首席数据官联盟:展望2017年,有哪些新的商业思考和战略布局?

张为斌:我认为,做征信要有发展思维和全球眼光。所以我们在成立之初就提出了做“具全球视野的泛征信独立第三方”的愿景,这也是业内独一无二的,也是我们未来都将继续坚持的。

在去年的一个金融论坛上,曾经和嘉宾讨论到进入互联网金融时代后会出现互联网银行,是当前互联网金融和传统银行的高级业态,而以“数据支撑、场景驱动、客户引领”三要素为核心的大数据征信,将为银行、互金、互联网银行提供基于获客、风控等方面的基础服务,这也将是我们的业务方向之一。

这几年,“一带一路”国家战略不断推进,有越来越多中国企业走出国门对外投资,也有很多个人投资者进行跨境资产配置,包括移民、求学等,都需要全球征信服务。我们利用自有全球数据资源,联合几十家境外征信机构,已经完成了全球80%区域,大概有190多个国家的大数据征信业务覆盖,可以为更多的个人及企业机构提供便利的征信服务。

责任编辑:未丽燕 来源: 21CN网
相关推荐

2015-03-31 09:28:28

Hadoop大数据技术大数据未来道路

2013-05-13 10:01:47

大数据人工智能电子痕迹

2011-09-15 13:25:02

2017-03-25 21:13:38

JavaScript排序

2015-12-14 10:01:48

数据中心

2015-07-29 14:16:43

互联网金融大数据

2013-02-01 10:11:29

NoSQL大数据

2010-12-28 13:48:14

2013-04-25 13:58:15

编程

2021-11-05 11:17:45

互联网996大厂

2016-10-14 13:27:13

大数据互联网金融

2023-02-06 08:20:36

2010-08-05 09:29:08

jQuery

2024-11-26 11:02:17

2011-11-17 13:25:43

垃圾邮件

2015-11-24 10:05:07

私有云虚拟化负载迁移

2018-03-13 15:00:22

智慧交通高铁无人驾驶

2021-07-26 22:33:41

切片结构体代码

2011-06-29 16:29:19

2021-01-06 10:51:39

云计算云服务IT

51CTO技术栈公众号