【创新】大数据在金融创新的两个突破方向

标签:大数据金融

访客:50889  发表于:2016-07-22 09:48:02

【创新】大数据在金融创新的两个突破方向-09大数据

时下,“互联网+”概念占据了媒体头条、泛滥于各个行业峰会论坛。几乎每一个实体经营者都开始思考如何搭建网站开发app, 触网互联网化。而此时的互联网的领军人物,却开始思考网络与实体经济结合的核心纽带——数据,如何开拓和掘金数据经济这一新大陆。“C2B”, “产消合一”所定义的全新财富生产模式,远比“烟土”“劳动力”这些大航海时代所获取的新大陆要素更令人惊喜。而在所有要素的背后,大数据,不仅作为推动创新的工具(Tools),更成为驱动变革的原动力(force), 改变我们的生活工作方式,重塑和定义新的产业与市场。

科技创新的每一次巨大突破,都从打开一个全新的参照系开始。而今天,大数据在新的尺度上拓展金融服务企业的智力,在两个方向上创新与变革:对全局更系统的洞察;对个体更细化的刻画。

全局洞察与量化

工业文明缔造的金融机制以经济实体个体为度量基础,评估企业经营通过3张黄金会计表:资产负债、损益、现金流,对个体历史数据竖向分析。但面对更迭更快的经济周期和市场,企业间、行业间的全局洞察能力更为重要。

对于国内会计数据缺少或失真的现状,如何评估5000万实体企业的经济运营, 需要采用创新的数据结构,发现和度量事物彼此联系,把个体构建成群体的全局知识体系,即使用大数据复杂网络技术全局化建立金融网络。

构建群体智慧的首要条件就是发现彼此的联系,那么量化经济实体之间的往来经济行为,我们就可以抽象出来整个经济活动体系,同时评估个体经济实体在整体经济环境中的经济指标。借助复杂网络等大数据技术,通过企业之间的资金往来行为、投资担保关系、核心成员关系等相互联系,构建全局度量体系,提炼出高阶的系统和个体的评估量化指标,构建全局的高阶智慧。

在商业实践中,我们借助金融体系内部数据,从供应链到企业图谱,建立复杂网络核心参数(强健性,活跃性和流通性),经济资产中度量资金活性和贷款计提成本,动态定价。同时识别资金风险、关联交易等投融资黑洞。

资产评估到行为评估,供应链金融到企业关联图谱

早期的金融贷款是一种抵押物贷款模式,银行首先会对企业厂房、各种股票、汽车等资产进行评估,并作为抵押物来进行贷款,也就是企业的信用来自于资产评估。

供应链金融开始从交易行为中抽取事件作为评估依据,取代了传统方式用资产做信用评估的方式。比如汽车行业,一旦汽车厂向上游轮胎厂下一个订单,需要供应五千个轮胎,那么轮胎厂就可以拿订单找银行贷款,订单就可以代替抵押物进行贷款。供应链金融建立起来链条关系是线下的knowhow建立的,要看行业积累,靠从业人员的经验来确定上下游链条。

靠人为确定形成的产业链条只能发现局部关系。我们由此看到供应链金融的两个特点:首先,供应链金融已经跨越了一步,从资产评估走向了行为评估,但是链条依然是靠线下经验形成的,很难跨行业快速复制;其次,基于订单等交易事件的供应链金融,交易行为还存在一定偶发性,风险还是很高的,它更多依靠上下游链条企业的相关资质来评估。例如整车制造厂的规模多大,品牌知名度怎么样,他的订单置信度高则可以获得低风险贷款,但经过资金链传导多次的橡胶生产企业,其订单就很难获得客观信用评估。

如果供应链金融评估的是企业单次行为,那么是否可以累计更多行为,去构建新金融的关联图谱呢?

在实践中,通过使用某商业银行200多万对公账户的企业资金往来数据,构建一个真实的复杂网络,从往来的金额、往来频次和权重上构建实体与实体之间关系,把现金流往来回单表格中的2维数据,转化为矩阵操作,进行关系行为的量化。把每一个实体投影在全局中,把每一条链条都深入到网络中去,深化出一个更全面经济体的视图。构建全局经济视图就是从一次性的经济行为到历史的长周期的频繁经济行为的一个抽象,也就是我们构建“企业关联图谱”的过程。

企业关联图谱是对企业一个历史长周期内的事件的抽象量化。这个量化值是在全网络里计算的,这样得到的最后的结果,不是评估这一次的一个事件,而是N多个事件在整个历史周期里,依据网络结构迭代出的结果,可以平滑很多的偶发因素,所以会更客观更准确。而且这个值是在不断变化的,每一次新订单新的资金流的发生,都会对这个值进行网络的重新收敛,产生一个新的值,计算一个新的结果,所以它的风险模型和风险的指示输出是动态变化的,这样的评估体系会更客观,可以有效降低风险。

当整个经济网络视图形成的时候,就可以把其中所有经济实体做量化。每个经济实体的资金活性、资金回报率、资本计提的消耗,都是可以在量化关系里进行计算。

基于资金往来反映的历史周期里的常态性交易,可以量化的主要有两个方向:一个方向面向风险,一个方向面向利润。面向风险就是信用与评估;面向利润就是资产资金定价。以下是复杂网络所建立的评估指标:

复杂网络的评估坐标

我们抽取了强壮性、流通性、活跃性三个指标来构建评估体系,对企业的周期性行为进行评估。

强壮性计算节点在网络中的深度,越是核心(Coreness)的企业在网络中评估值越高。通过强壮性计算,可以发现经济网络中哪些经济实体的抗风险能力强,银行可以分析此类客户的信息发现其特征和共性,在将来业务拓展时尽力多增加此类客户,此类客户在银行的企业客户总数的比例也能直接反应出银行对公业务的整体抗风险能力,是对公业务健康稳健发展的垫基石。简单来说强壮性描述的就是网络里面最核心的企业点。当经济危机出现的时候,边缘企业倒闭的时候,生存在网络最强壮的企业依然能够存活下来,这就是我们所说的龙头企业,也可以标注谱聚类获得的行业群。

活跃性是指经济实体在整个企业图谱里的资金往来的频率,我们可以通过矩阵的方式多轮的迭代计算收敛得到企业的活跃性量化值。

从银行业务角度来看,节点所代表的企业客户的活跃性越大,则说明该企业业务量大且交易频繁,也能表达出该企业的状态良好且有壮大的趋势,是最有可能对银行业务需求量大的优质企业客户。因此通过活跃性分析可以提示银行需要重点关注哪类客户,做好关系营销、服务营销和个性化营销。举例来说,银行给餐饮行业放贷款,银行要怎么去获取客户,传统方式肯定是找知名企业,比如湘鄂情、俏江南、八国布衣、蜀国演义等知名企业。但我们通过我们的资金模型发现有一个企业不出名,但它的资金活跃度非常高。经过线下调查发现它是胡椒和辣椒批发商,每天有几顿的胡椒辣椒供应给上百家火锅店,他的现金流非常好,同样资金贷款,他周期短还款快,所以他的资本计提成本相对要低,定价就有优势。

通过流通性计算可以挖掘整个经济网络中各个供应链体系中的关键节点,因为大量的资金流动都会经由这些节点,所以这类企业在网络中处于关键地位,一旦企业出现变动将会直接影响上下游企业的运营状态以及整个供应链的生态体系。因此在整体经济形势发生重大变化事件时,银行需要重点扶持和关注该类企业,以免因这类企业出现问题后造成大面积影响,从而导致银行业务受损。

新金融从企业图谱中的获益

供应链金融从资产评估到行为属性评估的跨越,企业图谱从单次交易行为评估到长周期行为评估的升级。由行为联系构建成的群体智慧,为大数据金融提供了更多创新机遇。

第一个层面,直接与银行收益相关。如何获取客户,怎么发现识别优质客户,我们可以通过强壮性和活跃性的定量评估来定位到网络中的核心优质客户。也可以对相似网络结构属性的客户,做交叉金融产品的销售,提升或激活存量客户。

第二个层面,我们可以通过分析整个网络来进行风险控制,成本定价。比如某个节点活跃性值突然发生变化,梯度、方差超过行业平均水平的变化,那么它的经营是不是出现了问题。通过分析整个网络图谱,还可以有效发现资金闭环形成的子图,通过对各个闭环子图的深入分析,就可以有效的寻找出异常的资金来往,发现其中的关联交易;我们还可以通过实际的沙箱模拟操作发现潜在的投融资的黑洞。这些都是通过行为数据分析发现的,可以有效的帮助银行回避风险。

第三个层面,针对银行后端系统,通过整体网络分析怎么去进行一些流程性的改造。传统模型往往基于业务经验和规则,各种打分卡记录评级。而网络模型可以获得创新的业务实践规则。例如贷后管理的方式更直接来自于生产经营的资金活动数据,用数据定量的方式会对整个运作流程生成一个系统的变化。企业图谱对后端系统优化和合理化的持续改造提供依据。

个体个性化

商业银行、券商保险作为服务型企业,始终倡导以客户为服务中心,360客户画像或客户视图这些概念已经被讨论并在商业智能领域实践了多年。大数据带来的创新体现在哪里呢?一个简单的问题需要回答,那就是你服务的是“他”,还是“他们”。

成千上万的客户记录被复杂的数据仓库或是CRM客户关系管理系统组织起来,所有记录被统一存储,按照预先为所有客户设计好的格式,活生生的客户被行与列的条件约束在固定结构的表格里,变成一个个灰色头像隐没在数百万群体之中。大型商业银行数千万客户可以用一张表来描述,系统更需要关注群体的共性特征,或是整体趋势。

在有限的客户群体描述中,只需要定义普通客户、金卡客户、白金卡、钻石卡…, 基于这些有限的客户群体,金融精英们根据经验与最佳实践,设计出同样有限的商业策略或产品,分门别类的服务于这些群体客户。

如同我们生活在牛顿所定义参照系的世界里,基于有限事实得到的有限规则,这个时代的金融环境更强调规则和流程的重要,系统数据的组织和发现,更依赖于人的洞察和判断。有经验的专家、精英主导商业实践。数据服务于观点。

传统客户分析中也大量使用数据科学工具,例如模式识别、机器学习等统计分析和模型工具,但这些数据工具更多地被用来发现规则,而不是驱动一个商业实践的结果。例如:针对客户流失,传统BI方法通过账户金额变动等几个关键指标筛选客户,每天通过规则跑批的方式挖掘可能流失的客户群。这些关键指标往往通过概率统计手段获取,成为流失模型的核心。而大数据的做法是通过对历史流失客户数据的学习,获取模型,模型不可解释,但可以直接得到每一个客户的流失可能。

在规模化工业文明中,企业依赖于传统的概率统计手段可以帮助决策者回答yes or no的绝对问题。例如业绩销量、库存等的预测。但是作为服务型实体,企业需要更全面地与客户和市场交互,客户个体的偏好价值要远大于群体共性的价值,而个性偏好却是一个how much, how strong的程度问题,Fuzzy logic模糊理论方法要胜用于probability概率理论方法。通过移动互联实时干预反馈的客户接触,为每一个客户提供最佳服务。就像量子力学的测不准原理,干预手段也同样决定结果。例如客户对推荐的分期金融产品感兴趣的程度,接受产品的程度,也取决于个性化场景。

大数据对个体更细化的洞察与识别,不仅可以丰富金融产品,在多样场景中更生活化的服务客户,同时也在改变金融产品设计和服务的方式。

基于个体的主动金融服务

通过移动互联等数字化方式,先进的金融服务实体不断拓展自身的服务版图,无处不在永远在线的接触服务方式,在时间和空间上不断延展服务。在家里而不是网点做交易,在夜间而不受限于8小时工作时间内购买,金融行为越来越深度地嵌入生活场景中,客户不仅能够更自主地选择获取金融服务的时间和渠道,同时对传统金融产品的Inhouse专业生产方式,也发生了变革。金融产品的设计不再是由牌照资源所垄断的专有业务,由大数据平台推送给客户更多信息,消除信息不对称所带来的风险,客户不仅可以自主获取信息并决策,甚至可以主动参与设计金融产品。

在完全开放竞争、精英选择精英、粉丝社区化运营的网络经济中,基金经理的皇冠被摘取,封闭的产品设计逐步被开放分享的网络产品取代。面向更主动更多元的个体客户,与其纠结于多样化更出色的产品设计,不如利用大数据科技,转向消除信息不对称的专业数据平台营运。

C2B的主题消费金融产品

金融产品由谁来生产,B2C到C2B的换位,不仅是产品生产方式的逆转,金融产品的基础生产资料也呈现变革的机遇。

资产与货币始终是金融产品不变的生产资料,无论互联网金融外衣包装得如何华丽,“宝宝”类产品依然离不开货币基金模式。但在数据经济的创新商业形态中,数据本身开始成为新金融产品的生产资料。金融本质即在风险与利润之间的信息不对称而获益,尤其是大量的行为数据能够被持续记录和评估,风险可以被更精确地度量,接近利润最大化的产品定价。

从规模化工业经济转向数据经济,金融的属性也从最初支持企业生产,扩张到服务个体的消费金融。金融的静态资产要素也随之延展到动态行为要素。个体客户没有大型企业的会计报表可以评估,获取其房、车等资产数据也异常困难,信贷收益很难覆盖成本。但个体消费在移动网络、智能终端应用、电商搜索、支付等各个渠道媒介中,持续大量地留下痕迹,个性化描述客户的偏好、时空信息、支付能力等信息被系统沉淀、提炼出来,封装成创新的消费金融产品。

面对更碎片化的金额和周期错配,传统的产品设计和scorecard规则评估方式难以应对,大数据平台却可以充分发挥匹配撮合能力,并且很容易建立特地主题下的消费金融产品。例如定位贷款的目标群体,不仅能够识别学生、律师、农民这些组织形态清晰,线下推广便利的客户群体,还可以识别程序员这类行为特征独特,而线下分散推广困难的客户群体。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");