大数据是否真的可以降低P2P风险?

标签:大数据风险热点P2P

访客:21155  发表于:2013-12-20 16:38:02

【导读】业内在讲到互联网金融,尤其是P2P的时候,特别喜欢提到大数据,大数据可以帮助投资人降低风险,果真如此吗?来自P2P Lending Advice的一篇文章认为,迷信大数据是一个误区,因为P2P借贷中的很多问题大数据可能无法解决。

大数据是否真的可以降低P2P风险?

大数据并非无所不能,你需要了解下面四个关于P2P借贷中大数据的重要因素。

要素1:大数据只能代表过去的表现

任何一个曾经通过中间商出售过(或尝试出售)共有基金,股票,债券或其他投资的人都听到或看到过这样一个主题“过去的表现不能代表将来的结果”,确实如此。我们从历史记录中获得的借款人的重要信息,比如支付记录,FICO信用分和负面信息 ,只能代表他们过去的表现如何。如果他们曾经按时偿还了贷款,并不意味着他们也会按时将钱还给我们。但是这增加了偿还的可能性,特别是如果没有重大变故(如失业或生了重病等)的情况下。没有人知道未来会发生什么,这些信息并不具有预见性,它们只能反映过去。

要素2:贷款资金池可利用数据少且有时间局限

拿Lending Club来说, 从2006年一开始到2012年11月,他们发布的贷款总量第一次达到10亿美元。仅6个月后,在2013年5月,他们的贷款总量上升到了20亿美元。而在2013年11月,在他们首次达到10亿美元贷款总量的一年以后,他们发布的贷款总量又攀升至30亿美元。(相关文章) 这意味着,在不到一年的时间里,他们完成了现在贷款总量的2/3。有些人会说,从这些历史记录中,我们并不能获取有意义的信息,但更多人会认为我们获取到的最有意义的信息是早期支付违约的可能性。贷款资金池的长期数据中我们真正能用得着的很少。

我们的贷款投资组合最大的敌人是早期支付违约(在支付期前6个月内出现的违约)。我们现在有价值20亿美元的贷款在至少6个月后才能看出谁支付晚了,谁早期支付违约了。另外,由于被发布的贷款时间限制,很难从中获取所谓的有意义的数据。

要素3: 大数据各个孤立的因素是相互支撑的

数据的应用性很大,以至于你可以搜索星期四一天,加拿大地区,借款人的信用分有750,用于债务合并的贷款。大数据的一个所谓的好处是你可以利用它研究任何有意义或可能有意义的变量。这些变量中,我们在这里讨论的包括FICO信用分,负面评价,公开呈报,所在的州,拥有的住房,工作的时间等等。这些信息是好还是坏呢?好处显而易见,我们可以研究那些我们觉得重要并且能够降低我们风险的因素。

存在的问题

大数据处理的问题是这些变量都是分开的,如果把这些变量放在一起,我们能获得很多有意的信息,一旦分开,这些变量就贬值了。

比如说,信用分依赖于我们之前讨论过的许多因素,包括偿还记录,负面评价,公开呈报,资信调查,有效的信贷循环以及债务与收入比。当我们筛选信用分时,我们已经综合考虑了这些因素,如果进一步考虑孤立的变量,实际上是多余的,甚至有害于筛选条件的质量。因此,如果我们选择的条件包括信用分较高且没有负面评价两项,尽管我们已经知道没有负面评价会提升信用分,但我们依然重复计算这些因素而不是考虑其他信贷因素,这其实是多余的。

要素4:相互关系并非因果关系

科学家和研究员对这个短语比较精通。意思是,如果2件事物是有关联的,这并不意味着他们之间一件事情发生就会导致另一件事情也同时发生。这里讨论的一个很好地例子是,我关于以州来筛选贷款的帖子。我们之前讨论了加拿大地区违约率最高,同时它还拥有迄今为止最高的贷款成交量。如果你仅凭违约率最高,就将它从你的投资策略中筛除,那么就意味着加拿大地区所有好的贷款都被你拒绝了。这就好比倒洗澡水把婴儿也倒掉了。

信用分也是一个很好的例子。我们会很自然地认为公开呈报会减少借款人的信用分,也确实如此。然而,影响的大小取决于何时何事。5年前的个人评估不能作为对借款人6个月前情况的判断依据。 6个月内的公开呈报对借款人信用分的影响比较明显,其他方面的对借款人信用分和我们对其支付能力的看法影响较小。

总结

你不仅不需要一名优秀操盘手的数据资料,并且如果你没有那更好。因为当我们面对所有可用的大数据时,我们很容易陷入一些我们都可能陷入的误区。如果我们能铭记以上所有要素,当我们分析数据时,我们将会比P2P借贷领域里的其他投资者更胜一筹,同时能更清楚地意识到我们贷款组合中存在的风险。(来源:网贷之家)


评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");