揭秘金融欺诈新兴手段及防范策略

标签:大数据反欺诈金融欺诈

访客:71771  发表于:2014-05-06 16:01:20

揭秘金融欺诈新兴手段及防范策略

                               孙迎燕, 丰田汽车金融风险部总监

演讲嘉宾:董骝焕博士, SAS中国金融反欺诈首席咨询顾问

董骝焕:第一点这个是个趋势,大家都看到,什么大数据,实际上我们做的事情,这几年来一直做的事情实际上很吻合大数据这个含义有几个定义方法,四个V,第一个是大的数据量,第二个数量,第三个速度,第四个价值,这四个V来说,其实我们在欺诈管控方面,都有一个非常重要的应用,比如数据量大,比如在信用卡交易的数据量,一天都是20个G,一天都是几千万几百万的数据量,响应时效非常短,需要在十几个毫秒内做出响应。另外一种情况是多样性,其实在我们这种申请欺诈的角度来讲,其实我们对于这个数据的多样性达到了非常极致的使用,我们会从多个角度去提取数据,最终为我们可以达到一些怎么样对这个欺诈申请的价值的挽回,防止太多的损失。所以我们把题目改成了大数据环境下的申请欺诈。

这一张是必讲的,这是SAS的整个框架,到哪都必讲,基本上我讲了这张我的任务就完成了。SAS对于金融企业金融反欺诈的管理平台,他是一个很大的框架,他能解决基本上整个金融行业的,尤其银行行业的汽车金融行业的各种各样的欺诈问题,首先,刚才提到信用卡、借记卡欺诈,交易层面的欺诈,还有三方支付的,还有很热的网银、电子渠道欺诈,以及内部欺诈,很多时候我们考虑一些欺诈的时候,多多少少跟内部欺诈相关,还有申请欺诈,也是我们重点今天要的,反洗钱,商户欺诈。今天主要介绍一下申请欺诈,在这一块对于欺诈第一个要侦测出来,侦测的方法、实时授权的效率是个重点。社会网络分析,刚才在微信平台上看到有人要介绍一下网络分析的应用,其实这个是非常好的案例。再往后,如果我们有了欺诈的侦测报警,怎么管理他,怎么优先级别排序,如果确认下来有嫌疑的,归类为一个欺诈案件,去跟踪定型,把结果返回回来,这是一整套的平台流程,这是一套完全可以开封即用的一套东西。里面的基础有SAS的商业智能、数据质量和数据整合,是SAS的最强项。

当然到这种对欺诈侦测的手段来讲,无非就是这几种规则,对于我们已知的模式,如果我们描述出来的话,我们可以很快的写出个规则出来,并且很快的部署到这个平台上去,让他快速去进行侦测的一个识别。同样的一层侦测,我们可以利用单独的或者汇总性的变量,对他进行比如说组成成分分析,比如时间序列分析,对等组比较这些方法,可以通过在没有我们的欺诈案件标签的情况下,可以尽量从异常的行为角度来识别是否有欺诈的概率。第三块是大家经常讲的,高级分析模型,有的是逻辑回归做,有的用神经网络,各种各样基于,我们有监督模型,基于这种已经有关的欺诈案件的侦测标的的方法来做出一个数学模型,然后部署到这个应用当中去。最后是我们今天重点介绍的,我们对于网络分析怎么样能够利用到对于我们欺诈侦测的角度上去。当然最终我们有个基础,整个SAS对于数据质量管控会有一套平台,数据进来了有可能是乱七八糟的,怎么样把它整理清楚,怎么样控制,比如说地址,怎么把地址识别起来。整个加起来,目前就是说从分析角度,从我们这种数学也好、统计学角度也好,各种方法应用在欺诈方面的这种应用。

对于我们欺诈总的识别流程来讲,自然而然也有一套在日常业务中或者运营中的大致数据流程或者决策流程,首先我们会有相应的客户信息,申请信息,三方信息,加以汇总在我们刚才提到的数据管理的平台上,把相应的数据放到SAS的分析平台上去做相应的建模,相应的建模再去部署到我们的预警引擎,预警引擎上有规则的,有高级分析的预警,还有网络分析的预警,这个预警会实时的或者跑批的去侦测这些可疑的申请或者可疑安静,进行报警,放到案件调查的平台上,由业务人员具体调查,如果说这个案件被确认出来确实有问题,反馈到我们相应的案件管理的平台,把数据再反馈做重新的模型的调整。这是分析平台闭环也好,它反复的,如果每天晚上做这样的训练,可以变成自学习,所以这种闭环的模型开发平台。同样的,这个是我们SAS对于整个闭环的一个方法理念,决策的执行和效果的反馈,数据相应,再重新去做数据的完善,重新训练调优,部署再决策,通过这样一个循环的返回,可以实现将来这个决策越来越精准,越来越有效,这个就是我们一个案件管理的平台,因为首先必须要有这么样一个平台来,在我们做完相应的分析,做完相应的模型之后,我们势必要有一个平台来管理这些案件,管理这些流程,管理这些用户的权限,比如说最终要做到在这个平台上让什么人在什么时候做什么事情,有一个明确定义,整个欺诈平台可以得到一个非常平稳的流向,做一个管理。这是整个的我们SAS关于欺诈的解决方案的一个初步的介绍。

我们下面就开始申请欺诈的详细内容介绍。其实刚才广发银行的龙女士也讲了欺诈和信用风险的关系,我们也有自己的理解,不一定对,我们认为其实在申请贷款或者申请信用卡或者车贷的时候,主要是问四个问题,第一个是你确实是谁,你是不是你申请的那个人,这个是防止第三者被冒充,你丢了张身份证被人捡了,人家拿你的身份证去申请。第二种,我确实是我,但是我伪造了一些我的信息,主要是让你觉得我很有钱,可以多贷款给我,或者我身上没钱,这个是我们人为的一方欺诈。第三个问题,你的收入是否稳定,当然这个稳定有主观因素,更多的考虑一个客观因素,比如你的职位类型,什么样的工作,比如公务员比较稳定。第四个是还款风险,在评分卡里面会有两个体现,一个是刚才所说的职业类型,第二个道德风险,很明显的,女生的分比男生的分高很多。当然并不是说女生一定比男生收入多,实际上有的时候更多的是考虑还款意愿的情况,或者男生对还款的压力比较大。从这种角度来讲,实际上对于A卡,因为A卡一般来说是做信用评分的,我们认为需要有一种从方式上的切分。因为我们觉得A卡肯定是针对与信用风险的,但是对于反欺诈的角度来讲,我们希望更有第一方第三方团伙的欺诈的识别。第二角度从标签定义,第三个是标签要求,在信用风险的时候,我们需要有好和坏的两种标签,但是在欺诈识别的时候,我们主要是要坏,如果有好标签也可以,未知的也可以,但必须要有坏标签。技术方法,一般就是决策树、评分卡,对申请反欺诈基本上属于八仙过海,各显神通,拿什么都可以用。技术目标也不一样,一个是尽量把好和坏区分开,但是申请欺诈或者反欺诈的角度来讲,我要把坏给识别出来,或者识别出来大部分不一样的类型。业务目标也不一样,对业务目标来说,信用风险的A卡来说,他主要是为了比如说审批的自动化,比如说一致性,但是对反欺诈来说,我们一定要抓得准。第二,因为欺诈有的时候不能赶尽杀绝的话,太高的欺诈成本,使得他无利可图,这样可以使欺诈风险大大的降低。同样开放性还有技术指标、数据使用等等,尤其是数据使用这一块,我们一会会详细介绍,比如对身份识别、地址识别、信息验证的技术。

回到主题,大数据,上面这块是属于数据量的巨大,其实我们今天不是想讨论这一块,主要是讨论下面这一块,多维度,因为对于申请欺诈来说,更多是希望从多个维度来了解你到底是谁,你到底有多少钱。在这种情况下,我们很多情况下,比如说会利用三方的数据,比如像征信,还有公安部的数据,类似的一些卡交易、流水、工资流水还有一些企业的信息,还有通讯信息,比如你能拿到他的电话号码通话的记录或者通讯费用,哪怕汇总的信息,比如通信的半年的费用、频率等等,还有公积金等等这些角度,我们可以从这些角度各个方向来探测这个人到底是不是他,这个人到底他到底有多少钱。我们拿到这些数据,存在一个问题,各种数据的来源格式不一样,不做任何的申请欺诈,这是一个基础,我想很多银行应该都做了这方面的工作,比如说用关键字来做匹配,来做自动模糊匹配,这块SAS也有相应的模糊匹配的算法和平台,我们对于相应的中文的字符串包括姓名、地址、身份证号、单位名称等等相应的字符串,都可以进行模糊匹配。匹配的结果是相似度,把一个非定量的信息转换成了一个定量的信息。这就是SAS中文模糊匹配的平台,可以实现一个决策流或者一个数据流方式的开发,界面也非常友好。对于中文模糊匹配最难的地方就是地址识别,两个地址的匹配,SAS的角度会从对于这个地址的切词,对地址段模糊的比较,然后再计算它的加权相似率来比较,比如上海市斜土518路,和上海市斜士518路,可能会造成数据错误匹配模糊的地方,这个就需要我们模糊的识别,许多进行字符串的打分,这是一个最简单的方式。对于字符串的算法有很多种算法可以实现,比如可以计算字符串夹角,最简单的就是一一比较,差一个字就扣多少分,对于各个词段的相似度计算,形成这样的权重,最终权重的一个总值的计算,可以实现整个字符串总分的计算,这就是SAS的一个中文模糊匹配的简单介绍。

有了这种算法以后,我们可以实现对刚才我们谈到的大量的数据进行定量化的计算,有了这个相似度有什么用,我们每一个申请人都会有若干的信息维度,我只要能够实现相应的匹配,比如我这边的身份证号配上了,就可以形成一种间接的关系,这种关系就是一个关联或者叫链接。往下是链接分析,如果有了一个链接,可以把相关的链接都扩展出来,形成一个个小的链接网络,这个链接网络有什么用,第一个是黑名单、灰名单、白名单的匹配,还一个是可疑的链接模式,在一个小的链接里面不应该这样链接的,不应该有这样的网络,是违反现实的情况的,但它出现了,这就是一种可疑的。

刚才介绍到,目前来说大家讲的链接网络分析,或者叫链接方面,整套的分析基础是基于图论来发展出来的,从学习整个实体之间的关系的复杂网络,抽象成一个图论,图论里每一个点代表一个人,代表一个人与人的关系,定量成一个数学模型,或者叫图论模型,当然有一些具体概念这边就不太详细介绍了。主要的概念是点、边,边的数量、点的数量,边的密度、点的密度,都是一些图论的度量,这些度量对我们将来的欺诈分析会有很大的帮助。为什么这么说,当然我们这边复杂网络分析刚才介绍了一些指标,度的分布,点的边介数,聚集系数网络直径等等这些图论的指标,再结合我们在这个网络里面的一些统计指标,我们可以组合出来一些风险指标。这个就是我们一般SAS做复杂网络分析的一个分析流程,抽取在这个平台上做,相应的这些文本,我们可以引入一些文本分析,定量化一些文本,把这个结合起来,我们的实体做出一个单个实体的矢图展现,合起来变成一个链接网络,利用我们图论指标,对这个网络切割也好、分析也好,W对它定量化的欺诈风险的模式识别,整个的流程可以在这个平台上实现。

举一个例子,刚才说了有一种方式叫可疑的模式,这是一个真实的例子,发现有一个申请,小玲是申请人,那样写的她的配偶是小明,扩了一个礼拜,小明又来申请了,申请人叫小芳,这个事情也无所谓,因为有可能,实际上他们发现这两个人的电话号码是一样的,而在申请的时候,由于他是单个申请考虑的,没有画相应的网络,所以当时没有识别出来这两个的风险,如果有这个链接分析帮助他看一下的话,这是一个违反现实状况的例子,这是一个可疑的例子,这个也是后来发现之后,把这个规则写到了前台审批的决策流程里面去了,这种可疑的模式可以通过这种链接分析把它发现,固化下来,变成相应的决策去执行。

第二个是链接分析的典型应用,如果我们进来一个新的申请人,他关联上了一个网络里的电话的手机号码,势必这个申请也要被调查,不管怎么说你不是拒绝他的话,也要调查他的背景,至少跟黑名单相关的链接网络是有关系的,还一种情况为什么复杂网络分析会帮上忙,是因为在一般的实践或者理论中,一般认为欺诈网络的复杂程度会远远高于正常的网络,当然这是一个研究的数据,研究了这种对公的信贷,当然这不单是欺诈风险,他们了解到如果独立的信贷企业和有复杂关系的信贷企业网络,比如有互相的担保关系,有非常近的高管的关系,或者互相投资的关系,他的风险是完全不一样的,甚至这个事情实际上在江浙一带已经发现了,一些小企业之间互相担保,互相串通,更多的来申请一些贷款。这个可以通过我们识别欺诈网络的复杂程度来区别正常网络的风险。这是一种复杂网络分析的应用,我是静态的看这些网络的指标。还一种是动态的,随着时间的增长,这个也是一个比较有意思的案例,在申请一些小贷或者互联网金融小额贷款的时候,有的公司或者银行可能需要他提供一些工资流水和消费流水,实际上他们会发现,在某些银行或者在某些申请贷款的地方的楼上就是一个中介机构,这个中介机构就可以帮你办这些事情。这样就可以发现,比如在一周两周三周之后发现这个网络长得很快,第一周是这样的,有一个人从这个公司帮他办了流水,过一段时间又进来一个人,再过段时间又进来一个人,会发现一般欺诈网络随着时间的增长会远远快于正常的网络,正常的网络是一种随机的概念,样子会比较随意,一两个点会连起来,不会增长幅度特别快,怎样衡量增长速度,这些都是一些图论的指标可以完全来识别的。而且他们在我们一些同事有一些比喻,这种欺诈的网络就像癌症一样,长得非常快,远远高于正常的组织,这个就是风险的很好的度量。

我们今天主要讲的是最后一种方式网络分析这块,我们用了这些方式之后,我们是要实现这种对于风险的多重过滤,从规则也好、模型也好、网络也好,来提高风险识别的准确度。下面有请我们丰田金融的孙总。

孙迎燕:谢谢,我其实应该是接着他讲的,因为我们刚刚听到骝焕讲了很多技术层面的事情,但是这个东西到我们业务层面,这是我长期以来一直在思考的事情,很多的模型,很多的技术,他在那里,但是真正要落到我们业务层面,其实是很困难的一件事情,因为首先要知道这个模型和技术有没有对系统的改造造成一些影响,第二个,可能要考虑到这些技术和模型对我们的流程会不会造成一些改造,这个改造背后带来的是一个人的价值的一个改变,人的行为,就是我们业务人员审批、运营人员他的行为的改变。这些改变是不是符合我们业务在发展过程中的一个价值的趋势,这是我们一直考虑的一个问题。所以为什么在初期阶段反欺诈的一些手段不会很好的得到运用呢,这是因为我们的业务是在增长时候,它更多的是看到业务的速度和快速的让业务起来,当发展起来以后,接下来考虑精细化作业的时候,就会想到比如说决策模型,比如信用审批模型,比如反欺诈模型,以及后台的催收模型,以及更后台的客户交叉销售的模型,怎么样使业务在现有的基础上,他更加精细化的落到实地,而且在现在有关资源上不断挖掘现有客户的资源,使我们每一单的客户利润最大化。

这只是我的一个开场白,我在思考的过程当中也要融合到我们丰田金融自己的一些业务特征,所以想介绍一下丰田金融的特征跟一些银行和我们一些同行是不一样的,首先是丰田金融,我们是一家汽车金融公司,也是由银监会监管的,但是他同时又带有丰田的品牌,他是丰田整个汽车销售价值链的一个不可或缺的一部分,所以他的价值,我们这个丰田金融是为了让丰田车的销售达到最大最可能最快的成长的目的而存在的,这是一种风险偏好的一种选择。所以跟我们银行的车贷的风险偏好是略有不同的。所以在做信贷审批的时候,我们可能更加看重的是什么,这个客户是不是在买丰田车,是不是一个真正的丰田车的使用客户,银行会看更多的一些客人资质,这些我们也看,但是我们看的面会和银行普通的传统意义的贷款公司贷款银行的做法略有不同。所以在这个层面上,丰田金融的优势在哪,我们有经销商,因为我们是丰田的一个环节,所以丰田的经销商是我们非常好的一个合作伙伴,因为他们都是我们价值链的一部分,在这个基础上,但是要考虑到另外一点,经销商的兴趣是卖车,因为他们是靠车辆销售来获得利益,但是丰田金融是靠贷款,贷款贷出去的资本,利息收入达到那个收益。所以这两个其实是有不同的利益取向的,在这个过程当中是非常有意思的磨合过程,我们怎么样跟经销商的合作环境,以及我自己的价值链之间的磨合和匹配。另外一个角度来说,我们丰田金融在欺诈风险是有的,因为我们的单单自己不是我们自己的员工去收上来的,是通过丰田金融授权的丰田经销商来收取的,这里是非常有意思的一点。在这个基础上,第二点我们讲客户层面,客户层面的风险其实跟银行和我们很多的同业看到的是相差不多的,客户的造假、欺诈风险无非就是第一方欺诈、第三方欺诈,其中我最想讲的是,风险最大的一块欺诈风险,往往是我们看到的一种团伙欺诈,这种团伙欺诈我们平常会看到地铁或者说电线杆上贴一些小广告,说零首付、零利率等这种小广告挺拔多数的,而且我发现去年一段时间特别多,包括网上都有这样的一些广告。这些背后或多或少真的有一些担保公司在做真正的业务,但是不可避免的也有一些中介公司,他研究透了你的风险政策,他知道了你的金融公司或者银行对这些客户的一些基本的准入门槛以后,他开始造假,批量的造假,他帮你做一个虚构的社会环境,把这个人代入进去,让这个人借款人贷了车贷,拿到车以后,通过第三方、第四方下去把车卖了,然后他可以收取利润,这个借款人本身也是受害人,但是他出于某些利益或者短期目标,这时候出现了这种现象。这种团伙欺诈往往不是个案,要来就来一批,而且是短期内的区域性的来一批,它的区域扩展模式非常快,从一个地方会串到另外一个地方。这是我们面对的第二个挑战。

第三个是我们自审的时候发现的挑战,审批里面有两种大的模式,一个是分支机构,我记得是在几年之前银行都有自己的分行,分行在做贷款业务的时候,由银行的分支机构直接有审批权的。还有一种是像信用卡这样的集中审批,完全一个后台审批。这里面各有优缺点,我的理解是在分支机构或者有自己的一个地域性的审批的话,有一个非常大的优点,你信贷员本身或者审批员本身特别熟悉这一个环境,这个地区,那么对识别欺诈,对识别哪些人可能在哪个环境里面的一些特征是比较容易去判断的。但是他有个缺点,就是我们所说的手松手紧的缺点,尤其当我们要考虑怎么样更好的大家统一的标准化流程的时候,审批员的手松手紧可能会对我们的整个审批环节包括通过率的质量会有不同的影响。还有一种是集中审批,最大优点是快,就像一个流水线一样,每一个流程自己都有一个工作岗位,全部做完以后送到下一个工作流程,第一速度快,而且标准化流程。第三个,其实最好的一个就是当业务量有一个峰值和峰谷的时候有一个很好的均衡,一旦出现申请高峰的时候,我们马上可以派更多的人在加班加点的情况下,在不影响审批整体质量的情况下,能完成工作业务,因为对我们的业务模式来说,审批的效率也是考量我们这个丰田金融核心竞争力的因素。这些是不同的优劣点,我们在做新的策略的时候,包括引进一些新的业务的时候,必须要考量的一些问题。

这时候我们看到一些问题以后,这是我们传统意义的申请的一个数据的工作流,一个数据流。为什么把申请数据变成一个不同的颜色呢,因为我们觉得申请数据在目前丰田金融的环境下,申请数据是为经核实的,是直接在经销端内获取的。后台的蓝色数据都是我们比较靠谱的,PBOC的数据,然后我们外部的信息,比如说公安部的信息,这些是属于外部信息采集的,通过采集好这些数据以后,扔到打分模型里做评分卡决策,评分卡往往考量的两点是还款能力和还款意愿。这里面有个最大的问题,现在我们认为可能已经影响到我们业务下一步发展的一个重大的挑战,就是这个黄色部分的数据,大家知道,一个模型,真的数据进去才会有真的决策,假设有一个人使用我的人口信息,来扔到这个人口模型里,他会得到同样的分数,但事实上他并不是我本人,他用了他的身份证,用了我的所有的类似的信息,但是他并不是跟我有同样背景的人,他会得到一个非常好的打分,这其实是我们不想看到的一部分。所以说我们现在考量引进的就是一个反欺诈的模型,这就是为什么我们跟SAS公司有一些碰撞的地方,因为第一件事情考量的是我们的模糊匹配技术,有一些信息我们认为是靠谱的,PBOC信息以及一些第三方的我们采购的数据信息,这些信息是核实过靠谱的信息。假设这些数据跟真实数据不一致的话,我们会跳出来,但是一致的话,我们会进入第二个环节进行打分,所以说在第一个灰色部分,我们先做的是,我们考虑要做的就是模糊匹配,进行信息一致性的检测,检测的目的是我不见得能够完全择劣,但是能择优,如果一致性完全可以匹配的,我们就可以迅速通过模型,做到完全自动化的决策,这是我认为这个模型比较有意思的一点。

到了第二个部分,侦测部分,这其实是非常难的,为什么呢,是因为规则,规则其实很多是通过大数据挖掘,但是从我自己的经验感受来说,挖掘的背后必须会有一些痛,我们要说他是坏,必须验证他是坏,所以我肯定会遭受一定的损失。在遭受损失的基础上,在这个教训当中,学会如何吸取较,然后输入到我的第一个灰色地带里去做规则。规则不断的自我更新,我就变成了更多的灰色的一些规则。第三部分就是调研,调研其实应该是跟着我们慎用决策的一个环节一起匹配出来的,为什么呢,因为首先信用评分我们知道这个客户的还款能力和还款意愿,如果我们同时也知道这些信息的有效性,我把它做成一个二维的审批的策略,如果发现它又是一个比较高的有可能很低的一些客户,同时他的信息又是真实的,那么我们的调研步骤可以跳过了,但是如果说他的欺诈风险就是说灰色出来的分值是很高的,是高度疑似信息不真实的客户的话,我可能要把更多不同的审贷的策略放进去,可以上更多的家访,可以放更多的第三方的调研,派更多的数据获得其他的数据来验证数据的真实性,最终还是回到我们的信用决策里面去。所以这个黄色部分,其实匹配的是每一个决策模型出来的最后的行动方案,这个就需要我刚刚说的,一个数据模型出来以后,肯定会跟我们的运营部门,我们的IT系统部门进行磨合,磨合的背后就是说我们怎么做,怎么把它落到实地。这是我觉得在探索这个过程当中比较大的一个感触,当然这也是一直在思考的过程,只是一个初步的探索性的一个尝试。其实真正要说他有多好或者他给我们带来多少收益,最好的也是希望在模型上来以后还有相应的收益模型的监控,这就是题外话了。

我讲到这里只是讲到实时部分,有一些东西,刚刚董博士一直在讲网络怎么做,网络我们也想做,怎么做呢,怎么落地呢,这是比较难以回答的一个问题,因为我们的业务模式就是车贷,作为丰田金融的业务模式是希望我们能够做一个实时信贷决定,及时反馈到经销商那里,然后经销商可以继续下一步的车辆销售流程。应用网络必须要考虑大数据的运算,对运算的效率,他就会要求很高,投入的成本会很高。所以网络的话,假设这是一个网络希望看到的结果,就是一个周期过来,从一个经销商A过来,进来以后发现他有些问题,但是当时还没被识别,后面几个案子一起出来,可能他们就是一个团伙,非常高度疑似。这种报批在什么时候做,怎么做,这是需要我们在实际去实施的时候要想的,他对我们的流程,尤其是对系统的运算能力的构建,如果他放款了,你怎么把它收回来了,这是我们正在考虑的一个问题。其实很多东西都不是特别成熟,所以我希望业界的各位专家各位同行,如果有兴趣的话可以一起探讨一下,这就是我今天的发言,谢谢。

提问:丰田金融在运用金融防范策略时的挑战和机会是什么?

孙迎燕:我觉得这个问题是很大的一个问题,挑战刚刚我列出来了,但是机会来说,如果说我们能很好的把这些坏的不是真正来申请车贷的客户能够在第一阶段把他识别出来,也许对我们的业务,对整个丰田汽车的销售包括我们的丰田汽车车贷的一个申请和最后的通过和整个资产的快速增长,会有个非常大的提升。

提问:拒绝申请的百分点现在有多少?

孙迎燕:这个是相当低的,但是他的后果是很严重的,假设我这个车我们是按照车辆的售价,然后首付比例,平均的贷款余额是十几万,所以我们的整个百分点远远高于信用卡的百分点。

提问:链接分析和复杂网络分析的区别主要是什么?

董骝焕:链接分析应该说是要做复杂网络分析的话是一个必要的步骤,需要把点、关系,所谓的点就是实体,关系就是所谓的边,把链接网络画出来,在这个基础上我们才能对这个网络,我们所谓的这个图去做相应的图论的指标计算,统计指标计算,结合他静态的图还是动态的图,做出相应的指标的计算,基于这种,利用这个图的指标计算的方式,我们就叫复杂网络的分析。链接分析更多的我们理解是从后往前推,比如说简单的,刚才讲的,这个就属于我们后期发现了,再把这个问题重新研究了一下,把它会到我们决策的引擎上或者写成一个规则,这是一个很典型的链接分析的应用。还有黑名单、间接黑名单,我把这个网络关联到一个黑名单,整个链接网络都是可疑的。大概是这个意思,而且这个概念这个方法都在不断的进化的过程当中。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");