大数据对宏观经济及金融行业的支撑与分析

访客:98881  发表于:2014-09-12 10:27:27

    在2014中国金融云平台峰会上,国家信息中心的李良博士也对大数据时代金融行业的宏观经济进行了分析。

                                                   (李良)

    李良:今天很荣幸跟大家讨论大数据的问题,在座各位也看到几位朋友和前辈。很高兴,今天都是互联网的,金融方面的,包括大数据方面的专家,那么对于我来讲的话原来跟赵志宏学信息管理方面。结合我现在工作的一些情况对大家讨论一下关于大数据环境下宏观经济的一个分析。
    我们今天各位讨论比较多的大数据产品创新,然后风险管理。我们往往会考虑这个产品的环境,风险的环境是什么,这里面很重要的一个环节,就是经济环境,对于我们来讲更多要考虑宏观的金融环境的分析,宏观经济环境对于国家来讲,垄断一个是财政政策一个是货币政策,比如说财经政策如何拉动带动我们经济环境,如何用货币政策调整我们整个行业,金融风险是当前我们关注的问题。
    但是数据比较多,比如我们财政政策问题,比如一个国际环境,我们汇率问题,包括我们税收,现在谈的比较多的像阿里,这两天他们做IPO,阿里做的当前比较热门的互联网金融话题。作为互联网金融的话题如果给他更多财政调控手段,税收,货币政策方面干涉也好,或者是调整也好,那么对于当前的所谓互联网金融的发展产生很大的影响。我们想过没有,比如说在淘宝上收税的问题,我们在大量互联网金融公司,当前在做创新,假设说赋予它账户的职能,假设说给它提出更多的要求,那么它的发展会有什么情况。所以说经济环境,经济政策包括宏观经济对于当前互联网金融大数据发展都有影响,我们今天探讨关于宏观经济的问题。
    我们看一个影响,对于当前来讲宏观经济分析用四个大的指标:?
    当前CPI关注一个指数,对产品怎么确定,怎么考虑这个产品根据时间的变化,价格的变化,经济周期对它的影响,而产生的CPI,当前并不是十分准确,有些人提出更多的想法,说法,这就需要我们更多关注它的高频率的一个大数据,全数据环境下CPI测量,测算的问题,这是我们要考虑的。
    失业:
    我这两天在微博上看到新闻,淘宝网的网店也算就业,失业率大大降低,我们央视的说法,是否合理,从这个视角来看,对我们当前认定和判断,在互联网对经济影响的环境下,是我们要考虑的问题。
    另外国际收支,这也是我刚刚看的,也是一个微信,说美国根本不欠中国的钱,为什么这么说呢,我们知道我们中国在美国有几亿的国债,按照各自对对方总资产量,至少一万亿美元,这是他的一个理论。有人说,不能只看债券,债券只是各种投融资部分,各种不同视角,按照我们常规方法,咱们先不讨论这个观点对还是错,这个给我们一个启示,我们看从各个角度,除了正常的经济指标以外,还要看影响,包括整体来看,大数据。也就是说,为什么要讨论,金融行业大数据。
    所以说刚才说了,大家都是互联网方面的专家,金融,大数据的专家。我原来也从做风险管理,现在尝试关于大数据在宏观经济应用的一些情况;另外一点国家信息中心对大数据的应用。
    为什么会有大数据:三个关键因素:一是信息化发展,另外互联网发展。特别是互联网发展对我们交易形态、支付形态、经济形态产生了影响。大数据我认为最为核心一个影响就是我们的物联网,物联网就是通过感知,比如说它最核心的观点,通过不同感知终端来获取不同数据,除了我们常规数字化的数字化以后,更多是一些非结构化数据,你的感觉,你的视觉,包括你的一些言论,这些都是对大数据产生的。
    我们原来说风险管理,对于数据历史,要做全数据,但是我们那时候感觉数据是不够的,那么现在来看,我说到底数据够不够呢,仍然不够的,首先内部评级,包括巴塞尔的要求,不是全球都接受的,美国仍然没有接受它的要求,它认为这个框架并不合理,你衡量标准,你的方法,框架模型并不是能反应出我们金融风险实际情况,也就是你的数据量不够,不在于我的数据多少,而是在于你的覆盖面,跨度,CPI,以前我们数字来自于交易,我们交易时候终端,比如消费的收款台,现在我们数据来源于哪儿,除了收款台我们还有二维码的数据,电子标签的数据,对产品生产日期,数量,产地,形状,甚至一些特性,包括物流的一些环境都会有一些信息描述。对于这个情况下,我们准确判断,这个价格,比如说我是有机产品,比如说白菜,普通的白菜,价格不一样。怎么确定,在商品确定方面给予很好的帮助,我个人认为物联网对数据感知,对我们大数据产生和发展产生了影响。
    大数据产生以后对于数据获取过程实际是一个交易过程,它会存在变化,对我们整个商业行为产生影响,对我们整个经济环境,互联网时代不仅影响信息化,而更多对我们经济影响产生了重大的冲击,不是对金融,而是对消费行为,支付行为,金融行为,这是产生大数据这个原因。
    也就是说另外一个问题,我们讨论,为什么经济方面用大数据方面分析,?我们经常说我的分析结论就会越准确,还是感觉不够,不是说数量不够,而是跨度不够,也就是说传统经济研究方法,就是通过假设,得这种结论,现在更多提到时政经济学,数据产生的环境,也就是说,在我们传统上通过时间?,它是一个纯粹的结构化的数据,有必要的清晰经济学的含义。但是大数据分析环境来讲通过一些非结构的数据,比如文档,包括视频,图像,以及你的感觉,这是难以用表格来体现的,更多维的展示方法,通过分析方法对我们经济情况形态进行分析。因为我印象连续有5年的诺贝尔经济学奖跟行为有关的,相关研究的,所以说经济学发展在样板上来讲不一样,变化有影响的。
    但是说他们之间也有很大联系,不管大数据环境下进行分析,还是传统数量情况下进行分析,它的最核心从概论和数据统一,但是这个远远不够,这是技术方法。也就是说任何我们的研究都是有限的,如何通过我们现在当前大数据,如何通过数据挖掘,发现新的问题,经济学研究的发展,比如说有的专家说了,比如说将我们所有的数据进行整理,进行大数据的方法和模型,也就是说进行深度挖掘,得出更多的一些结论,得出更多的知识。
    举个例子比如样本数据,直接的对比数据。对于总体数据来讲,比如我们货币发行量增加500%,超过了美国,这个数据不仅仅通过统计数据,更多通过各个方面的数据,我们中国还欠美国一万亿美金一样。
    也就是说大数据在处理过程中,大量数据,大量数据不等于大数据,大量数据和海量数据下我们分析仍然不准确,还是存在误差,并不是完整的数据,对于数据描述,我们说信息化里面对于一个物品或者是一个事物精确的描述,我们说常规的结构化描述很难描述,未来有大量的数据用大数据来看。
    关系数据库是数据稀缺时代设计的
    通过报表,通过我们信息化的过程,电算化到我们一些手工文字转化为电子数据,电子数据以后通过这种数字的数据来代替。数据库产生变化,我们研究方法产生变化,所以这个准确度还是不准确。
    算法的进步快于芯片,大数据优于算法
    大数据的核心是预测,在当前复杂多变的内外部经济环境下,诸多机构都面临着经营环境变化、各类风险上升等众多问题。 相关职能部门如何以最快的速度收集信息,定位所需,发现危机,跟踪事态发展,实时向有关部门通报,快速应对处理,成为预警和规避风
险、提高资产质量、扩大利润空间和提升核心竞争力的关键。
    利用互联网信息采集和文本挖掘技术,加之人工智能研判,及时、全面、准确地从海量信息中监测、汇集、加工各机构所需的经济情报预警信息。
    当前情况下它的分析角度,同样分析不一样,有效的预测。运用互联网的信息采集和文本挖掘,加上人工智能进行新的预测。
    我们可以总结一下,这是中科院做的一个课题里面,大数据经济领域应用的三个层面:
    微观层面:企业推动,精准营销、生产运营;
    中观层面:典型行业
    宏观层面:宏观经济状况的反映、指标预测
    国内外经验
    IBM日本公司建立经济指标预测系统,从互联网新闻中搜索影响制造业的480项经济数据,计算采购经理人指数的预测值。 
    印第安纳大学利用谷歌公司提供的心情分析工具,从近千万条网民留言中归纳出六种心情,进而对道琼斯工业指数的变化进行预测,准确率达到87%。 
    企业发展工商指数的样本来自国家工商总局“金信工程”构建的国家经济户籍库,该库已经覆盖全国所有市场主体,包括5500多万家企业和个体工商户数据信息,涵盖企业成立、成长、发展、消亡全生命周期数据。在指数构建过程中综合考虑并结合规模、行业、主体类型等维度,初步设计了32个指标,经数据分析验证后,最终选择了10个对宏观经济具有显著先行性的指标合成企业发展工商指数。 
    经济情报预警
    运用互联网信息采集和文本挖掘技术,针对银行机构所面临经营环境变化、信贷风险上升等问题,通过计算机自动搜索加专家分析,向客户提供包括:可能导致行业和企业风险加剧的宏观经济形势变化或政策法规实施信息;行业风险预警信息;企业信用恶化预警信息;法律纠纷信息;突发及重大经济事件;贸易摩擦和纠纷等银行所涉及和关注的风险的快速识别与定向追踪,以及相关敏感问题的快速识别与定向追踪功能的预警情报系统。
    一种知识嵌入型软件即服务平台,强调对海量数据的机器学习与行业专家知识相互协作的知识运营与升级机制。 
    通过自主的方法进行判断,另一个方面通过专家不断进行调整和预测,除了结构化数据挖掘,还有非结构化数据挖掘。人的知识结构与计算机技术深度融合进行处理。我们说一些非结构化数据,中文分词及智能处理技术。
    财经综述、行业预警、企业预警、地区预警、警示公告、专业定制
    这个过程是通过从各个信息源的采集,包括新闻,论坛,包括网吧,包括博客,微博社交平台,信息采集和集成的方面。尤其是符合我们一些统计分析的及时监测。
    另外一点它的数据库统计数据采集接口,是一个准确,监测,发现,比如说关键点对于对热点,敏感点。主要是基于这个话题监测和跟踪,对当前热点话题。针对新闻信息识别,挖掘,组织,也就是说这个咨询主要是各类传媒机构。我前一段时间大概组织十大网站,进行网络信用评价的分析,基本上对于主要的产品,原来我们主要的人民日报,现在主要是网站,百度,新浪,搜狐,新华,人民网等等这些大的,逐渐作为重要的一个传媒渠道,信息更实时。另外基于语意分析,最后到金融机构内部,客户评审和评价系统,它这个客户在行业内的表现,比如说这个客户,它的上游企业,下游企业包括消费者评价,它有一个统一的,通过这种预警平台,识别平台,通过社交网络,新闻媒体,甚至行业分析,包括政策分析,包括区域分析,评价,这是一些方法和手段,下面我们主要对信息中心解决方案,宏观经济监测预测。
    国家最核心的信息采集,预测,比如说GDP预测,连续三年我们预测GDP指数和统计局的是一致的。宏观经济监测预测系统问世以来,已经在14个省市的宏观经济管理部门得到推广应用,对当地提高宏观决策的科学性、前瞻性起到了一定作用。另外,结合用户的具体特点,本系统在财政部、招商银行和人民大学也得到应用,并取得了较好的效果。
    另外关于经济信息的收集,预测,还有建设,网络建设和系统化建设的一些职能。大数据更多是非结构化数据,不像工商银行是热数据,随时读取,我们大数据是一些温数据,需要一些存储的方法解决方案。参与和关注的。
    我们基于这个蓝光做了联盟,全国大概11个院士来做这个蓝光光盘存储。国家信息中心大数据解决方案 -北斗数据中心 ;把短信和导航结合,是中国北斗卫星导航系统的独特发明。 
    北斗卫星导航系统的应用目前逐渐形成规模化、标准化的趋势,已向民用用户全面开放,成功应用于个人位置服务、气象应用、交通管理、运输管理、应急救援、精密授时、精细农业等多个行业
    近期,东南亚四国(泰国、老挝、文莱缅甸)都于中国政府签订协议,采用我国的北斗导航系统,同时中国与巴基斯坦有望在近期签订北斗系统合作协议,成为第五个使用北斗导航的国家。
    基本上我们对于宏观的研究,从大数据宏观方面的分析,我刚才说了,只是说尝试跟大家进行交流,对于大数据应用也是一个介绍。谢谢大家。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");