电信行业大数据及分析的应用与发展

标签:大数据电信行业大数据分析

访客:206054  发表于:2014-05-06 16:37:10


电信行业大数据及分析的应用与发展

嘉宾主持:

CNII中国信息产业网常务副总裁陈华先生

参与嘉宾:

工信部电信研究院高级工程师魏凯

中国联通云数据有限公司资深项目经理曹鲁

中国移动研究院云计算研究员邓超

SAS中国电信业解决方案首席咨询顾问万莉莉

会议内容:

陈华:尊敬的各位来宾大家下午好,SAS2014中国用户大会及商业分析领袖分会电信行业分论坛的研讨现在开始,很高兴为大家主持本次的嘉宾对话活动,来共同感受大数据的魅力,来探索电信行业大数据应用发展的命名。说到大数据的魅力,首先让我们用数据来说话,再来之前,我查了一下百度的搜索指数,发现从2012年开始关于大数据的搜索指数就一直呈现着直线上升的发展的趋势,现在IT和通讯行业的每一个人几乎都在讨论大数据,就像年轻的女士们现在在讨论来自星星的你一样那么的热烈,大数据已经成为电信行业最时髦的名词,我最近看微信的朋友圈,也在流传着这样一句玩笑话,说原来搞数据分析的,都在标杆自己说我现在搞大数据了,搞IBC的都在说我现在是搞云计算的,可以想一下,我们多么的擅长将最时髦的标签往自己身上贴,那么说到这里,在这里我也想做一个小小的调查,在座的各位有谁认为自己非常了解大数据的请举手,我很愿意邀请他上台来和我们进行一个研讨,大家都比较谦虚,但是没关系,待会儿我们有机会让大家提问题和我们嘉宾一起去进行一个交流。我们其实关于大数据都听说过一个类似的一些案例,我在采访的时候,也有很多的一些专家跟我说过这么一些事情,他说如果在西单逛街的时候,可能就会即时推荐的一些信息就告诉你附近的一些商场有什么样的品牌正在搞促销的活动,他说这就是大数据的一些实实在在的应用,但是不知道该高兴还是遗憾我没有受到过这样一个的短信,是不是也说明我们大数据的应用,还没有我们想象的那么美好。那么电信行业的大数据到底应该怎么去稿,我们是不是需要一些好的目标战略以及方法路径,这正是我们今天下午研讨的目的,非常荣幸我们请到了电信行业非常资深的几位专家来进行交流。

下面我介绍一下,他们由工信部电信研究院高级工程师魏凯先生,中国联通云公司资深项目经理曹鲁先生,中国移动研究院云计算研究员邓超先生,SAS中国电信行业解决方案首席咨询顾问万莉莉女生,下面让我们用热烈的掌声欢迎几位专家上台,有请几位专家。

我们每天都在谈大数据,那么电信行业大数据到底有多大,它是一个什么样的概念,首先我想请问运营商的两位专家,能不能简单的给我们介绍一下电信行业的大数据到底是一个怎么样的规模?请我们的邓超先生先讲一讲。

邓超:我是来自中国移动的,就目前我们前期跟省里面也做过关于大数据的项目和一些分析工作,有一个数据我觉得我们可以有个直观的体会,就是说一个中等规模的小公司,比如说两千万到三千万的用户,他网络上信息数据一天的信息数据是1个KB,大家可以想一下这个数据量有多大,那现在我们的处理系统可能一天1个KB原始数据的处理能不能指示到一个什么程度,这也是值得我们思考的问题。

曹鲁:大家好我是来自联通云数据有限公司的,我们联通成立云数据公司主要针对我们现有的全网IDC以及业务,云数据就是云计算和大数据,这是我们公司一个新的战略的计划。刚刚说到我们现在大数据的规模,因为就我们现在联通所有IDC的规模来讲,基本上有大概不下于50万台,就是现有的客户通网的和我们自身的一些云的服务器不下于50万台,然后每天产生的每一个核心结点,我们现在有三个核心结点,然后每个核心结点每天产生的网络流量是不下于20KB,如果说把这些数据真的集中起来来处理的话,我觉得应该是在大概两千亩的机房总体容量,所以当然我们因为发散的,发布在全国30多个省的,大概两百多个机房里,从面上还不是很多,但是如果集中起来,一起来处理的话,那是一个非常大的体量。

陈华:经过邓超和曹鲁的介绍,我感受到大数据的浪潮真是汹涌而来,如果海量的数据,它没有没价值的话,那么我存在是一个很大的成本,那么我们想请问一下几位专家大数据对电信行业的价值体现在哪些方面,怎么样看待大数据在电信行业的应用现状和发展趋势?首先我们想魏凯先生来谈一谈。

魏凯:我是工信部电信局的魏凯,那么刚才主持人抛出这个问题,我觉得对于运营商来说当然是一个非常好的转型契机,他对于运营商的价值可能从两个方面来看,其实运营商最应该做好的,我觉得是把自己管道和自身的业务用大数据来去提升到一个新的水平上,把这个成本降到一个新的水平上,这是一个最直接的对运营商的价值,这其实有很多的前景可以挖掘,比如说在网络优化里头,在培训部的服务质量和提升方面,在自身的业务营销方面都有很多的点可以挖掘,那么我觉得还有第二个就对运营商的价值,那这可能是运营商作为一个国民经济的社会,为社会各界提供信息基础服务的社会角色来说,他的网上其实有很大量的经济运行的,包括人民生活的数据,这些数据其实可以为其他行业所用,那这个价值可能远远大于运营商自身的那一万亿左右的价值,如果用的好话,其实可以给整个经济,给整个社会提供非常大的,现在来说很少有几类公共基础设施有运营商这样全面准确的信息化程度这么高的一个系统,如果把第二类价值转化出来的,不仅是对运营商来说,对于整个国家,整个经济,整个社会发展都是一个非常大的空间。

陈华:魏凯先生看的很高,我们站在国家经济社会发展来看到这个问题。那么想请问一下万女士您在SAS工作中,也在电信行业也做了很长的时间和运营商都有很多的交流,你怎样看待大数据在电信行业的价值以及它的现状和发展趋势?

万莉莉:那刚才魏工的话,聊了一下就是说处于运营商这边能够为国家提供一些什么便利的条件或者应用方面,那我这边是站在SAS的角度想聊一下,我们可给以运营商提供一些什么,那最早的话,可能大概十几年前很早就从经分那块,其实已经入手做了一些大数据的分析,包括在营销方面很早就去做了尝试,特别是增值业务的,那么后来的话,这几年慢慢开始考虑在网络怎么把大数据运用起来,可能接下来B域加O域的这两侧,我们怎么样去融合去做一些数据的分析,为运营商提供一些决策的支撑,那再往后我们能做什么,我觉得最后的话,肯定是说在整个的管理运营和决策支撑上面,我们能够全方位的为运营商提供哪些支撑,特别是它在资源投资,因为这个投资是非常巨大的,一上线几百亿的投资这个都是非常能够看得见的一些数字,那我们怎么优化投资便利应该放在那里,我觉得这是SAS可以为运营商考虑的。

曹鲁:大数据对我们运营商的价值,我认为首先我觉得我们运营商角色的定位问题,我们运营商其实是服务商,就是说和中石油、中石化是不一样,中石油、中石化他们提供的是产品资源,而且运营商说句实话是没有看得见形的产品,我们提供的都是无形的服务,这是我们自己对自己的定位,所以运营商做了很多事情也提升了很多的,包括服务质量等等之类的,但是是APP最多的,这是大家公认的,大家也都看到,我们所有的资费一直在降,但是一直受到社会的投诉、批评特别多,这是因为什么呢?因为运营商的角色是不太一样的,和其他公司的角色不一样,基于这一点我认为如果要提升我们运营商的服务,要提升我们运营水平,我们就要针对我们的客户,针对我们的产品,我们要做深入的分析和了解,我们要了解客户的需求在哪里,要了解我们产品的功能,市场价值在哪里,这些都是要基于什么呢?都是要基于市场的数据分析,这些都是来自于我们本身的,我们所有的网络,所有的用户,他们是反馈给我们数据信息里面,我们去提起,运营商就是包括从集团级领导到省级,到现在地市公司很多领导每天或者说每个星期很重要的一件事情做运营分析,以前这些分析都是从下面一级一级往上报,从市公司到省公司,然后到集团,领导之间,这个里面就产生了很多PPT表格等等之类的,就是说每天大量的人工做一些,在我们现在看来实际上一些所谓的低效的事情,这些东西事实上反映的都是什么呢?都是我们整个运营商系统,整个运营商企业内部所产生的一些精英数据、用户数据、网络数据等之类的,包括我们内部的一些建设和其他的一些表彰我们整个生活运营的数据,这些东西都是我们现在现有的情况,都是通过手工或者一些简单的系统来收集起来的,事实上这些数据我们完全可以通过一些系统的整合来获得,就是通过更加自动化的东西来实现提取,收集等之类的,这样的话,让我们运营商的效率更加提高,这是一个。

第二个能更好的服务于客户。

第三个能让数据本身的价值对客户来说,他们更有价值,主要是这三个方面。

陈华:我再问一下,就像我刚才讲了一下,您刚才也做了一些介绍,那么中国联通现在做的一些经营分析,到底是数据分析还是大数据分析?

曹鲁:如果是说,事实上是这样,我们怎么样去定义数据分析和大数据分析,当你说我们现在如果简单的说,大数据分析,当然数据量达到一个体量;第二个要求一定时限;第三个对它整个数据分析的深度、广度等等之类的,有一个衡量标准的话,我们可以认为现在做的都是一些数据分析,因为事实上我们的量可能不是说特别,对于每个地市或者是每个省不是特别的大,但是对于整个集团整体来说,我认为是达到一定量级的,你想每个月做的数据分析的东西,我们联通应该现在差不多有四十多万人,不太好意思的说,差不多有四五万人在做数据分析,可能觉得不可思议,就是说一个生产企业这么多人在做这些表格上的工夫,事实上这些东西对我服务型的企业来说我们要做的这个东西确实是很烦琐的,我自己也曾经做过两年多的专门给领导做金融分析的东西,每天看到数据头都是大的,所以我认为这个是大数据,我认为也是大数据,你认为说是一些数据,也可以这么说,目前来说我觉得就算是业内也没有对大数据有很明确的标准,所以就看你怎么去理解了。

陈华:难怪近两年中国联通3G增长这么迅猛,原来是有四五万人在背后做数据分析挖掘,然后把人家拉过来。那么请问一下邓超先生你怎样看待大数据对电信运营商的价值以及中国移动现在大数据的应用现状怎么样?

邓超:刚才曹总说的这块,我觉得有很多感受非常深,其实我们做的很多工作都很像,关于大数据这块,因为我们一直从2007年开始我们就在做最早的时候叫云计算,慢慢云计算团队里面有做分析的,当云计算和大数据这两个概念逐渐清晰,分开以后也逐渐有了大数据的团队越来越大,整体来看其实我们也在思考一些问题,就是说运营商我们在大数据这个里面,我们感觉是有两种,其实是有两种角色再做,第一种角色就是我们自己的数据很多,很大,这里面我们可以对这些大数据进行分析,提升我们自己的运营能力和对客户的服务能力,提升企业的效益,这是一个角度,那么另外一个角度就是作为中国移动也好或者别的运营商也好,现在大家都在提倡一个观点,就是我要转型,我不甘于做一个管道,我要做一个信息的专家,其实这种情况下,以电信运营商为基础,我怎么做成一个真正大数据的服务商,这其实也是未来的目标或者说现在所有尝试大数据服务的终极目标,都是想以自由的业务为基础或者自由的发展为基础,我怎么能提供更多的大数据服务,所以我的理解就是两方面,一方面是我企业内部怎么来更好的使用大数据提升我企业的效益,另一方面我怎么真正发挥,对外提供大数据服务,那么这是一个两方面的,那么目前我感觉,从我们的体现和业内的一流交流,包括除了电信运营商,还有互联网公司,甚至一些互联网公司来看,我的感觉不仅是国内,包括国外现在大部分都还是集中在大数据里面,大体量数据的分析,就是我们大数据第一现在可能大家真正有这么所谓的四个V,一个体量大,多样性,还有高速,还有价值,那么有的人也提出了另外一个V,叫真实性,其实这些东西说白了我们整个国际上现在关于大数据在做第一个阶段,就是大体量数据怎么来分析,比如说我们现在集中还有各种BSP或者一些开源的MPP等等这样一些东西,怎么对大数据进行处理,那么现在这个阶段集中精力在攻关这个东西,但是真正未来我要实现大数据服务,其实它的重点在我们刚才说的多样性,怎么把这些来自不同领域、不同业务部门或者不同行业里面的数据把他们关联在一起来做分析,来产生新的价值,看到新的业务点或者是看到新的服务点,这个是真正的,我觉得我们下一个阶段,就是我们脱离了体量大的阶段以后,再往上升级一个阶段必须要考虑到多样性,如果这两个要结合起来,那我们真正离我们最终的对外进行大数据服务越来越近这是我们的体会。

陈华:这个多样性是不是我们讲,就是数据的多样性是互联网行业数据和电信行业数据之间比较大的差异性。

邓超:您可以这么理解,就是说即使这种多样性,我们的理解是两种,一种是来自不同行业的,比如说我传统运营商里面就主要是一些客户数据,加上一些用户行为打电话的,还有发短信的,那么现在随着移动互联网的发展,用户上网对互联网的数据,它和我们传统的电信数据最大的区别就是非集化数据越来越多了,文本的,图像的,视频的,这些数据在以前的电信运营商里面基本上是没有怎么利用的,所以说这种情况下,跨领域结构化和非结构化数据怎么融合起来,更好的做的分析或者更好的给用户提供服务,这是一种。另外一点还是说企业自身内部其实也存在一个多样性的数据,比如说网络的数据和我们所谓的BOM三个域里面的数据,现在基本上这三个域是独立的,相对独立的三个域,那么我们的目标,可能就是说将来我把这三个域,如果能够很好的组合在一起,那么有可能我内部在做数据分析或者什么的时候,我数据分析的质量也会很高,这是多样性各行各业都在做。其实前段时间我们也在思考一个问题,我们每个部门、每个行业在做大数据的时候,可能类似于就是我们一个小作坊,我是一个小公司,比如说我就制造飞机的机翼,我就是制造飞机的螺旋桨的,然后另外一个做发动机,真正实现大数据服务,必须上我们类似于波音公司的大数据服务的部门或者决策部门,它能真正把这几个机翼各个不同的产品和数据融合在一起这样形成一个大飞机,那么这才是真正大数据产生的服务,至于你下边机翼、螺旋桨,你现在说你在做大数据,是你在做大数据,只是你在做里面的什么事,我的订单越来越多的时候,我做这种事情我能不能更高效的做,但是真正说你单独靠我解决这个机翼上更高效的做大订单,最终实现不了一个大飞机,那么真正要实现大飞机,必须所有的部门,所有的业务和所有的数据,所有的行业都联合起来都组装成一个大数据,这才是真正的大数据的目标。

陈华:其实我们知道中国移动研究院在云计算还有大数据研究都是非常领先的,那么现在您觉得感受对于大数据来说,您目前最大的困惑是什么呢?

邓超:其实现在我们第一阶段主要解决体量大的问题,最大的困惑因为说实话,运营商比如说我们运营分析这个系统,十来年了建设的,原有系统我要尝试往大数据方向走,我绝对不可能把原有的整个系统全部推倒,比如原来是经营数据仓库,做运营什么的,我现在比如说我要尝试大数据的一些新技术,新产品或者一些的方式去解决我原来解决不了体量大的问题,那我只能说是在从和原来不摧毁原来的基础上,我再建新系统,那么这个新系统和旧系统之间怎么在线完成共存这是最大的问题,其实大家不要小看这个问题,原来我是基于DBTO,现在我用的一些软件,但是真正的你去新进这个系统,怎么加到原来管控系统里面,怎么加到调度系统里面,这其实是真正实施广大数据做系统的时候面临最大的问题。

陈华:那请教一下曹鲁先生,就是您在中国联通的实践中,您对大数据的应用最大的困惑是什么?您认为中国联通应该采取什么样的大数据发展思路?

曹鲁:两个问题,我先回答第一个。我觉得就是我们运营商发展大数据最大的困难点是在于数据的收集和整合,事实上大家都知道,当达到一个体量的时候,数据的整合其实是切身到包括各个部门,当然这个部门不光是就是我们联通内部的一些部门,相关的做一个简单的比方,这段时间我们MH370这个事情大家都说飞机上总共两百多号人,对于他们相关的信息,包括之前的通话记录等等之类的,要收集他们之前详细的东西,马航用了好长一段时间,用了不下于十几天,事实上如果是说对于是这样能有一个比较好的平台基础上,能有比较好的大数据分析系统的环境下,他们两百多人在半年内或者是多长时间内所有的通话记录,他们的上网或者互联网的记录等等之类的,这些东西是可以在2分钟内甚至是几十秒内全部展现出来,但是事实上,因为没有这些系统,没有这些东西,然后这些数据的收集、整合整理就是一个很大的瓶颈,当然因为涉及到人员是多国的,跨国,跨部门,包括民政部、外交部很多部门协调的问题,这个里面可能就存在很多,但是如果是仅从技术角度,我觉得就是说在分分钟内解决的事情,因为如果能把这个事情很高效的解决,我们对于MH370的飞机的飞行方向的研判,可能会有一个很好的技术支撑,就是一个很好的支撑左右,所以我觉得就是说在这个过程中数据的收集和整理事实上对于现有的大数据的发展是一个很大的瓶颈,不光是技术,主要还是在包括一些政治,甚至是一些政治层面,文化层面的隔阂,还有一些就是说在整体的基础上,我们还要提供怎么样去实现技术的整合和怎么把整合的东西会合到核心的相关的部门去做处理,这是数据整合的事情。

还有一个投资的问题,就是说在这个过程中,我们要做这些数据的整合,对我们运营商来说,因为牵扯的方方面面比较多,然后说一千到一万,还是有没有足够的经济实力去做这个事情,还有领导决心的问题或者是说在整个权衡当中有没有魄力的问题,还有我们长期和中短期利益的抉择的问题,我觉得都是我们值得去探讨的问题,所以我觉得这才是真正的难点和瓶颈,而一些技术上的,就是说我们可能怎么样通过一些传感或者一些网络的搜集,流量的分析获得这些数据,我觉得相对来说到这个对我们运营商来说倒不是说最难办的一些问题,这是第一个。

第二个你说到大数据的战略和发展问题,因为这个只是我个人的一些观点,我认为我们运营商作为一个服务提供商,我们要给客户提供的是什么,提供的是超乎他们所付出的价值的价值,什么意思呢?就是说我们希望大数据能够挖掘获得就是比他们所付出的代价更高的一些价值,这才是我们进行大数据根本的目的或者说根本的价值所在,所以我觉得我们发展这个大数据战略的定位点,就应该定位在能给客户提供更高的价值,这样来说这个事情就好像刚刚陈博士说到在西单很多客户会收到短信,事实上我自己本身正好在西单,然后我现在经常收到的买房子和包括要不要投资等等之类的短信。

陈华:这些不是运营商发的。

曹鲁:这里面可能涉及到一些个人隐私泄漏的问题,但是如果是说提供战略的定位来说,我们应该定位什么呢?我们要给客户,不管是我们现有的运营商的客户,还是我们将来要发展的目标客户,给他们要提供什么呢?提供一个更加精细,更加精准的一些数据价值,我们是希望什么呢?比如我前不久做了一个租房的消息,然后很多中介打电话要不要租房子,事实上我现在已经租房子了,那么是不是应该大数据分析的程度是不是有一个过程就是告诉他不用再打他电话,他已经租了,类似这样一个概念,所以这是从最小的角度,但事实上从最小的事情上反映的是更高层面的一些事情,就是说我们把服务怎么样做到更精细,更精准,怎么样让客户更加满意我们给他们提供的数据服务,因为事实上数据服务很多,各行各业包括现在我认为将来比较会有一些比较好的大的发展前景的,比如像交通,现在我们北京交通情况都知道,大家市委市政府都通过不是很人性化的政策或者措施来限制大家出行,外地车辆不能进京等等这种方式,事实上交通拥堵的问题,我觉得光从高压政策,用词可能不太妥当,光用政策来疏解的话,以抑制需求为方式和手段的话,我觉得不是一个很文明很好的方式,我认为更应该要确切的分析,我们现在的路况到底是什么情况,到底是因为什么,因为路太窄了,还是说因为流量的疏导等等之类的,这些问题还是说人太多了等等,反正说我具体原因,我觉得应该要具体分析,对于没有数据,都应该是有可行的模型或者说可以解决的一种方法试着去解决,比如像一个简单的方式,之前想的一个方式,其实我们每个司机手上都会带手机的,然后再分隔系统里面,手机的位置其实是确定的,就是说你在某一个极端里面你手机的信号或者说这一群手机的信号是一个确定的,比如在我的无线网络的环境下,我可以描绘,描绘人群的密集或者人群动态的流向,因为每隔几秒钟你人的位置的变化,其实你手机信号的位置是变化的,在分隔系统可以体现出来,根据信号的强弱和方位角度等等之类可以确定位置,那么是不是这一点我就可以通过我手机的这种方式进行研判,比如在五环路上或者四环路上每一段手机信号特别密集,是不是这一段就发生了一些堵车,拥挤等等情况,还有一种情况是什么呢?如果是说我们对手机信号整个的流量观测,你会发现,当出现一些群体性事件的时候,比如说在火车站的时候,如果出现大量的一些信号不正常的情况,你会发现有什么问题或者是类似于某种情况就是说一些不该拥挤的地方拥挤了,有可能是这个地方发生了一些群众性事件等等之类的,这个从国家安全或者是一些公共安全的角度,我们觉得也可能是解决了,对我们运营商或者大数据对客户能提供价值的一些方法,这个和我们运营商战略说的有点远,有点细,我觉得我们战略的端点应该出于对客户的服务的意识或者服务的精细化,我觉得这才是我们真正要做大数据的根本出发点,只有在这个出发点上我们去怎么样宏观发展的大数据我觉得才有意义。

陈华:谢谢曹主任做一个很坦率的解读。那请问一下万女士在您和运营商的交流中,你有没有感受到像邓超、曹鲁他们感受到的一些困惑,另外您本人对于大数据最大的困惑在什么地方?

万莉莉:我刚才听这两位聊困惑,这几年天天面对面的时候也会聊这些问题,比如说数据的问题,这个数据清晰是非常重要的,数据的质量拿上来的数据质量如果低于百分之七八十号数据的话,那我们根本连数据挖掘,数据分析都没法做,所以对我们来说也是非常要命的,第一件事情先去看一下这个数据能不能做,然后咱们再谈下面的事情。所以这件事情也是我们面对的第一件事,那这件事情其实,我也知道其实各个运营商这几年一直在去解决这些事情,包括从集团层面到省层面,从研究院其实都在解决这个,但是有些可能也是受限于其实本身网络或者说是数据收集的一些问题,那本身SAS可能没办法帮你去解决你的数据质量差,我不可能给你造一些数据,但是至少我可以先去替你检查,我们帮忙去一些可视化的一些工具,检查完了之后,你可能更了解你的数据,有问题在哪里,那这样就可以更有针对性的解决数据的难点。那比如刚才邓工提到的说我们数据库不可能迁移三年一带这也没办法办,我今年刚刚升级完了一套东西,我明年就换下一套,这也不可能的,那SAS本身如果做软件的话,它是不存在问题的,我们是可以去跟所有的主流数据库,主流数据仓库都可以做连接,所以这个问题跟上司聊的话,基本上不太会出现,但如果说做仓库的公司或者说数据库的公司一聊肯定先要考虑这个问题,投资的问题不可能说我今年投资完了,明年继续做,所以其实这些问题都是很常见的,就是我们常会遇到的一些要考虑的点,然后我们也要替运营商去考虑这些问题,你的整个战略投资,你的整个战略规划,甚至你整个大数据的发展规划,我们都要去考虑这些事情。

陈华:那请问一下魏凯先生,就是您的研究中,您认为影响大数据在电信行业的运用推广和发挥作用,它最大的困难在于什么地方?

魏凯:那我就说一下,其实我对电信运营商用好大数据是非常悲观的,为什么这么说?其实刚才我说了电信运营商拥有的优势是什么?他是有很大的网络用户和用户在网上留下的痕迹,这是别人现阶段没有的,但是不表示人家明天后天没有,你看现在都在你们的OTT在发展什么东西,就是智能路由器,可穿戴设备,就是数据,所有的运营商都在做这个东西,OTT如果把他的数据的入口延伸到了硬件上来说的话,运营商数据的优势在什么地方,我觉得其实就是现在来看是有优势的,因为运营商掌握了一个用户的一天他访问了什么网站,所有的记录,现在没有一个OTT能够这么全,除非他有比如说谷歌的,安卓他能知道,但是百度的某一个应用他可能不知道其他时间,你不开百度应用的时候在做什么事情,所以说如果一旦这种OTT在你们上面进行业务的主体,把他的前沿推向了用户的设备,家里的网站和设备上来说,这个运营商数据的优势其实是在削弱的。

另外现在运营商有的数据的优势其实也是有限的,因为虽然运营商有全周期的数据,但是他其实是跟OTT之间是有分界线,如果说叫真的话,其实是OTT厂商是不允许运营商动的,你只能看包头的信息,这是一个困惑,这是一个很大的挑战,数据资源上的,慢慢就会丧失这种优势,如果不去尽快抓住这个机会的话,其实是很悲观的,另外一个悲观就是现在运营商也面临自己,大数据其实要长期的战略投资的,运营商现在下不了决心的,就是他传统上业务模式,实际上还是靠网络是他的主业,现在还没有一个运营商把他的重心转到这儿,所以说刚才曹总说的领导下没下决心这是很重要的,如果一旦领导下决心,我想SAS有这么好的方案其实这个技术就不成问题,现在从最高层还没有感受到就是大数据在他的里头其实不是最高的优先级的,你像运行上4G,马上5G,然后宽带,就是这些东西在那个战略优先,所以公司整个的资源的投向和领导脑子里想的问题,都是不一样的,我们是工信和信息化部的电信研究院,我们在我们不是运营商研究,所以我们比较能够超脱点说这样的话,但是今天的话也不代表我们单位的看法,这是我自己的看法,另外就是要诚心一点,我们在去年的时候,也给某一个运营商集团层面做一个战略规划,就是刚才大家问,主持人问到集团层面有个战略,我们去年给某一个集团做过三大运营商之一,做过一个战略规划,就是大数据的战略怎么发展,我们也提了刚才的观点,就是危机和现在的机遇,我们也提了应该怎么去,第一步做什么,第二步做什么,包括他的IT的整合,其实现在的烟囱还没有打通,你怎么谈合数据的融合,即使百度和腾讯他们这种互联网公司烟囱都没有完全的打通,我们运营商更处于早期,我们也提了这种现在运营商面临实际的困境,也提了未来应该怎么定位,有意思的现象就是那个战略我们做的课题就是汇报的,听汇报的评审专家是运营商退下来的,当年退下来的一把手,我见到的那一次开会评审的时候,应该是来了历届可能有七八届当过总裁副总裁,总经理副总经理的级别的领导过来来评审,还有就是现任的领导,其实有意思的就是两派人,退下来的领导都特别重视大数据,都认为公司应该把这个作为一个最早的优先技术发展,如果不发展,运营商可能未来的日子会很艰难,那么运营商总部的现职的领导可能他处于自身的考核压力,其实他们说了很多的困难,总之就是你可以看到泾渭分明的态度,所以说大数据是一个战略性的投入,不是短期的投入,这是没有拍板。另外现在我们的认识,其实大数据不管是理念,还是工具的技术还是应用的模式,实际上从互联网界起先最先应用的,从搜索引擎开始,大家现在谈的严格意义上都是从搜索引擎开始,网页爬虫户那个时间点开始,往其他行业渗透的,那在这个渗透过程中,其实有很多的模式都在变,理念要变,技术的框架也要变,比如说你要在其他行业用的话也要变,那么模式也要去变,在这个转化过程中,其实也是很费劲的,需要很强的背后的技术功底,你看OTT的人员构成是什么的,70%以上是工程师,研发人员,运营商的构成是什么样的?联通四十万人,电信可能更多,所以说真正要做大数据的公司,其实背后的因素是很难的,我觉得这都是我们很大的困惑。

还有一个困惑就是其实我们现在看到没有一个公司大数据就做很成功的公司,他只是做大数据,他都是在某一个业务背后加了一个数据分析的引擎来给这个主业做贡献的,比如说互联网金融,他肯定不是说这是单纯的大数据的公司,他是玩的金融分析,比如说电商的推荐,其实没有一个靠大数据本身能赚钱,而是我们理解就是应该是大数据和其他的价值通道结合起来,大数据等于说后面那个零不是前面那个一,前面的一是最重要的,我觉得运营商要做大数据其实要强化前面一的,你未来在哪里就是那个一是什么,就是价值的核心点是什么?然后大数据再给您的主业去加分,去加那个零,这个是一个考虑,所以说基于上面我们分析,我个人认为运营商大数据的发展,未来的路线可能是这样的,一个是我们一要强化,就是要把一做的特别强,我们的管道,就是像比如说任正非他在做最近软银的孙正义也在说,未来的网络是无限宽的,就比如说任正非说跟太平洋一样宽,就是你要想象未来的网络是个无限宽的网络,这个时候你运营商的价值在哪里,我觉得视野要管道还没有做到尽头,你的成本还没有,就是别人做管道这个是死的境地,现在你看大家比如说OTT公司,他纷纷在做骨干,以后会不会做记录,那国外也在做记录,就是你成本要低到他不愿意去自己建设网络设施这种,永远不要让他自己去建网络设施,那你的生意就会永远做下去,你前面一的机会就会永远的强,越来越强,那么大数据应该为这种主业去服务,我觉得这是最根本的一个,就是做好我们最熟悉的事情,我觉得这就是刚开始我说的第一种模式,就是运营商要用大数据来做大做强自己的主业,这有很多可以挖掘的,另外就是对于可以让其他行业去成价值的那个部分,我觉得现在运营商很难找到一种模式叠加到上面去,比如说你去做经营分析,做经营分析,其实你最大的用户的把给你包运也就两百多块钱,三百块钱就到顶了,你再做去分析,再做精细化的营销,你就是推销一个套餐,这就到顶了,如果说你把这种能力,这种数据提供给销售一个豪华轿车或者是房地产商或者是金融产业,他们产生多少价值,这个是很难去限量的,就是想象空间是很大的,所以我觉得第二个运营商做成一个全社会信息的基础,数据基础的平台,我可以给其他的行业提供基础数据的服务,就是把数据通过一定的挖掘,我做一个服务提供给其他行业的,我赚不了钱,我让其他行业赚钱,然后给我分成,这是也是可以的,我觉得这是一个,就像现在淘宝、阿里巴巴他们也是这种模式,他其实不卖,阿里巴巴自身又不卖任何的商品,他其实搭了一个平台,然后在这上面让大家运行,然后我把数据沉淀到我的平台上,我通过开放平台,开放API,收API的钱,你要调用我的API来分析某个区域的销售情况,你给我交点钱又可以了,你开店就不用钱了,所以他的大数据经营的思路是这种样子,就是让别人赚钱,我在里头分一杯羹,不是说我就要去赚钱,我觉得大概是这样的,一个是把自己的主业做强,另外把我的打造一个这样的平台,我把我的能力让别人共享,给别人创造价值,我才能有价值,这是我的一个看法。

陈华:刚才魏凯讲话中谈到有对咱们大数据的发展有一些悲观,但是根据我对您讲话中数据进行挖掘分析,我觉得悲观的背后其实蕴含着希望和期待,并且也给出了很好的意见和建议。因为确实是这样,大数据为什么,我觉得大数据在电信行业还会得到深度的推广和应用,我觉得有两个原因,第一个技术本身发展很快,它能够解决很多问题;第二个我们应用需求是存在的,比方说也是我们下一个问题即将谈到的,大数据在电信行业最大的应用是什么呢?也是和其他的行业比方说保险金融这行业有不同的,就是说他在网络分析和管理中有很多的应用,特别是现在随着数据起来之后,数据的流量更加呈现,包括是增长。那么下面这个问题我想首先您认为随着数据的爆炸,随着大数据的爆炸,对电信网络运营管理会带来哪些挑战,怎样运用大数据来改善网络的管理?

万莉莉:其实关于这个问题,在运营商这边谈了很多年了,就是关于流量经营这件事情,特别是4G网一上,多网协同,多网营销非常的明显,从2G、3G、2.5G,4G都要管,那同时在流量这块,现在流量的增速是非常快的,现在中国的网民应该是超过6.8个亿,慢慢流量消费人均已经超过一百多兆,现在应该是到两百兆以上,就是人均上,所以这个增速在接下来的五年会非常快的,那在这样一个环境下,我们这个管道怎么去做好,其实早几年我们谈这个话题的时候,运营商相对来说是比较回避的,不愿意甘于做管道,所有的领导都不愿意做管道,那跟这个问题是没办法去避免,就是说可能会出现这样一个问题,我们是要在做好管道的基础上,怎么样去做好其他的事情,我觉得如果是单纯从这方面来说的话,其实运营商是给了我们一个非常好的思考方式,让我们跳出传统模式的很好的借鉴,特别是在虚拟运营商里面是有几家的,比如电商的或者说互联网公司的这种,他们手里的是更多的目前最热门的一些数据,那他们其实是很看好电商,就是运营商这边的一些数据的,他们为什么看好,他们拿这些数据将来怎么进行自己的业务,返过来推就能够想清楚我们运营商拿我们现有的数据能够怎么样去做一些有利模式,我觉得就是借鉴别人的思考方式,反向推的话,其实是对我们一个很好的思路和借鉴,那其实虚拟运营商的发展估计至少要五年的时间,就是我们借鉴美国和欧洲的一些发展模式的话,大概需要五年的时间,最终可能平衡在5%到7%,这样对于中国来说大概至少也要五千万以上的水平,也就是说他们会分走我们五千万左右的用户数,那相对来说可能是大部分人相对来说可能是运营商本身这个号我不会丢,同时我会绑一个虚拟运营商的号,那假如说是我的话,我可能去绑一个虚拟运营商的号,我想用这个号来干什么呢?那我肯定是说那边可以一些增值的业务和服务,同时我又给他提供了运营商这边一些真实的、现实网络的一些数据,那同样我们可以运营商思考一下,那我手头原有的号,我在保留没有完全被你侵占的时候,我怎么样去提升我的服务,让你不要使我们现有客户的价值降低,那这从一方面首先传统的这些语音短信的现在下降的趋下,我们更多要考虑在我们流量网络这块,我们怎么样提升我们用户保留你的高价值,去提升你的客户价值,怎么样去做肯定最重要的一点,就是说要保证我们的网络质量,如何保证我们的网络质量,我们其实现在有很多的数据,我们的用户数据,我们的用户行为消费的数据,还有我们用户投诉的数据,这两年其实投诉的数据也在加以去用的,那投诉的数据其实对于网络优化,网络建设是一个非常好的点和例子的,那比如这一片地区投诉多或者说体育场我要开演唱会的时候,肯定马上派几个加急的应急车就过去了,那真正在网络建设的时候,4G网络建设刚刚铺开,那我们铺开的时候,为什么就不先想到这些问题,其实我们整个城市规划相对来说会稳定一段时间了,那我在4G要用的这几年的时候,我有没有考虑我的城市规划真的就是在网络建设的时候先把这个大数据应用进去,再去做决策的,在从第一步最开始的时候就先去做,这是我们去做好流量经营的第一步,那接下来的话,流量经营我们怎么样去让用户更好的消费流量,我们去提供哪些更好的服务,比如我一年消费好像月均消费2000还是3000以上又是移动的VIP,钻卡用户,那我肯定要保证你钻卡所有的服务质量提升到最高,那如果这样的一个情况下,你这个人在哪儿,你所在位置的网络是否是最好的,我怎么样给你提供最好的网络质量、网络服务,包括其他的企业级用户,我怎么样提高最好的宽带服务,这些其实都是流量经营需要去考虑的,这些就是依据现有的大数据分析的情况下,才能更好的去做判断的,这是我的一些个人见解。

陈华:那么SAS在国外和很多的你现在电信运营商有都过一些合作,那么他们是怎么样做的?

万莉莉:其实在欧洲的国家或者说在,我前两天看到一个意大利的案例,他们会在意大利的电信运营商,他们是在网络优化这一块就是用的就是SAS的产品,整个区网络建设、网络规划都会去做,包括SAS我们现在也有一套非常完整的网络优化的解决方案建议,就是能够去解决现有的这些问题,但是可能刚才也提到的我目前在B域切入的比较多一些,相对来说O域整个布置是SAS了,所有的集成商切入的也会非常少,就是在大数据和数据分析这块,切入的都非常少,那这块如果说是刚才提到领导们都已经把这个高度拔起来的话,这是我们最愿意看到的,那这样的话,我们就可以把集网的数据全部先融合起来,那可以在最好的方式上把我们网络分析的解决方案应用进去。

陈华:那请问一下曹老板中国联通这个网络管理和分析中,对于大数据分析的应用情况是什么?未来有什么样的考虑?

曹鲁:刚才万女士提到的,就是说到这些观点我都非常认同,就比如像我们,举个简单例子,我们联通集团这里B域和M域是由一个部门来主管,O域是另外一个部门来主管,那么这几个系统要整合的话,壁垒是很严重的,基本上我觉得目前来说是不太可能实现的,所以你说在我们运营过程中,如何利用大数据进行网络分析等等之类的,一个大的前提就是我们内部的这些系统首先是得通畅的,在这个通畅的前提之下,我们才能把所有的资源整合起来,才能把所有的数据才能收集起来,因为如果你对一个客户进行数据分析,你首先当然因为他网络质量的话,因为涉及到他的一些相关的所在的区域的一些资源,然后如果是这个客户信息的话,又涉及到我们B域一些信息,各个系统之间要整合,我觉得这个对我们来说是一个很大的挑战,就是我们之前也建议过,就是做过一些试探,最后效果不是很好,因为最后可能有撂挑子的情况,这是我们负责的事我们就专门负责了,其他的事我们就不管,有这么个情况,因为系统是死的,人是活的,如果很多事如果不做的话,这个系统最后弄的就不成样子,所以当然这是有一些体制的原因在里面,这也是一些观念上还没有突破的情况下才有这种现象,我觉得现在包括我们领导也是很重视这块,比如说有个运营公司,有一个主要的目的就是要打破一些壁垒,比如像所有的运营中心要统一一体化运营,包括组织机房的运围,到上乘市场营销发展的全部一体化来实现,在这块如果是我们进行一些大数据的网络流量的流向分析等等,这对我们整个大网的分析差不多相当于抓了一半,我们把所有的下行全部抓住了,上行另外在我们网络建设部那一块,网络建设部和运营部他们集中来做,他们共同来管这块,那么从这个角度讲,我觉得对于运营商来说,我相信不光是我们联通,电信移动也是差不多类似的情况,因为部门至今一些的壁垒导致很多系统的统一和整合难度非常大,然后当然这对我们整个网络分析来说并不是一个很好的事情,但是现在我觉得这种情况肯定是要改变的,就是我们要做的是智能管道,大管道等等之类的,做这些事情的时候,肯定是要把这些壁垒打破,肯定是要把对我们现在不利的一些因素要驱除,然后刚刚说到在技术层面,我觉得就是说从我们现有比如像我们公司现在就有一套流量流向的分析系统,一个简单的比喻,我们知道,比如像山东和北京之间相互之间哪些用户他访问、互访,包括异网的穿越等等之类的,这些流量我们都很清楚,然后我们在一定条件下,我们可以知道这个客户比如他在山东部署了IBC的一些资源,然后他要不要在北京部署资源,我们是有一个衡量,比如说当北京的用户很多都是通过北京程序网访问到山东服务器当中,我们就认为他肯定是有这个需求的,在这种情况下,比如客户跑过来跟我们说你这个高于一个G和我们每个月高于四十万我们不要的,然后我们告诉你,我们就会跟他们说你是不可能不要的,因为你们的用户访问的跨省的访问流量是非常大的,对于你们来说这个,比如在北京布置资源点是必须的,所以有了这个我们作为底气,我们就可以抗住价格的压力,类似于这个,这是一个简单的例子,并不是代表全方位的分析,就是说对于这块来说我们进行网络的话,是很有好处的,所以我认为在大数据这块,将来显现的功能,特别是对我们云公司来说的,我们觉得是很有必要的,并且我们现在也是逐步完善我们网络流量流向的分析。

陈华:理想很丰满,现实很骨干。那联通有没有做过一些定量的研究,因为我们知道如果我们采用大数据分析的,网络分析的手段,其实也是增加成本,但我们本身应用大数据分析就是为了降低成效

,那么有没有这么一个衡量,就是说我们应用大数据分析或者不应用大数据分析会带来成本或者效益上什么样的变化呢?

曹鲁:因为做这个相对来说是比较困难的,首先是模型的建立是有一定难度的,然后第二个因为因素牵扯的确实很多,你说客户,比如像一些数据,一些流量对我们的影响,他有受到什么呢?有受到市场环境的,有受到客户本身,有些客户他就是能花得起钱的客户,一些可能确实是很抠门的,说句不好听的,一些互联网客户对我们来说说句实话就是量大,但是对我们来说并不是特别利润很高的客户,有点像鸡肋的那种,就是说,扔了是不能扔,但是吃起来确实不是很好啃,所以对于你说的所谓的精确的东西,因为我们包括我们公司目前也没有做过这方面的定量研究,我们也不能给一个虚假的数据,但是我觉得我们肯定是要,逐步地进行这一些量化的工作,因为我们现在包括我们公司有一个研发部门,也在开始就是着手大数据的一些包括对我们自己运营的系统的模型的建立做一些研究,因为我们研发部门好几个人都是从我们联通研究院过来,他们在大数据和云计算理论方面有很强的知识背景和理论的背景,所以我觉得在这块来说,我觉得将来我们肯定是有一个很好的,会给大家呈现一个比较好的结果和效果,能让大家看到大数据对我们运营确是是一个比较好的效果。

陈华:那么请教一下邓超,就是说中国移动的大数据在你们内部的网络分析管理中发挥了哪些作用?

邓超:这个其实曹总刚才说那个,BOM域这三个域,正好是在运营商内部是不同的部门来负责,所以说数据也是在各个部门之间,所以说实话想把他们完全整合在一起,按理想状态来做大数据分析,现在还是有一个难度,需要一个过程,但是目前我们就是说大家有一个共识,大数据是肯定要做的,所以说壁垒虽然现在打不破,各个部门都在做相关大数据的工作,比如说我们的B域,比如我们现在有什么集中化经分这样的一个规划的建设,甚至一期已经开始建设,比如说我们北京有北方基地,那我就说或者广东那边有南方基地,我们把数据中心集中建设起来,这样的话各个省不再向以前的那种模式,我数据是各省,分省运营,然后数据放在各个省,分析完了以后再上报,不是这样的,现在我做了这个基地集中化以后,这个区域内的数据都可以上报到这个地方来,这就是我大数据分析第一步,先把数据集起来,那么这是B域在做的工作,那么B域在做这个工作的同时,也在做我这个数据量,比如说以前我只能分析三个月的用户数据或者半年的数据我就没法分析了,那这时候现在我们用一些新的大数据技术,我们尝试新技术,我来分析更多的,我六个用一年的数据,我开始尝试分析,比如说我以前做校园用户识别或者做别的特殊群体识别的时候,我原来的工具,原来基于数据仓库的脚本的处理方式,我做不了太大用户,那么现在我们一些新的技术,我就可以尝试,我用做权杖用户的他的交往圈,还有通话交往圈以及他身份的识别,是我可以做到B域方面可以做到的关于大数据方面的事,那O域方面的其实大家知道,就是说运营商B域相对是IT走的相对比较靠前,那么O域相对可能以前侧重点在核心网络建设上,对于他分析还有系统支撑方面可能没那么靠前,但是现在从大数据的角度来说,也在做这样的事情,比如说我们的网络在做什么,网络中分系统,就是把各个网络上的数据,用户数据,然后各种数据搜集起来,做统一的规划分析和统计,最典型的例子就是之前中国移动一直在倡导一种叫四网协同,怎么来做好四网协同的工作,其实给大家举个很明确的例子,有可能体会到四网协同这个事,的确需要大批人去做,怎么讲?就是说我们现在以前都是G网,就是我们2G的网络,GSM网络用户,有很多用户,那么现在很多用户上网如果走我的GSM网络,导致我们网络零散很严重,我正常的语音服务我就保证不了,这个很严重,但是我们现在希望做是什么?就是把2G网络上的流量业务尽量的移到3G网络,然后现在包括4G网络上,那么这个东西怎么做,第一点你得分析,我所有全网的网络里面哪个网络,哪个基站上面他用户上网数据流量大,也就是我们说的热点,这个要做全网热点分析,这个可不是随便的一个软件或者一个数据仓库在短时间内就能做出来,所以说你只有用大数据的基础,以前各个省上报上来,通过Excel表格统计,这个基本上靠我们手工做好的方式,那么现在在做的方式就是说我可以用这种各种大数据技术我直接一次处理,把全网的数据哪些是热点,比如说流量大于50兆的哪些用户,这些是在2G网络上,如果要建3G网替代2G网络,分别分流的话,我怎么建设,那么以前是没办法做的,那么这里面就有一个复杂计算的过程,比如说这三个基站之间,有三个2G基站我用一个3G和4G的基站,我可以替代,那这典型的一个复杂图规划的问题,以前没办法,那种分析大数据那种分析数据也好或者平台下等于没办法做那么复杂,上百万结点的分析是非常复杂的,所以这就是我们在B域和O域都在做这样的事情,包括现在基于以前云计算潜在的研究以及部署上面,比如说我们建云计算的基地,比如说在阿尔多斯或者地理条件好一点的地方,我们会集中的建一些类似于这种大数据的机房,将来的业务都放在这个上面,大家都摸着往前走,虽然也壁垒,但是我们庆幸的是我们至少壁垒总有消除的一天,所以现在大家也不再等,而是在各个领域先做好这个事情,做好准备,将来有可能壁垒一消除,我们直接就好了,不希望我先去消除壁垒,然后再去做事,不是这样,运营商一直不是这种风格。

陈华:刚才我们谈到的大数据在网络分析的应用研究,O域的应用的问题。那么我们来谈一谈想请教一下魏凯先生,就是大数据的应用对于电信行业的商业模式将带来什么影响?如何应用大数据的分析来提升运营商的商业价值?

魏凯:这块我可能谈不了更细,因为我本身不在运营商里头工作,但是我觉得就是还是我刚才那些话,一个是在比如说传统精分里头,以前可能主要是一些结构化的那些数据,但是现在比如说你可以融合社交网络或者是网页爬虫类的数据可以做的更全面一些,实际上就是两个,现在我估计可能SAS系统也是这样的,一块是传统的关系型,一块是非关系型的架构,然后来源可能也是不同来源,上面会做更高级的融合分析,可能使咱们精分更准确,更高效,这是对内部的应用,我觉得对外我还是那种框架,如果对外的话,有可能会形成一种类似于云服务,大数据云服务的模式,我把我运营商的数据包装成一种服务的形态提供出来,有可能不是直接的数据就给你了,而是你有什么样的请求,然后我来根据你的请求做一定的加工,把结果保存,这是有很大的前景去做的事情,在这块其实这中间可能如果要做第二种模式的话,现在运营商的技术条件和这种要求中间还差很厚的一层分析能力,可能这个是未来主要的方面,努力的空间。

陈华:在大数据商业运用,其实一个不可回避的问题就是说数据的应用会带来用户的个人信息安全的一个隐私保护的问题,那么您认为怎么样去改善大数据的安全监管呢?

魏凯:这块就是现在都很重视,所有人都清楚大数据意味着你的隐私可能受到很大的挑战,这个是一样,在去年的时候Facebook有一个论文,他就是说我通过分析用户的赞的行为,然后我就基本上可猜出来你很多信息,他拿到你历史上点过50次赞的帖子,你再哪个帖子下点了赞,然后他就可以分出你是男的,是女的,是多大年龄,所以这个隐私的边界,以前的隐私保护可能只是注重你的身份证号码,姓名,家庭住址,电话号码这些,直接可以识别你身份的就是PII的信息,但是现在随着技术的发展,随着PII这种氛围不断的扩大,有可能不是直接这种信息,但是也可以去干一些坏事,但是我们觉得其实现在也是大家越来越容忍这种情况发生,比如我们很多时候都是用隐私来换免费服务,大家其实对这个事情看法其实也在慢慢的变化,就是原来认为坚决不能放网上的东西,现在也慢慢放到网上去,比如你小孩的照片,以前很少有人在微博圈,在圈子里头公开,但是现在大家都愿意分享,就是大家对这个东西的认识理念也在发生变化,就是容忍度更高了,但是我觉得不管怎么样,这个还是需要一些规章制度来给他划一条界限,就是说什么东西是禁止的,什么东西是可以的,去年工信部也出台了相关的规定,叫电信互联网个人用户信息保护的规定,那里头其实对于数据的采集、使用、转移和销毁等等都做了很多明确的规定,这个是我觉得在大数据里头可能,那个规范其实是一个底线,所有的做这种类型服务的其实都应该遵守的,那么在这个之外,他可能还不是足够期,不会涵盖现在技术带给现在管理很多挑战,他可能还没有考虑到那么细,所以说我们现在作为行业的研究机构,我们也在跟一些运营商也在探讨我们如何让运营商的大数据的挖掘能够不涉及到,不侵犯用户的隐私,有一个规则出来,大家有一个行业共识,就是说这个保护水准达到什么程度,比如说我的数据在给别人用的时候,我的艺名化要做到多大的强度,什么数据是可以去跟其他合作伙伴去分享,比如说现在很多运营商跟广告公司就是RTB,实施进价广告的广告公司在合作,就把用户的标签跟广告公司的系统打通,然后广告公司在做在线广告的时候,但是这里头可能就需要一个隔离带,这个隔离带可能需要详细的讨论,能够形成一个行业的规范,我们现在也在跟三家运营商一块来试图在做这块工作,目的就是想让我们的大数据应用能够更稳妥的前进,更健康的发展。

陈华:确实互联网的应用对我们生活改变了很多,原来我们不认为是个人隐私的东西,现在可能大家觉得这是隐私,原来认为隐私,现在觉得可能觉得可以放开一些,其实很多的用户,我觉得用户在网站的行为,包括他点击某个文章或者浏览某个视频等等,其实都有一些动机,但是他可能自己也不清楚自己需求是什么,我们通过网络分析工具和手段,就可以很好的挖掘出他一些潜在的需求,比方说平常一个人可能是道貌岸然、正人君子,但是他在网上看到一些很漂亮的照片,他可能会点开看一下,如果是平常一个人有点小偷小摸的行为,他在网上看到有些可怜的儿童或者什么事件,他也会表示一下关怀,这些潜在的需求完全可以通过我们大数据分析给它挖掘出来,我觉得大数据真是一个了不起的技术。

魏凯:现在对于隐私其实国际上也是很困惑的,大数据跟原来的隐私保护规则那八个原则就是知情同意用户许可等这些原则其实是有冲突的,现在有两种声音,有一种就是以像谷歌这种公司和互联网创始人他们代表一类开放派,让大家对这个东西更容忍一些,不要太在意很多东西,像以前的知情同意原则,其实在大数据里头其实很难做到,你数据那么多,很难让每个都让你同意一下,那你都烦死了,还有就是目的原则,原来目的原则就是你拿到我的数据以后,你让用户许可的时候,你得告诉我你拿到数据干什么,现在不可能了,因为链条可能干了什么事,现在这些原则都是要挑战的,另外一派就是管制,美国也有两派,美国的商务部做了一个规定,就是那个标准就是在浏览器,在浏览器里头建一个字段,那个字段如果开启的话,这个网站是不能收集用户隐私,比如说存留用户的帐号,如果不开启的话,就会表示同意,他这要强制执行,总的来说他这种想法限制收集,根本不能让你用,两派截然分开的,现在怎么平衡是一个很难的问题。

陈华:这方面也需要进一步的加强研究。那我们接下来谈下一个问题,无论是我们刚才讲的网络分析也好,还是商业模式改变也好,我想最基础的还是在你们大数据的技术在不断的进步,在不断的发展,那么我想请教一下万女士,SAS目前来说再关注的大数据技术重点或者说你们研发重点方向在什么地方?

万莉莉:其实这个问题比较大,不太好回答,我个人会觉得就是从我们从大数据本身这件事情来说,数据容量大家都是知道的,那数据类型多,包括它的数据价值密度非常低,响应速度会非常快,那我们肯定是针对这几点要求做研究,我们还能往哪些方面去走,那比如大家在外边展台的话,可以看到有一个叫高性能分析,这个其实就是主要去解决我们现有的效率的问题,就是关于效率的问题,最开始大数据上来的时候,包括大数据分析的时候,可能放在后台里隔个十天八天才能算出来或者一个月才去做一次的事情,大家都是可以接受的,现在肯定就是到天,再过两天可能就是实时,我必须要做实时的一些东西,那这样一个访问速度的话,在技术上,层面上我们要求怎么去做,SAS本身要考虑内存计算的技术,那通过这样一些技术和产品可以让大家更快的得到结果,你原来等一天,12个小时以上得到的结果,你可能现在等半小时、几分钟、十几分钟都能得到了,这是对大家最小的改变,你那些分析人员不会说我今天点了一个按纽,我明天再来看结果,我可能等几分钟我就可以拿到我想要的结果了,另一方面现在可能大家接触比较多的是文本的分析和声音的分析,接下来可能对于视频,将来最重要的是视频,视频这块的数据如何提炼出有价值的东西,视频这个东西其实在他的密度上是最低的价值密度,你可能三十分钟的视频,用户关注的就是几秒钟的事情,那他的价值如何更好的体现在大数据的分析结果上沉淀出来,这是我们将来要考虑的事情或者我们在努力的一些方向。同时的话,比如另外一个概念,其实这是跟传统的商业模式有关的,我们去谈互联网的商业模式最重要的是什么?其实最重要的一个就是他的响应速度快,另外一个就是它的交互性,但是对于传统的企业,他的可交互性是是非常低的,可能也只是这几年,我可能给用户有些体验式的一些东西,我去建一些体验的旗舰店或者说一些手机的体验的应用,仅此而已,那么互联网从一开始我就是交互的,我就是体验的,我更以客户为本去做一些事情,那这样的一个传统的商业模式,肯定是要跳出去,肯定是要改变的,如何跳出去,以前可能是做数据挖掘的这些人是要数学系的研究生及以上去做,天天对着代码或者灰色或者黑色编码的东西,现在不是,现在你可能几百个字段,你拖拖拽拽几个字段过来,当时图形化的交互式的数据分析我就给到你了,大家很容易,很直观的比例接收到了,那对于将来的一些员工的一些快速的适应,快速相应得到快速的结果,这些都是非常有利的,我们可能五天的强化培训,你就可以做一些很基础的东西,这不是我要去学一个编码,隔个半年,一年,两年,我才能上手去做挖掘的事情,那让更多的人,更多的业务理解上,更多懂业务的人去做挖掘的一些事情,去做原来只能技术达大拿们能做的事情,这是我们希望去改变的传统商业模式的和大家的一些习惯。

陈华:那么下面我想请教一下曹鲁和邓超,从运营商的实践来看,你们认为目前的大数据技术存在着哪些不足,你们最关注哪些大数据技术的发展。

曹鲁:目前来说,因为特别所关注大数据处理的技术,我们更多的就是希望能获得的一些包括帮助或者说我们更看好的一些就是在大数据和我们云技术的一些结合,就是在我们的平台上怎么更多实现大数据做的一些操作等等之类的,怎么说就是一方面数据挖掘的深度其实我们很多时候更多考虑的就是在这个有限的深度层面上去做一些事情,并不是越深越好,因为做数据挖掘的越深,对我们来说成本越高,事实上我们有些时候是不需要特别深的一些程度来进行对客户数据挖掘,但是我们对广度来说,需要广度的应用会比较多一点,因为我们运营商其实也是必须特殊的和客户的,不光是一个手机的连接,现在手机里面包含的内容,包括你可以用手机挂号,就是说从医疗个人的一些购买东西,还包括等等各个方面,所涉及的东西特别多,我们是希望在大数据挖掘的时候或者中型分析的时候,我们希望广度层面能更广,因此得到数据价值更多,深度层面有些时候是不需要的,不是说特别很深,我觉得这是我个人的感觉,就是说这样的话,对我们来说可能会更好一点,因为这样的话,我们可以以较低的成本来做这个事情,第二个我们能覆盖较大的,包括对一个客户来说,就是较大的行业范围,对于我们所有客户来说,所有的客户群都是挺大的,因为我们可能没有对某一个行业,我们要做一个数据分析的话,那么我们可以分析什么呢?清算这个行业有哪些用户可能会使用这个行业相关的工具或者是信息,然后我们对这个行业的分析就基于我们对这些用户的分析,然后得到一些有价值的东西,这样的话,对我们运营商来说就能更好的掌握一些相关的信息或者有用的信息。

邓超:这个大数据技术方面,其实我们从早些年到现在一直在登这个技术前沿,包括一些侧重于开源先进的技术,其实这块总体来说,我觉得这和我们业务有关系,其实我们运营商的业务,一部分是是所谓的离线分析的,还有所谓的就是这种实时交易性的数据,还有一种是总实时的查询的数据,不同的数据对数据量上来以后或者多样性上来以后,对技术的需求是不一样的,这里面其实我们觉得,现在这样的问题就是说有各种开源技术,开源的框架,但是现在我们的商用软件还是很难和这些开源的东西很好的结合起来或者很好把开源里面一些先进的模型提用到咱们的商业产品里面,比如说我们的SAS,可能现有,能不能提供很好,就是SPSS常用的分析软件,他这个和其他软件结合怎么样,就是我们现在用的大数据量处理,咱们分析的一些工具,他们结合程度,紧密程度,这是我们现在比较关心的问题,因为开源的东西自己用起来维护成本很高。

陈华:好了谢谢刚才几位专家精彩的阐述,作为主持人我本来还准备了好多问题,但是因为会议组织,我们安排的时间段有点超了,那么我们就将宝贵的提问机会就留给台下的观众。

提问:各位嘉宾好,其实咱们电信行业是掌握了,首先对客户准确度是很高的,因为可以定位到个人的姓名和手机号,咱们掌握的信息也很丰富的,从客户的手机的设备的信息,甚至客户的日常用手机的浏览信息,这些信息其实是很丰富的,很全的,刚才咱们也谈到了就是作为对除了我们自身的一些本身的优化,能不能为其他行业提供一些支撑的数据服务,就是说咱们电信行业更多的是有这样大数据作为一个数据服务提供商,提供一些数据产品,比如说现在利用咱们的数据可以对手机的制造商提供一些信息,反馈一些信息,还有对金融行业的欺诈,特别是手机号一些行为的分析,然后欺诈的一些识别,还有对客户行为的分析,关联出整个行业的行情这个情况,市场情况,所以说我不知道想问一下嘉宾咱们在这方面电信行业有没有作为一个数据产品提供商的想法。。

陈华:我看这两个问题都是跟运营商相关,请曹主任和邓超跟大家讲一下。

邓超:其实这个说句实话,运营商一直想做,但是不敢做,大家也都知道,因为运营商手上把握用户的数据也好或者什么东西,都是用户在现实交往的数据,和你用户在上网里面,比如说你上淘宝,上百度,你是一个虚拟世界里面的数据,你说用户本身对这两种,对运营商的容忍度和对互联网公司的容忍度是两个完全不同的级别或者说给运营商的绳子特别紧的,就是那根红线我们只要一碰,立马会召来,甚至是杀身之祸,但是这个事能不能做呢?能做,所以这个东西就是我们刚才电信研究院的专家说了,这个东西需要大家互相认识的过程,同时还有法律政策逐步完善的过程,我认为是这样的。

曹鲁:我觉得刚刚魏工也说到,我们可以把这个我们从大数据得到的一些结果和一些产品,然后作为一种服务提供给我们的客户,但是里面确实涉及到边界问题,确实很多时候,我们现在的情况不是很好掌握,但是话也说回来,说一个比较简单的,比方就是我们把钱存在银行的时候,我们所有的身份信息,基本上你把所有能提供的个人信息都提供给银行了,为什么我们能信任银行,而不能信任运营商呢?所以我觉得大家对运营商的要求实在是有点爱护之切,怎么说就是说,比如假设打个比方,假如360把你的信息泄漏出去,你会不会打360的电话去投诉他们,我相信这个百分之七八十的可能不会做这个事情,但是如果运营商把相关的信息透露出去,我很有理由相信你肯定会打我们的投诉电话,比如像10010去投诉,说我的信息怎么被你们给泄漏出去了,所以我觉得在这个刚刚邓工也提到就是说对我们要求有些时候不是很一致的,所以在这种情况下,我们如果要做这方面的运营或者做这方面业务的话,我觉得我们相对来说在大家接受程度阻力上是会比较大的,所以我们在这块的进展也是相对来说比较缓慢的,正是因为这个缓慢给了很多互联网产商或者很多其他的一些公司机会,所以说他们在这块也是做了很多,比如刚才360,现在我看到有很多电话,我就打电话过来,他就会显示这个电话是一个推销电话,很多时候看到推销电话我就掐掉了,表面看起来是一个普通号码,看不出平常,但是因为上面会标记推销,所以我觉得在这块相对的服务来说,对我们来说,我觉得我们可以做,但是再做到一个怎么样的程度,我觉得要得到大家的认可才能继续下去,如果说大家觉得运营商就是说做这个是违反公众利益的,我们肯定不会做这个对我们本身得利不讨好的一些事情。

提问:我是做金融服务行业的,我们面临的挑战主要是来自电商,就是阿里、腾讯这样的,所以今天这个会场我就不去了,确实没什么新意,我就来这边电信的,就是希望电信行业的数据能对我们开放,为什么呢?如果我们举个例子,你们刚才说数据可能涉及到一些隐私和法律问题上,如果是当时的阿里他们如果不敢做的话,他们现在也发展不起来,所以我是希望我们能突破这种法律界限或者说我们能够走到法律边缘,这个对我们来说,总的办法,因为我们是玩金融的,有的是办法,所谓金融创业是什么,就是规避各种法律,如果你们只要是有这个积极性的话,有这个愿望的话,我们这边绝对能想到办法出来,这就是我的希望。因为这个说实话,玩数据分析和数据挖掘对我们来说并不是难事情,但是我们受限就是这个数据,你们移动和联通都要强大网络,只要能获得我们支撑的话,我们也不会担心腾讯、阿里,这就是我们的希望。

魏凯:我们其实通讯部电信研究院实际上是在考虑这个问题,就是说运营商有这么大一个资源的优势,我们却在这儿静静的等着,所以说,但是确实是有一个边界在那里,所以我刚才也说了,我们现在联合三家运营商先在探讨这个红线在哪里,我也特别希望跟金融界的朋友一块来探讨,你们需要什么样的运营商这边的数据,然后我们之间应该有一个什么样的隔离程度,然后怎么样保留安全,怎么样保留隐私。

提问:我就是举一个例子,就是说我们希望数据,就是我在过去两年,我研究什么呢,我最感兴趣的是百度算法,因为我看到的是,我虽然不知道阿里他们是怎么做的,但是我大致可以猜出来,比如说他们有的数据,两千五的数据,我们这边没有,我们可能也获得少量数据,发现这些数据其实也是涉及到隐私的,但是同样是这样的,就是说我们现在走了五十步,我干嘛不走一百步,我是绝对有这个动力,就像国外的基因库,涉及到各个种族的基因,他这种做法其实也同样涉及到法律问题,但如果的话,因为这个问题不能往前走的话,那么我们就丧失了发展机会。

魏凯:就是我在这里也回应一下,然后也做个广告,就是我们现在有一个数据中心联盟,这个是我们和运营商和互联网公司和设备商一块成立了一个联盟,规模很大,七十多家单位,然后我们准备在五月中旬的时候,专门开一次研讨会,主题就是怎么把互联网的数据和金融界的数据,我们现在正在跟支付清算协会联合筹备这个会,如果说金融界的朋友很感兴趣的话,那边已经确定一些初步一些人,如果其他同志感兴趣的话也可以参加一块来交流,这个事情怎么往前推,这个是很有意义的事情。

陈华:几位专家还有补充的吗?因为时间的关系,我们就不安排下面观众提问,待会儿散场之后还可以和我们专家进行进一步的交流,就在本节圆桌对话里面,我们几位专家深入阐述了大数据对电信行业的价值,电信行业应用大数据面临的挑战以及大数据的发展趋势,我想观点都是非常精彩的,让我们用热烈的掌声再次对他们表示感谢,本次对话到此结束,谢谢大家。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");