圆桌论坛:正在构建的大数据商业模式

标签:技术商业热点中国技术商业论坛及领袖峰会

访客:27899  发表于:2013-11-08 12:29:06

关于更多精彩内容,详见:中国技术商业论坛暨领袖峰会

  主持人:下面我们请姚宏宇作为我们这场的圆桌讨论的主持人。

   圆桌论坛:正在构建的大数据商业模式

   姚宏宇:我是友友系统CEO姚宏宇,我原来一直做云计算和数据层面的,在中国已经做了大概5年时间了,今天是第一次,非常感谢IT经理人世界,我以前一直做嘉宾,现在主持人了,非常感谢IT经理人世界。我邀请4位嘉宾商台。第一位是立得空间董事长郭晟先生,第二是中国电信研究院刘嘉总监,主要做大数据分析方面的研究,第三位达梦北京公司的总经理王国军先生,达梦是国产数据库的品牌,到时候让王总给大家介绍一下。最后是腾讯云数据分析中心总监傅志华先生。

   郭晟:大家好,我们立得空间是专业从事测绘和地理信息的专业公司,我们运用移动测量技术为政府军方和企业提供比较高端的专业的地理信息服务。我们公司治理与运用地理信息的大数据为政府企业提供服务,谢谢大家。

   刘嘉:我叫刘嘉,来自于中国电信北京研究院的。中国电信大家可能都比较清楚了,研究院的使命帮助运营商在信息时代,通过各种服务和增值业务和平台工建和共享开放构建比较好的开放环境,应用运营商的数据让企业更好的应用。

   王国军:达梦公司是国产数据库很重要的厂商,主要做关系型数据库,在安全方面做的比较突出,希望和大家有合作的机会。

   傅志华:我是来自腾讯的,我在腾讯市郊网络事业群里面做数据分析,数据挖掘的。我们的工作帮社交网络事业部把数据用好,提升产品经理在运营中的效果,提升产品活跃,产品收入,大概是这样的。

   姚宏宇:腾讯是大数据走在最前面的公司,我想请傅总帮我们分析一下,到现在为止云计算很多事搞不清楚,大数据最基本的东西都没有搞清楚。我想让傅总给大家解释一下,大数据跟以前有什么不一样?大数据分析跟以前有什么不同,因为这两个是促进大数据时代到来的原因?  

   傅志华:从我自己的工作感受来看,大数据是全样的,不是抽样的,它是准精确的,不是传统的统计的,或者你在oracle里,每个都不能丢的那种。比如说有一些操作统计的时候丢掉一个也不行,它是准精确的。第三我们要相关性,要效果,而不是简单的要找原因。比如说我们用数据的时候,更多的帮产品经理提升点击率这是很重要的,我们通过数据挖掘方法,对海量数据做分析,我找到一个规则,识别了一群用户,你针对这些用户做运营的时候,他的点击率比原来的点击率高,这样的话就行,不用证明为什么是这个原因,或者你的精确度有多高,你的抽样方法对不对,不存在这样的问题。

   姚宏宇:我觉得说了几个挺有意思的点出来,至少没有说4个V。下一个问题,上个礼拜麦肯锡发布了一个研究报告,指出未来10年会涵洞整个经济社会的基本技术,排在前面4项的会超过3万亿,排在前面10项中的没有大数据,排在最前面的4项,第一个是移动互联网,第二个是知识工作自动化,第三个是物联网,第四是云,但是每个东西跟大数据都是息息相关的。下面请电信研究院刘总跟我们说说麦肯锡的报告,大数据跟这几样的关联是什么?

   刘嘉:我们的理解,大数据像以前的网格计算或者之前的云计算和现在的大数据都是技术手段,未来的想象很难框定它的范围,未来得移动故联网,物联网都是大数据可以做的事。远程控制都是通过大数据改变他们方式的点。更基础的云计算,云计算跟大数据本身紧密度更高,大数据现在的技术,它的底层和它的处理,更多的都是从网格到云的承载。最后大数据可以影响很多很多的事情。就像现在的电子商务和信息化的共享开放会影响更多的传统行业,现在谈2025很难说谈我限制在哪些方面。只要你想到的,努力收集这些数据,共同把这个能力开放给大家,一起推进它,我相信它会润物细无声的存在。

   姚宏宇:刚才讲的是最基本的,一个大数据是什么,大数据分析跟以前有什么不一样,大数据跟热点领域有什么关系。下一个是大数据应用领域,面对的挑战。现在说了很多,其实落地是很难的。第一个问题王达梦数据库的王总,驾驭大数据在技术层面会面临一些挑战,您觉得最大的几个挑战是什么?应该怎么应对?

   王国军:从技术层面来讲,大数据首先是一个大,容量很大,大数据种类非常多,现在从关系型数据库,行存的,现在发展成列存的数据库,主要是对历史数据进行统计,分析查询速度比较快,还有非机构化的数据库,还有新型的,甚至流式数据库之类的,新型的技术,达梦在这方面做了一些基本工作,尤其是列式数据库和行式数据库,我们已经把这两个数据库整合在一个数据库当中,它可以同时支持在线的事务处理以及在线的事务分析。从使用角度上来讲,我觉得应该把大数据归归类,现在我们讲垃圾要分类,把各种各样的垃圾放在一个垃圾桶,这个垃圾彻底变成垃圾了。但是如果有条理的分在不同的垃圾桶就能变成有用的东西,大数据也同样如此。

   大数据大部分的情况下都是沉淀下来的数据,这些数据要分门别类,进行有规范化的,有规则的清洗,转换,加工处理,这样根据不同的数据库,根据你自己的目的,我们出发的时候知道目的,但是走的时候,就忘了目的是什么。我们大数据也同样如此,我们要知道,我们是为了智能交通,还是为了舆论导向,还是为了决策分析?我们知道我们的目的是什么,我们就会把大数据分门别类做的比较好。大数据肯定会改变我们的生活状况,谢谢。

   傅志华:我从应用角度来看,因为我回头看,跟很多朋友聊的时候,天天谈大数据,发现很重要的问题企业是不是重视?看看管理层有没有看这个职位,或者全职KPI是这个,如果没有天天说也没有用。因为你靠底下的人证明数据的价值是比较困难的。比如说把点击率提升2、3倍,但是你的管理层觉得还不如弄一个产品,比你那个效果好。如果管理层上面没有这个决策是很难推动大数据的。

   姚宏宇:这个东西是从上至下,一定要有一个决心。王总从技术角度说了一下,郭总做的是IT行业偏传统的,做的地理信息,在大数据整个理念当中,是从互联网公司发展,然后延伸出来的,对您这块行业,或者像您这样的传统的IT行业,您觉得有什么意义吗?有没有什么新的挑战和新的机会?

   郭晟:我们做的不是传统数据。我们做的是地理信息,现在与地理信息相关的,大家经常提到的GPS卫星定位,GNS,和摇杆技术,这些都是前沿的技术。我们是一个基于地理信息服务的公司,我们公司是国内实景地图的发明人,04年的时候,就是提出实景地图的概念。因为大家认为地图是二维地图,只是告诉我们位置。但是实景地图是什么概念?它尽最大程度的把我们所处的现实的物理环境,最真实,最快的展示清晰的位置。我们不光致力于地理底图,还致力于实景地图的推广和应用。大家对云计算恐慌,是不是有安全的问题。我们推出实景地图的时候,大家都说有什么用,对硬件和软件有很多的要求,我们怎么用呢?那是04年的时候。

   我们从08年开始致力于把实景地图应用在军图应用,比如说测绘,勘测的应用,我们沿着高端的专业放推进这个东西。按来我们想做数据的,不用管实景地图引擎,软件,也不用管实景地图的存储,也不用管实景地图的端,环境的应用。后来发现不是那么回事。想把实景地图大数据应用的好,我要做很多事。一个新的产业链产生的时候,你的原产业链里面的伙伴跟不上你的创新节奏,这时候我们要做很多事。比如说实景地图引擎要做,数据存储我们用云存储,还有手持终端的管理软件。我们提供大数据服务和自己应用大数据的时候不是简单的问题。

   企业怎么利用大数据?首先要对企业的信息化部门来一个改组,任命首席信息官要知道什么是大数据,什么是云计算。首先对公司的结构,对你的管理流程做一个改组。比如说现在都在讨论,商业电子化的问题,我觉得大量的传统企业,线下百分之八九十的传统企业,还没有实现真正的商业模式的电子化,这也是应用大数据所需要做的首要的工作。事实上技术的工作并不难,你这个企业新的IT架构是服务于自己企业发展的业务模式和业务战略的,你怎么用新的大数据的技术去服务企业的发展的模式,这是一个很重要的问题,所以企业还要干好这件事。干好这件事的时候,企业应用大数据就是自然而然的事,因为大数据已经来了,你可以不看它,但是它已经在那了。

   姚宏宇:在大数据里面,大数据应用带来的安全和隐私的隐患,有哪些隐患,我们如何应对?

   刘嘉:众所周知,因为中国是一个有分类管制的国家,我们的宽带和基础通信服务是政府政策资金壁垒垄断很严重的企业。以前传统的双方交易模式,我们对通话时间,流量或者更简单的打包做收费行为,所以对里面的内容不关心,通信隐私我们不关心,因为无利可图,所以我们不关心,因为量特别大。有了互联网以后,引入多方交易的模式,三方,四方,或者更多,打造一个平台,打造一个圈子玩法。运营商在商业模式的竞争上太传统了,慢慢被边缘化了,我们拥有的数据是最原始的,第一时间的,如何用好它。用好之前是如何能用它,如何敢用它。现在国内关于隐私信息安全的法律法规没有明确的说法。在什么情况下就侵犯所有人或者一些人的隐私,包括最近说的国与国之间的监听,反监听,多是大数据的应用。

   我们如何为大家的生活和各行各业的理念创新做服务?这种平衡很难把握。我们摸索一两年,现在大致的想法,清单级的,每一个人的一定是涉及隐私的,不管对你来说是小的东西,但是一旦被使用,首先告知诸位,你们愿意使用吗?或者点到在什么情况下使用。不能笼统的说你的信息作为内部使用,这种话跟没说一样。更多的是对外,大家一起利用数据,创造更多的边缘消费者和行业应用的情况。

   从群体特征来看,可能就不涉及到个人隐私的问题了。比如说我们对运动比较感兴趣,运动的厂商很多种,他们在哪里设计电子更贴近他们的消费者,以及他们的消费者在网上实体店是怎么分布的。以前打电话都是小量的,抽样的,这些材料是清单级的,涉及保密和隐私,以后我们通过技术手段,通过基站,URO的分析下,知道你上网的情况。比如说访问的阿迪达斯是百分之多少的是男性,多少是女性。这些信息可能就不侵犯隐私,如何利用分类以后的脱敏信息,可能是更多的使用者使用的。我们运营商希望把分类数据用开放的形式展现出来,供大家统一使用。我们希望遵守共同的使用规则,这些使用可能会有一些分层的问题。

   姚宏宇:因为我在大数据领域做了很长时间了,觉得争议比较大的两件事,我根大家谈谈,这个不在我们原来议题里面的。一个是刚才王总提到的,现在试图做统一,其实大数据最根本的,你能放进去,能存下来才谈大数据。从技术手段做平台,把OLTP和OLAP融合在一起。我希望每一位嘉宾从自身的经验来说,这种可能吗?有人能做到吗?

   傅志华:不一定是所有的数据都要存,敏感的信息不一定存的时间很长,除非用户有要求,或者付了费,一定要存才会存的,另外就是操作类的行为。比如说用户按哪里可能会存。但是也有一定周期,比如说多长时间没用调用就清除掉了。不是不可以存,要考虑你的投入产出比。因为在企业里面,因为像我们这样,我们在计算和存储成本花了接近上亿,这块要花不少钱。所有的东西多可以存,但是你的成本以非常高的速度增加的,这个命题可能要看一下,我们假设是什么?

   姚宏宇:你回答的是关于隐私的问题,这个隐私问题不光光是隐私法律上的考虑,还有成本的问题。我问的技术问题,OLTP和OLAP有没有可能统一起来。HANA说可以,王总也说可以,不过这个统一是有条件的。傅总先说一下,在腾讯里面是不是这样的?

   傅志华:我们也在试图去做,当然这是行业探索的方向,我们也在做,但是我们做的速度要考虑投入产出比。比如说我投入多少经历,投入多少成本,带来多少效果,这个决定我做这个事情的进度和最终实践的目的。

   姚宏宇:你觉得可以做,但是每个情况不一样。请刘总,你觉得这个说法靠谱吗?

   刘嘉:我觉得任何的现状都要看历史和发展才能讨论未来,不可能脱离过去讲未来。我讲一下我们运营商上是怎么考虑的?我们要求稳定的运营,我们对大家收费的,要承诺说得过去的电信服务质量。微信断了几个小时,没有别的渠道。我们断了几个小时,索赔和社会影响是非常巨大的。包括受理变更的业务调整,尽量用传统可靠的方式做,因为它的成本是可控的。但是要做好适应变化的要求,从技术层面和人员挑战方面,对我们传统行业来说,压力是很大的。

   姚宏宇:不能光靠技术本身。

   刘嘉:我们的薪酬体系跟他们不可同日而语,我们对我们在座的精英有多大的吸引力,大家心里有数。以后三大运营商可以查到你上网的行为,这种查询会采用新的技术,比如说Hadoop,分层存储,减少网络的开销,我们都会考虑的。我们更多的从过去看现在看未来,一定不是多长时间替换哪一个过程。

   王国军:达梦有一个产品叫达梦新(音译)把行式和列式数据整合在一起了。在一个库中不同的表根据你的应用,如果是LTP采用竖存,LAP采用行存。

   姚宏宇:大数据在有一些地方很明确的,除了互联网企业最强的在传统企业是交通和公安领域,我不知道在座的各位看到大数据的现状和商业应用领域,你觉得未来大数据会在哪些行业和哪些事情产生一些冲击。

   刘嘉:我觉得首先跟个人使用有关,因为大数据最终的商业模式,翘动所有的起点在于是你是否满足便利性。如果行业不改变,让企业使用一些应用慢慢渗透。

   郭晟:大数据是本来就存在的事,比如说地理信息里面,每天植物都在长,鸟在飞,这是生物多样性,这些事情本来就存在,比如说北京这个城市,我们每天在这个城市里发生的事件,每天也是存在的,企业每天产生大量的大数据,每个人的行为产生大量的数据,这些数据是存在的。现在由于移动互联网智能设备的发展,让我们感知这些大数据,原来我们对这个世界的了解是碎片化的或者残缺不全的,现在我们感受到大数据在我们身边,我们怎么采集它,管理它,利用它,有这样的概念在里面。

   汽车行业是自动化程度最高的行业,仅次于航天航空这个行业,他们对汽车零部件的制造,需要的数据量是惊人的,都是在内部实现的。汽车厂商销售的时候,收集客户的信息,但是这些远不远,买车到车的淘汰的全过程。随着新的技术的产生,我们可以对任何一个产品,全设备周期都关注用户的体验,用户的感受,我们重组生产资源,为用户提供最满意的产品。企业最大的问题,就是线上和线下的鸿沟,传统企业怎么跑到线上,线上的企业怎么跑到线下。我们企业不断的实现电子化,像腾讯不断的把自己的技术应用到传统领域,我相信过几年以后,我们就能真正使用好我们的大数据,享受它给我们带来的便捷。

   王国军:前一段时间我们跟交通委做的合作项目正好用到了大数据,哪个环路应该增加一个出口,哪个公交车站应该拉长站台,交通拥堵不是有事故或者怎么样了,是因为它的交通管理设施出口以及它的画线有问题。如果能用大数据做一些分析,肯定对我们交通起到很好的疏导作用。

   姚宏宇:傅总把未来展望和现状做一个总结?

   傅志华:从数据处理过程中有那么几个环节,采集,存储,分析最后呈现。为什么现在大数据比较热呢?因为这两年,互联网和移动互联网的发展比较快,渗透率比较高,移动故联网的能力决定采集数据的能力提升了。大数据就在我们身边,我们是没有能力采集或者以更低的成本采集回来。比如说用摄像头采集也可以,但是图片处理成本就高了。未来哪些行业跟互联网结合的比较紧密,它就更有可能能够通过大数据改变它的商业模式和提升它的运营效率。

   姚宏宇:好谢谢,我们今天的圆桌讨论到此结束了,非常感谢各位嘉宾。未来整个趋势有三个,一个是泛数据化,泛网络化,泛移动化,这三个趋势加起来,对未来社会产生更大的冲击。

关于更多精彩内容,详见:中国技术商业论坛暨领袖峰会

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");