五大商业分析趋势 帮助CIO处理商业数据

标签:最佳实践商业智能

访客:21904  发表于:2012-05-29 09:47:48

数据分析技术与商业智能的发展使得CIO们能以较低成本、快速而深入地处理商业数据。

近期,趋势中心调查显示,CIO们对商业分析的关注度并不低于如何利用新商机的力度。例如,随着越来越多公司不得不面对海量数据,如何利用这些数据也被提上了日程。大型数据集管理与分析等技术的出现,能够提前帮助公司分析成本与发展趋势,提供更有用的信息以帮助公司运营业务,这意味着公司能够发现比以前更深层次的问题。

在采访中,CIO们总结出了五点影响他们进行商业分析的IT趋势,分别为:大数据增长、数据快速处理技术、IT商品的成本下降、移动设备的普及和社交媒体的增长。

第一,大数据。

大数据指非常庞大的数据集,尤其是那些没有被组织、管理起来,不适于传统数据仓库的数据集。比如:网络蜘蛛数据、社交媒体反馈和服务器日志,以及来自供应链、行业、周边环境与监视传感器的数据等,这些数据致使公司的商业分析变得比以往更加复杂。

尽管并不是每个公司都需要处理大型、非结构型的数据集。但是,Verisk Analytics公司CIO Perry Rotella认为所有公司的CIO都应当关注大数据的分析工具。Verisk帮助金融公司评估风险,与保险公司共同防范保险诈骗,2010年的营收超过了10亿美元。

Rotella的工作是预先寻找数据间的联系与模型。他认为,技术领导者对于数据大幅度的增长,应该持乐观、欢迎的态度。

HMS公司CIO Cynthia Nustad认为,大数据呈现为一种“爆炸性”增长趋势。HMS公司的业务包括帮助联邦医疗保险(Medicare)和医疗补助(Medicaid)项目控制成本及私有云服务。其客户包括40多个州的健康与服务项目和130多个医疗补助管理计划。HMS通过阻止错误支付在2010年帮助其客户挽回了18亿美元的损失,节约了数十亿美元。Nustad称:“我们正在收集并追踪大量素材,包括结构性与非结构性数据,因为你并不知道你将在其中寻找到什么。”

关于大数据谈论最多的一项技术是Hadoop。该技术为开源分布式数据处理平台,最初是为网络搜索索引等任务开发的。Hadoop为多个“非关系型(NoSQL)”技术(其包括CouchDB 和 MongoDB)中的一种,其通过特殊的方式组织网络级数据。

Hadoop可将数据的子集合分配给成百上千台服务器处理,而主作业调度程序将整理每台服务器汇报的结果,因此其具有处理拍字节级数据的能力。Hadoop既能够用于分析前的数据准备,也能够作为一种分析工具。此外,没有数千台空闲服务器的公司,也可以从亚马逊等云厂商那里购买Hadoop的按需服务。

Nustad称,尽管并不是为了其大型的联邦医疗保险和医疗补助索赔建立的数据库,但是HMS正在探索NoSQL技术的使用。其包括结构性数据,并且能够被传统的数据仓库技术所处理。她称,经过实践证明最好用的解决方案,如果从传统关系型数据库管理层面出发并不明智。不过,Nustad认为Hadoop在防止欺诈与浪费分析上发挥着重要作用,并具备能够分析各种格式的病历方面的潜力。

在采访中,那些体验过Hadoop的CIO们,包括Rotella和Shopzilla 公司CIO Jody Mulkey在内,都将数据服务作为公司业务的参考重点。

Mulkey称:“我们正在使用Hadoop,代替以往数据仓库的工作。更重要的是,我们获得了以前未有的切实有用的分析技术。”例如,作为一家商务网站,Shopzilla每天会积累大量的数据。他称:“以前,我们必须要对数据进行采样并对数据进行归类。在处理海量数据时,这一工作非常繁重。”自从采用了Hadoop,Shopzilla能够分析原始数据,跳过许多中间环节。

Good Samaritan医院是一家位于印第安纳州西南的社区医院,其数据处于另一种类型。该医院的CIO Chuck Christian称:“我们并没有我认为属于大数据的东西。”尽管如此,管理中规定要求其整合庞大的电子医疗记录,存储为全新的数据类型。他称,这无疑要求他们实现从数据中收集医疗保健信息。不过,这可能将在地区或国家层次的医疗保健协会中实现,而不是在他们这种单个医院中实现。因此,Christian未必会对这种新技术进行投资。

Island One Resorts公司CIO John Ternent称,应该明确所面临商业分析的挑战取决于大数据中的“大”还是“数据”。 他认为,公司需要一种经济的方式来分析复杂的抵押贷款组合,目前,其正在谨慎地考虑在云上使用Hadoop的方案。据悉,Island One Resorts公司管理着佛罗里达州内的8处度假村。他称:“这种解决方案有可能解决我们目前遇到的瓶颈。”

第二,商业分析速度加快。

肯塔基大学CIO Vince Kellen认为,大数据技术只是加快商业分析这一趋势的其中一个元素。他称:“我们期待的是一种更为先进的海量数据分析方法。”与更为快速地分析数据相比,数据量的大小并不重要,“因为你想让这一过程快速的完成”。

由于目前的数据能够实现内存中处理,这与硬盘处理相比,其计算结果更快,即使仅处理数G数据量,效果依然明显。

尽管经过数十年的发展,通过缓存频繁访问的数据,数据库性能提升了许多。在加载整个大型数据集至服务器或服务器集群的内存时,这一技术变得更加实用,此时硬盘只是作为备份。由于从旋转的磁盘中检索数据是一个机械过程,因此与在内存中处理数据相比,其速度要慢许多。

Rotella称,他现在几秒中分析的数据在五年前则需要花上一整晚的时间。Rotella的公司主要是对大型数据集进行前瞻性分析,经常会涉及到查询、寻找模型、下次查询前的调整等。在分析速度方面,查询完成时间非常重要。他称:“以前,运行时间比建模时间要长,但是现在建模时间要比运行时间长。”

列式数据库服务器改变了关系型数据库传统行与列的结构,解决了另一些性能需求。查询仅访问有用的列,而不是读取整个记录。选取可选列,这极大地提高了组织或测量关键列的应用性能。

Ternent警告称,列式数据库的性能优势需要配合正确的应用和查询设计。他称:“为了进行区别,你必须以适当的方式问它适当的问题。”与此同时,他还指出,列式数据库实际上仅对处理超过500G字节数据的应用有意义。他称:“在让列式数据库发挥作用之前,你必须收集一定规模的数据,因为它依赖重复性提升效率。”

保险与金融服务巨头John Hancock公司的CIO Allan Hackney称,为了提高分析性能,硬件也需要进行升级,如增加CPU芯片,其与游戏系统中用到的图形处理器相同。他称:“可视化需用到的计算方法与统计分析中用到的计算方法非常相似。与普通的PC和服务器处理器相比,图形处理器的计算速度要快数百倍。我们的分析人员非常喜欢这一设备。”

第三,技术成本下降。

随着计算能力的增强,分析技术开始从内存与存储价格的下降中获益。同时,随着开源软件逐渐成为商业产品的备选产品,竞争压力也导致商业分析产品的价格进一步下降。

Ternent为开源软件的支持者。在加入Island One公司之前,Ternent为开源商业智能公司Pentaho的工程副总裁。他称:“对于我来说,开源决定着涉足领域。因为像Island One这样的中等规模公司能够用开源应用替代SAS进行统计分析。”

以前开源工具仅拥有基本的报告功能,但是现在它们能够提供最为先进的预测分析。他称:“目前开源参与者能够横跨整个连续统一体,这意味着任何人都能够使用它们。”

HMS公司的 Nustad认为,计算成本的变化正在改变着一些基础性架构的选择。例如,创建数据仓库的一个传统因素是让数据一起进入拥有强大计算能力的服务器中处理。当计算能力不足时,从操作系统中分离分析工作负载,可以避免日常工作负载的性能出现下降。Nustad称,目前这已经不再是最佳的选择了。

她称:“随着硬件与存储越来越便宜,你能够让这些操作系统处于一个商业智能层。”通过重定数据格式和将数据装载至仓库中,直接建立在操作应用上的分析能够更为迅速地提供答案。

Hackney观察认为,尽管性价比趋势有利于管理成本,但是这些潜在的节约优势将被日益增长的能力需求所抵消。尽管John Hancock每台设备的存储成本在今年下降了2%至3%,但是消耗却增长了20%。

第四,移动设备的普及。

与所有的应用一样,商业智能正日益移动化。对于Nustad来说,移动商业智能具有优先权,因为每个人都希望,Nustad能够随时随地亲自访问关于公司是否达到了服务级协议的报告。她还希望为公司的客户提供数据的移动访问,帮助客户监控和管理医疗保健开销。她称:“这是一个客户非常喜欢的功能。在五年前,客户不需要这一功能,但是现在他们需要这一功能了。”

对于CIO们来说,要迎合这一趋势更多的是为智能手机、平板电脑和触摸屏设备创建适用的用户界面,而不是更为复杂的分析能力。或许出于这方面的原因,Kellen认为这相对容易。他称:“对于我来说,这只是小事情。”

Rotella并不认为这很简单。他称:“移动计算影响着每一个人。许多人开始使用iPad工作,同时其它的移动设备正在呈现爆炸式增长。这一趋势正在加速并改变我们与公司内部计算资源交互的方式。”例如,Verisk已经开发了能够让理赔人在现场快速进行分析的产品,因此他们能够进行重置成本评估。他称:“这种方式对我们的分析产生了影响,同时也让每一个需要它的人随手就能使用。”

Rotella称:“引发这种挑战的因素在于技术的更新速度。两年前,我们没有iPad,而现在许多人都在使用iPad。随着多种操作系统的出现,我们正力争搞清楚它们是如何影响我们的研发的,这样一来我们就不必不断的编写这些应用了。”

Island One的Ternent指出,另一方面,为每一种移动平台创建原生应用的需求可能正在消退,因为目前手机和平板电脑上的浏览器拥有了更为强大的功能。Ternent称:“如果我能够使用一款专门针对移动设备,基于web的应用,那么我并不能肯定我将会对定制的移动设备应用进行投资。”

第五,社交媒体的加入。

随着Facebook、Twitter等社交媒体的兴起,越来越多的公司希望分析这些由网站产生的数据。新推出的分析应用支持人类语言处理、情感分析和网络分析等统计技术,这些并不是典型商业智能工具套件的组成部分。

由于它们都是新的,许多社交媒体分析工具可以作为服务获得。其中一个典型案例是Radian6。Radian6为软件即服务(SaaS)产品,近期已经被Salesforce.com所收购。Radian 6是一种社交媒体仪表盘,为Twitte的留言、Facebook上的帖子、博客与讨论版上的帖子与评论中提及的特定术语进行分析,尤其是为商标名提供生动、直观的推断。营销与客户服务部门购买后,这类工具不再依赖于IT部门。目前,肯塔基大学的Kellen仍然相信他需要对它们进行高度的关注。他称:“我的工作是识别这些技术,根据竞争力评估哪些算法适合公司,然后开始培训合适的人员。”

与公司一样,大学也对其声誉监督十分感兴趣。与此同时,Kellen表示,他可能还将寻找机会以开发专门用于解决学校所关注问题的应用,如监督学生入学率等问题。例如,监控学生在社交媒体上的帖子能够有帮助学校与管理人员尽早了解学生在大学里遇到的麻烦。Kellen称,目前戴尔已经做了这些工作,其产品支持公司探测人们关于故障笔记本电脑的分析。他称,IT开发人员还应当寻找一些办法将社交媒体分析得出的报警信息推送至应用中,以便于公司对相关事件快速做出反应。

Hackney称:“我们没有诀窍,也没有工具处理和挖掘海量社交媒体帖子的价值。不过,一旦你收集了数据,你需要有能力获取公司所需的充足信息,以将它们关联起来。” 虽然Hackney称John Hancock在这一领域内的努力还处于“起步阶段”,但他认为IT部门,将在公司数据的社交分析服务的数据关联中发挥重要作用。例如,如果社交媒体数据显示公司在中西部地区的社会评论越来越负面,那么他将希望看到,公司在该地区就价格或策略进行调整后是否会扭转这一负面趋势。

Hackney称,发现这类关联的意义在于让公司领导相信对社交媒体的投资具有高回报。他称:“在我所从事的行业中,每个人都是精算师,每个人都在计算,他们不会将任何东西建立在想当然之上。”

评论(1)

您可以在评论框内@您的好友一起参与讨论!

    1. 徐蕊 在采访中,CIO们总结出了五点影响他们进行商业分析的IT趋势,分别为:大数据增长、数据快速处理技术、IT商品的成本下降、移动设备的普及和社交媒体的增长。

      回复[0] 2012/05/29 09:48

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");