关于Cloudera

访客:14038  发表于:2018-01-18 12:41:16

Cloudera使组织机构在当今超连接的世界中成为数据驱动型企业。我们开发了用于数据管理、机器学习和分析,且为云计算优化的现代化平台。我们通过与全球开源社区的广泛合作,数据管理技术的不断创新,以及利用基础设施的最新发展(包括公共云“大数据”应用),取得了这一地位。我们开创性的混合开源软件(HOSS)模式将最好的开源与我们强大的专有软件结合起来,形成企业级平台。该平台为数据管理、机器学习和分析提供了一整套功能集成,为客户提供了一种灵活,可扩展和具有成本效益的解决方案,用于转型其业务。我们的平台使组织能够利用来自物联网(IoT)等多种来源的大量数据,更好地为客户提供服务和营销,设计连接的产品和服务,并通过更多的数据洞察力来降低风险。在我们的平台周围发展了一个充满活力的生态系统,并且正在建立越来越多的应用。我们认为我们的解决方案是最为广泛采用的大数据平台。

世界正在通过移动,社交,互联网和传感器活动迅速相互联系。国际数据公司(IDC)估计,到2020年将有300亿互联网连接设备及移动设备。此外,预计每年产生的信息量将会增加,IDC估计2020年将会创造的信息量将比2005年增加约440倍。开发人员已经创建了数据密集型应用并且利用所有这些信息。传统的数据管理技术在技术或经济上不能捕获这些数据或支持这些应用。企业面临的挑战是管理和使用快速增长的新类型和不同类型的数据。而且竞争越来越激烈和监管要求越来越高。为了实现其业务目标,他们必须采取以信息为中心的策略和数据驱动的解决问题的方法。所有行业的组织需要发展能够以任何形式从大量数据获取洞察力、有效竞争和遵守法律法规的快速、经济高效的数据处理能力。他们需要管理所有可用的数据,无论它可能来自或存放在哪里。他们需要一种基于最新开源技术的现代开放数据架构,同时也适用于公共云基础架构设计。

于此响应,我们创建了我们的软件平台,开创了混合型开源软件模式。 HOSS将最好的开源软件与专有软件相结合,以满足大型企业的严格要求。通过将强大的专有软件与基于领先的数据管理和分析技术的开源平台相结合,我们为客户管理,运行和保护数据和数据架构提供了更大的价值。我们的HOSS模式对区隔我们与竞争对手的解决方案也有重大意义,比如那些只从开源社区里‘拿来主义’但并不贡献的厂商。这种差异化也建立了长期的客户关系,并产生了确保我们能够持续创新的收入。

我们的横向扩展分布式架构能够在低成本的行业标准硬件或云基础架构上提供高性能。我们允许企业在多种架构上运行,管理和移动工作负载,混合内部部署和云环境,包括所有主要的公共云基础设施提供商 - AWS亚马逊网络服务,微软Azure和Google云平台以及托管服务提供商(MSP) 。我们还实现了企业的“多云”战略,使其能够将工作负载从数据中心迁移到公共云,在公共云供应商之间迁移,或者再迁移回来,从而避免了云供应商锁定。此外,我们的客户还可以从同一个管理平台上跨这些不同环境进行部署、配置和监控所有工作负载。这种灵活性使客户能够不断确定和实施最具成本效益的策略。截至2017年1月31日,我们全球8000多名客户中约有18%在云端运行我们的平台。

下一代数据管理,机器学习和高级分析的市场随着世界日益紧密的联系而大幅增长。我们的平台目前面向三个新的转型市场:(i)动态数据管理系统; (ii)认知/ AI系统和内容分析软件;和(iii)高级和预测分析软件。 IDC估计,总体而言,这些市场将从2015年的87亿美元增长到2020年的221亿美元,年复合增长率为20.5%。除了这些新市场,我们的平台目前正在解决和扰乱传统市场,包括关系型数据库管理系统和非关系型数据库管理系统市场的很大一部分。将IDC对这些新兴传统市场的估算结合起来,我们认为,到2020年,我们的总体市场机会预计将达到656亿美元。

我们以订阅的形式提供我们的软件平台,并将我们的销售重点放在全球最大的8000家企业 (G8K) 以及大型公共部门组织中。我们面向这些组织机构是因为它们采集和管理世界上大部分数据并运行高度复杂的IT环境。这些组织最能体会到企业级平台的最大价值。我们在相对较短的时间内取得了显着的增长和全球规模,截至2017年1月31日,我们拥有大约500个G8K客户。 我们的客户不断扩大对我们平台的使用。截至2017年1月31日,我们的订阅收入净增长率为143%。在我们的平台周围发展了一个日益壮大的充满活力的生态系统,许多第三方开发商已经主要对其进行了标准化,构建了100多个行业特定用例或应用程序,使用我们的专有技术。我们将其称为合作伙伴解决方案。作为这个生态系统的一部分,我们与英特尔公司(Intel)建立了战略合作伙伴关系,以优化我们的软件以用于英特尔处理器和架构。由于我们和英特尔致力于这一合作伙伴关系,我们的平台在当今的英特尔架构上实现了差异化的性能,并且预计也将在未来的英特尔平台技术上实现差异化的性能。通过使用案例和打包解决方案的不断发展,合作伙伴生态系统的扩展和技能的繁衍,我们将进一步扩大客户的机会,由易用性和云的加速推动。

我们解决方案的主要差异性

可部署的内部部署或公共云 - 或两者兼而有之。通过我们对基础设施泛硬件兼容的理念,企业可以在最能满足其性能和效率目标的各种环境中存储和分析数据 。我们的解决方案允许企业跨环境管理长期和短暂的工作负载,混合内部部署和公共云基础架构,包括所有主要的公共云供应商 - AWS,Microsoft Azure和Google Cloud Platform。我们能够实现企业的多云战略,使其能够将工作负载从数据中心迁移到公共云,在公共云供应商之间迁移,或者再迁移回来。客户维护和控制对其数据的访问,并且能够更好地获得更优惠的条件,也避免云供应商锁定。

利用最新的开源创新。我们的平台整合了开源数据管理技术的最新创新。除了我们对新项目创新和现有项目增强的贡献之外,我们还能够利用更广泛的全球社区最重要的创新。例如,我们是第一个采纳Spark的数据平台供应商,在2013年将其集成到我们的平台中,从而增强了批量处理,实现了实时,流式和机器学习工作负载。我们采用Solr,Kafka,Impala和Kudu这样的项目表明,这种策划和整合是一个持续的承诺。因而我们能够为客户提供更好的服务,并将最新开源技术的业务资本化,以提供高度集成,安全和高性能的平台。

赋能机器学习。我们平台的独特设计旨在赋能快速增长的数据科学社区和机器学习应用。通过集成Spark和流行的数据科学语言(如Python和R),我们的平台支持批量,实时和高级分析。我们提供了在大量数据上可靠地运行大规模迭代算法(包括机器学习算法)的能力,以支持各种关系和非关系模式,并在多种开发和数据科学语言中表达分析工作负载。这些功能使企业能够识别历史数据的趋势,识别当前或流媒体数据中的事件,并预测未来的事件,并能随着经验而不断改进。

提供企业级性能,特点和功能。我们的平台符合大型企业内部和公共云的严格要求,包括:

可扩展性和高性能。分布式架构使我们的客户能够轻松,低成本地增加容量,以满足企业应用的速度和吞吐量需求。结合许多小型,低成本的计算机,并将其存储和处理能力集中在一个或多个集群中,我们的平台可以以较低的成本提供超过传统系统十倍或更多的性能改进。随着数据量或性能要求的增加,添加更多容量或计算能力就像向集群中添加其他计算机一样简单。容量和性能随群集大小呈线性增长。通过我们平台的一次安装,客户可以扩展到数百PB的管理数据。

规模化和跨环境的集成管理。我们的客户可以从集中式的界面在公共云或本地环境的任何组合中部署,配置和监控所有的集群和工作负载。我们提供可配置的监控和报告以及直观,强大的故障排除,以便对海量不断增长的数据集和并发用例进行全面管理。

数据安全和治理。我们的平台使用专有身份验证,网络隔离,基于用户和角色的权限,访问日志记录,审核,沿袭和加密,包括复杂的密钥管理,以在整个平台上提供全面的企业级数据安全性。此外,我们的平台通过全面的数据治理,包括数据发现,数据血缘追溯,元数据标记和策略执行,实现了监管和行业特定的合规性。

总拥有成本低。我们的扩展架构在低成本的行业标准硬件或云基础架构上提供高性能。这种架构允许组织以比传统数据管理平台低得多的成本获得洞察力并从数据中实现价值。我们专有的云自动化,系统管理和数据管理功能可以减少运行集群和工作负载所需的人员,同时满足合规性标准。我们的平台允许客户选择最具成本效益和适用于每种用例的基础架构环境。此外,我们平台的原生安全功能不需要额外的第三方许可证,进一步降低客户的成本。

公司简介

Cloudera成立于2008年,四位创始人分别来自Google (Christophe Bisciglia)、Yahoo! (Amr Awadallah)、Oracle (Mike Olson),和 Facebook (Jeff Hammerbacher)。成立后不久,Doug Cutting,Hadoop的发明人,于2009年加入公司任职首席架构师至今。公司目前有超过1600名员工在28个国家有分支机构。合作伙伴超过3000家。

评论(0)

您可以在评论框内@您的好友一起参与讨论!

--> --> -->
<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");