天猫双十一IT能力大揭秘:更自信,就不需要百炼成钢

标签:天猫双十一IT能力

访客:22934  发表于:2015-11-23 10:36:16

在当前云计算市场,混合云是一个颇为时髦的名词,它让用户暂时不去纠结公有云安不安全,也让在云计算面前踌躇不前的企业多了“先干起来”的理由。不过在近日阿里巴巴双十一技术分享会上,面对有记者关于“天猫双十一混合云能力是如何部署、比例是多少”的提问,阿里云阿里云资深总监李津却有点儿急:“很多人都要去纠结公有云、私有云的比例,但与其关注比例,不如关注能力,能力到了,比例根本不是问题。”

有“母体” 更自信

李津对阿里云的技术能力特别自信,在他看来,做云计算业务有“母体”的公司并不多,国外有AWS、Azure,国内有阿里云。这也让阿里巴巴在杭州既有提供公有云服务能力的阿里云,也有传统的天猫和淘宝的机房。对于阿里巴巴来说,没有云上和云下的概念,部署的都是统一的标准化产品。对此他举例:“以前双十一我们需要增加两份资源,一份是阿里云的资源,一份是集团的资源,而今年我们只增加了一份,阿里云的能力已经在与母体整合,未来一到两年之后公有云、私有云的区隔就取消了,一切只取决于资源的替换。当技术上阿里巴巴已经实现公有云、私有云的打通时,真要说比例,那就是把资源转化成公有云进行售卖的比例。”

天猫双十一IT能力大揭秘:更自信,就不需要百炼成钢

天猫双十一IT能力大揭秘:更自信 就不需要百炼成钢

当今年的双十一阿里巴巴实现912亿人民币交易额的背后,可以想见其“母体”有多大,李津坦言阿里云还没有超过“母体”,不过明年或者后年或许就会超过,而AWS已经超过。不过在“母体”之外,当我们把目光聚焦在912亿人民币交易额背后的另两个数字:每秒14万笔交易和每秒8.59万笔支付时,很难想象这些核心交易系统和核心支付系统已经在本次双十一实现100%构建在公有云之上。

云计算不是一个拼体量的事儿,对此阿里云高级产品专家何云飞表示:“做技术要么是赚钱,要么是省钱。阿里巴巴其实只有3万人,而我们更愿意用技术去实现资源利用和资源调度。”应该说透过阿里云,大家看到的只是其“母体”的“冰山一角”。在aliyun.com上,在服务器、负载均衡、RDS云数据库“三大件“之外,虽然阿里巴巴自研的大数据产品ODPS、OceanBase都会尽快上线,但是还有太多的阿里巴巴十几年发展起来的技术能力没有开放出来。以虚拟化为例,阿里云目前在公有云上售卖的主要是XEN、KVM虚拟机,并不是阿里巴巴全部虚拟化技术,其实阿里系什么样的虚拟化技术都有,只是不可能都拿出来售卖。

有时候不需要百炼成钢

在阿里云目前即将售卖的能力中,OceanBase数据库令人关注,蚂蚁金服高级技术专家韩富晟也在本次沟通会上详尽介绍了这个从第一行代码开始写起、完全自主研发的关系型数据库产品。

OceanBase从2010年5月份开始立项,去年双十一正式开始使用,有10%的交易流量留在OceanBase数据库上,到今年这一数字已经达到100%。

其实熟悉数据库的人都知道,传统关系型数据库一直被一两家公司垄断,配备的硬件设备也都极其昂贵。对此韩富晟表示:“基础软件建立信任感是最重要的,我们用了五年时间已经算是很快。”因为如果想要把双十一百分之百流量迁到OceanBase上,就需要获得所有人的认可,这其中牵涉到最关键的就是“钱”,而OceanBase也承诺了金融级的安全。今年双十一14万每秒的订单创建和8.59万笔每秒的支付全部落在OceanBase里,直接结果就是双十一当天写进数据库的数据量有10TB。

数据库最主要的衡量标准就是可靠性,这方面容不得闪失。鉴于OceanBase使用PC服务器,OceanBase考虑的就是如何在软件层面弥补设备在高可靠性上的差距。对此OceanBase实现同一个用户写进来三份数据,使用Paxos协议保证数据写到三台机器中的至少两台。

另外,OceanBase有别于传统数据库整个存储数据的方式,只是把发生变更的数据放到SSD上,所有的修改操作只发生在内存中,保证了高性能。因为发挥长处、避免短处,使硬件效率发挥到最大,这也使得OceanBase比开源数据库成本更低。

其实对于阿里巴巴自研OceanBase,应该说一直存有争议。对此李津特别感慨:“总有人问我们为什么写OceanBase?那我要反问一句,为什么AWS要去写自己的数据库?以前华为、海尔担当提升国人信心的事,在互联网时代,阿里如果不担此重任,都对不起2000亿的市值。”他有一个形容在记者看来还是挺动情的:百炼成钢绕指柔。因为国人对自己的很多技术和产品不自信,新东西出来根本不敢往外推,包括OceanBase、淘宝和天猫使用的HTTPS还都没有上云,可是有时候千锤百炼就意味着贻误战机,绕指柔就不能杀人了,在李津看来这还是自信心不足的问题。

在阿里巴巴技术研发之路上,有时候事情开始的时候没有那么大野心。对此李津举了个例子,双十一开始几年,阿里巴巴坚定地认为银行就可以解决交易支付问题,但事实上很快就失望了。因为你的诉求不是他的诉求,没有道理让银行为了阿里巴巴去增加几倍或几十倍的技术支持,而且这个体量的增加还是建立在原来IOE架构之上,投资得呈几何级数增长。这就倒逼了阿里系去做创新,这也就促成了余额宝、花呗的诞生。再回到OceanBase上,如果阿里巴巴不去自研并使用,挣的钱都不够交License。

倒逼技术创新

作为倒逼出来的技术创新,阿里巴巴技术保障部研究员林昊也介绍了阿里巴巴的异地多活技术。对于业界流行的两地三中心,阿里巴巴认为不适合自己,原因有三个:首先,当一地数据中心出问题时,异地备份的数据中心并不保障一定能够正常服务,即使服务正常,运行速度可能也会迟延;其次,异地备份中心平时不对外提供服务,资源闲置造成浪费;另外,对于阿里巴巴这样的规模来讲,两地三中心中意味着数据还是单点写,压力高的时候对于存储成本压力会不断增加,数据库伸缩和外层业务伸缩都面临更大挑战。

针对这一情况,阿里巴巴的解决方法是使用异地多活,在1000公里以外跨地域部署数据中心,每个数据中心都承担用户读写流量,任意一个数据中心出现问题,其他数据中心都可以分钟级去接管用户流量。

对于阿里巴巴来说,其实异地多活面临着很大挑战:包括距离带来的延时问题、多点写入带来的数据正确性问题,为此阿里巴巴内部诞生了很多自研技术,来面对挑战,包括数据库保护技术、流量切换技术、数据同步控制技术。其实阿里巴巴异地多活的实现也经过了三年的时间。这其间为了平滑迁移,不影响业务,分为三步走:同城双活、异地双活、异地多活。

对于阿里巴巴来说,其异地多活能力已经在内部沉淀为支付宝、蚂蚁金服的能力,而这一能力未来完全可以向业界开放。

来源:ZD至顶网

天猫双十一IT能力大揭秘:更自信,就不需要百炼成钢

评论(0)

您可以在评论框内@您的好友一起参与讨论!

<--script type="text/javascript">BAIDU_CLB_fillSlot("927898");