万网范春莹:混合云计算的技术解析和实践
目前中国网民数量达到5.2亿,并且不断向上攀升,同时有4亿手机用户,以及去年年底到6000万智能手机设备,今年突破一个亿,另外电子商务发展速度非常快,一直是GDP速度的5倍左右。域名775万、网站230万,其中企业网站100万左右,国际出口带宽1.4T,这里很多数据在下降或者增长很慢,比如域名和网站下降很多,高峰期达到1100万域名,现在已经降到300万,这也说明互联网发展状况如果我们也用基础设施建设大跃进方式做肯定走回头路。国际出口带宽1.4T并不大。我们难以想象一个国家出口带宽还不如一个网站一天所需要带宽量,这里面有很多问题说明我们在国内外信息交换做了很多限制,或者说抑制了大家国内国外数据进行融合的诉求,这是我们未来要盯住的基础数据看看互联网到底前进还是后退。
中间的图是说国际上云计算发展平均增长率26%,中国根据IDC产业报告大约在30—40%,高于全球云计算增长率。第第一张图说明最近几年电信固定资产投资规模没有上升在持平的状态,在这个状态下依然实现云计算30—40%的增长,说明云计算技术提升设备资源利用率,带来了更好的绿色环保的技术发展状态。现在十万台以上服务器规模只有30台左右,大部分零散的,没有做整合数据中心,今年年初的数据,全中国服务器保有量只有500万台,平均下来每个数据中心也就10台服务器,这显然是步态可能的,说明数据中心非常零散,未来五年大量数据中心迎来一次整合,可能由小变大,也可能虚拟化云计算技术把这些数据中心重新组装起来,这里面存在着巨大的机会。云计算在全球IT架构中的采用比重,云计算技术面临很多旧设施体系的淘汰,浪费很多陈旧成本,发达国家用云计算替换传统IT架构更谨慎,而发展中国家很多从零开始,我们从最初就选择云计算架构,甚至云计算概念反倒更容易申请到项目投融资包括项目计算,催生整个云计算产业是全国性的,不仅仅是供应商和用户的追捧,包括企事业单位研究机构甚至大学院校纷纷搞云计算课题,这对于我们是一个机会,今天我们希望这个概念持续升温,很多年大家向这个方向努力,即便有一点理想主义色彩,最后我们也能把它做成真实的状态。因为云计算让我们有机会跟欧美站在同一水平线上。
互联网今年五大关键词,云计算占了其中的很重要的一项,最后球是运营商、平台商,这都是大的传统软件企业,或者是像Google或者微软这样的提供平台,下面是虚拟化管理软件,中国也有一些企业像万网、阿里云、华为、盛大也都在。
什么是混合云?这是根据美国国家标准和技术研究院的定义,混合云它是把公有云和私有云整合在一起,通过或者是标准化或者专有技术能够使数据和应用自由地转化和移动。私有云和公有云混在一起,但是数据能够自由转换。所以我们先看一下私有云架构,私有云架构里把传统的孤立数据中心用虚拟化技术、一定的存储技术,比如共享存储或者分布式存储,再有云计算资源调度系统,这三种系统管理起来称之为私有云架构,同时跟公有云或者互联网的接口。公有云跟私有云最大区别是依赖公有网络,现在万网属于阿里巴巴集团,所以集团做公有云部署是三个点,北京、杭州、青岛,三个点的公有云数据中心通过骨干网光纤连在一起,现在是双向15T光纤连在一起,可以通过内网传输,我们1个G差不多付出15—20万的费用,今天通过公有网络进行时时备份还是做不了,代价非常高。当你一台机器出了问题想到另外一个城市这几乎是不可能的,这种数据传输成本还是比较高的。公有云现在不同点,当一个城市如果彻底出现网络线路崩溃,我们可以通过自由线路走到另外一个城市。在公有云网络里边肯定不依赖与单点机房,我们今天在杭州至少有六七个机房,电信、联通、教育网、光电这些都连在一起,这些机房用我们自由的ABTN骨干网连接在一起,在一个城市里可以形成一个城域网,所有数据可以自由在机房转换,用户感觉不到跨了机房,这个线路可以做到60—70G,逻辑上理解为一个网络。然后我们还需要CDN最后一公里的技术,如果我们想做公有云技术肯定要学习亚马逊,把整个产品线做得更完整。我们沿着亚马逊的路线做公有云
那么为什么有混合云状态的存在,基于上述两种状态都有各自的优缺点,公有云现在遇到了一些安全和隐私方面的挑战,很多企业不愿意把自己的数据放在公有云上,尤其是大公司,他觉得钥匙还是在自己这里比较好。第二公有云有资源控制性的问题,它能控制到什么程度、灵活配置到什么程度。私有云的性价比不高,需要自己做网络设备部署,需要自己管理,如果部署了500台服务器只能享受到500台服务器的资源,扩展性比较差,无法做到快速部署,不像公有云那么灵活,门槛也比较高。企业商业模式支撑的敏捷性问题,这是私有云和公有云都有的缺点,当需要私有的时候发现公有想扩展的时候私有云又不支持,所以这时候就呼唤另外一种云计算的模式,就是混合云的模式。
国内外混合云发展状况和趋势,我们在这里会看到有四行,这四行大体代表现在主流的状态,我们发现这里边强调的混合云具有同源性,我们不对国内国外做评价广告,我们客观看待其实私有云就是由这么几家控制的,第一家是opnestack,cloudstack、racpspoce,目前来看它的俩很像,是两个不同的分支。racpspoce如果选择了他的混合云结构,可以把racpspoce的公有云和物理服务器联结在一起。可以把私有云连接在一起,多个私有云用一个管理起来。可以把运行在各个数据中心私有云网络跟racpspoce的公有云连接在一起,所以一套管理系统公有私有一起管理起来,这是racpspoce的特征。Eucalyptus和amazon,在未来的某个时刻amazon可能只支持安树,这样私有云最佳解决方案肯定找Eucalyptus,他们跟电科32所建立战略合作关系。在安舒领域也是做的非常不错,他会把私有云通过安舒系统管理起来,整个安舒天然就没有自己存储系统,它的存储系统或者共享存储或者通过API软件直接写到amazon,所以它天然支持亚马逊,跟亚马逊没有竞争只有合作关系。我们再看微软系,今天微软在中国推出的云计算解决方案,这套解决方案现在是3.0最新版本,已经不错了,这是微软收购的项目,原来虚拟化的早就废弃掉了,微软产品一直是到3.0才算稳定。万网在虚拟化这太路上走了很多弯路,我们在08年的时候就用了1.0做的虚拟化,当时是微软很多工程师帮忙来做,事实上还是有很多问题。现在到了3.0基本上在分区虚拟化做的非常不错了。微软的云计算核心竞争力其实在公有云,在微软pus平台上,所以微软全球平台都是自己做,他没有把自己当成解决方案提供商,他把自己当成一个运营商,只有在中国是例外,因为中国他拿不到IDC资质,没有办法在中国运营托管云计算的环境。以前他们通过新加坡解决这个问题,目前他们准备在中国建立云计算合作中心,这也是迫不得已的选择。EMC收购了vmware,这是两个贵族血统的牌子,未来的十年已经发生为为消费者服务的时代,他们那么昂贵的存储设备都会面临一次彻底的革命,他们可能再也卖不了那么高的价格,因为客户今天多了很多现在,他可以用完全免费的分布式存储、用廉价的PC服务器做存储,不需要再买那么多设备,原来强调高IOPS、高稳定性,现在在云计算已经不存在,现在没有人再想空间不够,或者消除副本保留单父本,现在是保留几个在云存储体系,公有云一般是三个拷贝,根本不建议多保留几份拷贝,所以这套贵族体系未来彻底洗牌。他们为了避免被洗,现在收购一系列公有云的公司。万网因为有IDC背景,现在也在做混合云的项目。
安舒和亚马逊架构图,左边私有云、右边公有云,通过IGI做交换,直接写到亚马逊存储。这个图也很像,左边私有云、右边公有云,这是传统意义上理解的混合云的架构,其实opnetsack主要是三个部分,第一是管理系统、第二是存储,可以提供对象存储和分布式存储,第三它提供把EMG存到本地,也可以存到其他公有云存储里,所以这套存储可以方便构建自己的IT系统。它唯一缺少的第一是弹性计费,没有bos系统,得自己开发。第二要自己做汉化,现在没有特别好的版本直接拿过来就用,所以开元项目做到一定程度就不再往下做了,剩下的是留给各个企业进一步完善它。微软的Azure平台,它提供给工程师非常方便的方式写公有云和云计算方式,将来分布式计算存储都会发挥出作用。我们可以用管理工具既管理私有云和公有云帐号权限,也是同一套系统管理两部分。所以我们也在想如果公有云再逐渐扩大,整个互联网都是一个项目的时候,私有云可能变成公有云的一部分,这是公有托管私有的一个理想状态模式。假设我们现在处于大的公有云活动,用户访问到的都是虚拟机,虚拟IDS数据库,体系都是公有云体系,很多用户希望把自己私有云的部分搬到公有云机房,有物理服务器、阵列、安全设备,我们允许搬到物理机房里,形成了物理上的公有云机房和私有云机房,但是线路完全打通实现内网互联,逻辑上用户把数据库把ERB系统放在服务器上,把前端应用放在虚拟机上,之间形成内网互联和逻辑上同一套网络结构,从而形成了公有托管私有的模式。
对用户来说原来要自己找托管放硬件的私有云环境,今天我们把它的物理服务器和设备都放在公有云服务商这里,很多用户可以在同一个机房单独拥有自己私有云的网络和一块自留地,同时也可以通过内网互联方式享受到公有云的服务。你既有自己独立防火墙和硬件,也可能用虚拟云数据库,两者随便切换共享。综合来看,现在基于不同企业云计算公有云、私有云、混合云解决方案,第一是云主机、云存储CDN加速,第二是云主机+负载均衡+RDS,第三种就是大型一点的企业需要给混合云的架构,让他更灵活控制和设计自己的商业结构。
万网的核心就是把私有云公有云中间整合一下让数据自由地跑,混合云的时代已经到来,它更适合中国的国情,希望我们一起拥抱这个时代。