云计算核心技术及安全问题
1云计算的概念与特征
1.1云计算的概念
关于云计算的概念,从不同的角度来看有不同的定义。
1)从应用的角度来定义:
相关研究和实践证明,云计算既不是什么计算,也不是一项单纯的技术概念,而是一个如何在现有互联网的基础上把所有硬件、软件结合起来,充分利用和调动现有一切信息资源,通过构架一个新型的服务模式,或者能提供服务的一种新的系统结构。为人们提供各种不同层次、各种不同需求的低成本、高效率的智能化的服务及信息服务模式的改变。
2)从技术的角度来定义:日可以说云计算是并行计算、分布式计算和网格计算的发展,或者说是这些计算机科学概念的商业实现。
1.2云计算的特征
不管从哪个角度来定义云计算,云计算应该具有如下几个特征:
1)以网络为中心。云计算的整体架构是建立在由多台计算机和其他各种硬件、设备组成的网络环境之中,离开了网络,云计算也无从谈起。
2)以服务为提供方式。这跟过去有所不同,是根据用户的需要,按需服务的方式,根据不同用户的个性化需求推出的多层次服务。
3)应该具有高扩展、高可靠性。因为用户要在这上面接受服务,这是必须要具备的特征和条件。
4)弹性,随着业务增长,这个系统能平滑过渡,平滑增长。
6)动态,最主要是适应现在各种IT业务,IT系统用户需求的快速变化。
7)极其廉价。“云”的特殊容错措施使得可以采用极其廉价的节点来构成云:“云”的自动化管理使数据中心管理成本大幅降低:“云”的公用性和通用性使资源的利用率大幅提升:“云”设施可以建在电力资源丰富的地区,从而大幅降低能源成本。因此“云”具有前所未有的性能价格比。Google中国区前总裁李开复称,Google每年投入约16亿美元构建云计算数据中心,所获得的能力相当于使用传统技术投入640亿美元,节省了40倍的成本。因此,用户可以充分享受“云”的低成本优势,需要时,花费几百美元、一天时间就能完成以前需要数万美元、数月时间才能完成的数据处理任务。
2云存储与虚拟化
2.1云存储
数据量对我们提出严峻挑战,使目前数据库技术已经不能应对这些蜂拥而至的数据的浪潮。在各个领域都呈现严峻的挑战形式,这就是为什么人们积极寻找构建新的云存储,即云数据库来应付海量数据到来。
数据不断从前端向后端聚集,大部分数据被聚集到了一个中心服务的地带,因此这两项趋势造成我们面临一个巨大的数据集合 目前数据管理面临挑战性方面在于:我们如何去应对不断开展的数据规模,如何提供一种好的可扩展性,如何提供一种好的成本效益的一种服务,如何去支持在这种模式下具备好的容错能力,以及如何有持续研发的机制。这是新的系统要面对的,也是传统的不能解决的问题。
现有的云数据库系统大体划分为两类:一类是基于Google的系统,结构用了分布式储存的方式;另一类是以DYNAMO为主体,采用了P2P处理结构。目前该领域开发出有代表性的云数据库系统,它们是:HADOOPDB,HBASE和CASSANDRA.
未来的数据库。云数据管理系统。研究方向应该是:可扩展性、成本效益和容错性,持续的简化能力和易于管理等等,更重要的是构造的云数据管理要能支持多种形式的应用,这是一个很复杂的问题,因为每种应用需求都不一样,目前构造的云存储是针对某种应用或者某种情况设置的,是有局限性的,所以支持多种形式的应用将是云数据库研究的核心内容。
2.2虚拟化
虚拟化是一个物体虚拟成不同物体,每个物体担当不同任务,当虚拟物体完成工作后可以关掉,把资源释放回来做更多事,一台笔记本虚拟成三台笔记本,做三台笔记本工作。
虚拟化本身就是把底层物理设备和上层的软件进行分离的一种去耦合技术,各个层面做各个层面的工作,不要捆绑在一起,目的就是为了实现信息资源的利用效率和灵活性的最大化。
虚拟化技术可以促进IDC提高资源利用率和服务水平,虚拟化技术能够降低IDC的运营成本,帮助IDC提供性价比更优的服务,吸引更多企业采用IDC的服务,从而为IDC带来更大的收益。研究资料表明,虚拟化技术将各种资源虚拟出多台主机,以提高这些资源的共享率和利用率,将IT环境改造成为更加强大、更具弹性、更富有活力的架构,为IDC带来以下效益:
1)35%-75% TCO(总体拥有成本)节省:通过将整合多个物理服务器到一个物理服务器降低40%软件硬件成本,每个服务器的平均利用率从7%提高到60%一80%,降低70%一80%运营成本,包括数据中心空间、机柜、网线,耗电量,冷气空调和人力成本;
2)提高运营效率:部署时间从小时级到分钟级,服务器重建和应用加载时间从20-40 hrs=>15-30 min,每年节省10000人/h(300台服务器);以前硬件维护需要以前的数天/周的变更管理准备和卜3小时维护窗口,现在可以进行零宕机硬件维护和升级;
3)提高服务水平:帮助企业建立业务和IT资源之间的关系,使IT和业务优先级对应;将所有服务器作为大的资源统一进行管理,并按需自动低动态资源调配:无中断的按需扩容;
4)旧硬件和操作系统的投资保护:不再担心旧系统的兼容性,维护和升级等一系列问题。虚拟化技术为IDC提供了云计算的基础架构,虚拟化技术除了帮助IDC提供资源利用率和提高服务水平之外,更重要的一点是它释放了IDC的潜力,为IDC带来了极大的运营弹性。未来数据中心的面貌就是将底层的硬件,包括服务器、储存与网络设备全面虚拟化,建立起一个共享的随需而选的运作环境,上层的数据可以根据业务型态的不同需求,搭配出各种互相隔离的应用,形成一个服务导向的IT架构。虚拟化技术不仅仅是一个简单的整合工具,它将更先进的自动化和系统管理引进到数据中心,为数据中心提供了一种共享加隔离(安全、可信)的云计算基础架构,这样的数据中心不再是传统的IDC,而是叠加了云计算功能架构的弹性数据中心。
整个云的变化,其实是一个虚拟化的转变,包括从一开始看到是一个物理机,慢慢走向虚拟化,走向云计算,云计算是虚拟化最后的延伸 ,虚拟化技术是云计算的核心技术。
3云计算行业应用
3.1中国科技资源共享网
中国科技资源共享网是一种跨学科、跨地域、跨组织的科技创新合作。这里的科技资源包括科学数据,科学成果,科学仪器,通过这种共享可以优化我们国家的科研基础设施。整个科技资源共享网系统下面有科技文献的资源,自然科技的资源,科学数据的资源,通过统一的一个规范和标准,进行汇交和集成。
现在科技资源共享网整合了30个专业门户专业资源,2O多个平台,3O多个地方平台的资源。科技平台涉及材料、农业、海洋,现在涉及到部门是国务院37个部门数据,500多个国家重点工程中心的数据, 目前涵盖了全国31个地方平台,200多个生物种子资源,目前形成了资源数据库28类,提供了六大类各种各样的特色服务,数据量超过1O00TB.
底层站点有4O多个国家平台资源。各个专业平台,林业、农业、生物、海洋包括气象。还有20多个行业资源,还有31个地省市地方资源平台占领。科技共享网是去年年底开始正式运行服务。目前的提供是4个服务:
1)跨平台跨领域的数据文献仪器的搜索和导航,
2)网络协同和远程操作。
3)提供科技资源建设和服务情况的评估监测,
4)专题热点服务。
在科技文献子平台,国内珀勺文献都可以查询,国外的可以通过科技引擎来查询。科技资源共享网整是一个全国性的共享服务设施 同时对加盟的站点,包括几十个子专业平台和科技资源站进行实时的监测。
整个科技共享网的定位:
1)是科技基础条件资源信息回教中心,
2)是资源共享服务的平台
3)是合理布局决策支持系统
4)是发布和成果展示的窗口
5)是资源动态监控和管理的工具
6)是和国内外相关资源合作交流的枢纽。
3.2鸿蒙网
鸿蒙网站平台基础结构:鸿蒙按照行政区域划分,由中国省、市、县、乡镇、村网站系统组织,每个云网站系统又按照行业分类方式有很多行业网站系统构成。每个行业网站包含多个功能系统,每个网站系统独立运行,彼此之间相互联系,形成有利的整体。鸿蒙云计算应用网站平台是由很平常的服务器操作系统和功能软件组成的。鸿蒙网站系统的门是由行业门户的构成,随着社会需求变化构建不同的行,就是弹性可变的,随时增加或俭省行业。
鸿蒙网的云计算特征。作为中国首个云计算应用平台。鸿蒙网有以下特征
1)采用虚拟化技术按照行业进行划分,搭建独个系统,每个系统有独个用户,从而形成独系统独用户。比如说河北鸿蒙网是一个系统,都是独立的,现在已经搭建了60000个系统,其中行业里面是将近1O0万个。而中国鸿蒙网包含多个行业网站平台,每个网站平台有多个用户,从而形成比较复杂的云中云系统。我们这个图示比较形象地研究云的组合。
2)网站平台里的数据按照其物理属性进行描述,因此数据是连通的。比如一个村里的数据,同时属于上级行政区域。所以在鸿蒙云计算网站平台里,不存在信息“孤岛”问题。
4云计算时代的安全解决方案
当我们进入云计算时代,对机器的控制和权限从企业慢慢走到服务商时,则我们的所有数据都必须在云提供商的数据中心里。此时,系统变成不可控,资料变成可控,这便是在云中最大的两个变化,也是云和传统最大的变化。
虚拟技术是云计算的核心技术,我们的数据资料都是运行在数据中心的虚拟机上,但是虚拟机和虚拟机之间会互相攻击,这就使得我们的系统变成了不可控。虚拟机有一个现象叫做“跑出去”,就是说虚拟机会跑动,这就使得我们的资料变成了不可控。例如,现在要设计资料中心,传统的方法是买一个最好的防火墙把资料中心围住,机器都在里面;但是在云计算时代,我们的资料都在虚拟机里,虚拟机会跑动,此时,防火墙就没有作用了,当然我们的资料也就变成了不可控。
另一个安全问题是数据的隐私性。一个现象是,当我们把数据放到互联网上时,除了我们自己能够看到外,服务商也能够看到,因为我们的数据是被保存在服务商的数据中心里;另外一个现象是,一旦我们把数据放到互联网上时,服务商会把数据作好几个备份,数据的备份归服务商管理,所以数据销毁变得不可能。
防止虚拟机之间相互攻击的解决方案是,在每个虚拟机里都做一些防火墙和IDS;把防范措施做到虚拟机里,让它跟着虚拟机跑动,并且把虚拟机里的资料进行加密和解密;为虚拟环境的隔离做有效区分,监控虚拟机的状态。数据的隐私性解决方案是,需要建立服务商和用户之间的信任,通过建立相应的法规来保护用户数据的隐私性。
5云计算平台与应用实践
IBM的智慧城市和智慧地球。IBM智慧城市的构想要达到两个基本的技术要求:第一是可量化,从我们手中的终端机或者从城市终端机采出数字,例如,在高速公路上采取车流资料,帮助我们分析今天会在哪段塞车;第二互联互通。通过网络的连接。我们采集到的数据可以缔造需要的终端——作为存储和分析。
存储和分析最终目的是要有智能,判断我们在生活和工作中所做的决定是否正确。这可以人工所为。对于所收到的信息。我们可以自己找出所需要的信息:但是如果有个很智能系统化工具帮我们处理这些信息,这就非常方便了。这个系统可以简化我们需要的信息,能够减少我们每天的烦恼,增加生活质最,这是我们的最终目的。一些数据说:现在碰到一些困难,最终目标就是物联网。物联网和智慧城市是这样,物联网以物采取数据,数据存储分析,最后提供智能,这是物联网三步曲,这是符合中国的国情,中国提倡要突破物联网提升帮助我们国家更智能地支撑民生,招商引资。物联网需要互联网,云计算可以支撑有弹性的存储和分析。IBM智慧地球概念可以理解为物联网和互联网融合,以云计算支撑。
6结束语
本文简绍了云计算的概念和特征,以及在云计算行业领域有代表性的两个应用和在云计算平台与应用实践方面具有影响力的一个项目;通过探讨和分析,得出云存储和虚拟化在云计算技术中占有非常重要的地位,系统、资料的不可空性以及数据的隐私性是云计算技术中必须解决的两个核心问题。