彻底解读“IT明日之星”——云计算

彻底解读“IT明日之星”——云计算
2008-06-27

【编者按】

  云计算是近来最有召唤力的IT技术,吸引许多不同技术领域厂商争相投入,但是,在经过多方不同立场的解读后,云计算反而像是一团难理解的云雾。现在就来彻底解读云计算。

【正文】
  Google提出的分布式运算技术,让开发人员很轻易开发出全球性的应用服务,云计算技术可以自动治理大量标准化(非异质性)计算机间的沟通、任务分配和分布式储存等。

  云源自分散平行运算,但比网格更擅长数据运算

  云技术可以算是网格技术的一个子集合,两者目的相同,都是要把系统的复杂性隐藏起来,让使用者只要使用而不需要了解系统内部如何运作。

  各方跟进Google推广云服务,但定义不同

  不同业者对于云计算的定义各有不同,只有广义上对于「云模式」的概念是相通的。凡是透过因特网提供给用服务,让使用者透过浏览器就能使用,不需要了解服务器在哪里,内部如何运作,都被称为云计算的服务。

  Yahoo用Hadoop处理4 PB的网页

  Yahoo架构工程师Vivek Ratan表示:「目前使用Hadoop框架的云计算,任务规模最大的是Yahoo用来建立网页索引数据库的运算,同时使用1万个Linux平台的处理器核心,处理1兆个网页连结,从4PB的数据,运算得出300TB的索引数据。」

  趋势用云技术解决大量资料的全球移动难题

  趋势科技4年前就开始利用平行运算的网格技术,来提供云服务。

  使用云运平台后,不论美国或中国的研究人员,都可以透过同一套运算平台,共享病毒分析的数据。

  云技术降低SaaS门坎,小公司也能做全世界的生意

  工研院信息与通讯研究所副所长余孝先认为,即使企业没有足够的能力或财力,自行建立自己的机房与网络架构,都能够利用Amazon或Google的信息架构,来提供全球性的SaaS(Software-as-a-Service)服务。

  云计算核心技术MapReduce

  云计算的要害技术MapReduce,是一种解决问题的程序开发模型,也是开发人员拆解问题的方法。最早由Google提出,后来也运用在开源的云技术Hadoop中。

  云源自平行运算,但比网格更擅长数据运算

  最近,中研院网格计算团队主持人林诚谦不论走到哪里,都被问到一件事,从新加坡的学术论坛,到南台湾的学术圈交流场合,大家都问他:「Google谈的云计算(Cloud Computing),和网格运算(Grid Computing)有什么不同?」

  「云技术可以算是网格技术的一个子集合,」林诚谦说:「两者目的相同,都是要把系统的复杂性隐藏起来,让使用者只要使用而不需要了解系统内部如何运作。」

  林诚谦认为,网格技术涵盖了云技术,但是,网格能够处理更复杂的问题,而云技术则可视为是网格技术的一种商业化结果。

  「云计算是从网格技术的分散平行运算技术和观念发展出来,业界再用新名词来包装原有技术,只是使用的比喻不同。」他进一步说:「对计算机产业而言,这么做很重要,因为有助于推广大众对这项技术的了解。」

  同样地,高速网络与计算中心企业与计划治理组计划主持人黄维诚认为,大体上来看,云计算和网格运算背后的哲学是一致的,他说:「对使用者来说,不需要了解服务器是什么?在哪里?就是把需求丢进去,就会得到结果,这是云计算的想法,也是网格运算的想法。」

  再进一步分析两者的差异,黄维诚说:「虽然云计算源自平行运算的技术,不脱离网格运算的哲学,但是云计算更专注在数据的处理。」

  从处理的数据型态来看,黄维诚认为:「云计算适合的任务,多半是数据处理次数频率高,而每一次要处理的数据量小。」

云计算vs.网格运算(表略)

  例如像是网页搜寻的工作,每一次运算只需要比对一个网页,比对数据的大小可能不超过1MB,但是,全世界有几十亿个网页,若要全数比对,要比对的总数据量就非常可观。黄维诚认为,这种特性与网格运算擅长的类型不大相同,网格运算适合解决科学研究,例如分析卫星回传的信息,每一次要分析的讯息档案就高达数GB。

  即使云计算与网格技术同是采用平行运算的哲学,但因为云计算较适合执行单次数据处理量较小的任务,黄维诚认为,云计算在实作方式上就会与网格运算不同。

  他进一步解释:「例如搜寻网页,每一次要比对的网页,其实档案都不大,所需耗费的处理器资源不多,所以用大量的个人计算机就可以来执行网页搜寻的运算,但是,要用个人计算机来架设网格运算就比较难,因为网格运算所需的处理资源较大。」

  所以,实作的差异就是,云计算可以组合大量的个人计算机来提供服务,而网格运算则需要依靠能提供大量运算资源的高效能计算机。

  网格技术的理想,是要让任何服务器,都能加入到一个运算网格中,以提供庞大的运算量,因而在技术上的困难,就是要解决不同服务器、操作系统、甚至是程序编译器版本差异等异质性问题。

  然而,以Google的云计算做法为例,则是使用大量规格相同的个人计算机等级服务器,来执行云计算的程序,所以不需要处理异质性的问题,可以简化平行运算的系统架构,更轻易协调服务器间的信息传递,让分布式处理的整体效能更好。许多Google的产品或服务,例如Google搜寻、 Gmail、Google Maps、Google Docs等,都使用到云计算的技术,藉由大量低价服务器的运算资源,来满足大量使用者的需求。

  云名词解释

  ●云计算(Cloud Computing):Google提出的分布式运算技术,让开发人员很轻易开发出全球性的应用服务,云计算技术可以自动治理大量标准化(非异质性)计算机间的沟通、任务分配和分布式储存等。

  ●网格运算(Grid Computing):在网络上,透过标准化协议与信任机制,整合跨网域中的异质服务器,建立运算丛集系统来共享运算资源、储存资源等。

  ●服务在云(In-the-Cloud)或云服务(Cloud Service):供货商透过因特网提供服务,使用者只需透过浏览器就能使用,不需了解供货商的服务器如何运作。

  ●MapReduce模式:Google运用在云计算中的要害技术,让开发者开发大量数据的处理程序。先透过Map程序将数据切割成不相关的区块,分配给大量计算机处理,再透过Reduce程序将结果汇整,输出开发者需要的结果。

共8页: 上一页 1 [2] [3] [4] [5] [6] [7] [8] 下一页

上一篇:Elsevier 94年以前的杂志是不是没有电子版可供下载?   下一篇:关于香草醛显色的
ad
ad