彻底解读“IT明日之星”——云计算
2008-06-27
【编者按】
云计算是近来最有召唤力的IT技术,吸引许多不同技术领域厂商争相投入,但是,在经过多方不同立场的解读后,云计算反而像是一团难理解的云雾。现在就来彻底解读云计算。
【正文】
Google提出的分布式运算技术,让开发人员很轻易开发出全球性的应用服务,云计算技术可以自动治理大量标准化(非异质性)计算机间的沟通、任务分配和分布式储存等。
云源自分散平行运算,但比网格更擅长数据运算
云技术可以算是网格技术的一个子集合,两者目的相同,都是要把系统的复杂性隐藏起来,让使用者只要使用而不需要了解系统内部如何运作。
各方跟进Google推广云服务,但定义不同
不同业者对于云计算的定义各有不同,只有广义上对于「云模式」的概念是相通的。凡是透过因特网提供给用服务,让使用者透过浏览器就能使用,不需要了解服务器在哪里,内部如何运作,都被称为云计算的服务。
Yahoo用Hadoop处理4 PB的网页
Yahoo架构工程师Vivek Ratan表示:「目前使用Hadoop框架的云计算,任务规模最大的是Yahoo用来建立网页索引数据库的运算,同时使用1万个Linux平台的处理器核心,处理1兆个网页连结,从4PB的数据,运算得出300TB的索引数据。」
趋势用云技术解决大量资料的全球移动难题
趋势科技4年前就开始利用平行运算的网格技术,来提供云服务。
使用云运平台后,不论美国或中国的研究人员,都可以透过同一套运算平台,共享病毒分析的数据。
云技术降低SaaS门坎,小公司也能做全世界的生意
工研院信息与通讯研究所副所长余孝先认为,即使企业没有足够的能力或财力,自行建立自己的机房与网络架构,都能够利用Amazon或Google的信息架构,来提供全球性的SaaS(Software-as-a-Service)服务。
云计算核心技术MapReduce
云计算的要害技术MapReduce,是一种解决问题的程序开发模型,也是开发人员拆解问题的方法。最早由Google提出,后来也运用在开源的云技术Hadoop中。
云源自平行运算,但比网格更擅长数据运算
最近,中研院网格计算团队主持人林诚谦不论走到哪里,都被问到一件事,从新加坡的学术论坛,到南台湾的学术圈交流场合,大家都问他:「Google谈的云计算(Cloud Computing),和网格运算(Grid Computing)有什么不同?」
「云技术可以算是网格技术的一个子集合,」林诚谦说:「两者目的相同,都是要把系统的复杂性隐藏起来,让使用者只要使用而不需要了解系统内部如何运作。」
林诚谦认为,网格技术涵盖了云技术,但是,网格能够处理更复杂的问题,而云技术则可视为是网格技术的一种商业化结果。
「云计算是从网格技术的分散平行运算技术和观念发展出来,业界再用新名词来包装原有技术,只是使用的比喻不同。」他进一步说:「对计算机产业而言,这么做很重要,因为有助于推广大众对这项技术的了解。」
同样地,高速网络与计算中心企业与计划治理组计划主持人黄维诚认为,大体上来看,云计算和网格运算背后的哲学是一致的,他说:「对使用者来说,不需要了解服务器是什么?在哪里?就是把需求丢进去,就会得到结果,这是云计算的想法,也是网格运算的想法。」
再进一步分析两者的差异,黄维诚说:「虽然云计算源自平行运算的技术,不脱离网格运算的哲学,但是云计算更专注在数据的处理。」
从处理的数据型态来看,黄维诚认为:「云计算适合的任务,多半是数据处理次数频率高,而每一次要处理的数据量小。」
云计算vs.网格运算(表略)
例如像是网页搜寻的工作,每一次运算只需要比对一个网页,比对数据的大小可能不超过1MB,但是,全世界有几十亿个网页,若要全数比对,要比对的总数据量就非常可观。黄维诚认为,这种特性与网格运算擅长的类型不大相同,网格运算适合解决科学研究,例如分析卫星回传的信息,每一次要分析的讯息档案就高达数GB。
即使云计算与网格技术同是采用平行运算的哲学,但因为云计算较适合执行单次数据处理量较小的任务,黄维诚认为,云计算在实作方式上就会与网格运算不同。
他进一步解释:「例如搜寻网页,每一次要比对的网页,其实档案都不大,所需耗费的处理器资源不多,所以用大量的个人计算机就可以来执行网页搜寻的运算,但是,要用个人计算机来架设网格运算就比较难,因为网格运算所需的处理资源较大。」
所以,实作的差异就是,云计算可以组合大量的个人计算机来提供服务,而网格运算则需要依靠能提供大量运算资源的高效能计算机。
网格技术的理想,是要让任何服务器,都能加入到一个运算网格中,以提供庞大的运算量,因而在技术上的困难,就是要解决不同服务器、操作系统、甚至是程序编译器版本差异等异质性问题。
然而,以Google的云计算做法为例,则是使用大量规格相同的个人计算机等级服务器,来执行云计算的程序,所以不需要处理异质性的问题,可以简化平行运算的系统架构,更轻易协调服务器间的信息传递,让分布式处理的整体效能更好。许多Google的产品或服务,例如Google搜寻、 Gmail、Google Maps、Google Docs等,都使用到云计算的技术,藉由大量低价服务器的运算资源,来满足大量使用者的需求。
云名词解释
●云计算(Cloud Computing):Google提出的分布式运算技术,让开发人员很轻易开发出全球性的应用服务,云计算技术可以自动治理大量标准化(非异质性)计算机间的沟通、任务分配和分布式储存等。
●网格运算(Grid Computing):在网络上,透过标准化协议与信任机制,整合跨网域中的异质服务器,建立运算丛集系统来共享运算资源、储存资源等。
●服务在云(In-the-Cloud)或云服务(Cloud Service):供货商透过因特网提供服务,使用者只需透过浏览器就能使用,不需了解供货商的服务器如何运作。
●MapReduce模式:Google运用在云计算中的要害技术,让开发者开发大量数据的处理程序。先透过Map程序将数据切割成不相关的区块,分配给大量计算机处理,再透过Reduce程序将结果汇整,输出开发者需要的结果。
·如何用IP打开网站
·这是个什么google网站?
·雅虎宣布向第三方开放搜索服务
·未来浏览器37项功能希望目录大公布
·求两篇文献全文,新手检索,希望帮忙!
·中国互联网 世界第1还是57
·如何快速的找到文献
·紧急求助哪位大哥帮个忙!!!!
·谁能给我个链接
·英文免费全文数据库
·百度主页有变化?
·如何快速获得文献
·一份杂志的免费页,未发现杂志名称
·谷歌排序的介绍
·ISI 与 PUBMED(08-10)
·这篇中国医学论坛报上的文章引用哪篇文献?(08-10)
·如何才能比较全面地查找某一领域的文献?(08-10)
·*** 影像技术升本习题 解剖 病理 生理(08-10)
·现状分析(08-10)
·如何快速获得文献(08-10)
·百度主页有变化?(08-10)
·紧急求助哪位大哥帮个忙!!!!(08-10)
·远程医疗叫好不叫座 完善产业链成关键(08-10)
·中国互联网 世界第1还是57(08-10)
·未来浏览器37项功能希望目录大公布(08-10)
·如何用IP打开网站(08-10)
·雅虎宣布向第三方开放搜索服务(08-10)
·Elsevier 94年以前的杂志是不是没有电子版可供(08-10)
·提高阅读效率——PDF文件标注功能简介(129)
·哪位手上有2007年中文期刊影响因子列表呀?(124)
·王路专业文档搜索引擎(109)
·规求!如何批量下载CNKI全文文献??大虾们指导(61)
·万方和CNKI的区别?(58)
·中华内科学-实用内科学-西氏内科学电子书分享(52)
·哪有可以下载的《分子克隆实验指南》第三版的电(48)
·在检索中怎么提高查准率和查全率(46)
·Nulog——广东高校文献信息网(44)
·Quosa 8.02.77 下载地址(41)
·天津图书馆电子文献网上阅览“一码通”(免费申(40)
·全球医学教育最低基本要求对高校信息素质教育的(39)
·开放获取2007年进展(zz)(38)
·pET22b载体(37)

