首页 | 登录 | 注册 | 免费发布商机 | VIP | 搜索 | 意见反馈 | 设为首页 | 加入收藏
中国通信企业协会通信器材分会 、 中国通信企业协会通信电缆光缆专业委员会 主办 协会动态
热门: 求购 新手帮助 免费发布供求信息
  首页 论坛日程  
             
  中国通信器材网11月21-22日消息:由中国通信运维网主办的首届中国通信网络接能论坛在北京南粤苑宾馆举行。大会以“建设节能型网络,营造绿色通信,促进通信业可持续发展”为主题进行了探讨。本网全程现场直播此次会议。
  我是IBM公司系统和科技事业部的系统架构师,我的名字叫做梁建球。那么系统和科技事业部主要是集中在给大家提供一些服务器、存储这方面的产品。当然,还有相关的冷却产品的方案。我今天想讲的是想围绕着怎么样通过改良的IT系统的一些方案和技术,来提高机房的能源的效率,也会谈到一些在机房制冷上的创新的方案。

  我要讲4个内容,第一个是绿色数据中心的迫切性,第二个是建设这个绿色数据中心的一些方法,第三个是怎么样提高IT系统的能源效率,像服务器、存储、网络设备的能源效率,第四个是谈我们比较新型的机房冷却的方案。

  绿色数据中心的迫切性很简单,我们从三个方面看。第一个,数据中心的规模越来越大,它的用电的密度也越来越高,数据中心已经成为了世界上用电的大户,它的节能减排对整个社会的贡献是比较显著的。我们举一个例子,在美国2005年,美国所有的数据公司的耗电一年是450亿度电,这是什么概念呢?这相当于一个发展中的国家斯里兰卡,他在当年全年的全国的用电。我们就看到,随着IT系统应用的深入,还有IT设备的性价比越来越高,现在数据中心扩展的规模和速度都在加快。数据中心已经在不知不觉中成为了用电的大户。所以,数据中心进行节能减排是一个对社会、环境贡献很显著的行动。

  第二个,数据中心面临的问题是什么呢?在2006年市场调查的公司发现最主要的两个问题就是,维护一个数据中心它的管理人员最头疼的问题,前两位就是散热,过度的散热怎么办?第二个就是供电不足,其实这两个都是跟供电有关。因为散热是消耗电产生的。所以,绿色数据中心是运营者比较头痛的问题。

  第三个,在这个图的右下角,在这个图里面我们可以看到,在未来几年数据中心购置新的服务器的费用,和每年供电和冷却费用的比较,我们可以看到,如果我们不提高用电和冷却的效率,我们可以看到数据中心运营的整体费用比例会越来越高。所以,绿色数据中心的迫切性第一再生我们要做一个用电大户,要为这个社会做贡献。第二,只有控制用电才能解决数据中心运营者最头痛的问题。第三,是一个很有效地控制我们成本的方法。

  怎么样建设这个绿色的数据中心呢,现在有一个组织叫做绿色网格,这个是业界几个重要的IT公司组织在一起去探讨提高IT系统的能源效率的组织。那么它里面提出了两个指标,一个就是PUE,一个是DCE,这两个之都是用来衡量这个数据中心的能源效率的。那这两个指标的关系是一个导疏的关系,是整体的机房的供电和IT的供电的比较。那么PUE是一个机房的供电的,那么DCE是供电的采样。

  那么在美国大部分的PUE在1.81和2.10的关系。如果以2.10谈就比较容易了,有两度电在数据中心里面,有1度电是供电的损耗和空调其他的设施的用电上面。只有另外一度电才真正地给我们的IT设备。那1.81就好一点了,就是说我们超过了一半是给IT的。那我要谈这个表的意义在哪里呢?其实我们可以看到,在大部分的数据中心里面,有一半或者是超过一半的电不是在IT上面消耗的。如果我们作为一个数据中心的运营者,如果要提高这个数据中心的能效,首先要做的是什么呢?首先就看看知道自己是什么样的情形,有没有对这两个数据进行一个评估。

  那怎么样去提高数据中心的能效呢?我们可以看一下,先看一下用电到了数据中心里面以后是怎么分配的。第一个我们看到数据中心其实大概只有少于一半的电,就是通过大量的统计来看,只有少于一半的电是供给IT设备的,其他的是供电和冷却其他设施的损耗。我们可以看到如果我们可以提高IT设备分到用电的比例,就可以切实地提高数据中心的能效。

  那如果从IT设备本身来看,以服务器本身为例,我们可以看到在它的用电分配里面,30%是再处理器,真正的运算的部件是占30%的用电,其他的就是它的电源损耗、冷却风扇、内存、主板还有硬盘的损耗。如果我们可以通过更好地包装,提高处理器的用电水平,或者是通过更好的技术,减少服务器整体的用电水平的话,也可以提高我们的能源效率。

  那另外一个更往细一点看,就是构造在一个服务器里面,我们看它的工作负荷的情况,我们可以看到通过大量的文字采样,平均服务器的平均使用率是20%,就是80%是空闲的。那空闲不等于不用电,只是系统处于闲置的状况,那它还是在运行。所以我们可以看到,如果我们能够提高这个服务器的平均使用率,我们也可以切实地提高数据中心的能效。

  我们看到这几个方向,我们看一下技术和方案。第一个我们重视和提高虚拟化的技术,来提高服务器的平均使用率。虚拟化的技术是怎么一回事呢?我们最普遍看到的虚拟化技术就是分区。在少的物理服务器上划分多个虚拟服务器。我们在这个图上可以看到,没有虚拟化之前我们有大量的各自服务器,上面跑各自的应用。它的使用率不高,特别是在X86的情况下,就是Linex或者是Windows的情况下,总体的能耗效率是比较低的。如果我们通过少量的高端的机器,在里面划分虚拟的服务器,把原来的物理服务器迁移到少量的高端的服务器上面,这样可以大大提高服务器的使用效率,总体来讲降低用电的损耗。

  这个在很多的实际的例子里面都是得到证实的。那么虚拟化提高的原理我们可以比较一下,如果我们每个人都在上班的时候都在开自己的小轿车,就等于我们拥有了很多的大量的低端服务器,其实小轿车一个人开就是占了1/4或者是1/5,那么是对资源大量的消耗。那么很逻辑的,我们需要通过少量的、大型的设备,大家共同共享它。那么这样的话,既可以提高效率,也可以大大减少对能源的消耗。这是很好的比较。

  比如说在我们的方案里面,比如说IBM高端的PC的服务器,它就是有很强的虚拟化的功能。可以把大量的低端的服务器迁移到高端的服务器分区上面,这样可以很切实地减少这个能源的损耗。那么在我们很多的通讯技术里面,很多都购置了低端的Linex服务器做应用,这个服务器可能是购买的年代比较久,应用率不高。其实,我们可以把它往更高性能上面进行逻辑分区的虚拟服务器上面进行迁移。大大地降低能源的损耗,也可以大大节省对机房空间的占用。

  其实这个在我们具体的个案里面我们进行了分析,我们刺激在一个案例里面可以把752台物理服务器,把它的合并到7台服务器上面,这是通过逻辑的方面。那么我们服务器的使用可以从18%提高到27%,那么对于逻辑应用可以达到52%。那么在实际应用的项目不一样,但是这个能源节省的效果很明显,这个是不容置疑的。

  那另外一个除了虚拟化以外,虚拟化的意义主要是在于当一个服务器的使用率比较低的,进行虚拟化可以提高服务器的使用率。但是在一个环境里面,每一个服务器的使用效率比较高的时候,我们也可以通过刀片的技术提高它的效率。刀片的技术主要是可以简化IT的基础架构,在以前没有刀片的时候,我们采用机架式的服务器或者是塔式的服务器,那么我们如果把刀片服务器变成所谓的模块或者是刀片,这样我们可以共享机箱基础的设施,包括电能和风扇。这样,可以显著地提高部件能源的效率。另外很重要,每个刀片跟外界的连接,已经不需要通过物理的联线,只是通过机箱的背板和交换模块进行连接。这样,我们可以省掉大量的一些局域网的交换机的设备,或者是存储交换机的设备。一方面简化了连接,另一方面减少了数量对能源的损耗。

  再一个42U的标准机柜上面,如果我们现在用机架服务器,它可以容纳42个服务器,但是如果用IBM的刀片中心的话,一个7U的刀片中心可以容纳14片刀片,我们只需要3个这样的刀片中心,就可以容纳42个服务器了。我们可以对空间节省50%,在空间的用电上也可以节省10%到25%之间。

  下面谈到用电的管理,为什么要谈用电的管理呢?因为我们首先第一步要了解他们用电的真实情况,如果我们有100台在数据中心里面,我们知不知道他们每天用多少电,用电的情况是怎么样的。首先我们必须得知道我们用电的情况的能力,所以有电管理第一个阶段,我们要有了解设备用电的能力。这个可以通过机器本身提供的一个功能或者是提供我们在供电插拔PDU用电的功能上面来了解用电的水平。第二个,我们要对我们的设备进行一个用电的封顶,如果这个设备的用电不能控制,我们一定要语流大量的空间给每个设备,按照额定的用电功耗来提供一个冗余度给它。这样的话,会造成一定的浪费。如果我们能够进行封顶的话,我们很有信心去控制整体的有电的水平。

  那么第三个,就是通过可不可以通过基于一些策略的调整,来达到整体的节省有电。

  举个例子,像IBM用电管理的软件叫做Power Executive,可以直接跟服务器沟通,不需要安装其他的软件。那么我们看一下这个图,这就是机器实际应用的水平,它有一些波动,但是历史上不会超过这个用电水平,这通过Power Executive进行长期的采样,来了解这样的水平。但是红色的部分加灰色的部分就是这个机器在品牌上的额定用电的功率,我们有的时候用电的时候一定要根据额定的高层来分配。因为自己不可以保证历史上不超过某个水平,以后就不会超过。如果我们在分配上不留有余地的话,可能会出现跳闸等等危险的情况。如果我们每个服务器都没有余地的话,它就没有很充分地利用,那整个的UPS供电能力有一定的余量的话,它本身的效率也会降低。因为我们知道UPS工作效率比较低的时候,按比例来讲是比较高。

  那么我们按照这个软件对于这个机器的用电水平进行了控制,如果你超过的话,我们会通过用电的功能把它拉下来。这样的话,我们会按照自己制定的值分配用电给服务器。

  刚才我把我们以前留下来的余量分配给更多的用电设备,这样的话,我们对于用电者使用够更加有效。那么第一个IT设备都有很多不同的用电模式,包括节电模式或者是动态调整模式,或者是保证性的模式。那么现在大部分的服务器、CPU都有这样的一些能力。那么我们可以通过用电管理的软件,去针对工作符合来调整它本身的用电模式。那么另外,我们还可以通过虚拟化,把一些虚拟服务器在不同的物理服务器上进行了迁移。比如说我们在早上工作繁忙的时候,我们需要数目比较多的物理服务器,把这个逻辑服务器分插在物理服务器下面,在晚上进行迁移。这样,对机房进行整体结合的效果。

  下面有一点时间谈一下我们的一个针对高密度运算的新型的冷却方案。首先,我们要了解我们在计算机设备里面的用电密度的发展趋势是越来越高,就是我们现在面对的机柜的平均的用电负荷是比以前高很多。在以前,我们大概一个机柜,如果我们以IDC机房来看,一个机柜的用电在2000瓦到4000瓦之间。如果现在我们变成了刀片的服务器,每个机柜的用电供应可以达到12千瓦到3、4千瓦。其实在传统的,我们依赖于空气做冷却的话,我们是依赖于足够的送风量来冷却一个机柜。基本上在送风量方面我们是用CFM做衡量的。CFM就是每分钟立方英尺的送风量。我们看一下这个图线,这是告诉我们机柜的用电功率是多大的时候,我们需要多少的送风量。我们可以看到,如果18千瓦的机柜的用电量的话,它的散热也需要18千瓦。它需要的是2500个CFM。那么我们看到地板它的送风量大概是300个CFM。如果我们计划和设计得比较好,一些堵塞都清掉的话,可以达到500个CFM。那么即便是这样子,我们叫做简单地计算,都需要5块地板才可以造成18千瓦用电的机柜。这基本上是作我们机房用电面积比较紧迫的时候,是一个很不实际的设计。一个机柜在这里,前面5块地板开口送风给它,也未必可以达到1200个CFM的效果。

  所以,传统只是冷却高密度的机柜是不足够的。所以我们把在机柜里面不要用太多的设备,这样把我们高密度节省的空间的意义去掉。

  这是一个传统的风冷的示意图,我们有一个空调,立言有一个冷凝片,这里面是7度的冷水,那么热空气经过了冷凝片,变成了冷空气。这个冷红旗出来以后,就通过一些开口的地板送到用电机柜里面,这样这个冷空气再送回到空调。这个是我们希望的方向,但是事实上空气的流动是很难控制的。因为空气的流动会因为温度,在机房不同的阻碍物的情况会改变。实际上,我们用传统的风冷的原理,我们的制冷是大的搅拌器。就是我们的空调是不断递送冷风里面做混合,达到一定的温度。

  事实上,我们通常碰到的情况就是过度制冷,我们要用很大的力度去应付机房,特别是热点。我也参观过客户的机房,碰到的情况就是出风口的温度跟进风口的温度是差不多的。因为空气的流动很难控制,所以我们可以讲,用传统的风冷的制冷效率是比较低的。

  那么我们IBM有一个差别叫做背门热交换器,它的做法就是把在机柜的背门换成一个5英寸的背门,里面走冷水。我们可以通过交换器把它变成18度的冷水,为什么是18度呢?我们基本上防止冷凝的效果。我们现在达到的效果,就是18度的冷水经过这个门,我们的机柜的散热有50%到60%是通过这个冷水带走的。因为我们这个冷却的设备,直接地贴在这个后面,而且我们的水管也是定向地迁移,另外就是水的热传导率比空气要好,在机房里面超过50%的热量,可以通过能源效率高得多的冷却的忙是去进行处理。这个一方面是可以提到能效,另一方面,我们可以把超过一半的能效通过这冷水带走。这样,对于机房的空调的压力也减少很多,对于高密度的环境是比较适合的。

  这个就是大概我们的一个原理图,也是一个实物图。最后我很快地谈我们一个案例,是在台湾的一个气象的部门。我们看到这个机器,后面用的是IBM的P575的高性能运算的节点。这位先生是我们在大中华地区的最高领导何国伟先生,他手指的就是冷水进去和排出来的水管。那个门就是冷水在跑的门,他告诉我们,他现在感受到在门的两边的差异是非常大的。就是说这个门的吸热的效果是很好的。我们做了一个很有趣的比较,我们比较的是这个客户用这个冷水背门和不用的差别,我们从一个很有趣的角度,因为他其实是一个高性能运算的部门,那它本身是需要自己达到某一个高性能运算的指标,我们是有这个所谓的浮点运算的指标来比较的。那么我们比较的是他们在当时这个机器在高性能运算最高头500名里面的排名,如果说它使用了冷水背门的话,它能够达到的运算能力当时是44位,如果不能够就排101位。为什么呢?因为这个客户的机房只有100平方米左右,如果它要容纳比较高的密度,它需要的是156个节点,这156个节点是无法用单纯的风能解决的。如果我们没有风冷和水冷的辅助,在当时的环境里面,只能够容纳最多是81个节点。这样,就产生了运算性能的差异。这样,我们可以看到一个很有趣的现象,就是说冷却的方案在特定的环境里面,是可以直接影响我们这个数据中心的运算的能力的。

  今天因为时间比较短促,我今天的报告就到这里,谢谢各位!
 
关于我们 | 联系我们 | 广告合作 | 付款方式 | 帮助中心 | 申请友情连接 | 代理合作
中国通信器材网  版权所有·严禁复制
技术支持:010-82410521 82410526 传真:010-82413142
电话:010-62947349、82416171 韩先生
E-mail: chinacie@vip.sina.com
电信与信息服务业务经营许可证070081号
本网律师 首创律师事务所 张峰华
运行时间: 93.75 ms