Uptime Institute的一项调查研究显现,高达非常之一的机柜运转在温度高于设备可靠性辅导原则所引荐的答应规模。现在数据中心的机柜功率密度不断攀升,平均每台机柜的功率密度抵达5kW乃至更高,因而,估计受热门困扰的机柜数量将日积月累,很快超越上述份额。
假如热门迟迟无法消除,时刻一久便可能带来严峻的要挟,不只危及IT设备的可靠性与功能,还会影响硬件制造商的保修或保护协议。因而,数据中心运维人员需尽早采纳有用办法,避免呈现此类危险。
1. 什么是热门
许多IT专业人员常常查看热通道的温度,或在冷通道的过错方位查看温度,一旦发现温度过高,便自以为发现了热门。然后,他们会采纳各种应对办法,但成果可能令人绝望,非但未能消除热门,反而引发更多的热门。搞清终究什么是热门、热门的底子原因以及怎么辨认热门关于铲除热门至关重要。
(1) 热门的界说
不能将数据中心内随机测得的任何高温点都视作热门。咱们将热门界说为:当IT设备进风口的温度高于ASHRAETC9.9所引荐的期望值,即视作热门。一般机柜顶部的方位最简略发作热门。美国供热、制冷与开元旗牌|中国有限公司官网工程师学会(ASHRAE)的热攻略给出了服务器进风口处温度的引荐值及答应值规模。
(2) 热门发作的本源
数据中心所设备制冷设备的制冷量常常供大于求,特别是当制冷量彻底由IT设备“铭牌”上的额定值所决议。假使如此,那么为何还会呈现热门?究其原因,热门的发作并非是制冷量缺少或热负荷过大,而是制冷量未能得到充沛的运用,换句话说,制冷量是足够的,但未能在需求制冷的区域供给充沛的制冷量,这是由于缺少气流办理所构成的。
图1是一个制冷量未被充沛运用的比如,这是来自施耐德电气对一个实在事例的研究。图中显现了一个选用房间级制冷的传统典型数据中心,它的高架地板和吊顶用作送风和回风通道。机房开元旗牌|中国有限公司官网先是以必定的压力和速度将凉风送入地板通道。然后,凉风经过高架地板中的穿孔地板(占机房开元旗牌|中国有限公司官网气流的54%)和地板上线缆切断(占机房开元旗牌|中国有限公司官网气流的46%)从地板通道进入IT空间(即走漏气流)。
地板上线缆切断的走漏气流会导致制冷量的丢失,由于气流无法抵达IT设备的前方,而是绕过了设备。事实上,这些气流并未带走任何热量,而是又绕回到制冷单元。
经过穿孔地板的大部分气流(占穿孔地板风量的96.29%)都流经IT机柜中的设备,但由于缺少气流办理,并非全部气流都经过设备。一小部分凉风(占穿孔地板风量的3.71%)绕过IT设备又回来到制冷单元。与走漏气流相同,这些旁通气流也会构成制冷量丢失。一起,某些“亟需冷却”的IT设备无法取得满足的冷量,而不得不从机柜后部吸入设备排出的热风(占IT气流量的7.15%),这常常在“亟需冷却”的IT设备的前方构成热门。简而言之,用于削减气流走漏、旁通与再循环的办法将有助于热门的消除。
(3) 怎么辨认热门
尽早发现热门关于避免IT设备过热和毛病至关重要。咱们能够经过以下三种办法发现热门:
其他有助于辨认或避免潜在热门的主张包含运用计量型机柜式PDU辨认并查看高密度(功率密度在5kW以上的)机柜——由于这些机柜呈现热门的可能性更高。在决议进行移动、添加和更改机柜操作后或在数据中心规划阶段,运用CFD软件猜测热门。CFD模仿技能能够供给机柜前部温度与压力云图以及机柜周围气流散布的具体三维剖析,然后发现潜在热门。该东西的强壮之处在于能够发现哪些区域的制冷量被糟蹋,哪些区域存在冷热气流混合,导致制冷量未被充沛运用。
2. 评价所采纳的传统办法
当发现热门,数据中心运维人员会采纳各种应对办法。不过,并非一切的办法都会见效。下文将介绍一些传统的应对办法,并论述这些办法见效/无效的原由。请注意大部分办法关于削减气流旁通或再循环底子杯水车薪。
(1) 调低制冷单元的温度设定值
调低送风温度有助于削减热门的说法形似合乎逻辑,但在处理热门时实为不得已而为之的下下之策,由于这会下降整个制冷体系的功率和制冷量。这种办法的效果取决于机房开元旗牌|中国有限公司官网的作业状况。假如制冷体系尚有剩余容量(即作业负载缺少100%,未抵达制冷极限),那么调低温度设定值的做法具有活跃的效果。关于靠近机房开元旗牌|中国有限公司官网方位的热门,调低温度设定值能够下降热门处的温度。但假使机房开元旗牌|中国有限公司官网正以最大容量(100%满负载)运转,由于体系已抵达制冷极限,调低温度设定值是没有用果的,所以无法消除热门。每个制冷体系在给定环境条件下都有固定的最大制冷容量。温度设定值调低后,“最大”制冷容量也随之下降。
(2) 在热通道中放置穿孔地板
有人以为这办法很好,这是由于他们不了解冷通道/热通道布局规划的优势,而将一切高温现象都视作热门。事实上,这种办法非但不能消除冷通道中的热门,还有可能引发更多热门。此外,在热通道中放置穿孔地板(即构成气流旁通)还会削减可用的制冷量。冷通道/热通道布局规划是最为行之有用的办法,因而热通道中底子不存在热门。由于冷通道是IT设备获取制冷量的“冷量容器”,关于IT设备而言,在冷通道内坚持低温至关重要。在风冷型大型设备盛行初期,往往经过高架地板供给冷量,制冷单元依据回风温度进行操控。这种办法之所以见效是由于室内空气温度均一,冷热气流充沛混合。而现在,冷通道/热通道的布局规划中特意别离树立冷热两个温度区,构成回风温度的不均一。习惯于均一室内温度规划的人员可能会在热通道中放置穿孔地板,以为这样做就能够处理热门问题。
(3) 将机柜和穿孔地板紧靠制冷单元
有人会觉得将机柜和穿孔地板尽量紧靠制冷单元的做法不错,这是由于他们假定放置在距离制冷单元几英尺规模的机柜和穿孔地板能取得较多的制冷量。但事实上,效果恰恰相反。它可能导致IT设备呈现供冷缺少的现象,且无法继续消除热门。尽管这一做法能够协助搜集大部分排热,但不具有可猜测性,并不是处理热门的高效做法。而这种做法导致IT设备呈现供冷缺少现象的原因在于,从制冷单元送出的气流具有很高的速度,导致该片区域内的静压很低。这也就是说,该片区域内设备的穿孔地板的供冷量很小,乃至可能会将房间内的气流吸入地板通道内。
确定高架地板下的气流是否存在问题有一个很简略的做法,那就是在穿孔地板上方放置一小纸片。假如纸片被吸向穿孔地板内,则应将穿孔地板更换为实心地板,以平衡高架地板下的通道压力。
(4) 将落地扇置于热门机柜前
有人以为此举可将气流直接会集在某个热门的前方,因而是一种消除热门的好办法。但是,这种办法只能在紧急状况下暂时运用,如IT设备行将发作制冷中止时。这种做法能够下降设备的运转温度然后消除热门,但本钱极高。落地扇的效果根本相当于一个气流混合器,将设备排出的热风与凉风混合,使气流的温度介于低送风温度和高排风温度之间。这还会添加经过设备的气流量。冷热风的混合还会下降制冷体系功率,构成添加除湿/加湿担负,制冷体系容量运用不充沛,并可能因制冷冗余构成丢失。此外,落地扇还会成为数据中心内的附加热源。
(5) 将气流吹过冰并送入冷通道
有人以为用冰降温是一种简略易行的好办法。尽管此办法有助于缓解热门问题,但冰融化后会变成水,可能溢出容器,构成严峻后果。即使运用包装好的冰袋,这种办法也并非上策,由于还有许多更简略有用的办法。咱们将在下文中具体评论这些办法。
(6) 推入便携式制冷单元
有人以为这是一种处理问题的好办法,由于此举可将凉风直接会集在某个热门的前方。但这种办法只能在紧急状况下暂时运用,如IT设备行将发作制冷中止时。惋惜的是,人们常常将这种办法用作永久性处理方案。便携式制冷单元一般是在失去制冷的状况下应急运用,由于数据中心作业人员能够很方便地将其推入到位。但是,关于怎么妥善处理遍及数据中心的热门问题,下面所评论的最佳办法才是首选的永久性处理方案,不光本钱低价并且非常见效。
(7) 添加更多制冷单元
有人很自然地将热门问题与制冷量缺少相关起来,因而以为添加制冷单元不失为一种抱负办法。但是,在大都状况下,制冷量非常足够,仅仅由于缺少气流办理,导致抵达制冷需求点的制冷量未抵达要求的水平。此外,这种办法并非全能,并且在处理热门问题的一起还会发作很多费用开销。Uptime Institute的一项调查研究显现,尽管某些IT机房的制冷量已高达需求量的15倍,但机房中仍有7%到20%的机柜存在热门。究其原因,竟是送入的凉风绕过了IT设备的进风口。正确的处理方案是选用下面所评论的最佳办法,然后再核定是否需求添加制冷单元。
3. 消除热门的新办法
以上办法习以为常,但咱们大都不引荐运用,由于这些办法关于构成热门的两个首要原因(即气流旁通与再循环)力不从心。如要根绝气流旁通与再循环现象,有必要将冷热气流彻底别离,这样热门就底子不会存在。下面的前四种最佳实践之所以有用,正是由于这些实践处理了气流旁通或再循环问题,或一起处理了这两个问题。最终一个新办法只要在气流办理彻底执行到位之后方可选用。
(1) 办理机柜气流
许多热门的呈现是由于设备排出的热风在机柜内部或机柜周围发作再循环。因而,改进机柜气流办理关于处理热门至关重要。敞开的机柜U空间和进出线口是构成热风再循环的首要原因,直接导致热门发作。改进机柜气流状况最简略、最经济有用的办法之一是运用盲板封堵未运用的机柜U空间,并在机柜的进出线口方位设备毛刷。企业应更新数据中心运转流程,规定凡有移动、添加和更改操作,便要设备盲板和毛刷。
某些类型的交换机和路由器选用侧向气流。假如在设备这些设备的数据中心内,机柜气流选用早年向后的传统形式,则交换机/路由器的排出的热风可能回来进风口并构成热门。
咱们能够运用机柜侧向气流分配单元以可猜测方式直接向侧向气流设备送入凉风,而不会构成热门。假如平均制冷总量足够,但在功率密度高于均值的机柜中发作热门,此刻能够添加风机辅佐型设备,经过改进气流状况和添加制冷量来改进制冷效果。风机辅佐型设备设备可有用地从功率密度为3kW以下负载的相邻机柜“借用”气流以支撑机柜负载。此办法可最大极限地下降机柜顶部和底部间的温差,并避免设备排出的热风再循环至机柜的进风口。一切排风设备在布置时有必要非常当心,以保证来自相邻空间的气流不会构成相邻机柜温度过高。这些设备应运用UPS供电,避免设备在断电期间发作制冷中止。在高密度环境中,发动备用发动机期间也可能发作过热现象。
(2) 办理机房气流
在改进机柜气流办理后,下一个重要过程是改进机房内的气流办理。首要,是密封高架地板中一切的开口。运用毛刷密封机柜后部和PDU下面的进线口。导致意外气流走漏大都由这些开口构成。还可运用空气阻尼泡沫或软垫密封制冷单元周围的缝隙和其他地板空隙,在地板残缺的部位铺上实心地板,找出构成气流旁通的穿孔地板并改用实心地板。例如,假如一个空机柜前铺了穿孔地板,则应将其换为实心地板。此外,还可遵循侧栏中的操作程序对地板下的气流进行重新平衡。正确铺设地板并密封高架地板中的缝隙有助于收回运用丢失的制冷量。
另一个导致热门问题的要素是机柜顶部上方和机柜行末端周围发作的冷热气流混合。处理这一问题的一个最佳实践是经过遏止通道和/或机柜气流将冷热气流分隔。通道气流遏止不只要助于消除热门,与传统的非气流遏止数据中心规划比较还愈加节能。
能够用一个送风设备替换机柜的后门,然后将其变为一个主动式风管机柜。需注意这些设备将使机柜的总深度添加大约250mm,这可能会增大每两行相邻机柜之间的距离。一般状况下排入热通道的热风会被搜集起来并向上推送,然后沿管道进入回风通道。此举可避免气流在机柜进行再循环并进步制冷体系的功率和制冷量。主动式独立笔直风管体系中的电扇可支撑高达12kW的机柜功率密度,并能战胜欠安通道压力或因服务器排风口线缆过度密布而导致的压降。但主动式笔直风管体系很简略为数据中心的其他区域带来意想不到的问题,因而在布置设备时应分外当心。在这些设备中有必要运用盲板和机柜侧面板。主动式风管体系是耗电设备,因而需求监控和保护。
(3) 搬运问题负载
如上所述,搬运问题负载的办法是在发现“问题”负载之后将其搬运到低密度机柜,然后消除热门。为机房装备制冷设备,让机房冷却到低于机柜潜在峰值的一个平均值,并将负载分摊到几个机柜,然后将任何负载超越规划平均值的机柜负载分流。请注意,将设备负载分摊到多个机柜会使机柜内呈现很多未运用的笔直空间。有必要用盲板将这些空间密封,避免制冷功能下降。假如能够撤除一台服务器或其它关键性设备,此举简直毫无本钱却可处理热门问题。
(4) 改动温湿度传感器的方位
在大都陈腐的数据中心,都是在机房开元旗牌|中国有限公司官网回风气流中设备温度探测器,使得气流具有不可猜测性。此举还会导致机房开元旗牌|中国有限公司官网负载不均衡,然后使服务器进风口的温度发作动摇。将温度探测器搬运到送风气流中(这儿的送风可操控并且可猜测)可使IT设备进风口的温度愈加平稳。假如与气流遏止办法结合运用,改动温度探测器的方位还能进步送风温度,然后削减制冷体系的能耗,一起无需忧虑送风温度是否会有大幅动摇。
(5) 运用数据中心基础设施办理软件操操控冷单元的气流
有些体系能够依据IT机柜前方的温度操控单个机房的制冷单元。这些体系可运用含糊算法动态猜测和调整制冷单元的电扇转速,并测算哪些制冷单元可封闭。经过操控进入数据中心的风量能够限制旁通气流量。Vigilent制冷体系就是这种体系的一个典型。
4. 结束语
热门会严峻影响服务器的可靠性和功能,乃至会构成服务器的损坏。热门一般呈现在IT设备的进风口方位,原因包含低效的气流办理,如凉气流走漏(即气流旁通)和设备排出的热风再循环等问题。巡视感知温度、手动丈量温度或主动监测是三种辨认热门的首要办法。
数据中心运维人员为消除热门,选用了许多应对办法,但大都不尽人意,有的仅能作为应急状况运用,而有的却杯水车薪,有的乃至会使问题落井下石。消除热门的最佳实践包含机柜和机房的气流办理、气流遏止、问题设备搬运、改动温度传感器方位以及经过数据中心物理基础设施办理软件操操控冷单元的气流。用这些办法处理热门问题不只简略易行,并且本钱低价,行之有用。
文章来源:机房专用开元旗牌|中国有限公司官网www.wisconsinbrewingtaphaus.com