空调制冷

随着数据中心业务量逐年增加,机房楼装机率不断提高,更高的机架热密度对数据中心水冷系统的稳定性提出了高要

“非全尺寸”备品备件? 案例分析数据中心水冷系统备品备件管理新思

来源:香港服务器 作者:徐磊 浏览量:132 更新:2020-03-30

近年来,数据中心单机架功率密度呈上升趋势,根据Colocation America数据显示,单一机柜机架功率密度由2008年的6kW,直线上升至2016年的12kW。2020年,单一机柜机架功率密度可能达到16.5 kW。而个别改造案例中,单一机柜机架功率密度更是高达43 kW,高功率密度的机架假设为数据中心制冷系统提出了前所未有的高要求。水冷系统冬季通过冷却塔、板式换热器利用室外自然冷源进行制冷,全年能效比相比风冷空调更具优势,在越来越多的大型数据中心得到应用。

图1 数据中心典型水冷系统

典型的数据中心水系统通常由冷冻水、冷却水系统组成,管路较长,法兰、阀门、过滤器等管路附件较多,随着使用年限的增加,水系统故障率随之升高。面对随时可能发生的故障,水系统备品备可以说是应急抢修的保障前提。备品备件是指为保障系统正常运行和设备修理要求,储备、存放于库房内备用的用于维护系统和设备的可替换单元。

1  非常用型备品备件储备

不同企业所需备品备件种类不同,根据现场实际情况,企业需制定生产、订购、供应、储备等方面的备品备件管理方案。针对数据中心7X24小时平稳运行的需求,故障处理务必及时有效,备品备件存在种类多、数量大的特点。大型数据中心部分水冷系统管径超过DN500,管路附件类配品备品备件并不常用,且尺寸、重量较大,出于非常用备品备件自损及库房空间规划的考虑,这些非常用型备品备件不会进行现场储备。

但值得注意的是,这些非常用型备品备件一旦出现故障,很可能直接影响数据中心水系统运行。如果现场没有储备,而备品备件的供应周期又长,数据中心就会直接面对制冷中断的风险。

2  故障抢修案例分析

2.1  故障描述

某大型数据中心机房楼配备5台冷水机组,故障发生前1#、2#、3#冷水机组运行,单台负载率均在60%以上。

2019年8月16日17:10,1#冷水机组冷却水自清洗过滤器漏水,冷却水缺水导致冷水机组停机,系统自动切换至4#冷水机组,切换后3台冷水机组负载率均在60%以上。但由于5#冷水机组压缩机故障无法启动,现1#冷水机组不能启动,导致制冷系统无冗余,数据中心运行存在巨大风险。

数据中心立刻成立专项抢修组,争取在最短时间内完成故障的恢复。

2.2  故障原因

图2 自清洗过滤器

如图2所示,自清洗过滤器是安装在管路Y型过滤器上的自动清洗排污装置,Y型过滤器管径为DN350。自清洗过滤器主要由法兰盘、不锈钢内刷(含支架)、过滤网、钢刷主轴、电机组成,漏水原因为自清洗过滤器运行时间较长,法兰盘安装孔处水封腐蚀,且钢刷主轴磨损严重,安装孔处冷却水泄露。

虽然备品备件库储备了水封,但因自清洗过滤器尺寸较大、故障率低,故并未储备。因钢刷主轴磨损严重,故单纯更换水封无法解决冷却水泄露的问题。

2.2  故障处理

方案一:采购钢刷主轴进行更换

因自清洗过滤器为定制设备,美国服务器,主轴为异型件,制作周期最少为3-4天,且发生故障临近下班时间,经电话沟通,主轴的制作最快为第二天上午,这样,冷机系统处于无冗余备份状态至少持续4-5天。采用方案一,数据中心将面对前所未有的运行风险。

方案二:利用未启用水系统钢刷主轴进行更换

除冷冻水、冷却水在用主管路,该数据中心还配备水环加热管路,且并没有启用。可利用管路上的自清洗过滤器钢刷主轴进行更换。但自清洗过滤器为铸铁材质,自重较大,常规拆卸电机、法兰盘及钢刷主轴需要约2小时,故拆卸及安装将耗时约4小时,且因自清洗过滤器较重,安装过程极易造成水封变形,可能导致再次漏水,如故障抢修失败,故障恢复时间将会延长。采用方案二,该数据中心亦将面对较长时间的运行风险。

2.3  故障分析

方案一风险过高,方案二虽然利用了闲置备品备件,但依然不能在短时间内完成故障抢修。

抢修组成员均认为方案一和方案二效果都不能达到短时间完成抢修的目的,并总结关键点如下:

(1)自清洗过滤器泄露点为钢刷主轴与法兰盘的安装孔;

(2)自清洗过滤器重量大是拆装工作耗时较长的主要原因;

(3)自清洗过滤器利用内部钢刷、排污开关定时启动,达到控制水质的目的。

针对以上三个关键点,抢修组提出了几点疑问:

(1)不更换钢刷主轴和水封,而是完全堵住安装孔,是否可以解决漏水问题;

(2)自清洗过滤器更换是否可以减少工作量;

(3)1#自清洗过滤器不起作用,是否会对系统水质产生影响。

针对以上三点疑问,抢修组经过讨论,香港服务器,最终得到答案:

(1)完全堵住安装孔,可以解决漏水问题;

(2)工作量可降低至拆卸法兰盘、钢刷主轴及不锈钢内刷(含支架);

(3)1#冷水机组运行时,可加大另外两台冷水机组自清洗过滤器的排污量,不影响系统水质。

综上,抢修组总结得出方案三:

拆除1#自清洗过滤器法兰盘,并将钢刷主轴、不锈钢内刷(含支架)拆除,临时利用一款铁板焊死安装孔,再安装回Y型过滤器。

2.4  故障处理

(1)17:10—17:30

抢修组对现场故障做出评估,最终确定方案三;

(2)17:30—18:45

抢修组借调其他机房楼人员力量,关闭1#自清洗过滤器前后阀门,完成拆卸;

(3)18:45—19:00

抢修组现场利用一小块铁板将安装孔焊死;

(4)19:00—19:30

抢修组安装1#自清洗过滤器的法兰盘。

(5)19:30—20:00

抢修组打开1#自清洗过滤器前后阀门进行注水,观察1#自清洗过滤器前后压力恢复正常,安装孔无泄漏现象。

部分文章来源与网络,若有侵权请联系站长删除!