国内资讯

作为专业的数据中心服务商,首先要建立良好的应急机制和储备,应急演练要常态化,制度、流程、人员要规范化。

数据中心危城抗“疫”

来源:服务器托管 作者:香港服务器 浏览量:132
2020-03-09
0

武汉,一座正在与新型冠状病毒肺炎做殊死搏斗的“危城”。

中金武汉超算中心身处“危城”之中,其建设并运营的武汉市电子政务云为武汉市40多个委办局的140多个业务系统提供了云计算服务,其中,武汉微邻里、长江网武汉城市留言板-在线问诊平台、武汉红十字会网站、武汉市新冠肺炎疫情防控指挥平台、市公安局视频统一应用云平台、市智慧城管的智慧桥梁和智慧燃气等系统和应用连接成武汉抗击疫情的大动脉。

“危城”中的数据中心,它如何坚强挺立,它又如何为抗击疫情提供持续、稳定、可靠、安全的后台支撑?

武汉超算中心

数据中心的真正考验来了

科技战“疫”,即利用云计算大数据、人工智能、5G等技术抗“疫”,取得了非常积极的效果,从相关疫情信息的统计、分析和披露,到医院的建设和对病人病情的发现与治疗,再到疫苗和药物的研发等,无不渗透着科技的智慧和力量。而作为这些技术应用的底层基础支撑,数据中心发挥着中流砥柱的作用,为科技战“疫”保驾护航。

高力国际近日对105位数据中心资深专业人士进行了一项调研,受访者的普遍共识是,此次疫情对数据中心的长远发展来说是利好的。在抗击疫情的过程中,大数据的助力使得防控措施的实施更精准、更有效,比如数据支撑和辅助决策为国家切实有效地控制疫情蔓延发挥了积极作用;再比如,专业病理大数据分析、促进新冠疫苗研发的大数据云平台等需求激增,这些都对数据中心的平稳安全运行提出了更高的要求。

但同时,高力国际通过调研也发现了一些数据中心不得不面对的新挑战,比如疫情可能会导致供应链短缺,一线人员劳动力不足,这意味着数据中心建设周期会更长,总体投资以及运营成本会变高等;另外,复工慢将增加数据中心运维难度,加之需要更加严格的消毒措施,设备的调试与更换也会面临挑战等。

除了高力国际的调研所述,笔者认为,此次疫情的发生对数据中心的重大考验还有一项应该引起特别重视,那就是应急响应,以及BCM(业务连续性管理)、BCP(业务连续性计划)的制定与落地执行。以前,我们谈到数据中心业务连续性面临的主要挑战,更多是讲地震、水灾、火灾等自然灾害。但是,从十几年前的SARS到今天的新型冠状病毒肺炎,面对突出其来的疫情,数据中心要如何快速、有效地应对是一个值得深入探讨的新课题。疫情有其特殊性,特别是一些特殊政策和手段的使用可能给数据中心的运维带来很大困难。举例来说,在武汉封城后,公共交通中断,数据中心运维人员如何及时到位并保证7×24小时在线和响应就是一个现实问题。中金武汉超算中心从上到下的快速响应,以及应对之策经受住了考验,值得分享与借鉴。

打好防疫第一仗,确保人员安全

此次疫情袭来,首要的工作就是确保人员的健康和生命安全。中金数谷公司和武汉超算公司在第一时间分别成立了疫情防控领导小组,统一建立了疫情防控应急领导工作微信群,加强沟通协调,统筹部署公司疫情防控工作,做到了“准确预判,提前防控”。举例来说,在武汉地区口罩和消杀物品开始稀缺的情况下,公司紧急购置口罩、消毒液,并安排对位于武汉的数谷、超算、台商、工地等四个办公地点进行消毒。从1月20日开始,执行全员每日安全健康状况跟踪统计和统一报备制度。公司领导直接指挥,针对疫情期间出现的问题,组织相关负责人每日会商研究,高效决策,及时处置,坚决不留隐患。

疫情就是命令。1月21日,中金武汉超算中心成立了应急组,包括保障、支援、技术支持等多个小组,许多员工主动报名加入,中金武汉超算基础设施运维弱电工程师夏昕就是其中之一,他主要负责数据中心内设备的监控和运维,以保证数据中心的稳定运行。

从1月23日开始,中金武汉超算中心的9名人员三班倒,负责数据中心的整体运维。从1月25日开始,由于武汉封城,很多小区封闭,人员不能随意进出,且公共交通中断,导致原有的9名运维人员减至6人,但大强度的三班倒一直在坚持。听了夏昕的讲述,那种紧迫感,以及在疫情面前的众志成城,让人犹如身临其境,备受感动和鼓舞。

零疑似,零确诊,近一个月过去了,中金武汉超算中心仍在延续这一纪录。在保证健康和安全的前提下,执行更严格、更高频次的巡检,保证数据中心的稳定安全运行,这就是一直坚守在岗位上的夏昕和他的同事们做的最有意义的工作。

部分文章来源与网络,若有侵权请联系站长删除!