新闻资讯
浅谈金融数据中心的测试验证工作
发布日期: 2023-04-18 浏览数:185
近年来,社会各界高度重视金融系统的安全稳定运行,国内金融机构大力推进金融系统基础设施数据中心的建设。数据中心的测试验证工作既是数据中心建设的终点,也是数据中心运行的起点,因此,数据中心的测试验证工作至关重要。一、金融数据中心测试验证工作的重要性1)金融数据中心测试验证工作可以验证数据中心建设是否合符设计标准金融数据中心的建设,涉及调研、规划、设计、实施等全生命周期,属于重资产行业,投资比效大且能耗高,目前政府严格管控数据中心的建设。因此,金融数据中心的建设存在周期长、耗资大、政策管控严等不可预知的变更风险。竣工后的数据中心是否合符设计标准,必须通过验证测试工作进行验证确认,以便制定相关的运行使用手册。2)金融数据中心测试验证工作可以及时发现数据中心建设的缺陷并及时整改金融数据中心的建设是一个庞大的系统工程,涉及供配电系统、暖通空调系统、安全防护系统、网络通信系统等,每个系统又涉及复杂的系统架构、专业设备和实施工程,如供配电系统涵盖高压供电线路工程、高压配电装置、变压器、UPS不间断电源、低压配电装置、PDU电源插座、工业电源连接器、列头配电计量柜、发电机后备电源系统。因此,金融数据中心的建设工程实施不可避免会出现一些缺陷,这些缺陷只有通过测试验证工作才能被及时发现和整改,从而确保金融数据中心的建设工程保质保量竣工。3)金融数据中心测试验证工作可以规避数据中心正式投入运营的安全风险金融数据中心测试验证工作是新建金融数据中心安全稳定运行的最后一道防火墙,数据中心一旦投入运营就不可中断,测试验证工作可以验证新建数据中心安全稳定运行的可持续性,因此,测试验证工作是数据中心建设工程必不可少的一个环节。二、如何做好金融数据中心测试验证工作金融数据中心测试验证工作是一个系统性的工作。数据中心整体及其各子系统、专业设备、施工过程都是数据中心测试验证的对象。通过对金融数据中心开展工程质量核查、承载容量测试、系统功能验证、系统逻辑验证等工作,确保数据中心的建设符合设计标准,确保数据中心安全稳定运行。从验证工作流程上分,主要测试验证工作有工程实施质量预监查、功能测试验证、性能测试验证、系统综合测试验证;从验证工作内容上分有供配电系统、空调暖通系统、安防系统、网络IT系统。1)工程实施质量预检查一方面,核查设计方案和施工图纸,验证工程是否按照设计方案和施工图纸进行施工,如果存在变更,是否按照工程变更管理规范完成审批流程;另一方面,制定管理工程质量施工的制度,明确施工质量管理责任人,建立工程施工质量奖惩及整改机制,工程施工全过程中随机不定时定量抽查,对于抽查结果严格执行工程质量施工的管理制度,做到从源头上杜绝工程施工质量问题。在数据中心建设过程中,严格的预检查工作能够发现绝大部分的施工工艺问题,例如:UPS电池接线不规范,紧固力矩不合格;电力电缆连接不规范,螺栓与垫片规格不匹配;电气链路上存在施工遗留物,可能导致电力故障;不同消防区域的分隔封堵不满足规范要求,存在火灾隐患等,如图1所示。图1 施工工艺问题2)功能测试验证工作功能测试主要是测试验证各个子系统的终端模块或者单体设备运行能否达到设计的基础功能。终端模块或者单体设备主要有以下几类。供配电系统:高压线路、高压配电柜、变压器、UPS、电池、母线、低压配电柜、配电列头柜、PDU、工业连接器、发电机组。暖通系统:冷水主机、水泵、供水管道、冷水塔、精密空调、新风机、封闭冷热道。消安防系统:消防报警系统、消防气体系统、极早期报警系统、灾后排烟系统、烟感器、温感器、消防水系统、监控摄像器、监控存储系统、门禁系统。按照数据中心运行的规范,搭建真实运行的测试环境,在额定负载下验证终端模块或者单体设备的运行技术参数、输入输出功能、容量承压能力等是否合符设计方案及数据中心安全稳定运行的要求。3)性能测试验证工作性能测试主要是测试验证数据中心各子系统运行能否达到设计的系统性能。子系统主要有:高压供电系统、UPS系统、低压配电系统、后备发电系统、暖通空调系统、监控系统、门禁系统、消防系统、IT系统等。按照数据中心运行的规范,搭建真实运行的测试环境,在额定负载下验证数据中心各子系统的运行技术参数、逻辑系统功能、容量承压能力是否合符设计方案及数据中心安全稳定运行要求。4)系统综合测试验证系统综合测试是对数据中心整体的、全面的、系统的、综合的测试验证。按照数据中心运行的规范,在模块机房内各个机柜配置设计额定负载,模拟数据中心真实的运行状态,验证数据中心的运行技术参数、逻辑系统功能、容量承压能力。同时,通过模拟相关故障场景,测试跨系统的联动性能,验证数据中心的应急保障能力、自动控制功能是否合符设计方案及数据中心安全稳定运行的要求。综合系统联合测试验证应该在单系统测试验证完成且验证结果合格之后、在数据中心项目竣工验收之前进行。综合系统测试需要在测试服务单位的组织下,由数据中心建设各方全部参与,按照既定方案与计划进行测试,测试的全部数据都应该被详细记录,作为后续数据中心运维管理的重要依据。三、金融数据中心测试验证工作的重要关键环节一是金融数据中心的测试验证工作必须符合规定的负载容量和持续的时间。一方面,必须在额定负载或额定负载120%的模拟测试环境下进行验证测试;另一方面,单体设备或者终端模块测试时间不应少于8小时,数据中心各子系统测试时间不应少于24小时,数据中心的系统综合测试时间不应少于72小时。数据中心系统测试只有在达到相应的容量负荷且持续一定的时间长度后,隐藏的施工质量问题、材料设备质量缺陷、设计方案的欠缺等问题才会呈现出来。例如在笔者开展的测试中,在2500kVA变压器满载测试运行8个小时后,输出母线接头的温度达到华氏93.6,超出规范要求范围,但变压器的冷却风扇没有自动启动。类似故障如果没有被及时发现及排除,将会导致数据中心投产后发生严重故障。二是模拟故障场景测试系统联动性能和应急保障能力,必须涵盖所有的故障场景。数据中心由不同的专业系统组成,系统之间又相互关联、相互影响,一个安全的金融数据中心必须保证具有高度的冗余能力以及应急自动响应的能力,而且这些能力必须在带载的条件下接受检测与验证。最基本的综合系统测试包括以下场景:模拟A路市电中断,验证系统的自动切换能力与连续供电、供冷能力;模拟B路市电中断,验证系统的自动切换能力与连续供电、供冷能力;模拟两路市电均中断,发电机系统投入运行,验证系统的自动切换能力与连续供电、供冷能力;模拟市电恢复,验证系统的切换能力与连续供电、供冷能力;模拟火灾灭火动作信号,验证电气系统、空调系统的消防联动反应能力是否符合设计要求。三是机柜供电链路测试。必须对所有机柜的供电链路进行测试,对每台机柜的“供电链路PDU-工业连接器-列头柜分开关-列头柜总开关-UPS输出配电开关-UPS-UPS输入开关-低压配电总开关-变压器-高压开关-高压线路”进行全链路验证测试,验证链路的正确性、连通性以及额定负载下的温升标准。四是高度重视隐蔽工程的测试验证工作,必须对隐蔽工程进行无死角、全过程、全方面的测试验证。四、结语数据中心的测试验证工作关乎数据中心建设是否合符设计标准,关乎数据中心未来能否安全稳定运行,进一步关系到金融系统的安全稳定运行,因此,在数据中心建设工作中务必做好数据中心的测试验证工作。