一般情况下,企业在自行建设容灾备份中心之后,还需要持续不断的投入资金和人力,进行各类的管理与测试等工作。智控国际通过灾备中心建设方面的丰富经验和对金融行业的深刻认识,为银行客户提供针对性的全面解决方案,应对金融灾难备份中心建成后的全部管理问题,可总结归纳以下6个大类:
组织架构不健全
容灾中心建成以后,相应的系统维护工作量大大增加,但很多单位忽视了需要增加相应的职能岗位,导致系统切换存在隐患。从组织架构方面来说,当灾难发生时,需要相应的责任人做出容灾系统是否切换及回切的决定;日常运行时需要组织和完成管理、预警、演戏、测试和培训等工作,以及运输、安保和信息发布等相关的后勤保障工作。因此,容灾需要一个包含决策组、执行组和行政管理组在内的完整架构。相关职能职位可以专职或兼职,但转职人员不得少于一定数量。在组织建设中,还需要编制容灾组织架构各岗位职责及工作手册,并且还要包括组织架构成员,以及集成商、设备供应商等的联系方式以及优先次序,确认有效通知手段以及后备人员等。
日常管理不到位
日常管理工作的核心是保证容灾备份中心的应用系统和软硬件平台的持续可用,可以随时进行应用切换及业务接管,包括数据审查、系统维护、系统监控、软件版本管理、容灾变更管理等内容,从而保证在必要的时候能够及时接管生产系统。因此需要在容灾中心和生产系统之间建立起数据同步审查机制,以核对生产系统可能出现的问题,进一步优化和完善整个灾备业务保障体系。
预警流程不完备
完善有序的预警流程能够保障在突发状况下迅速有效地按照预先设置的正确方式妥善处理,是根据以往的经验教训所总结提炼出来的处理流程的制度化体现。完备的预警流程至少应该包括七个主要步骤:风险上报、风险评估、风险决策、风险告知、风险警备、发起系统切换和预警总结,分别对应为针对不同的环节相应的职能发挥应有的作用。
容灾演习不重视
容灾系统建成之后必须不定期地进行演习,是灾难恢复计划的最好验证手段,以此来检验系统和相关职能岗位的实际运行效果。根据在演习过程中是否真正进行系统切换,可分为模拟演习和真实演习两种,分别侧重于职能岗位的流程演练,和验证容灾系统能否正常的切换与回切。同时演习过程中系统的具体表现,可作为考核容灾系统和生产系统的各项指标,并且演习完成之后及时总结经验教训,针对发现的问题来修改或者优化灾备处理流程。
容灾测试不全面
如果对容灾系统的数据、功能、性能等方面没有测试验证,难以保证容灾系统可实现数据保护和业务接管。容灾测试是对容灾系统的数据、功能、性能等方面进行验证,保证容灾系统的建设和变更能够实现数据保护和业务接管。测试方式尽可能采用测试脚本,避免人为误操作。测试环境尽可能与生产系统隔离。在不发生系统变更时,最好每月测试一次,否则须即时测试。
容灾培训不及时
通过容灾培训,可确保相关人员及时准确地了解系统结构,熟悉测试、演习、灾难恢复流程,明确自身职责,沟通、协作顺畅,提高工作技能和灾难应对能力。如果没有做好培训,难以保证相关人员及时学习到相关的知识和技能并及时更新。培训内容主要包括:容灾基础培训、容灾流程培训、容灾技术培训。遵照灾难恢复计划中的切换和回切流程,在不影响正常生产情况下,严格按照事先制定的培训教材,开通容灾中心全部设施及模拟测试终端。
投资巨大的容灾备份系统,只有在关键时刻起到应有的作用才是值得的,如果把以上六个方面比作一个链条上的六个环节,那么任何一个环节的缺少都可能导致容灾中心形同虚设。俗话说,养兵千日,用兵一时,任何一个细节的忽视,都可能导致容灾中心在关键时刻不能发挥应有的作用,但到时悔之晚矣。因此将链条环环紧扣,问题全部解决,是容灾备份系统建设的指导原则。
