树人论文网一个专业的学术咨询网站!!!
树人论文网

疫情下对基层央行IT应急管理工作的思考

来源: 树人论文网发表时间:2021-06-11
简要:要:随着金融信息化的快速推进,人民银行各项业务对网络和信息系统的依赖程度不断增强,对IT应急管理工作也提出了更高的要求。特别是在疫情防控时期,IT应急管理面临了新的挑战

  要:随着金融信息化的快速推进,人民银行各项业务对网络和信息系统的依赖程度不断增强,对IT应急管理工作也提出了更高的要求。特别是在疫情防控时期,IT应急管理面临了新的挑战。笔者结合当前疫情防控新形势,探讨了基层人民银行在IT应急管理工作中存在的问题,并提出了相关改进建议。

疫情下对基层央行IT应急管理工作的思考

  本文源自张宏琳; 胡雨时, 金融科技时代 发表时间:2021-06-09

  关键词:应急管理;疫情防控;应急预案;应急演练

  一、引言

  近年来,基层人民银行IT应急管理工作在总分行的指导下,逐步形成了“横向到边,纵向到底”的IT应急管理体系架构,内容涵盖组织架构、应急预案、应急演练、应急处置及应急人员物资等方面,为基层人民银行履行货币政策、货币发行、支付结算、经理国库等职能提供了安全、可靠的技术支撑和保障。新冠疫情爆发以来,IT应急管理面临了新的挑战,基层人民银行IT应急管理工作也暴露出在应急预案、应急演练、应急准备及应急协调联动机制等方面的不足,亟待改进。随着疫情向常态化、全球化态势发展,如何健全IT应急管理机制,提升基层人民银行IT应急管理工作的科学性、系统性、有效性和专业性,值得进一步研究。

  二、IT应急管理工作中存在的主要问题

  (一)应急预案尚不完善

  IT应急预案是IT应急管理的重要内容,也是提升 IT应急管理水平的重要制度保障。根据人民银行总行 IT系统应急管理相关工作的要求,基层人民银行每年对IT应急预案进行修订和完善。目前,IT应急预案已基本涵盖了信息系统、网络系统、机房环境、安全设备及核心设备等各个方面,具有组织完善、措施具体、分工明确、要素齐全等优势,对应急处置IT突发事件具有较强的指导性和操作性。但结合新冠疫情突发事件来看,IT应急预案内容仍不够全面,如因发生重大突发公共卫生事件造成了人员隔离、交通管制、场地封闭等,以及出现应急技术人员通勤困难甚至无法到岗、重要应急设备及备品备件无法及时到位、系统运维场地隔离封闭等情况。目前,尚未有涵盖此类极端情况的应急措施及方案。

  (二)应急演练深度广度不足

  近年来,基层人民银行每年通过桌面演练、现场模拟演练或实战演练等方式,针对网络通信中断、机房设施故障、病毒入侵及重要业务系统无法访问等各类突发事件开展常态化应急演练,极大地促进了IT应急管理能力的提升。但是从演练的实效上来看,仍存在不足。一是应急演练真实性低,实战经验不足。考虑到业务连续性等因素,通常选择易操作、易验证的应急方案开展演练,演练场景、流程既定,而忽视了真实环境的情况。二是应急演练场景不足。采取的演练基本上是常规事件场景的演练,而针对地震、洪水等自然灾害的相关演练场景较少,且未涉及由新冠疫情等突发事件导致的交通管制、人员隔离、场地封闭等情况。三是应急演练协同性不足。基层人民银行未能建立毗邻地区应急演练协同机制,开展跨区域应急演练较少,无法真正有效的体现应急响应的时效性。

  (三)应急管理缺乏技术支撑

  一是缺乏统一集中的应急指挥决策技术平台支撑。未通过技术手段实现突发情况下应急人员、应急物资、外部支撑、应急流程等要素的全景式动态化实时展示。二是实施异地接管的管理机制及技术措施尚需进一步完善。因突发疫情等特殊情况需上级行实施异地接管时,设备及运维脚本的差异性、跨平台兼容性及设备权限责任划分等问题都制约着异地接管的有效实施。三是缺乏远程监控及运维手段。由于不同网络区域间存在物理隔离,基于不同管理级别的IT基础设施远程监控及系统运维的安全性还有待进一步研究。

  (四)应急队伍能力不足

  IT系统应急人员作为应急事件处置的先头兵,其应急事件处置能力对于处置突发事件的效率至关重要。在当前疫情防控常态化的背景下,需进一步加强应急队伍建设。一是应急人员技能储备有待提升。关键岗位人员依赖性较高,重要岗位虽然设置了AB角或 ABC角,但在实际工作中主要还是依靠A角,当A角人员无法及时到岗时应急处置效率不高。二是设施和信息系统的运维过于依赖外包。受限于技术的专业性,通常与第三方设备或系统供应商签订维保协议,如因交通管制造成外包人员无法及时提供现场技术支持,将严重影响系统故障的快速恢复,给应急处理工作带来极大的困难。

  (五)应急协调机制不健全

  一是需进一步强化内部应急协调联动工作。由于业务、科技、管理等部门缺乏统一的应急协调机制,协同能力、保障能力不足,对突发事件的应急响应及处置流程不一,在一定程度上增加了应急响应的协调难度,影响了事件处置效率。二是外部应急管理协调渠道尚未畅通。虽然建立了外部支持应急保障人员联系机制,但受地域、专业、职责等各方面因素的影响,各分支机构应急管理各自为战,忽视了重大突发事件对整体协同合作的要求,跨行业、跨区域应急管理经验交流及应急演练尚显不足。协调机制的不畅影响了应急处置效果。当发生疫情等特殊情况时上级行如何接管或同级部门如何支援,如何建立共享、共用保障协调机制等,仍需进一步研究探索。

  (六)应急物资统筹不到位

  一是重要设备、关键设施的冗余设备的一致性检查不到位。由于备用冗余设备未能直接在真实生产环境下运行,且运维人员对备用设备的环境参数、系统配置及运行性能等的深度检查、一致性测试工作不到位,在生产主机发生故障时,备用设备无法达到预期的切换上线效果。二是储备应急物资管理精细化程度不高。应急物资尚未分级分类,相关分级分类标准尚未制定,应急物资管理还不够精细化、规范化和流程化。三是应急物资统筹储备不到位。应急物资储备缺乏统一规划,各分支机构按照既有经验,仅储备临时性的设备及备件。虽然与第三方外包服务商签订重要设备维保协议,但仅依靠第三方提供应急物资存在不足,特别是当发生重大疫情交通管制时,应急资源的响应将受到极大的影响。

  三、相关工作建议

  (一)进一步完善应急预案体系

  在现有IT应急预案的基础上,应进一步完善各类突发事件的类型,丰富应急场景,考虑极端情况,合理制定应急处置措施和方案,提高对重大特殊事件的应急处置能力。应根据重大公共卫生事件发生时可能出现的交通管制等各种场景,进一步细化应急处置流程,围绕运维技术人员、应急物资、备用运维操作场所、应急协调联动机制、远程运维体系等环节完善应急措施,制定切实可行的应急处置方案,保障IT应急预案内容全面、场景丰富、流程科学。

  (二)进一步加强应急演练管理

  应急预案演练是检验、提升应急能力的有效措施。通过进一步完善应急演练内容,实现由“演”到 “练”的转变,才能达到演练的真正目的。一是提升实战能力。逐步从桌面演练、现场模拟演练向实战演练过渡,按照IT应急预案开展真实环境演练,全面复盘,深入分析演练过程中的每个环节,及时发现不足和缺陷,提高应急演练的实效性和针对性。二是丰富演练场景。随着金融信息化业务的发展,基层人民银行应结合当前内外部环境变化,对场景或案例进行动态更新、完善,不断丰富应急场景库,开展对自然灾害、疫情等极端特殊情况导致的交通管制、科技人员隔离、场地封闭等场景的应急演练。三是注重协同作战。要切实发挥应急协同机制的作用,通过开展跨区域、跨机构、跨部门的IT应急演练,提高应急响应效率,共享应急经验,加强横向交流学习。

  (三)发挥技术支撑作用

  夯实应急管理的技术是做好应急管理工作的重要保障。随着金融服务向数字化、智能化转型发展,应急管理需进一步发挥技术支撑作用,提升应急管理的技术性和创新性。一是搭建统一的IT应急指挥决策技术平台。将事件报告、预案启动、处置流程以及人员、物资信息等纳入技术平台,实现对人员调配、物资统筹以及应急响应的实时动态监测,实现应急信息的互联互通、信息共享,为启动应急预案、实施应急处置提供科学决策和管控手段。二是加大金融信息化基础设施建设力度。充分考虑资金使用效率和信息化建设可持续发展之间的平衡,合理投入,统筹规划同城、异地灾备中心建设,提升网络和信息系统运行的高可靠性,有效降低因特殊突发事件而造成灾难性破坏的影响。三是探索构建远程智能化运维平台。利用 VPN、大数据、云计算等技术,探索实现安全可控的远程办公、远程监控、远程运维、异地接管、远程访问、变更控制等安全措施,为保障业务连续性提供技术支撑。

  (四)强化应急队伍建设

  加强应急人才培养是提高应急管理水平的前提条件。一是做好人才培养。多维度强化IT应急技术人才培养,围绕专业技术、应急管理、疫情防护等方面进行多角度、全方位、系统化的专项培训,提升应急人员的知识水平和技能储备,培养一支高素质、懂技术、善管理的多元化专业人才队伍,为应急管理工作提供人才保障。二是做好人才储备。为提高在特殊时期的抗风险能力,除了设置AB或ABC岗外,还要对关联度较高的岗位进行轮岗、交流,通过实践,培养“多面手”应急队伍,降低人员“单点故障”风险,提高应急队伍整体实战经验。制定关键岗位清单化与流程化操作管理机制,实现应急岗位人员平稳无缝交接。三是做好技能储备。应进一步规范和增强自主运维能力,通过实战培训或技能竞赛等方式,积极提升自身技术人员的日常维护和故障处置能力,做到外包公司只参与评估故障、出具处置建议及其他技术性指导,减少对外包服务的依赖,提高自身技术人员的专业技能。

  (五)健全应急协调管理机制

  要将IT应急管理纳入基层人民银行整体应急管理体系,统筹协调联动各部门、各系统、行业间及地方应急管理等各类应急资源,建立健全应急协调联动机制,形成内部协同、上下联动、横向互动的“立体网格化”应急管理体系。一是本级机构内部要做到全行 “一盘棋”,科技部门要与国库、支付结算、发行等业务部门建立应急管理联动机制,提升应急处置的快速响应、迅速行动的能力。二是由省级机构牵头建立毗邻地区的跨区域应急协调机制,共享应急事件处置知识库和处置经验,加强横向交流学习,统筹人员、设备、场地资源,形成应急管理合力,切实提高事件应急响应、处置和故障恢复能力。三是要建立与政府、疫情防治部门联动的应急机制,同时加强与第三方外包技术公司、通信、电力等部门应急管理的合作广度与深度,协同统筹人员、物资等各项应急准备。

  (六)统筹应急物资管理

  全面充足的应急物资准备是做好应急管理工作的保障。一是加大科技投入,常态化做好IT系统基础设施建设、应急物资保障工作。按照IT基础设施全生命周期管理要求,及时对超过正常使用期限的重要设备进行更新,确保重要设备的高可靠性。定期对冗余设备进行深度检查或切换演练,确保冗余设备的可用性。二是加强应急物资的精细化管理。制定应急物资分级分类标准,按照IT应急物资的范围、数量和种类等标准要求,定期梳理关键设备、备品备件等,做好应急物资的动态合理配置。可将应急物资管理纳入技术平台,实现统一管理、集中监测、统一调配,做好日常精细化管理。三是建立IT应急资源库。加大对IT应急物资的储备,实现关键设备、备品备件等物资本地化。建立省级人民银行集中IT应急资源库,共享重要基础设施备品备件。加强行业区域性协调,探索建立金融业同区、同城、毗邻地区公共IT应急资源库,为特殊时期快速调度应急物资做好准备。