
中国工商银行
集中式网络文件存储
异地双活高可用架构应用实践
获奖等级:总决赛一等奖
关键词:NAS、全闪存、4DC、容灾、高可用、多地多中心
申报单位:中国工商银行
项目背景
NAS容灾架构当前行业内常用容灾架构有单DC双活,同城双活,两地三中心架构,全球范围内目前能达到的最高技术水平为同城双活+异地容灾的两地三中心架构。金融行业普遍部署为以上列举的几个容灾架构。
随着国内金融行业监管要求提高,对关基业务的容灾等级有了新的要求,每年需要例行演练且异地容灾演练要运行满足48个小时。在日常容灾切换演练或者遭遇自然灾害情况下,关基业务异地单DC运行无高可靠架构保障,一旦再次遇见故障,不可避免的会导致业务受损甚至数据丢失。这在银行业尤其是工行内是不可接受的。需要更加可靠的NAS数据存储架构保障业务异地运行RPO=0.业务从本地生产中心切换到异地能够长时间运行无忧。
项目方案
中国工商银行集中式网络文件存储异地双活高可用架构应用实践是在原NAS 3DC架构的基础上,平滑升级至NAS 4DC架构,主要应用于联机业务文件和批量文件处理、容灾演练等高性能、高可靠文件业务相关场景。单业务高峰流量可达到7GB/s。3DC架构升级为4DC架构性能不降,业务无损,异地容灾可靠性从99.9999%提高到99.99999%。

其最终架构如上图所示,在外高桥、嘉定部署一套全闪存NAS双活业务,用以保障同城本地的业务高可用。在武清和西三旗部署一套全闪存NAS双活业务,用以保障异地运行期间业务的高可用。上海嘉定和北京西三旗之间采用异步复制方式保障数据本地和异地的数据同步。

当前工行已经在外高桥、嘉定、西三旗部署了全闪存NAS存储组成两地三中心的解决方案,并承载了关基业务。需要业务无损平滑升级为两地四中心的解决方案。
其基本实施步骤为先升级到支持双活+异步复制+双活组网的软件版本,新建武清站点全闪存NAS存储业务,再在站点西三旗存储上创建到站点武清存储的文件系统双活Pair,整体实施过程依赖华为高端全闪存在线业务无感平滑升级方案。
上层业务在同城数据中心两个站点和异地数据中心两个站点内部署。
1、在遭遇同城单DC存储故障,业务通过NFS+的多路径功能,自动路由到同城灾备机房,业务无感切换。
2、在遭遇城市级灾害或者异地容灾演练的时候,上层业务切换到异地运行,异地存储无缝接管业务。和同城本地高可靠架构保持一致可长时间运行。
本架构仅需4台华为全闪存NAS存储即可部署,可根据业务的实际需求横向+纵向扩展性能和容量。
创新点
作为金融容灾领域的创新引领者,中国工商银行以开创性思维打造全国首个"双活同步+异步复制+双活同步"三级容灾架构,实现三大历史性突破!
首创突破一:从容灾到“永续”,定义行业最高保护等级
依托全栈国产化技术突破传统三中心架构边界。通过华为全闪存存储方案独家支持的免网关扩展能力,实现国内首个两地四中心容灾组网,将容灾能力从单城失效容灾跃升至双城三中心失效防护,开创业务连续性管理新范式。
首创突破二:多级弹性保护,打造“无边界”高可用生态
工行打造的“多DC容灾架构”,通过异地双活同步接管与跨域冗余设计,在同城数据中心全故障的极端场景下仍能保障业务以双活形态持续高可用运行。创新性采用多级保护策略与弹性部署架构,不仅支持生产业务"零停机"无缝升级,更通过常态化容灾演练机制,将异地容灾能力从理论验证转化为实战保障。
首创突破三:技术自主可控,彰显“国之重器”担当
基于华为全闪存存储方案的全栈国产化能力,工行成为首个实现四中心免网关组网的金融机构。工行方案以唯一支持4DC平滑扩展的领先优势,攻克多中心数据一致性、跨域时延优化等世界级难题,为全国同业贡献“中国式容灾”范本。

应用效益
1.产业效益
工行集中式网络文件存储异地双活高可用架构的成功实践树立了存储产业新标杆,其中包含的技术包括但不限于容灾架构平滑升级,四中心数据双活同步,NFS+协议支持。
2.社会效益
以科技硬实力护航金融新基建,中国工商银行集中式网络文件存储异地双活高可用架构的成功实践,标志着我国金融业数字化转型的里程碑。通过每年开展多轮真实业务场景的容灾演练,工行不仅验证了技术体系的可靠性,更构建起数据和业务的全生命周期容灾管理体系。
3.经济效益
本项目基于华为全闪存存储3DC平滑升级4DC,双活文件系统同步的基础能力,仅需额外投入一个数据中心的存储成本以及主动演练切换适配工作量,即可将3DC容灾架构升级为4DC容灾架构。原存储设备不变,免数据迁移,免业务停机处理。节省至少3/4的存储设备和人力资源的投入,在当前试点业务下总计预估节省约千万。随着后续业务量的增加,其节省的成本线性增加。
