Summary
Overview
Work History
Education
Skills
Certification
Self Evaluation - Summary
Personal Information
Timeline
Generic

关 月

Principal Engineer, Field Service

Summary

本人在工作中践行技术驱动、坦诚沟通、正直乐观的准则,对自我能力评价如下:在专业技能方面肯钻研、务实自驱,具备较强的逻辑思维能力,善于思考总结,能够不断为自己设定新的目标,持续进步。在项目执行上有自己的方法论,具备全局视野,能够发现项目中潜在的风险,善于应对和解决复杂问题,敢于担责。在协作中擅长跨团队的沟通合作,能够聚焦在关键任务上,求同存异,达成最终目标。

Overview

17
17
years of professional experience
5
5
Certifications
3
3
Languages

Work History

大型银行z/OS系统搭建、升级与运维保障

04.2011 - 01.2018
  • Z/OS作为IBM大型机核心操作系统,其技术架构复杂度高(Parallel Sysplex架构,大版本升级需要耗时1年),客户对于稳定性要求严苛。
  • 作为z/OS技术专家需要持续保障客户的z/OS运维和升级工作顺利进行。
  • 个人职责:负责z/OS安装搭建及升级全流程,具体包括:软件升级规划、硬件升级规划、环境搭建、多轮次版本验证测试、生产环境发布、运维体系标准化建设。
  • 项目成果:先后负责从ZOS 1.12开始到ZOS 2.3的多个大版本的软升级工作,先后给3个大客户进行硬件版本升级和数据迁移,共计帮助5个大客户成功完成20+生产环境的升级工作,升级成功率100%,多次收获客户书面感谢信。

Principal Engineer, Field Service

戴尔科技集团
01.2018 - Current
  • 职责:隶属 DELLEMC 现场服务部门,作为售后资源技术专家,负责企业级高端存储产品面向重点客户的生命周期管理(ITIL processes),包括规划设计、交付实施、售后运维等。服务客户包括 BOC, BOCOM, ABC, CCTV, PINGAN, 复兴银行等。同时面向 Public 等客户提供中端 NAS/SAN 存储产品的交付与运维,包括交付规划配置、硬件上架、系统安装、测试验收、运维交接等关键环节。服务客户包括北京天坛医院、中国高校、中央电视台、嘉实基金等金融行业。
  • 技能:熟练掌握操作系统 Mainframe/Unix/Linux/Windows,拥有 17 年系统和存储管理经验。配合前端存储产品交付运维(DLm+DataDomain, PowerMax8000 等产品),稳定存储系统建设能力,应急处置能力,事故分析根因调查能力,文档编写能力。Dell 中端存储产品 PowerScale(ISILON),PowerStore, VxRail, PowerEdge 等系列产品安装与运维集成项目以及 DR 客户中心的规划和测试。

高端存储产品交付与运维(面向金融大客户)

DELLEMC
01.2018 - Current
  • 中国多家大型银行(如BOC、ABC、光大银行、交通银行、平安银行等)采用DELL 的PowerMax高端存储及DLm+DD带库架构,支撑核心业务数据存储与容灾。
  • 客户对稳定性、安全性及交付效率要求极高。我作为对接这些客户的技术负责人,需通过体系化手段提升标准化交付能力与运维质量,以应对客户业务的增长及技术迭代带来的稳定性问题。
  • 个人职责:针对金融行业特性,建设标准化交付流程,保障“0事故”交付,包括交付规划、硬件上架、配置调优、测试验收、运维交接等关键环节。
  • 主导建设存储产品运维体系:“预防->感知->止损->根因追查->根治复盘”,保障客户系统稳定性。
  • 负责重点客户关键运维工作的执行,比如硬件大版本升级;关键时间的重点保障及应急响应等工作。

Advisory IT Architect

国际商业机器(中国)有限公司
08.2008 - 01.2018
  • 职责:隶属 IBM Lab Service 部门,从事 IBM 大型机系列软件 z/OS 操作系统的交付和售后运维工作,深耕 zOS 操作系统。连续负责多家大型银行的 Mainframe 操作系统搭建,Parallel Sysplex 环境设计与实施,参与大型银行数据中心高可用架构的设计和执行,如“两地三中心”、“数据中心双活”等。服务客户包括 BOC, ICBC, CCB, ABC, BOCOM 等中国大型银行数据中心,亲历中国大型银行数据中心技术和架构的变迁。
  • 技能:IBM 大型机系列 z/OS 软件交付运维能力,数据高可用架构设计能力,两地三中心数据架构实施能力,COBOL, JCL, REXX 等编程能力。熟练操作子系统(SMS, RACF, JES2, VTAM, TCPIP, TSO, MQ, DB2, GDPS 等子系统)

中端NAS存储产品交付与运维(面向Public大客户)

DELLEMC
01.2018 - Current
  • 中国多家大型医疗、教育、影视平台(如协和医院、各大高校、中央电视台、嘉实基金等)对NAS文件级别的访问需求越来越高,多家大客户采用DELL 的PowerStore、PowerScale、VxRail(基于VMWare架构)等一系列中端存储产品,通过高性能,智能化管理和多种工作负载的支持为客户提供强大的存储解决方案,助力其实现数字化转型和业务增长。
  • 我作为对接这些客户的技术负责人,支持客户无缝的横向和纵向的计算和存储能力扩展(scale out和scale up),满足企业不断增长的数据需求;通过消重和压缩技术优化存储容量,减少成本。
  • 个人职责:针对Public行业特性,满足不同规模企业的多样性需求,快速响应市场变化同时控制成本并提升运营效率,我负责交付规划配置、硬件上架、系统安装、测试验收、运维交接等关键环节。
  • 主导建设存储产品运维体系,提供软件定义存储的操作系统支持,灵活部署和管理,数据管理与安全保护,多协议支持。

CIMB银行存储重大故障攻坚与根因治理

07.2024 - 08.2024
  • 马来西亚CIMB银行在PowerMax存储升级(V3→V4)后,出现备份数据丢失的严重故障,极大可能影响客户核心数据安全。
  • 该问题既涉及PowerMax又涉及IBM mainframe比较复杂,且Dell的东南亚本地支持团队没有人熟悉IBM mainframe环境。由于我同时具备2个产品的运维背景,所以被团队派往马来西亚紧急处置该问题。
  • 个人职责:背景分析:快速了解客户系统架构(重点是z/OS和PowerMax的交互架构),确定问题现象、影响范围;收集相关日志,同时和本地团队及实验室研发建立war room。
  • 根因追查:通过分析z/OS系统日志(发现VSAM KSDS数据集校验日志)以及JCL脚本逻辑,发现问题根因是两个问题叠加造成:首先发现批量作业盘转带时进行备份数据拷贝时出现了LREP目标文件损坏,但应用团队编写JCL会将MAXCC LE 8时重置为0,导致问题没有在第一时间发现,出现数据备份失败,其次对文件进行Examine时发现文件CI不完整,定位PowerMax硬件版本升级后与产品的兼容性发生问题,以上两者造成客户第三份数据丢失。
  • 问题根治:协同PowerMax研发针对文件拷贝失败的问题进行修复,同时推动客户应用团队修改JCL脚本容错逻辑(MAXCC LE 8时重置为0),彻底解决该问题。
  • 系统性风险治理:对外和客户z/OS团队合作建立数据拷贝日志监控,并且多次配合客户从PowerMax到VMAX3的切换演练;对内主导建立“重大故障应急响应SOP”,提升跨国团队协作效率。
  • 项目成果:48小时内定位问题根因,一周内解决该故障,挽回客户潜在的业务损失,获得客户和DELL销售团队联合表彰。

大型银行核心交易数据中心“异地双活”架构改造 项目负责人

03.2016 - 07.2017
  • 为了满足金融行业对高可用性、灾备能力、业务连续性的严苛要求,中国工商银行(ICBC)在大型机(Mainframe)系统中采用双活架构(Active-Active),出于高可用和资源充分利用考虑,中国工商银行决定将数据中心由一个生产中心,变为两个生产中心同城双活的A-A架构,增加第三个异地节点作为异步备份,形成两地三中心架构。
  • 作为z/OS负责人提供并行耦合体多个实例,通过动态负载均衡自动分配优化交易性能。
  • 个人职责:参与双活架构设计,风险评估,问题处理及投产支持。
  • 主导双活组件(MQ/QREP)的环境搭建,功能测试,性能分析。
  • 基于IBM GDPS同步复制技术,确保双活节点数据强一致性,配合自动动故障检测与切换(CF故障时,秒级切换至备用节点)。
  • 项目结果:成功帮助客户搭建国内首个超远距离(1200km+)数据中心双活架构,实现双生产中心架构,提高数据中心容灾能力,缩短灾难恢复时间,交易处理能力 50,000+ TPS(每秒事务数)。数据同步延迟

Education

MBA - Economics

北京大学
中国
04.2001 -

本科 - 外国语教育

辽宁师范大学

Skills

Mainframe

Unix

Linux

Windows

系统和存储管理

Dell高端存储产品交付运维

稳定性体系建设

应急处置

事故分析根因调查

文档编写

Dell中端存储产品安装与运维

DR灾备中心规划和测试

Proficient in [software]

Software architecture

Problem-solving abilities

Analytical thinking

Client relations

Problem resolution

Professionalism

Problem-solving aptitude

Reliability

Certification

Expert – VMAX All Flash and VMAX3 Solutions Version 2.0 (DCE) PowerMax

Self Evaluation - Summary

本人在工作中践行技术驱动、坦诚沟通、正直乐观的准则,对自我能力评价如下:在专业技能方面肯钻研、务实自驱,具备较强的逻辑思维能力,善于思考总结,能够不断为自己设定新的目标,持续进步。在项目执行上有自己的方法论,具备全局视野,能够发现项目中潜在的风险,善于应对和解决复杂问题,敢于担责。在协作中擅长跨团队的沟通合作,能够聚焦在关键任务上,求同存异,达成最终目标。

Personal Information

  • Date of Birth: 1986年5月
  • Gender: 女

Timeline

CIMB银行存储重大故障攻坚与根因治理

07.2024 - 08.2024

Principal Engineer, Field Service

戴尔科技集团
01.2018 - Current

高端存储产品交付与运维(面向金融大客户)

DELLEMC
01.2018 - Current

中端NAS存储产品交付与运维(面向Public大客户)

DELLEMC
01.2018 - Current

大型银行核心交易数据中心“异地双活”架构改造 项目负责人

03.2016 - 07.2017

大型银行z/OS系统搭建、升级与运维保障

04.2011 - 01.2018

Advisory IT Architect

国际商业机器(中国)有限公司
08.2008 - 01.2018

MBA - Economics

北京大学
04.2001 -

本科 - 外国语教育

辽宁师范大学
Principal Engineer, Field Service