当前位置: 信息机 >> 信息机资源 >> 数据大楼IDC机房客户设备搬迁
项目实施方案
1、搬迁背景
中国电信广州互联网数据中心机房位于越秀区较场西路21号,随着业务不断发展,业务系统持续增加,机房区间、机房电力空调等基础设施容量趋于饱和,当时设计的能力已难以满足中国电信广州互联网数据中心业务发展需要。中国电信广州互联网数据中心搬迁的目标为:机房名称与现机房公里。为满足业务发展需要,中国电信广州互联网数据中心需尽快实施新数据中心的搬迁,使数据中心的综合管理和生产运行能力上一个新台阶。通过充分的调研,制订完善的整改及实施计划,提供充足的实施资源,安全、平稳、高效的项目实施。在保证数据安全、设备安全的前提下,使业务系统在停机窗口内平稳过渡到新的托管环境,同时对业务系统进行资源整合,并按照安全等级保护要求进行规划及整改服务。整改后的数据中心运行稳定、高效、可靠、安全,并能够满足未来一段时间内信息系统扩充升级的需要。
2、搬迁范围
中国电信广州互联网数据中心3楼搬迁的范围,现场共有7台机柜,71组设备,详细数据如下:
交换机6台:H3C2台核心交换机在用,华为核心2台暂时未启用,H3CS台为占用状态
服务器54台:联想RD台在用,联想RD台在用,联想SR台暂时未启用;IBMXM39台在用,IBMX3台在用,IBMXM49台2U在用,IBMXM41U处于关机状态,IBMX台在用,IBMX台4U在用,DELLR台在用,DELL台无线关机状态,DELLR台在用,DELL台无线,H3CG34台在线,HPDLGEN9(1U)2台在线,,HPDLGEN9(2U)1台在线。
防火墙6台:F5(1U)1台在线,FORTINETD(2U)2台在线,NSFOCUSWAFNX5SERIES(2U)在线,INFORCUBEIFCSIEM-H(2U)1台在线,INFORCUBEIFCDBA-S(2U)1台在线
磁盘扩展柜4台:NETAPPNAJ-(2U)4台在线
光电转换:(1U)1台在线
3、搬迁策略制定的意义
搬迁策略是搬迁实施的指导原则,一个好的搬迁策略可以帮助中国电信广州互联网数据中心安全、平滑地实现系统搬迁和业务切换,反之,一个不好的搬迁策略则会给搬迁工作带来很多的麻烦,严重时甚至会造成搬迁的失败;中国电信广州互联网数据中心搬迁策略制定的主要意义在于:
保障业务系统顺利搬迁:
全面分析应用关联和物理关联
制定业务和数据安全保障建议
制定应急预案的建议
降低业务中断影响:
分析业务中断影响
保障业务按优先等级进行恢复
缩短重要业务的中断时间
降低搬迁风险:
多方位的风险识别、风险分析
制定风险应对策略建议
提高搬迁效率:
规划搬迁各批次的应用及设备清单
规划搬迁时间
梳理搬迁前的准备工作
4、搬迁策略制定
在整个搬迁策略制定的过程中,我们采取了的搬迁策略制定方法。如下图所示。首先,通过访谈、问卷、现场勘查、现有资料分析,我们对中国电信广州互联网数据中心的信息系统基础架构进行了全面的了解,在此基础上,从IT基础架构、应用关联关系、业务中断影响、批处理关联、系统保护现状、物理设备共享关系、设备冗余情况、机房现有环境、人员组织架构及搬迁风险等方面,全面进行了搬迁分析,通过综合考虑各方面的要素,制定出中国电信广州互联网数据中心数据中心的整体搬迁策略,包括各应用的搬迁方式、搬迁批次、搬迁阶段临时备份策略、搬迁过程中的数据保护方式、搬迁组织架构、搬迁应急预案等重要策略。
5、搬迁策略制定原则
在搬迁策略策略的制定过程中,我们考虑了以下原则:
采取先易后难,循序渐进的原则进行分阶段、分步骤的实施,从而可以降低搬迁的系统性风险,减少业务停顿次数和总体停业时间。
按业务等级、应用关联和业务中断影响,决定搬迁过程中业务恢复的优先顺序以及不同应用的搬迁方式。
制定完善的核心应用和数据保护方式,降低搬迁对核心数据和系统的风险。
保障重要应用系统应急环境的建立,缩短搬迁过程的故障处理时间。
搬迁过程尽量保持原有IT服务水平,避免增加单点运行风险。
提前测试和验证新机房的环境、网络及数据,保证的搬迁过程的平滑过渡。
6、搬迁方式通常数据中心的搬迁分为三类:
物理搬迁:物理设备整体搬迁。
业务系统切换:数据、应用整体切换;无物理设备的搬迁过程。
混合型:部分数据、应用切换;部分数据、应用直接物理搬迁。
7、搬迁策略制定的重点和难点
中国电信广州互联网数据中心数据中心搬迁策略的重点和难点主要有以下几方面:
应用关联复杂:从业务持续角度出发规划搬迁方案,需要充分考虑应用间的千丝万缕的联系。
业务中断影响大:在制定搬迁策略时需要最大限度地减少中断时间,降低中断给业务带来的影响。
应用搬迁和网络的割接同时进行:这样增加了搬迁的难度,需要确定网络割接所影响的业务系统,保障应用系统搬迁所需的网络环境。
8、搬迁策略阶段工作总结搬迁策略阶段主要工作内容:
完成了机房的初步勘查工作
老机房和新机房现场勘查
整理了各机柜的详细设备信息
该阶段得出单应用分析报告、搬迁业务影响分析、定时批量任务关联分析、应用关联分析、业务恢复时长分析、应用设备对应清单、机柜设备清单等文档。
二、中国电信广州互联网数据中心数据中心搬迁策略
搬迁策略的要点
整体搬迁方式
搬迁过程中的数据保护方式
搬迁划分
搬迁系统的设备数量统计
各业务中断和恢复时间分析
搬迁前的准备工作
搬迁过程中的数据备份策略
搬迁过程中的应急环境策略
搬迁组织架构策略
搬迁策略分析内容
IT架构分析
从IT总体架构可以看出,搬迁过程中,由于网络分区的现状及网络设备需要搬迁,对外业务相关系统最好一起搬迁,核心区内的业务,由于新老机房核心区联通,可以按多个批次进行搬迁。但整个搬迁过程中,网络环境的具备与快速恢复将是搬迁的重要条件。
考虑数据安全的重要性,计划采用数据同步复制结合数据切换的方式,从而避免数据丢失或者存储故障而带来的严重后果。
根据业务中断影响,可以发现对外服务的业务需要尽量减少停机次数,并需要尽可能地建立专用应急环境。
系统保护分析综合当前系统的备份方式,我们在搬迁过程中需要考虑临时备份问题。另外,若有建立了灾备系统,搬迁过程中,如出现紧急情况,可以考虑使用灾备系统进行应急恢复,另外,等系统搬迁至新机房后,也需要考虑尽快恢复灾备系统。
对于专用机柜我们最好整柜搬迁,以减少搬迁风险。
机房布局图
中国电信广州互联网数据中心3楼机房设备拓扑图及布线图表
数据中心机房搬迁设备网络拓扑图如下:
搬迁设备布线表如下:
新机房机柜位置摆放图:
搬迁划分要求
系统切换的要求:核心业务系统采用切换的方式进行迁移,需要提前搬备机;
数据迁移的要求:数据复制会严重影响生产性能,尽量分散该存储上系统搬迁批次,以提供足够窗口进行复制和数据验证。
搬迁的应急预案
设备搬迁过程中的物理损坏和数据丢失是机房搬迁过程中的主要风险之一,因此,在搬迁前需要根据业务系统的需要提前准备相应的应急设备和环境。
应急方案主要包括四个层面:
设备搬迁过程中硬件故障,立即采取备件进行替换;
在缺乏备件、备件替换时间过长、备件替换无效的情况下,立即采取应急环境进行系统恢复;
如出现大雨、交通堵塞、通关或者其他因素导致搬迁无法进行,需中止搬迁或者进行系统回退;
安排专人对整个搬迁过程进行应急响应、事件监控和快速处理;
备件替换是应急的主要方式,由中国电信广州互联网数据中心安排专人,提前准备相应备件,在紧急情况下,立即进行备件提供和替换;
应急环境分为两大类:专用应急环境和通用应急环境。专用应急环境主要用于对外业务或者非常重要的系统,通用应急环境主要用于对内业务或者相对重要程度较低的系统;
专用应急环境:就是指提前准备专用备机、部署相关的应用并进行测试,在搬迁设备损坏或者其他应急情况下,利用这些备机进行应急恢复;专用应急环境的来源有以下四种:
原先系统的冷备机、或负载均衡的备机;
新购备机;
从其他厂商或者合作伙伴借用的备机(包括加密机);
通用应急环境环境,就是提前准备一些机器,在紧急情况下,立即安装应用并进行系统恢复。
安排专人对整个搬迁过程进行应急响应、事件监控和快速处理:
设立专门的应急响应小组,对搬迁过程中的事件进行快速决策,并安排相应人员执行;
安排人员专门协调备件的提供,确保设备维修和备件替换迅速;
安排人员和物业进行协调,确保搬迁过程中电梯、运输通道等通畅;应急预案的建立遵循以下原则:
针对业务关联性高、业务影响面广的关键业务系统采用专用应急环境。在应急设备上安装与生产环境一致的操作系统、数据库、中间件和应用程序,这样在发生设备损坏时能快速恢复生产;
针对那些业务影响面相对较小的对外业务系统可以采用通用应急环境。在有限数量的小型机和PC服务器上安装相应的操作系统,发生设备损坏时,在通用环境上安装相应的数据库、中间件和应用程序,从而可以较快的恢复生产;
对于其他管理类、经营分析类业务系统,可考虑只提供应急备件支持。当发生损坏时,现场进行硬件的故障修复。
应急环境设备可以提前布置在新机房,已进行存储数据验证和测试。基于以上的原则我们可以得出各应用系统所需的应急环境。
目录
1、搬迁背景
2、搬迁范围
3、搬迁策略制定的意义
4、搬迁策略制定
5、搬迁策略制定原则
6、搬迁方式通常数据中心的搬迁分为三类:
7、搬迁策略制定的重点和难点
8、搬迁策略阶段工作总结搬迁策略阶段主要工作内容:
1.搬迁策略的要点
2.搬迁策略分析内容
3.搬迁划分要求
4.搬迁的应急预案
一、1、搬迁背景中国电信互联网数据中心机房位于越秀区较场西路21号,随着业务不断发展,业务系统持续增加,机房区间、机房电力空调等基础设施容量趋于饱和,当时设计的能力已难以满足中国电信互联网数据中心业务发展需要。中国电信广州互联网数据中心搬迁的目标为:与现机房。为满足业务发展需要,中国电信互联网数据中心需尽快实施新数据中心的搬迁,使数据中心的综合管理和生产运行能力上一个新台阶。通过充分的调研,制订完善的整改及实施计划,提供充足的实施资源,安全、平稳、高效的项目实施。在保证数据安全、设备安全的前提下,使业务系统在停机窗口内平稳过渡到新的托管环境,同时对业务系统进行资源整合,并按照安全等级保护要求进行规划及整改服务。整改后的数据中心运行稳定、高效、可靠、安全,并能够满足未来一段时间内信息系统扩充升级的需要。2、搬迁范围中国电信互联网数据中心3楼搬迁的范围,现场共有7台机柜,71组设备,详细数据如下:v交换机6台:H3C2台核心交换机在用,华为核心2台暂时未启用,H3CS台为占用状态v服务器54台:联想RD台在用,联想RD台在用,联想SR台暂时未启用;IBMXM39台在用,IBMX3台在用,IBMXM49台2U在用,IBMXM41U处于关机状态,IBMX台在用,IBMX台4U在用,DELLR台在用,DELL台无线关机状态,DELLR台在用,DELL台无线,H3CG34台在线,HPDLGEN9(1U)2台在线,,HPDLGEN9(2U)1台在线。v防火墙6台:F5(1U)1台在线,FORTINETD(2U)2台在线,NSFOCUSWAFNX5SERIES(2U)在线,INFORCUBEIFCSIEM-H(2U)1台在线,INFORCUBEIFCDBA-S(2U)1台在线v磁盘扩展柜4台:NETAPPNAJ-(2U)4台在线v光电转换:(1U)1台在线3、搬迁策略制定的意义搬迁策略是搬迁实施的指导原则,一个好的搬迁策略可以帮助中国电信广州互联网数据中心安全、平滑地实现系统搬迁和业务切换,反之,一个不好的搬迁策略则会给搬迁工作带来很多的麻烦,严重时甚至会造成搬迁的失败;中国电信广州互联网数据中心搬迁策略制定的主要意义在于:保障业务系统顺利搬迁:n全面分析应用关联和物理关联n制定业务和数据安全保障建议n制定应急预案的建议降低业务中断影响:n分析业务中断影响n保障业务按优先等级进行恢复n缩短重要业务的中断时间降低搬迁风险:n多方位的风险识别、风险分析n制定风险应对策略建议提高搬迁效率:n规划搬迁各批次的应用及设备清单n规划搬迁时间n梳理搬迁前的准备工作4、搬迁策略制定在整个搬迁策略制定的过程中,我们采取了的搬迁策略制定方法。如下图所示。首先,通过访谈、问卷、现场勘查、现有资料分析,我们对中国电信广州互联网数据中心的信息系统基础架构进行了全面的了解,在此基础上,从IT基础架构、应用关联关系、业务中断影响、批处理关联、系统保护现状、物理设备共享关系、设备冗余情况、机房现有环境、人员组织架构及搬迁风险等方面,全面进行了搬迁分析,通过综合考虑各方面的要素,制定出中国电信广州互联网数据中心数据中心的整体搬迁策略,包括各应用的搬迁方式、搬迁批次、搬迁阶段临时备份策略、搬迁过程中的数据保护方式、搬迁组织架构、搬迁应急预案等重要策略。在搬迁策略策略的制定过程中,我们考虑了以下原则:采取先易后难,循序渐进的原则进行分阶段、分步骤的实施,从而可以降低搬迁的系统性风险,减少业务停顿次数和总体停业时间。按业务等级、应用关联和业务中断影响,决定搬迁过程中业务恢复的优先顺序以及不同应用的搬迁方式。制定完善的核心应用和数据保护方式,降低搬迁对核心数据和系统的风险。保障重要应用系统应急环境的建立,缩短搬迁过程的故障处理时间。搬迁过程尽量保持原有IT服务水平,避免增加单点运行风险。提前测试和验证新机房的环境、网络及数据,保证的搬迁过程的平滑过渡。l物理搬迁:物理设备整体搬迁。l业务系统切换:数据、应用整体切换;无物理设备的搬迁过程。l混合型:部分数据、应用切换;部分数据、应用直接物理搬迁。中国电信互联网数据中心数据中心搬迁策略的重点和难点主要有以下几方面:应用关联复杂:从业务持续角度出发规划搬迁方案,需要充分考虑应用间的千丝万缕的联系。业务中断影响大:在制定搬迁策略时需要最大限度地减少中断时间,降低中断给业务带来的影响。应用搬迁和网络的割接同时进行:这样增加了搬迁的难度,需要确定网络割接所影响的业务系统,保障应用系统搬迁所需的网络环境。完成了机房的初步勘查工作n老机房和新机房现场勘查n整理了各机柜的详细设备信息该阶段得出单应用分析报告、搬迁业务影响分析、定时批量任务关联分析、应用关联分析、业务恢复时长分析、应用设备对应清单、机柜设备清单等文档。1.整体搬迁方式搬迁过程中的数据保护方式搬迁划分n搬迁系统的设备数量统计n各业务中断和恢复时间分析n搬迁前的准备工作搬迁过程中的数据备份策略搬迁过程中的应急环境策略搬迁组织架构策略1.1)从IT总体架构可以看出,搬迁过程中,由于网络分区的现状及网络设备需要搬迁,对外业务相关系统最好一起搬迁,核心区内的业务,由于新老机房核心区联通,可以按多个批次进行搬迁。但整个搬迁过程中,网络环境的具备与快速恢复将是搬迁的重要条件。考虑数据安全的重要性,计划采用数据同步复制结合数据切换的方式,从而避免数据丢失或者存储故障而带来的严重后果。根据业务中断影响,可以发现对外服务的业务需要尽量减少停机次数,并需要尽可能地建立专用应急环境。2)对于专用机柜我们最好整柜搬迁,以减少搬迁风险。n机房布局图中国电信广州互联网数据中心3楼机房设备拓扑图及布线图表数据中心机房搬迁设备网络拓扑图如下:搬迁设备布线表如下:新机房机柜位置摆放图:2.a.系统切换的要求:核心业务系统采用切换的方式进行迁移,需要提前搬备机;b.数据迁移的要求:数据复制会严重影响生产性能,尽量分散该存储上系统搬迁批次,以提供足够窗口进行复制和数据验证。3.设备搬迁过程中的物理损坏和数据丢失是机房搬迁过程中的主要风险之一,因此,在搬迁前需要根据业务系统的需要提前准备相应的应急设备和环境。应急方案主要包括四个层面:a.设备搬迁过程中硬件故障,立即采取备件进行替换;b.在缺乏备件、备件替换时间过长、备件替换无效的情况下,立即采取应急环境进行系统恢复;c.如出现大雨、交通堵塞、通关或者其他因素导致搬迁无法进行,需中止搬迁或者进行系统回退;d.安排专人对整个搬迁过程进行应急响应、事件监控和快速处理;A.备件替换是应急的主要方式,由中国电信广州互联网数据中心安排专人,提前准备相应备件,在紧急情况下,立即进行备件提供和替换;B.应急环境分为两大类:专用应急环境和通用应急环境。专用应急环境主要用于对外业务或者非常重要的系统,通用应急环境主要用于对内业务或者相对重要程度较低的系统;a.专用应急环境:就是指提前准备专用备机、部署相关的应用并进行测试,在搬迁设备损坏或者其他应急情况下,利用这些备机进行应急恢复;专用应急环境的来源有以下四种:-原先系统的冷备机、或负载均衡的备机;-新购备机;-从其他厂商或者合作伙伴借用的备机(包括加密机);b.通用应急环境环境,就是提前准备一些机器,在紧急情况下,立即安装应用并进行系统恢复。C.安排专人对整个搬迁过程进行应急响应、事件监控和快速处理:a.设立专门的应急响应小组,对搬迁过程中的事件进行快速决策,并安排相应人员执行;b.安排人员专门协调备件的提供,确保设备维修和备件替换迅速;c.安排人员和物业进行协调,确保搬迁过程中电梯、运输通道等通畅;应急预案的建立遵循以下原则:a.针对业务关联性高、业务影响面广的关键业务系统采用专用应急环境。在应急设备上安装与生产环境一致的操作系统、数据库、中间件和应用程序,这样在发生设备损坏时能快速恢复生产;b.针对那些业务影响面相对较小的对外业务系统可以采用通用应急环境。在有限数量的小型机和PC服务器上安装相应的操作系统,发生设备损坏时,在通用环境上安装相应的数据库、中间件和应用程序,从而可以较快的恢复生产;c.对于其他管理类、经营分析类业务系统,可考虑只提供应急备件支持。当发生损坏时,现场进行硬件的故障修复。应急环境设备可以提前布置在新机房,已进行存储数据验证和测试。基于以上的原则我们可以得出各应用系统所需的应急环境。