修复数据中心故障中需注意的问题 |
发布时间: 2012/8/2 19:23:49 |
故障切换和故障恢复流程相当之复杂,并且必需在事先仔细规划并测试。当切换到一个备用站点,相应的技术应当能够接管应用,尤其是运营系统、网络访问以及带宽、足够的数据存储、数据库、文件和设备。不过,在切换回原系统之前必需解决一些额外的情况。本篇将分析在故障切换和恢复系统至主站点之前所要解决的各项问题。 如果企业规模较大,有诸多办公室和完善的IT部门,那么在你故障切换和故障恢复时可能不会遇到太大的障碍。这是因为你在仓库中应当会留有备份资源,比如服务器、桌面系统、笔记本电脑和其它设备,在恢复站点可以进行快速地替换。不过如果你的企业规模较小并且没有这种额外的资源,你的恢复选择可能会比较局限。 对于中小型企业(SMB),有许多种灾难恢复可供选择,不过必需在财务资源、员工、物理空间、已有系统和所需数据之间进行平衡。 不过当你准备恢复(故障恢复)至原系统时,事故发生后的环境可能和之前一样,但也可能不一样。在故障恢复时,你通常有两种可能性:你之前的办公环境(假如和事故前没什么两样);抑或是一个不同的场所,部分或甚至全部失去了你原有的办公空间。 在故障切换时,应当将以下问题作为整体解决的一部分加以考虑确认: 现有系统和相关软件可以复制在备用站点中(物理设备和基于云的解决方案)。 所有的重要数据(例如日常工作文件)和信息(例如用户记录)可以复制在备用站点中,并且时间节点尽可能接近事故发生时。 特定的故障切换软件(例如Double-Take)在两个站点都可用来启动故障切换作业。 有足够的网络带宽(例如通过因特网)传输数据至进行故障切换的备用站点。 当准备恢复至原站点时,测试系统和基础架构来确保其工作正常;确保有足够的存储容量处理返回的系统和数据;并且确保有足够的网络带宽来用于故障恢复。 现在,如果你的原站点并不可用,你的灾难恢复规划必须启动如下步骤: 获取新的硬件(例如服务器、存储和路由器)和软件(例如操作系统和应用程序)来支持你实现和原环境类似的运作环境。 确保空间来放置新的IT设备。 获取新的桌面系统和周边设备。 安装故障切换/故障恢复软件,如果在你的恢复规划中有这部分策略的话。 确保网络带宽足以支持故障恢复工作。 再次提醒下,如果你是中小型企业,请考虑购买数TB的外部存储来备份你的系统和数据。这些存储设备可以在许多办公供应商那里购得。同时,部署“第二层备份”也是个不错的作法,以防你的故障切换和故障恢复部署没有如期工作。 好消息是市场上有大量用于中小型企业(以及大型企业)的故障切换和故障恢复工具。无论部署何种策略,你需要牢记以下关键点: 确保灾难恢复规划中的故障切换和故障恢复活动的正常运作。 和已确定的数据恢复供应商协作安排应急备份和恢复。 将灾难恢复规划文档化,其中清晰地概括故障切换到备用站点以及故障恢复回主站点或新站点的各项步骤(例如具体脚本)。 建立IT硬件和软件的主和备用源。 每年测试故障切换和故障恢复流程和系统,确保其工作正常。(最好每周末时进行一次测试,不过桌面的演练同样有效) 明确灾难事故中员工的角色和职责。 培训IT员工故障切换和故障恢复的流程内容总结 确保在进行灾难恢复规划时,你会考虑将IT运营故障切换至另一个备用站点,并且你如何恢复(故障恢复)至原始站点或可能的新站点。很有可能你的故障恢复会比故障切换更为复杂,因此准备好仔细检验所有的可用方式。 本文出自:亿恩科技【www.enkj.com】 |