在当今数字时代,数据对于企业和组织至关重要。因此,制定一个全面的备份服务器灾难恢复计划至关重要,以保护关键数据免受各种威胁,例如自然灾害、网络攻击和人为错误。
备份服务器在灾难恢复中扮演着至关重要的角色,其主要功能包括:
有效的备份服务器灾难恢复计划应包括以下组成要素:
识别可能导致数据丢失或损坏的潜在风险,例如硬件故障、自然灾害和网络攻击。
制定定期备份数据的计划,包括备份的频率、保留期限以及备份存储位置。
建立一台或多台备用服务器,用于在主服务器发生故障时接管数据处理任务。
选择一个位于主数据中心位置之外的物理或虚拟站点,作为灾难恢复的备用位置。
定期对备份和灾难恢复计划进行测试和验证,以确保其有效性。
记录备份服务器灾难恢复计划,并将其分发给所有相关人员。
向员工提供有关备份服务器灾难恢复计划的
云服务器是一种基于云计算技术的虚拟化服务器,它不依赖于物理硬件设备,通过使用虚拟化技术将一台物理服务器划分为多个虚拟服务器。这些虚拟服务器可以在一个或多个数据中心中运行,并通过互联网提供计算资源和服务。
云服务器具有多种主要功能包括:
每家公司都会遭受各种各样的灾难,这些灾难可能源于自然灾害、恐怖袭击、员工的错误(或恶意)行为或硬件故障。 各种规模的公司都在重新审查他们的容灾计划能否应对灾难。 丢失数据的后果相当严重。 目前,越来越多的公司以电子的形式记录信息。 公司越来越依赖这些记录,越来越依赖用于处理和存储数据的工具。 人们从来不会打印电子邮件、事务处理等大多数电子记录。 电子记录一旦丢失,就不可能重新创建。 而大部分公司都不允许丢失数据。 目前,公司应该遵从法规需求,即使在面临灾难时也要保留和查询电子信息。 因此,公司必须采用一定的技术和政策,保证数据安全存储、随时可用;同时也要保证灾难发生后能及时恢复数据。 要实施灾难恢复战略,首先应进行合理的规划和设计。 提高灾难恢复能力 灾难恢复计划必须包括如下三点: 必须保护备份数据。 例如,在当地磁带驱动器中设置一个备份磁带,用以存储数据,这种方法在整个数据中心着火的时候就不实用了。 你需要在其它地点另外设置备份复本。 必须能通过备份使公司恢复运作。 如果某个站点被洪水冲走,就必须保证某个受保护的站点拥有足够的数据,使公司能继续正常运作。 对大多数公司而言,数据虽然不代表整个公司,但是却支撑着整个公司的运转。 恢复进程必须在公司需求描述的时间框架内正确地运行。 如果你不能使公司再次运作——或者需要花费几周时间才能修复磁带数据,那么只是简单地实行远程备份毫无意义。 明白了这几点对公司恢复需求的重要性后,你就可以开始制定灾难恢复战略了。 战略和公司需求 制定灾难恢复战略(有时也称业务连续性计划或BCP)有许多种方法,保护公司运作也不止一种正确的方法。 一家公司制定的战略和程序可能对另一家公司就不适用。 但是,实现灾难恢复计划有一些常见的方法。 异地磁带备份是最传统的方法,即数据中心或远程办公室中会定期备份数据。 然后,复制备份磁带,将其转移到一个安全的站点,其中Iron Mountain公司的网络管理产品就是这么工作的。 可以根据循环周期定期召回磁带,或者需要恢复时也可以召回磁带。 近些年,备份过程开始使用DVD等光学介质。 光学介质的价格通常高于磁带,但是其性能更佳、可靠度更高。 不过,由于容量有限,人们慢慢地不再倾心于光学介质。 远程磁盘复制越来越流行,数据中心的资源定期复制到远程站点相同的存储资源中。 银行可能会通过WAN链接将EMC Centera的内容复制到远程站点的Centera中。 这样,就具有双倍的资源,恢复速度也大于磁带;如果实施得当,还能在主站点失效时,接管主存储站点。 制定灾难计划/战略时,通常要考虑成本因素。 这种形式与保险相似:你在花钱避免更大的经济损失。 数据保护模式非常复杂,具有一定的成本,而你在努力降低潜在损失,最终目标是要将两者协调。 所以,一家小型医疗公司也需要每周进行异地磁带备份,因为可能无力支付更贵的恢复需求;一家全天候工作的全球互联网供应商需要复制一个数据中心,因为宕机时期的损失远高于灾难恢复战略的成本。 请牢记上文所提必需条件的第三条:恢复必须在时间框架内完成,与公司的恢复需求或ROI保持一致。 要想在紧张的恢复时间目标(RTO)内获取大量数据,必须精心制定恢复战略。 工具和产品 你选择的数据保护解决方案应该体现你的恢复战略,应根据公司的恢复需求而定。 如果选用磁带作为备份和恢复介质,你可以选择与磁带驱动器平台兼容的备份/恢复软件。 通常可以在Symantec (Veritas) NetBackup、EMC NetWorker和IBM Tivoli Storage Manager等大型数据中心找到这些产品,。 许多灾难恢复战略要求在存储阵列之间进行复制,可以由阵列生产商提供的软件来完成这项工作。 EMC公司的Symmetrix远程数据设备可以在Symmetrix系统之间复制数据。 IBM公司采用点对点远程复本在IBM阵列之间实现复制。 Hitachi数据系统公司采用TrueCopy在HDS阵列之间实现复制。 但是,你也不是非得采用硬件式复制软件,FalconStor Software、 NSI Software和Kashya (现属于EMC)等公司提供的工具可以在不同的存储阵列之间实现复制。 公司如果缺少资源管理灾难恢复站点,可以将灾难恢复任务外包给第三方服务供应商,按月支付费用即可。 此类灾难恢复供应商有E-Vault、IBM 全球服务事业部和EMC公司,EMC最近收购了Mozy (Berkeley数据系统公司)。 灾难恢复战略并不能“以一应十”。 实施分层灾难恢复战略意义重大,这样就可以联合使用磁带备份、磁盘备份和数据复制。 并非所有的商业流程对公司的生存都具有同等重要的作用,因此,不同流程支持的系统和数据具有不同的恢复优先权。 文档灾难就意味着危机,在这场危机中,你没有时间查找各种磁带,没有时间规划如何重建备份环境。 灾难恢复专家都强调,必须具有全面、及时更新的文档。 这些文档应该包括:系统准备工作的说明书、恢复步骤、正常运作恢复之前对数据中心进行后期恢复测试/确认。 文档还应该包括联系信息(如管理员电话、服务部门联系方式等)或访问密码。 文档应属于灾难恢复计划的一部分。 恢复计划应有多份复本,每分复本由专职IT人员或管理人员保管。 请注意:严格控制恢复计划的版本,保证人员只能获得最新版本。
如何制定网站运维管理规范以及灾难恢复计划?随着互联网的普及,网站成为人们获取信息、交流和购物的主要途径。 然而,由于网站不可避免地会遇到各种各样的问题,所以制定网站运维管理规范以及灾难恢复计划对于网站的正常运营非常重要。 本文将介绍如何制定网站运维管理规范以及灾难恢复计划。 一、为什么需要制定网站运维管理规范1.规范运维管理流程:规范的运维管理流程可以帮助运维人员更好地组织工作,提高工作效率。 2.降低风险:在规范的运维管理下,可以避免人为因素对系统的影响,从而降低风险。 3.提高用户体验:稳定的系统可以为用户提供更好的体验,降低用户流失率。 二、制定网站运维管理规范步骤1.明确目标和任务:制定网站运维管理规范的第一步是明确目标和任务。 需要从系统稳定性、数据备份、性能优化、故障处理等多个方面考虑,确定增强网站运维能力的目标和任务。 2.制定运维规范和流程:在明确目标和任务后,需要制定运维规范和流程。 规范包括每台设备的安装、配置、监控、备份等,流程则包括故障处理、文档规范、变更管理等。 3.落实责任分工:网站运维管理需要涉及多个环节和岗位,因此需要明确责任分工。 需要明确每个岗位的职责和权利,并建立相应的考核体系。 三、为什么需要灾难恢复计划1.降低损失:意外事故可能会导致系统不可用、数据丢失等严重后果,而灾难恢复计划可以快速响应和恢复,降低损失。 2.提高可用性:在制定恢复计划过程中,可以发现和解决系统弊端,提高系统可用性。 3.合规要求:灾难恢复计划往往是政府和行业规范要求之一,因此也是企业合规的一部分。 四、制定灾难恢复计划步骤1.识别关键系统和数据:制定恢复计划的第一步是识别关键系统和数据,包括客户、业务数据、系统配置信息、重要文档等。 2.评估风险和潜在损失:需要针对关键系统和数据,评估潜在风险和损失。 这有助于识别和优化系统漏洞和瓶颈,以减少系统故障和数据丢失风险。 3.制定恢复策略:在识别关键系统和数据,并评估风险和潜在损失后,需要制定针对不同类别的灾难的恢复策略,保障关键系统可用性和数据完整性。 4.测试恢复计划:制定完恢复计划后,需要进行实际测试以验证计划的可行性和准确性。 结语:对于网站而言,保障系统可用性是保证用户体验的关键。 制定网站运维管理规范以及灾难恢复计划是确保网站稳定运营的重要措施。 只有在规范的基础上,才能更好地应对各种意外情况和风险,确保网站稳定、安全、高效地运营。
我们是否可以按照需要进行恢复?”去年夏天,飓风艾琳肆虐了美国东海岸,给许多企业、员工和家庭带来了不可逆转的损害和损失。 艾琳应该教会了我们一些非常重要的经验教训。 艾琳带来的经验教训 首先,所有的企业都必须有一个经过全面测试的灾难恢复计划。 对于这样的重大灾害对您的整体业务的健康运作所产生巨大的影响,您绝对买不起单。 更何况,该计划对于支持您当前的业务需求是至关重要的。 IT部门必须和业务部门进行沟通和协调。 他们必须承认,他们的灾难恢复计划必须与整个企业的紧急预案相辅相成,以最大限度地减轻脆弱性和减少数据丢失。 企业还应该确保他们有一个基础设施,帮助他们在灾区地理区域以外恢复到维持一个备用的紧急措施的恢复设施。 失败的灾难恢复计划 失败的灾难恢复计划大致可以分为如下五大类 ·不完整:计划不包括所有关键系统 ·过时:计划不保护现有的IT基础设施 ·交付差距:尚未对IT工作人员完成培训 ·测试问题:计划在近期尚未完全测试 ·协调问题:计划缺乏与业务整合 所以,你要怎么能确保你的灾难恢复计划不会失败?首先,最重要的是要确保你有熟练的技术资源,可用来执行恢复。 毕竟,像艾琳这样的飓风灾难,你不能预测关键IT人员的可用性。 灾难恢复计划应指定专门的团队成员,无论是来自企业内部或从服务提供商处购买服务,站灾区以外有专业知识的人来管理为您恢复。 重要的是要了解一个灾难恢复计划必须定期进行全面的测试,以确保系统和工作人员能够按计划需要被激活。 你必须总是问自己:“如果我要调用计划,我可以100%的相信我可以恢复既定目标之内的业务吗?” 创建和测试灾难恢复计划 那么,究竟应该怎样准备你的灾难恢复计划?并且,你应如何测试它?这里我给出了10项创建和测试您的灾难恢复计划时的建议,仅供参考: 最新、完整和全面的:确保你的计划是到目前为止最新的,详细和易于遵循。 并且,支持您的企业的所有关键业务。 优先、分类和分发:在您的计算机房内,并非所有的服务器对于您的企业都具有同等的重要性。 优先级服务器和关键任务应用,并确定这些计划。 分配计划到所有计划持有人,并确保它很容易访问,而且保证在计划发生变化时,他们及时收到更新的副本。 预定测试日期!说得够多的了。 经常性的测试:为了确保业务连续性,灾难恢复计划应每年至少进行一次测试,如果主要业务或基础设施发生变化,或如果你有很短的恢复时间要求。 在已知的等待事件前,提前预订您的灾难恢复测试时间。 进行不同的测试:对于计划的所有组成部分纳入各种测试。 在模拟的,逼真的灾难场景中的测试,你可以得到真实的实践方案。 积极和的测试:进行两类测试:通过积极的测试行使你的程序和行动计划;通过消极的测试,与程序主要参与者进行沟通。 两者都同样重要。 应对突发性:由于灾害事故经常是突然来袭,将突发性的这一特点纳入到您的测试,看看您的计划的反应。 真正的准备,你需要体验模拟灾害,并评价目前程序的有效性。 执行基本的例行演习和后勤检查:执行呼叫联系列表,以确认任何可能涉及(其中包括供应商)的联系信息都是最新的。 确保你可以很容易地随时从异地召回存储备份磁带。 不要忘了检查会议记录。 测试发电机:测试发电机在满负荷情况下如何反应。 确保你有多个燃料供应商的支持协议,当你在需要补充柴油时,按规定的服务水平协议(SLA)提供。 检查备份策略:定期查看您的备份策略,并确保其正确地反映了你的数据的优先级,恢复时间和恢复点目标。 底线:企业依靠技术来运行他们的业务,因此停机时间是一个商业问题,而不仅仅是一个技术问题。 任何灾难,无论是自然灾难(飓风、洪水或地震)或相关的设备/硬件故障,无疑会造成停机或更糟的状况,对公司的底线产生负面影响。 一次又一次,我曾看到那些经历了灾难恢复噩梦的企业后悔他们的灾难恢复计划没有准备充分。 并且,所有这些公司有一个共同点:他们从来没有想到灾难会发生在自己身上。 我的建议是:假设灾害会在某些时候影响你。 Forrester研究显示,60%的企业在过去五年中曾调用过他们的灾难恢复计划。 吸取飓风艾琳事故中学到的重要教训,在2012年飓风季节启动您的灾难恢复计划,并对其进行测试。 我保证你不会后悔。
名词解释
备份:为应付文件、数据丢失或损坏等可能出现的意外情况,将电子计算机存储设备中的数据复制到磁带等大容量存储设备中。从而在原文中独立出来单独贮存的程序或文件副本。(摘自《计算机科学》)
如果系统的硬件或存储媒体发生故障,“备份”工具可以帮助您保护数据免受意外的损失。例如,可以使用“备份”创建硬盘中数据的副本,然后将数据存储到其他存储设备。备份存储媒体既可以是逻辑驱动器(如硬盘)、独立的存储设备(如可移动磁盘),也可以是由自动转换器组织和控制的整个磁盘库或磁带库。如果硬盘上的原始数据被意外删除或覆盖,或因为硬盘故障而不能访问该数据,那么您可以十分方便的从存档副本中还原该数据。
备份分类
备份可以分为系统备份和数据备份。
1、系统备份:指的是用户操作系统因磁盘损伤或损坏,计算机病毒或人为误删除等原因造成的系统文件丢失,从而造成计算机操作系统不能正常引导,因此使用系统备份,将操作系统事先贮存起来,用于故障后的后备支援。
2、数据备份:指的是用户将数据包括文件,数据库,应用程序等贮存起来,用于数据恢复时使用。
备份作用
备份的作用是用于后备支援,替补使用。
备份是容灾的基础,是指为防止系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它的存储介质的过程。传统的数据备份主要是采用内置或外置的磁带机进行冷备份。但是这种方式只能防止操作失误等人为故障,而且其恢复时间也很长。随着技术的不断发展,数据的海量增加,不少的企业开始采用网络备份。网络备份一般通过专业的数据存储管理软件结合相应的硬件和存储设备来实现。
备份方式
比较常见的备份方式有:
定期磁带备份数据。
远程磁带库、光盘库备份。即将数据传送到远程备份中心制作完整的备份磁带或光盘。[1]
远程关键数据+磁带备份。采用磁带备份数据,生产机实时向备份机发送关键数据。
远程数据库备份。就是在与主数据库所在生产机相分离的备份机上建立主数据库的一个拷贝。
网络数据镜像。这种方式是对生产系统的数据库数据和所需跟踪的重要目标文件的更新进行监控与跟踪,并将更新日志实时通过网络传送到备份系统,备份系统则根据日志对磁盘进行更新。
远程镜像磁盘。通过高速光纤通道线路和磁盘控制技术将镜像磁盘延伸到远离生产机的地方,镜像磁盘数据与主磁盘数据完全一致,更新方式为同步或异步。
数据备份必须要考虑到数据恢复的问题,包括采用[2]双机热备、磁盘镜像或容错、备份磁带异地存放、关键部件冗余等多种灾难预防措施。这些措施能够在系统发生故障后进行系统恢复。但是这些措施一般只能处理计算机单点故障,对区域性、毁灭性灾难则束手无策,也不具备灾难恢复能力。
备份技术
系统灾难恢复
(IDR=Intelligent Disaster Recovery )
系统灾难恢复,就是在系统出现崩溃的时候,能够用非常少的步骤,将系统重建,包括上面的系统补丁、应用软件和数据。这样可以提高恢复的准确性、缩短恢复时间、缩短业务中断时间。
主要[3]灾备技术,在恢复的时候有这么几种方式:
采用公用的一张光盘,所有的系统都采用这一张光盘。这个光盘可以启动系统,同时可以启动网络,然后备份服务器将备份在磁带库(或者虚拟带库)中的整个硬盘内容或者第一主分区内容恢复到灾难机。这样不论灾难机原来有多大容量数据,都可以存放在整个备份系统的备份设备中,统一进行管理,而且不需要经常刻光盘,也就是说光盘不需要经常更新。比较典型的代表是BakBone NetVault VaultDR。右图是BakBoneNetVault VaultDR灾难备份和恢复的数据流,所有系统采用统一的光盘进行。
需要针对每台计算机单独刻光盘,恢复的时候需要利用针对性的光盘来恢复,每台机器都需要自己的光盘,而且需要定期不断更新。这种方式的最大不足是经常要刻光盘,否则灾难出现的时候如果没有光盘或者光盘太久了,都会影响恢复的速度和恢复后的状态。这种技术的典型代表是EMC NetWork Recovery Manager模块。
恢复时需要借助网络启动,也就是需要具备一台相同操作系统的主机作为引导机器,然后利用备份的内容进行恢复。这种技术的典型代表是Symantec NetBackup的Bare Metal Restore(裸金属恢复)模块。
操作系统自己提供的灾备工具。对于大多数Unix小型机,都提供系统备份工具。借助于系统自身提供的磁带机,利用一个简单的命令,HP-UX采用make_recovery就可以把整个root卷备份到服务器自带的4mm磁带上。在恢复的时候,这盘磁带可以自启动系统,采用一个命令就可以将整个root卷恢复到硬盘上。这种方式的好处是简单和经济,尤其对于Unix系统,这样的方式远比备份软件提供的BMR模块方便、安全和经济,因为备份软件提供的BMR模块往往需要相同平台的其他服务器来启动。
数据远程复制
将数据在另外的地方实时产生一份可用的副本,此副本的使用不需要做数据恢复,可以将副本立即投入使用。数据复制的最大好处是副本数据立即可用,没有数据恢复时间,RTO 非常好,同时因为是实时复制,RPO也非常好,几乎不会丢失数据。缺点是费用远比数据备份要高,不仅仅是数据复制系统价格高,还需要另外的硬盘存储空间和主机系统,甚至建立另外的远程机房,考虑网络布线,这些都将带来成本大大增加,所以数据复制的建设和维护费用远远大于数据备份。
数据复制目前有如下实现方式:
基于主机。基于主机的数据复制技术,可以不考虑存储系统的同构问题,只要保持主机是相同的操作系统即可,存在支持异构主机之间的数据复制软件,如BakBone NetVault Replicator就可以支持异构服务器之间的数据复制,可以支持跨越广域网的远程实时复制。缺点是需要占用一点主机资源。
基于存储系统。利用存储系统提供的数据复制软件,复制的数据流通过存储系统之间传递,和主机无关。这种方式的优势是数据复制不占用主机资源,不足之处是需要灾备中心的存储系统和生产中心的存储系统有严格的兼容性要求,一般需要来自同一个厂家的存储系统,这样对用户的灾备中心的存储系统的选型带来了限制。
基于光纤交换机。这项技术正在发展中,利用光纤交换机的新功能,或者利用管理软件控制光纤交换机,对存储系统进行虚拟化,然后管理软件对管理的虚拟存储池进行卷管理、卷复制、卷镜像等技术,来实现数据的远程复制。比较典型的有Storag-age,Falcon等。
基于应用的数据复制。这项技术有一定局限性,都是针对具体的应用。主要利用数据库自身提供的复制模块来完成,比如OracleDataGuard,Sybase Replication 等。
数据保护技术
CDP(Continuous highlight=true>快照,它无法恢复任意一个时间点。如Symantec 、CommVault、凯备份的CDP都属于这种类型。
TrueCDP,我们称之为真正的CDP,它可以恢复指定时间段内的任何一个时间点(APIT,Any Point In Time),而BakBone TrueCDP属于TrueCDP类型。
当前应用情况
如果采用灾备方案的分布在各个行业,不过大家都是按照一定的梯度来使用。
首先采用的是系统灾难备份(BMR Bare Metal Recovery),因为这种方案成本最低,只要在建设数据备份系统的时候追加一些模块就可以完成。不需要附加的存储空间,也不需要附加的[4]容灾机房,所以,有条件的用户几乎都可以实施。只不过有的用户采用操作系统提供的备份工具来辅助,有的用户采用备份软件提供的灾难模块来完成。这样的用户数量最大,分布在各个行业。BakBone 的VaultDR在使用BakBone NetVault的备份软件用户中被广泛采用。很多用户非常喜欢BakBone VaultDR不用关心操作系统类型,而且一张标准光盘可以应用到所有Intel x86服务器进行灾难备份和恢复。
其次是建立容灾系统的用户,大数据量的高端企业普遍采用基于存储的数据复制技术,比如电信、金融行业。中低端用户普遍采用基于主机的数据复制软件,成本较低,而且不需要进行严苛的存储系统采购,尤其是BakBone的NetVault Replicator不但可以进行远程数据复制,而且可以支持异构平台,所以在国内外有广泛的用户,一些政府部门、电力公司、证券部门、网站公司等都采用这种方式,而且大多运用在Windows、Linux平台。基于存储交换机层的虚拟存储技术虽然也在有了一些用户,但是因为此技术起步时间有限,技术成熟度需要进一步验证,很多用户只是做为试点,没有大范围的展开。对于基于应用的数据复制方式,也有部分高端客户在采用,而且也有大量的用户。
对于CDP技术,才刚刚起步,这种技术满足了很多关心灾备的用户的需求,在RTO 和RPO方面都能得到很高的标准,同时还可以进行任意历史版本的重现,正在被越来越多的用户所关注,相信将来会有非常广泛的用户。BakBone的TrueCDP可以进行任意时间点的恢复,是真正意义上的CDP,将会比其他准CDP产品有更大的优势,会被更多关心灾备的用户所选用。
应用误区
灾备系统因为能够带来业务的连续性,正越来被大家所重视,但是在使用过程中也要切记出现一些误区。
没有选择适合自己的。没有仔细分析和明确业务连续要求,对RTO和RPO没有进行仔细研究,要么不做,要做就想追求最全面的,这样可能忽视了最需要的建设,没有切实满足自己的需要。
认为灾备系统是万能的,夸大灾备系统的作用,忽视了备份系统、高可用系统的建设。其实各个系统都有自己的作用,需要根据实际需求进行建设。
没有有步骤分阶段的进行灾备建设,总想等实际成熟的时候全面建设,甚至还没有先进行数据备份系统的建设,就开始着手进行灾备系统建设。不进行备份系统建设,就没有满足数据安全的底线,在关键时刻缺少一份完整的数据,而花费大量的财力进行灾备系统建设,反而得不偿失。
多种灾备技术的选用不合理,比如主机系统的资源可以接受基于主机的复制软件来运行,却选用了基于存储系统的设计,造成必须选用相同类型的存储设备,增加了总体费用。
对BMR系统灾难备份总是希望选用备份软件自带的BMR模块。其实,备份软件自带的BMR模块对于Window和Linux比较方便,但并不是对于所有的Unix系统都合适,在Unix系统备份方面,Unix自带的系统备份工具和自带的磁带机就非常方便,一个命令就可以完成系统备份,还不用依赖于其他服务器,远远胜于一些备份软件自带的BMR模块,不但操作方便,而且减少费用。
未来发展方向
未来的技术发展应该是多种技术并存,而且越能满足客户需求的方式更能得到客户的关注。
未来的发展之一应该是基于主机的异构复制技术会有更广泛的市场。因为大多数客户具备异构主机环境,支持异构环境的数据复制技术,就可以利用现有环境,各台主机之间互为复制。对于不支持异构环境的复制软件,就需要购买相同的存储或者购买相同操作系统的主机进行数据复制,增加了灾备的总体费用。
未来的发展之二就是CDP技术。CDP融合了数据备份和数据复制的优点,既可以进行实时数据保护,还可以任意时间点的历史数据恢复,将会具有更加强大的生命力。随着TrueCDP和传统备份软件的无缝衔接,将会有越来越多的用户采用TrueCDP 进行灾备系统建设。右图是广为流行的BakBone NetVault TureCDP 备份系统架构图。
备份系统
备份系统的作用
很多系统管理员认为,投资建立一个备份任务的管理,较原来复杂的备份系统只是在恢复的时候才起作用有些浪费,并且平时增添了很多的管理任务,这对于企业来说是一个大的浪费。
这个问题是一个大问题,直接涉及到对于一个企业的信息系统的投资回报率(ROI)。当IT系统的重要性非常高,企业的关乎生命的数据都在计算机系统里面,那么数据的保护就非常重要,这是其一。另外,实施备份系统并不会带来更多的管理任务,相反为系统管理员带来了很多维护上的方便,主要有以下几点:
备份的自动化,降低由维护员的操作带来的风险;
数据库在线备份,保证24×7小时业务运行;
文件系统及数据库数据的时间点恢复,历史版本管理;
磁带的复制(Cloning),可降低磁带的出错几率和实现异地容灾保存;
网络备份、LAN-Free及Serverless多种备份方式;
系统灾难快速恢复。
因此,如果企业必须实现上述功能,而企业又不实施备份系统时,需要的人力及设备的投资如果大于实施备份系统的投资,则该备份系统的投资是可以被接受的。
备份系统的功能
用户只需要简单的备份就可以了,不必要那么复杂。用户买了很多备份系统中没有用处的先进技术,没有必要在系统中实现过多的复杂功能。
备份系统实现的功能是备份技术发展到一定阶段的产物,先进技术的出现也由于用户的系统中有这样的需求。当IT系统发展到一定程度,用户对IT系统的依赖型增强,IT系统的数据量越来越大,对系统备份的要求就水涨船高。但好的备份系统应该有如下的特点:
备份系统可根据应用系统的需要非常容易地进行扩展;
满足未来的数据量及应用系统升级带来的备份系统的压力;
备份系统中,尤其是备份软件的可升级能力。
总体来说,备份技术已经经历了几个发展阶段,从传统的磁带备份到网络备份,从SCSILAN-Free备份到SAN结构的动态共享LANFree备份,直到出现的Serverless备份。可以预见,未来备份产品有以下几个趋势:
磁盘备份
状况
随着SATA磁盘价格进一步下降,磁盘的备份优势逐渐体现出来。EMC已经推出了使用磁盘作为虚拟磁带库的产品,在功能上可以替代磁带库的功能。笔者认为,该产品的大批量投放市场,会在一定程度上引发备份硬件设备的升级换代。
iSCSI技术
该技术可以利用现有的TCP/IP网络进行数据传输,用户可以很方便地实现数据的远程异地保护。市场上已经出现了较多这样的产品,相信随着产品的成熟,会有很多异地备份和容灾方案会选择该技术。
NDMP协议
NDMP(网络数据管理协议)作为一种标准,已经发展到了Version 4,支持该协议的产品,可以非常方便地实现NAS服务器数据的快速备份和恢复。对于大数量的小文件,该技术有着得天独厚的优势。
备份技术
很多的磁盘阵列都提供了SnapShot功能,而对于磁盘阵列上的SnapShot,我们可以充分利用SnapShot技术进行数据的Serverless备份,这对于企业级的大型系统有着十分重要的意义,极大地降低了备份时对于生产系统的资源占用,并且可以非常快速地恢复。
实现备份介质的生命周期管理
通常每盘磁带都有一定的使用次数限制,因此,对于磁带备份系统来说,磁带使用了一定次数后,就应该摒弃掉,不能用来备份关键数据。
维护
人们投资购买了全自动的备份系统,目的就是降低维护工作量,只要实施了该系统,维护工作就可以放松了,只要过一周或者一个月检查一下备份的状态就可以了。
当用户实施了备份系统后,对于备份系统的维护工作仍然非常重要。主要由以下因素决定。
由于很多单位IT系统的主机很多,应用系统很多,并且每套应用系统都有相应的管理和维护人员,备份是各种应用数据备份任务的集中管理。因此对于应用系统较为复杂的用户来说,可以设立备份系统管理员或者存储备份工程师,对整体备份系统进行维护。
随着数据量的增大,应用系统的增长,备份策略随着时间的迁移应进行优化。
备份系统涉及的技术包括操作系统、数据库、存储、磁带库等诸多技术,因此建议备份系统管理员对各种知识有一定的了解,并且除了参加备份系统知识的培训外,还要参加操作系统、数据库等产品的专业培训,以保证应用系统在出现灾难时尽快实现数据的恢复。
关键数据库的日常备份如果失败,可能导致数据库的挂起。例如,对于[5]oracle数据库来说,如果不及时对数据库的“归档日志”进行备份,则会导致整个数据库的停止。
如果磁带库备份系统中有“克隆”的功能,还需要每日将“克隆”的介质取出,放置到异地保存,以利于容灾。
产品
在选择产品时,备份磁带库容量尽可能大,磁带机速度尽可能快,尽可能使用最先进的技术。
在产品的选择过程中,性价比是最重要的指标之一,但绝不是全部。建议用户在选择产品的时候考虑以下几个因素:
本系统应用数据的类型、数据量、备份策略(全备份、增量备份等)及关键数据的保留时间决定了磁带库的总容量;
备份时间窗口和备份数据量的峰值数据量决定了磁带机的最低数量;
应用系统的种类和数据类型决定备份时采用哪些技术。
如用NAS设备备份,尽量选择NDMP备份;SAN架构备份尽量选用磁带机动态共享;磁盘阵列提供了镜像或者SNAP功能,可以使用SnapShot备份技术。
磁带机技术的选择方面,建议选择较为通用的设备,对于该磁带机来说,操作系统及备份软件对其兼容的程度较好。
由于磁带机属于机械设备,故障率较磁盘、光盘等设备要高,因此配置磁带机时尽量保持冗余。SATA磁盘技术有了突飞猛进的发展,磁盘备份技术已经成为了发展方向。
硬件设备考虑备件的提供情况及提供商的服务水平,而对于备份软件来说,提供专业服务及技术支持也是需要考虑的重要因素。
备份软件应该具有较广泛的兼容性。
数据容灾
企业关键数据丢失会中断企业正常商务运行,造成巨大经济损失。要保护数据,企业需要备份容灾系统。但是很多企业在搭建了备份系统之后就认为高枕无忧了,其实还需要搭建容灾系统。数据容灾与数据备份的联系主要体现在以下几个方面:
数据备份基础
数据备份是数据高可用的最后一道防线,其目的是为了系统数据崩溃时能够快速的恢复数据。虽然它也算一种容灾方案,但这种容灾能力非常有限,因为传统的备份主要是采用数据内置或外置的磁带机进行[6]冷备份,备份磁带同时也在机房中统一管理,一旦整个机房出现了灾难,如火灾、盗窃和地震等灾难时,这些备份磁带也随之销毁,所存储的磁带备份也起不到任何容灾功能。
容灾与备份
真正的数据容灾就是要避免传统冷备份所具有先天不足,它能在灾难发生时,全面、及时地恢复整个系统。容灾按其容灾能力的高低可分为多个层次,例如国际标准SHARE 78 定义的容灾系统有七个层次:从最简单的仅在本地进行磁带备份,到将备份的磁带存储在异地,再到建立应用系统实时切换的异地备份系统,恢复时间也可以从几天到小时级到分钟级、秒级或0数据丢失等。
无论是采用哪种容灾方案,数据备份还是最基础的,没有备份的数据,任何容灾方案都没有现实意义。但光有备份是不够的,容灾也必不可少。容灾对于IT而言,就是提供一个能防止各种灾难的计算机信息系统。从技术上看,衡量容灾系统有两个主要指标:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了当灾难发生时允许丢失的数据量;而RTO则代表了系统恢复的时间。
容灾不仅是技术
容灾是一个工程,而不仅仅是技术。很多客户还停留在对容灾技术的关注上,而对容灾的流程、规范及其具体措施还不太清楚。也从不对容灾方案的可行性进行评估,认为只要建立了容灾方案即可高枕无忧,其实这具有很大风险的。特别是在一些中小企业中,认为自己的企业为了数据备份和容灾,整年花费了大量的人力和财力,而结果几年下来根本就没有发生任何大的灾难,于是放松了警惕。可一旦发生了灾难时,后悔晚矣!这一点国外的跨国公司就做得非常好,尽管几年下来的确未出现大的灾难,备份了那么磁带,几乎没有派上任何用场,但仍一如既往、非常认真地做好每一步,并且基本上每月都有对现行容灾方案的可行性进行评估,进行实地演练。[7]
数据容灾等级
设计一个[4]容灾备份系统,需要考虑多方面的因素,如备份/恢复数据量大小、应用数据中心和备援数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等。根据这些因素和不同的应用场合,常见的容灾备份等级有以下四个:
本地冷备份
这一级容灾备份,实际上就是上面所指的数据备份。它的容灾恢复能力最弱,它只在本地进行数据备份,并且被备份的数据磁带只在本地保存,没有送往异地。
在这种容灾方案中,最常用的设备就是[8]磁带机,当然根据实际需要可以是手工加载磁带机,也可以是自动加载磁带机。前者主要适用于存储数据容量较小的中小型企业。
参考资料
附链接:网页链接
您好,很高兴能帮助您,据国际标准SHARE78的定义,灾难恢复解决方案可根据以下主要方面所达到的程度分为七级,即从低到高有七种不同层次的灾难恢复解决方案。 可以根据企业数据的重要性以及您需要恢复的速度和程度,来设计选择并实现您的灾难恢复计划。 这取决于下列要求:? 备份/恢复的范围? 灾难恢复计划的状态? 在应用中心与备份中心之间的距离? 应用中心与备份中心之间是如何相互连接的? 数据是怎样在两个中心之间传送的? 有多少数据被丢失? 怎样保证更新的数据在备份中心被更新? 备份中心可以开始备份工作的能力现已证明,为实现有效的灾难恢复,无需人工介入的自动站点故障切换功能是一个必须被纳入考虑范围的重要事项。 目前通用的异地远程恢复标准采用的是1992年Anaheim的SHARE78,M028会议的报告中所阐述的七个层次:0层- 没有异地数据(No off-site Data) Tier0即没有任何异地备份或应急计划。 数据仅在本地进行备份恢复,没有数据送往异地。 事实上这一层并不具备真正灾难恢复的能力。 1层- PTAM卡车运送访问方式 (Pickup Truck Access Method)Tier1的灾难恢复方案必须设计一个应急方案,能够备份所需要的信息并将它存储在异地。 PTAM指将本地备份的数据用交通工具送到远方。 这种方案相对来说成本较低,但难于管理。 2层- PTAM卡车运送访问方式+热备份中心 (PTAM + Hot Site)Tier2相当于Tier1再加上热备份中心能力的进一步的灾难恢复。 热备份中心拥有足够的硬件和网络设备去支持关键应用。 相比于Tier1,明显降低了灾难恢复时间。 3层- 电子链接 (Electronic Vaulting)Tier3是在Tier2的基础上用电子链路取代了卡车进行数据的传送的进一步的灾难恢复。 由于热备份中心要保持持续运行,增加了成本,但提高了灾难恢复速度。 4层- 活动状态的备份中心 (Active Secondary Center)Tier4指两个中心同时处于活动状态并同时互相备份,在这种情况下,工作负载可能在两个中心之间分享。 在灾难发生时,关键应用的恢复也可降低到小时级或分钟级。 5层- 两个活动的数据中心,确保数据一致性的两阶段传输承诺(Two-Site Two-Phase Commit)Tier5则提供了更好的数据完整性和一致性。 也就是说,Tier5需要两中心与中心的数据都被同时更新。 在灾难发生时,仅是传送中的数据被丢失,恢复时间被降低到分钟级。 6层- 0数据丢失 (Zero Data Loss),自动系统故障切换Tier6可以实现0数据丢失率,被认为是灾难恢复的最高级别,在本地和远程的所有数据被更新的同时,利用了双重在线存储和完全的网络切换能力,当发生灾难时,能够提供跨站点动态负载平衡和自动系统故障切换功能。 你的采纳是我前进的动力,还有不懂的地方,请你继续“追问”!如你还有别的问题,可另外向我求助;答题不易,互相理解,互相帮助!
恢复服务器的方法有:备份恢复,RAID数据恢复,数据恢复工具。
1、备份恢复
如果有定期备份服务器数据的策略,可以使用备份数据进行恢复。通常,需要将备份数据还原到服务器上,以恢复丢失的文件和数据库。这可能涉及使用备份软件或通过命令行工具执行相应的恢复操作。
2、RAID数据恢复
如果使用了RAID(磁盘阵列)来提供冗余和数据保护,但其中一个磁盘发生故障,可以更换故障的磁盘并进行重建。RAID控制器将根据其他磁盘上的数据和校验信息来恢复丢失的数据。
3、数据恢复工具
如果没有备份或RAID,可以尝试使用数据恢复工具来恢复丢失的数据。这些工具可以扫描服务器上的磁盘,并尝试从已删除、格式化或损坏的分区中恢复数据。一些常见的数据恢复工具包括TestDisk、Recuva、PhotoRec等。
服务器的作用:
对终端的服务请求进行响应和处理,上网的时候不能直接上网,都需要通过服务器连接网络,服务器响应您的网络请求,进行处理后才能连接到网络,存储功能,服务器的存储容量通常足够,可以存储非常多的信息。
主要用于网站和大型数据库,其高性能主要体现在高速运算能力、长时间可靠运行、强大的外部数据、吞吐量等方面,服务器的结构与微机基本相似,有处理器、硬盘、存储器、系统总线等,针对具体的网络应用特别制定的,所以服务和微机具有处理能力、稳定性、可靠性和安全性。
制定灾难恢复计划和构建基础架构是一件让IT经理烦恼的事。 云服务提供更低的成本和更大的灵活性,但并不是没有风险的。 灾难恢复即服务意味着更多的部署和灵活性测试,但也意味着更多的不确定性。 灾难恢复(DR)会导致大量令人棘手的问题;灾难恢复系统价格昂贵, 灾难恢复配置难度较高,而且大多数灾难恢复只能在非业务时间进行故障恢复测试,灾难恢复模拟故障的内容很容易就过时了。 灾难恢复服务(DRaaS)是一种云端容灾的方法,成本更低,更容易部署,有定期提供测试计划的能力,能与企业的变化保持同步。 值得注意的是,云端的灾难恢复选件可能在毁灭性的灾难之后不可用。 这意味着滞留IT资源和数据,使企业瘫痪。 数据中心工作人员和业务相关人员花了很多时间和精力在到制定和测试灾难恢复脚本上。 首先,预测潜在的数据中心灾难:灾害性天气,停电,供应商系统脱机,内部人员的破坏或外部攻击都是有可能的。 确定公司的灾难恢复应用程序要立即在线。 审核清单和优先考虑日常运作的重点程序。 接下来, 原始资料和安装冗余数据中心基础设施——服务器、软件、网络连接、支持应用程序的载体,。 灾难恢复计划无法避免成本考虑;一个离线数据中心是昂贵的。 通常, 灾难恢复计划要求复制每个应用程序的基础设施组件。 此外, 灾难恢复需要和主备份站点网络连接,给备份系统当前的软件信息。 适当的工作人员需要了解如何调用备份进程。 他将决定哪些系统使用和哪些员工应该更换系统备份。 灾难恢复的职责包括通知他们的网络和系统提供商更改的数据和确保员工知道如何恢复系统。 理想情况下,业务用户只是略有影响。 IT团队需要在灾难恢复数据期间提供最新的备份资料程序给工作人员。 IT部门经常花很多时间在设计和分析物理灾难恢复计算环境上,而不是把时间用在编码和测试中增加价值。 测试一个灾难恢复计划,数据中心团队要和相关的操作系统和所有最新的补丁一起测试需要,接收、框架、堆叠和安装硬件。 他们创建灾难恢复用户帐户,部署框架或应用程序服务器环境和安装测试工具。 程序员可以花一半的时间在普通的灾难恢复基础设施问题上,而不是把时间用在实际的测试程序。 因为灾难恢复过程复杂,企业通常一年一次或两次进行测试偶发性的灾难恢复计划。 公司越大,对灾难恢复计划证明过程越复杂。 一旦灾难恢复程序进入计划,他们很快变成过时。 应用不断变化,因此团队必须在经常审查和更新灾难恢复程序。 大公司在计划的每个细节上花费员工众多的时间和高达7位数以上的金钱($1,000,000+)。 灾难恢复花费更多以确保计划仍然是可行的。 许多企业只是口头上承认灾难恢复。 在IT投资上,花大量的时间来缓解这1%,甚至更低的灾难恢复风险似乎并不是个好的投资。 IT经理有一份又长又不断增长的日常优先清单,而当灾难发生时,灾难恢复是唯一重要的事。 云服务在共享基础设施上不断省钱。 云的虚拟化和自动化的进步使之有更大的灵活性。 企业根据需要使用云资源,虽然只是在关键的应用上。 暂时的案例中灾难恢复测试发生容易增加。 基于云端的灾难恢复,程序员不用在比特和字节上苦干;他们在硬件和操作系统界面上工作。 因此更多的IT自动化的任务,生产力的提高和灾难恢复测试时间的减少。 数据中心的工作人员可以做为优先程序更经常, 分配更多的资源测试整个灾难恢复服务功能。 云端灾难恢复服务的价格正在上升: 根据咨询公司预测,从2013年的640,800,000美元涨到2018年的5,800,000,000美元,复合年增长率为55.2%。 灾难恢复服务有其局限性。 “云端灾难恢复供应商无法完备份系统冗余,“剑桥公司的灾难恢复分析师Rachel Dines说。 灾难恢复供应商不能证明以模仿每个客户的基础设施设置建设的数据中心成本, 所以他们走捷径。 灾难恢复服务提供商将构建系统处理数量有限的故障。 理论上讲,如果遇到灾难恢复特定场地的问题,比如数据中心的电力中断,企业将灾难恢复他们的系统,。 然而,如果发生重大自然或人为灾害,可能没有足够的空间在灾难恢复站点运行每个灾难恢复服务客户的应用程序。 当发现当灾难发生时, IT组织在危难关头唯一能做的是找到它并解决,因为灾难恢复服务比传统的灾难恢复构建有更大程度的风险。 云端的灾难恢复也增加了企业网络带宽的需求。 在供应商的云端灾难恢复服务放置应用程序副本和虚拟机(VM)镜像。 那些应用程序和虚拟机镜像不断更新,来自企业生产站点与灾难恢复服务供应商的数据中心的数据传输。 这种加载应变可用带宽。 灾难恢复服务能够很好地处理简单的应用程序,但可能降低网络性能的进程密集型系统,如客户关系管理、企业资源规划应用程序。
容灾和备份经常放在一起讲,但实际上是两个概念,容灾是为了在遭遇灾害时保证信息系统正常运行,帮助企业实现业务连续性的目标;备份是为了应对灾难来临时造成的数据丢失问题。 因此事实上容灾系统与备份系统是独立的(当然现在出现的一些灾备一体机会将两个系统融为一个)。 容灾备份产品的最终目标是帮助企业应对人为误操作、软件错误、病毒入侵等“软”性灾害以及硬件故障、自然灾害等“硬”性灾害。 但是目前很多用户会将容灾备份混为一谈,或者将容灾备份等同于数据复制或者高可用。 这里我们要明确几个概念:容灾≠远程复制;容灾≠备份;容灾分为两大类:数据级容灾:也就是异地容灾系统有本地数据的一个副本,数据可以是本地生产数据的实时复制,也可以比本地数据略微落后,一般使用复制或备份的方法实现。 目前实现数据级容灾的手段多种多样,技术成熟,更重要的是数据级容灾需要的软硬件投入较小,有着广泛应用。 应用级容灾:在数据级容灾基础上,在异地建立一套与本地生产系统相当的备份环境,包括主机、网络、应用、IP等资源均有配套,当本地系统发生灾难时,异地系统可以提供完全可用的生产环境。 大部分情况下应用级容灾要求容灾中心和生产中心之间有1:1的软硬件配置,相关的容灾软件价格也比较昂贵。 目前比较流行的集中容灾解决方案有:一对一灾备两地三中心多对一统一灾备
数据备份是指数据或系统的备份,它是容灾的基础,是指为防止系统出现操作失误或故障导致的数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它存储介质的过程。 灾难恢复是在企业经历过破坏性事件之后对业务进行恢复的过程。 通常这种破坏性事件会给企业带来相当大的经济损失。 如常见的地震等自然灾害、人为的恶性攻击或者一些设备故障导致的系统宕机等。
本文地址:http://www.hyyidc.com/article/15367.html
上一篇:ICANN认证的信誉选择oray,让您的域名管理更...
下一篇:ICANN认证的权威与oray合作,享受业界认可的...