恢复点目标 (RPO) 是您的组织期望在灾难期间从数据丢失中恢复的最大时间间隔。如果未满足 RPO,您的组织在停机期间丢失大量重要数据的可能性会增加,从而使您的组织面临失去业务和客户信心的风险。连同恢复时间目标 (RTO),或您的组织在预期重大财务损失之前可以承受的最大停机时间,RPO 是一个重要的、基于时间的指标,它为您的团队在业务连续性和灾难恢复期间提供目标 ( bcdr)规划。
恢复点目标 (RPO) 如何运作?
RPO 是组织在事件发生后可以承受的丢失数据的最长时间。RPO 是从您上次备份的时间或您仍有可用数据的时间到您完全备份并运行的时间计算的。换句话说,这是您的组织从备份中恢复数据所需的时间,包括将数据重新输入系统所需的时间。RPO 涵盖从中断开始到服务恢复的时间跨度。因此,RPO 越长,数据丢失的可能性就越大。
RPO 的范围可以从接近零到 24 小时甚至更长。大型企业可能需要保持接近于零的 RPO,尤其是在监管机构和其他机构要求它们这样做的情况下。可以在不需要记录的情况下生存数天的中小型企业有能力拥有更长的 RPO。接近零或更短的 RPO 是通过故障转移/故障回复策略实现的,因此比仅需要备份策略的更长 RPO 更昂贵。
实际恢复点 (RPA) 是恢复停机期间丢失的数据所需的实际时间。如果 RPA 比 RPO 长,您应该努力使其更短或等于您的 RPO。
RPO的计算
设置 RPO 时,请考虑组织的性质和状态。例如,如果您为客户提供关键服务,请确保您的 RPO 将通过连续故障转移复制或频繁备份将影响降至最低。其他有能力在系统不启动和运行超过一天的情况下运行的公司可以计划更长的 RPO。
数据保留和备份政策
RPO 旨在确保停机期间的数据丢失最少。因此,设计数据保留策略和备份流程时应考虑 RPO。例如,如果您的目标是确保在工作时间内输入系统的数据丢失最少,您可以设置每小时甚至更频繁的数据备份。这可确保在发生停机时将数据丢失保持在最低限度,因为您必须只将数据恢复到上次备份的时间。
数据量
在计算 RPO 时,输入系统的数据量也很重要。假设您的 IT 员工需要一个小时才能让您在停机后重新启动并运行,您需要考虑到您不仅要重新输入停机期间丢失的数据,还要重新输入本应输入的数据您的系统在停机时。如果您期望重新输入大量数据,您可能需要重新考虑您的 RPO 并设置更频繁的备份。如果您预计不会有太多数据重新输入或无法承受后果,则可以坚持更长的 RPO。
按系统计算
RPO 也可以按系统计算,因为每个系统的备份和恢复要求可能会有所不同,具体取决于它们的功能。对于任务关键型系统,您可能拥有接近零小时的备份以及连续或故障转移复制,确保几乎 100% 的正常运行时间。对于其他非关键系统,备份的频率可能较低。
一天或一周的时间
此外,RPO 可能会因一天中的不同时间或一周中的不同天而有所不同。例如,如果您不希望系统在清晨处理大量数据,则可以安排在午夜进行备份,并在 6 小时后重复。您可以在办公时间过渡到更频繁的备份,尤其是当您预计数据量在白天会大幅增长时。对于周末,您可以安排不太频繁的备份,尤其是当您预计数据量较低时。
数据丢失的高昂代价
数据丢失会严重影响任何组织的运营,或者更糟的是,会导致严重的财务损失。虽然每个公司的最终影响可能不同,但较大的公司可能会发现通过更广泛的准备来应对数据丢失更容易。另一方面,较小的组织可能会发现很难从这些潜在的严重事件中恢复过来。在某些情况下,数据丢失可能导致公司永久关闭其运营。
更长的 RPO 意味着更可能发生重大数据丢失,这反过来又会导致更大的业务中断。组织应努力缩短 RPO。您的灾难恢复 (DR) 解决方案在实现这一目标方面发挥着重要作用。例如,要实现零数据丢失的 RPO,可能需要具有连续数据复制功能的高可用性解决方案。然而,考虑到每家公司的资源可用性不同,这并不总是可行的。
在为您的组织设置数据备份过程时考虑 RPO。对于无法承受丢失大量数据的组织而言,云备份和复制解决方案以及故障转移/回切服务是理想选择。常规生产快照和外部存储备份可能足以满足要求不那么严格的其他组织。
RPO 在业务连续性中的作用
RPO 对于有效的 BCP 至关重要。如果没有允许最小数据丢失的合适 RPO,组织就没有机会在不遭受数据和声誉损失的情况下度过灾难性事件。
组织必须准备好花费更多的时间和金钱来设置和实现更短的 RPO。如果他们的运营将受到停机时间的显着影响,就会发生这种情况。如果一个组织在不考虑其潜在后果的情况下坚持更长的 RPO,它可能会在短期内节省资金,但它冒着丢失的不仅仅是数据的风险。设置 RPO 时,请确保您已经设置了您可以承受的最大数据丢失量,您知道数据丢失对您的操作的潜在成本,并且您已经计算了停机的缓解成本。其他考虑因素包括 IT 人员、财务资源和公司声誉。
有效的 RPO 使业务更具弹性。因此,与 BCP 相关的每个人,从 C 级高管到负责数据备份和恢复的 IT 人员,都必须为提出可行且有效的 RPO 做出贡献。您应该不断评估 BCP。如果您对您的 RPO 不满意,您可以相应地修改它。
RPO 示例
基于负载和丢失容忍度,企业可以拥有任意数量的不同 RPO 层:
不常见
13 到 24 小时之间。不经常更新的数据(例如产品规格)的 RPO 最长可达 24 小时。
不那么关键
4 到 12 小时之间。例如,营销数据通常被视为不那么重要,允许长达 12 小时的 RPO。
半临界
1-4 小时之间。半关键数据包括聊天记录或文件服务器上的数据,RPO 最长可达 4 小时
批判的
在 0 到 1 小时之间。关键数据是企业不惜任何代价都不能丢失的最有价值的数据,例如银行交易。这个RPO需要不断更新。
恢复点目标和灾难恢复计划
DRP 就是制定计划,以协助在数据丢失事件或自然灾害发生后恢复关键数据和系统。与计划的服务或停机时间不同,灾难性事件是不可预测的。因此,企业必须制定适当的灾难恢复策略,以及指定的 RPO 和其他目标。通过 RPO,企业将针对可能的数据丢失设置其损失容忍度,因此企业将提前知道将丢失多少数据,而不是完全无法预料的灾难。
考虑公司至少每小时备份一次重要数据的 RPO。作为业务连续性战略的一部分,它认识到数据丢失事件的最坏情况是它将丢失一个小时的数据。
恢复点目标与恢复时间目标
恢复时间目标 (RTO)是计算机服务和应用程序在发生故障或灾难后可以保持停机的最长时间,与恢复点目标密切相关。这两种方法共同提供 BCP 和 DR 计划。
恢复时间目标
RTO 被激活,随后发生丢失事件。它帮助公司确定他们可以在多长时间内从故障、自然灾害或恶意行为造成的数据丢失中恢复过来。