系列目录:
- VAO基础入门(一)- 简介
- VAO基础入门(二)- 安装与部署
- VAO基础入门(三)- 基本组件 · 上篇
- VAO基础入门(四)- 基本组件 · 下篇
- VAO基础入门(五)- 基础配置要点
- VAO基础入门(六)- 成功灾备计划的第一步
- VAO基础入门(七)- Plan Step · 上篇
- VAO基础入门(八)- Plan Step · 下篇
- VAO基础入门(九)- 文档模板解析
通过之前的配置,我们的VAO就可以开始正常使用了,我们可以用Plan Authors角色的用户登入到VAO控制台上,在控制台中,将看到被授权允许能访问的Scopes,并且可以对这些Scopes中的对象进行操作,包括Orchestration Plan、DataLabs和Report。
要成功实现企业的灾备计划,达成企业的RPO和RTO,除了需要超级强大的计算资源和工具软件之外,对于这个灾备工具的了解和熟悉程度也是非常重要的一部分。对于VAO来说,本身是一款非常强大的软件,但是需要灾备管理员非常清楚的了解灾备计划的每一部分以及它的操作的预期结果。所以成功的灾备计划第一步,我们先来看看VAO是如何工作的。
在这里我先使用user1@sedemolab.local
这个Plan Authors角色的账号登入VAO系统中。它将看到房间Scope A
和房间Scope B
Orchestration Plan
VAO中可以设定两类Orchestration Plan,分别是恢复计划和故障切换计划,分别对应VBR中的Backup和Replication功能。这两个计划是整个灾备和恢复的基础,所有自动化的操作过程都将会通过这个Plan加入到灾备中去。在这里,我建议首先第一步,尽可能的不要加入太复杂的自动化脚本,而是用系统自带的Plan Steps,用最少的流程来测试两类Plan,等到熟悉了系统的工作机制后,再来逐步逐步添加适合的自定义脚本。
- 创建Orchestration Plan,进入左边的Orchestration Plans,在右边内容显示区域,会看到顶部的一排4个按钮,其中在Manage按钮所在的下拉菜单中,可以找到New的按钮。通过这个按钮可以启动Orchestration Plan的创建向导。
- 打开向导后,首先需要选取使用哪个Scope来创建这个Orchestration Plan,就像前几篇中提到,每个Scope中包含了灾备的一系列元素,而Orchestration Plan则是把这些元素组合起来,形成一个可执行的计划。所以每个Orchestration Plan是属于某个特定的Scope下的Plan。 选择房间(Scope A)后,点击下一步。
- 设定Plan Info,此处的内容一般来说按照实际的情况填写,这些都会在Report中被使用到。
- 选择Plan Type,即决定这将是个Restore操作还是Failover操作,两者的唯一区别是,如果是Restore Plan那么将会增加一个Recovery Location的选项,选择我们这Plan Components之前设置好的Location即可。
- 选择VM Groups,在当前Scope下能看到的所有可用VM Groups都会列在Available Group中,通过Add按钮将需要的Group添加至右边的Plan Groups窗格中。也可以通过View VMs来详细查看当前选定的VM Groups中所包含的VM。
- 在VM Recovery Options中,需要设置3个内容: If any VM recovery fails then:如果Plan中有多台VM需要恢复,假如其中有一台VM恢复失败,此选项决定了后续的Plan如何操作,可以继续执行计划恢复其他VM或者是直接停止计划。 Recover the VMs in each Group: 按顺序恢复还是同时恢复。如果选择Simultaneously是同时进行,如果是选择In Sequence则是按顺序执行。 Recover simultaneously max of VMs:选择合适的数量,默认是10个,一般来说,管理员需要根据自己的计算资源情况,合理选择,最好执行一些测试后最后决定这里的数量。 Restore VM Tags:这个复选框下有个⚠️,一般来说恢复至新位置成为一个新VM则大多是不会选择这个恢复Tags,避免和生产的VM混起来。
- 在VM Steps中,可以选择很多恢复过程中的可以用到的Steps,默认情况下,系统自动会选上Restore VM和Check VM Heartbeat这两个Step。我建议刚开始熟悉VAO的管理员逐项逐项的添加各种Step,以测试每一种操作的功能,确定了某个需要的Step之后,再将其设计到自己的最终Plan之中。
- 在VM被恢复之后,为了确保系统的可靠性,VAO还提供了立刻继续将恢复出来的VM备份起来的功能,在Protect VM Groups中勾选Protect VM Groups after restore并且选择合适的Template Job就行了。这里面的Template Job都是在Plan Component中所选择的。
- 对于灾备来说,非常非常重要的一个指标就是RTO和RPO了,通常在备份或者容灾软件中很少有看到这两个数值的设定,而在VAO中,灾备管理员可以为每个Plan来制定相应的RTO和RPO目标,如果达成这个目标,系统会显示绿色的状态,而如果无法达成这个目标,则会发出相应警告⚠️。 此项的设置,具体数值可以精细到分钟级别。
- 管理员还能在VAO中定义Orchestration Plan的报表,在Plan中只需要选择相关的模版即可,可以选择pdf或者word格式的报表。关于报表模版的设计,我将会在本系列的最后一节详细介绍。
- 选择完报表模版后,可以设定报表计划任务,个人感觉都是报表的内容,实际上没必要分成2个页面来设置,但是不管怎么样,根据VAO产品的设计,我们可以在这里设置每天报表的计划任务,需要注意的是,报表更新的任务是每天为频率的,只能选择每天的时间,不能有其他更多选择。
- 又是一个复选框占用一个页面,勾选之后,VAO会在Plan创建完成后立刻进行灾备资源的可用性检查,根据实际情况选择即可。
- 以上就是所有设定步骤,在Summary中查看详细设置后点击Finish就能完成创建。创建完成后,这个Plan将会出现在Orchestration Plan的页面中。
对于创建好的Plan,管理员可以对它做以下操作:
Launch :Run和Schedule
Manage:Enable、Disable、New、Edit、Reset、Delete
Verity:Datalab test和Readiness check
Report操作
一般来说,新创建的Orchestration Plan是处于Disable状态,也就是前面的图标是灰色的,需要点击Manage->Enable选项来激活它才能正常工作。
做了恢复或者故障切换操作之后,管理员需要通过Manage->Reset按钮来重制这个Plan使其能继续工作,或者管理员还可以删除之前已经完成的Plan,重新定义新的Plan。
Datalab 测试
在Orchestration Plan的Verity按钮下,可以找到Run Datalab test的按钮,点击这个按钮后,会启动一个DataLab test的向导,通过这个向导中选择一些合适的选项,可以对于整个灾备计划做一次近乎真实的演练,整个演练过程甚至会100%模拟实际的Restore Plan和Failover Plan执行,包括了其中所有设置的自定义脚本,只是在分配网络的时候会选择Datalab的隔离网络。因此管理员能从这样的演练过程中清楚的掌握实际灾备环境中恢复的状况以及需要的恢复时间。
对于Restore Plan和Failover Plan,Datalab test会略微有些不同。
Restore Plan
选择Restore Plan后执行
- 打开向导后,首先需要选择在哪个Datalab中执行这个测试,在Scope下设定的所有可用Datalab都能够在这里找到。
- 选择快速测试还是完整测试,如果是快速测试,VAO仅仅是通过即时虚拟机发布的方式执行这个测试,不执行后续的迁移操作,整个过程完成的相对比较快。
- 选择Recovery Location,这和恢复步骤中的完全一致,只是在Orchestration Plan中已经选择过位置的,依然需要在此处再进行选择,此处的选择是为Datalab test专用的。
- 在自动测试完成后,选择是否要继续使用这些机器用于更多的测试,或者其他使用场景。在这里可以选择测试完成后立刻关机,也可以选择在测试后继续运行这个Datalab多少小时。
- 选择必要的Lab Groups,和VBR中的Application Group一样,在这里可以按需选择,当然也可以不选择Lab Group。
- 在Summary界面中查看当前的设置后,点击Finish就可以开始Datalab的测试了。
Failover Plan
选择Failover Plan后点击Run Datalab test,选项就相对来说比较少了。这里不需要选择test option和Recovery Location,直接进入Power Options和Choose Lab Groups的选择。
Schedule Datalabs Test
除了可以手工执行Datalab test之外,VAO也可以全自动执行Datalabs Test,以此来确保灾备的自动验证。在VAO的仪表盘中,找到Datalab Calendar部分,在这里可以看到Create Schedule按钮,就是用来设置全自动的Datalab test计划任务。同时,这个仪表盘也能过查看到已经设置的计划任务,来确认整个灾备的实施情况。
这个Schedule的设置向导和单次的Run Datalabs test大同小异,其中两个不一样的内容是,需要定制一个计划任务的时间,如下图:
选择哪几个Plan在这个Lab中测试。
以上这些就是最基础的Orchestration Plan和Datalabs测试的设置方式,成功设置并执行以上内容后,将为灾备成功迈出第一步打好基础。
更多内容欢迎关注本人公众号,