系列目录:
- VAO 基础入门(一)- 简介
- VAO 基础入门(二)- 安装与部署
- VAO 基础入门(三)- 基本组件 · 上篇
- VAO 基础入门(四)- 基本组件 · 下篇
- VAO 基础入门(五)- 基础配置要点
- VAO 基础入门(六)- 成功灾备计划的第一步
- VAO 基础入门(七)- Plan Step · 上篇
- VAO 基础入门(八)- Plan Step · 下篇
- VAO 基础入门(九)- 文档模板解析
前一篇,我详细介绍了 Orchestration Plan,在我们设计灾备计划时,可以从某个 Application 入手,从简到繁循序渐进的规划整个数据中心的灾备。
创建 Orchestration Plan 时默认情况下,为每个灾备计划内置了最基础的 Step,而 VAO 的强大之处在于它能够添加各种 Step,系统内置了一些常用的 Step,管理员只需要根据自己实际的需求选择相应的 Step,然后配置相关参数即可使用。
Out-of-the-box 的 Plan Steps
这些出厂自带的 steps 一共 22 个,大概可以分为这么几类:
恢复操作 - 2 个
Datalab Lab 验证操作:
- DataLab 准备操作 - 1 个 - 虚拟机基础验证 - 2 个 - 应用验证 - 12 个
通知操作 - 2 个
虚拟机电源操作 - 2 个
虚拟机服务启动操作 - 1 个
这些操作基本没什么特别需要注意的地方,所以的内容都已经固化内置在系统中了,根据系统的提示,填入相关的内容即可。本文不详细展开逐个讨论这里每一个 Step 的参数配置方法,具体大家可以根据实际情况选择逐个测试。
Plan Step 通用参数
在每个 Plan Step 中,都会包含一个最基础的Common Parameter
,这是对于这个 Plan Step 执行的基本控制条件,包含以下内容:
- Failback & Undo Failover Action : 决定在 Failback 和 Undo Failover 操作时是否执行脚本
- Test Action : 决定在 Datalab 测试中是否使用脚本
- Critical step : 定义这个 Step 对于整个 Plan 是否重要,如果是,则失败后立刻停止计划
- Timeout : 定义整个 Step 执行超时时间
- Retries : 定义失败重试次数
这个 Parameter 可以在每个 Orchestration Plan 中为每个 step 单独调整。
更强的自定义脚本
除此之外,VAO 还提供了额外的自定义脚本功能,管理员可以在 VBR 服务器或者恢复后的系统上直接调用使用 Powershell 脚本,完成各种骚操作。
举个例子,数据中心某应用架构如下:
典型的三层架构,Oracle 数据库在 AIX 小机上,中间件和应用服务器跑在 VMware vSphere 上面。灾备系统设计之初,Oracle 数据库通过 OGG 做了复制,实现了数据级同步。
这样的架构,通常 Veeam 使用 VBR 的时候会建议用户对虚拟化平台也做一个保护,确保在主数据中心出现故障的时候能够应用系统和数据库都切换至灾备中心。而在使用了 Veeam 的解决方案后,通常我们的用户都会发现,VBR 不仅能够很好的完成虚拟化平台的灾备复制任务,同时他的灾备演练能力也极其强大,系统会真实的被恢复出来并且提供恢复后的演练访问,真枪实弹的完成整个演习过程,并且还是全自动的。
但是,管理员很快会发现,很尴尬的一点是,应用系统没有数据库的数据支持,就算恢复了,也没办法正常工作,这样的测试还是无法最终等效于实际灾备场景。
VAO 来帮忙
这事情借助 VAO,可以完美的解决。整个过程会是这样:
- 启动应用系统的 Failover / Restore Plan,可以在真正的恢复过程前的 Step 中,加入 Powershell 脚本,和灾备站点的 AIX 进行通讯。
- AIX 上脚本执行后,新的 LPAR 部署出来。
- 再来一个脚本,将一个虚拟网卡 attach 到新部署出来的 LPAR 上,并让这个网卡和我们在虚拟化环境中创建出来的沙盒隔离网络相连,隔离网络无法直接路由访问到生产,所以是相对隔离的环境。
- 第三个脚本搞起,让最新的一份 Oracle 数据库运行在这个新的 LPAR 上。
- 一切准备结束,启动虚拟化灾备平台中的应用和中间件副本,这样在这个隔离环境中,起来的应用和中间件就可以访问 AIX 数据库了。
- 到这里还没完工,系统都跑起来了,让这套系统别停下,飞一会儿吧,可以在上面做一系列测试、开发等等操作。
- 经过一段漫长的测试,系统使用完毕,灾备管理员被通知可以回收了。灾备管理员操作 VAO,让系统进入下一步流程。
- vSphere 上的虚拟机被 Undo Failover 到演练之前的状态,这个非常简单,和 VBR 上几乎没差别
- 一个新的脚本被触发,通知 AIX,请删除这个 LPAR 和他上面的数据库,确保测试的数据不会被复制回生产中。
以上这个过程,是不是很不错?这样的过程不仅可以是加入和 AIX 的配合,同样各种系统不管是 HPUX 还是 Oracle Exadata 都可以搞一搞。对了,还有公有云,一起加入到这个灾备 Party 中吧,有了 VAO,这都不是事。
所以,有了自定义的 Script、计划任务的调度,VAO 神通广大,几乎能做任何由 Powershell 可以实现的事情。在下一篇,我会来详细介绍如何玩转这个自定义 Script。