VMware vCenter Site Recovery Manager 5.1.0.1 | 2012 年 12 月 20 日 | 内部版本 941848

VMware vCenter Site Recovery Manager 5.1(仅限 ISO) | 2012 年 9 月 10 日 | 内部版本 820150

上次更新时间:2016 年 3 月 9 日

请查看发行说明以了解新增内容及更新。

发行说明内容

本发行说明包含以下主题:

SRM 5.1.0.1 的新增功能

SRM 5.1.0.1 提供以下改进功能:

  • 解决了 SRM 5.1 中的重大问题。如果已安装 SRM 5.1(内部版本 820150),则必须将安装的版本升级至 SRM 5.1.0.1(内部版本 941848)。
  • 包括 vSphere Replication 5.1.0.1。如果已安装 vSphere Replication 5.1,将 SRM 升级到 5.1.0.1 后,也必须将 vSphere Replication 升级到 vSphere Replication 5.1.0.1。

有关升级的说明,请参见 安装和升级说明。

SRM 5.1.0.1 已解决的问题

  • 使用导入的证书安装 SRM 5.1 或升级至 SRM 5.1 时失败
    如果尝试使用导入的 PKCS12 证书(而不是自动生成的证书)安装 SRM 5.1 或升级至 SRM 5.1,安装程序会运行直至完成,但安装会失败并显示以下错误: 无法安装证书 (Failed to install certificate)。请参见 知识库文章 2036909。SRM 5.1.0.1 中已修复此问题。
  • 恢复站点上的 SRM 服务器在清理恢复计划时失败
    在清理过程中,如果没有需要清理的内容(例如没有要分离的 LUN,或者没有要卸载的数据存储),则恢复站点上的 SRM 服务器会失败多次。如果通过至少一个 LUN 成功执行了命令(该命令用于启动从 SRM 服务器到 SRA 的测试恢复),但恢复站点上的 ESXi 主机运行重新扫描时未发现任何 LUN,则会出现此问题。SRM 5.1.0.1 中已修复此问题。

SRM 5.1 的新增功能

VMware vCenter Site Recovery Manager 5.1 增加了以下新功能和改进功能。

  • SRM 5.1 支持通过 vSphere Replication 进行重新保护和故障恢复。之前,您只能对基于阵列的保护组执行重新保护和故障恢复。在 SRM 5.1 中,您可以对 vSphere Replication 保护组执行重新保护和故障恢复。
  • SRM 5.1 中的 SRM 服务器现在为完全 64 位应用程序。
  • 改进了在全部路径异常 (APD) 状况下处理数据存储的方式。如果 SRM 检测到受保护站点上的数据存储处于全部路径异常 (APD) 状态,并且正在阻止虚拟机关闭,则 SRM 将等待一段时间,然后再次尝试关闭虚拟机。APD 通常是暂时状态,因此等待处于 APD 状态的数据存储恢复联机后,SRM 即可在该数据存储上正常关闭受保护虚拟机。
  • VMFS 磁盘的磁盘重新签名有所改善。

本地化

VMware vCenter Site Recovery Manager 5.1 提供以下语言的版本:

  • 英语
  • 法语
  • 德语
  • 日语
  • 韩语
  • 简体中文

兼容性

SRM 兼容性列表

有关最新的互操作性和产品兼容性列表,请参见 VMware vCenter Site Recovery Manager 5.1 的兼容性列表。

兼容的存储阵列和存储复制适配器

有关受支持的兼容存储阵列和 SRA 的最新列表,请参见 《Site Recovery Manager 存储合作伙伴兼容性指南》

VMware VSA 支持

SRM 5.1 可以使用 vSphere Replication 保护驻留在 vSphere Storage Appliance (VSA) 上的虚拟机。VSA 不要求存储复制适配器 (SRA) 与 SRM 5.1 配合使用。

安装和升级说明

有关帮助进行 Site Recovery Manager 5.1 主要特性和功能的技术演练的评估指南,请参见 用于业务连续性的 VMware vCenter Site Recovery Manager 资源

安装 SRM 5.1.0.1

要进行 SRM 5.1.0.1 全新安装,请下载并运行安装程序 VMware-srm-5.1.0-941848.exe。请参见《Site Recovery Manager 的安装和配置》中的 安装 SRM  

将现有 SRM 4.1.x 安装升级至 SRM 5.1.0.1

在升级到 SRM 5.1.0.1 之前,请先将早于 5.0 的 SRM 版本升级到 SRM 5.0 或 5.0.1。

重要信息:将 vCenter Server 直接从 4.1.x 升级到 5.1 是受支持的升级途径。但是,将 SRM 直接从 4.1.x 升级到 5.1 不是受支持的升级途径。升级包含 SRM 4.1.x 安装的 vCenter Server 4.1.x 实例时,必须先将 vCenter Server 升级到版本 5.0 或 5.0 u1,然后再将 SRM 升级到 5.0 或 5.0.1。如果将 vCenter Server 从 4.1.x 直接升级到 5.1,则当尝试将 SRM 从 4.1.x 升级到 5.0 或 5.0.1 时,SRM 升级将失败。SRM 5.0.x 无法与 vCenter Server 5.1 实例连接。

将现有 SRM 5.0 或 5.0.1 安装升级至 SRM 5.1.0.1

要将现有 SRM 5.0 或 5.0.1 安装升级至 SRM 5.1.0.1,请下载并运行安装程序 VMware-srm-5.1.0-941848.exe。请参见《Site Recovery Manager 的安装和配置》中的 升级 SRM  。不支持从 SRM 5.0.2 升级到 5.1.0.1。

将现有 SRM 5.1 安装升级至 SRM 5.1.0.1

执行以下步骤将现有 SRM 5.1 安装升级至 SRM 5.1.0.1。

  1. 登录到受保护站点上运行 SRM Server 的计算机。
  2. 使用数据库软件提供的工具备份 SRM 数据库。
  3. 下载并运行安装程序 VMware-srm-5.1.0-941848.exe
  4. 当系统提示您确认要升级 SRM 时,单击 [是]
  5. 单击 [是] 确认已备份 SRM 数据库。
  6. 安装完成后,请单击 [完成]
  7. 在恢复站点上重复升级过程。

升级 SRM Server 之后,必须重新安装 SRM 客户端插件。

  1. 登录到运行 vSphere Client 实例(该实例用于连接到 SRM)的计算机。
  2. 卸载 SRM 5.1 客户端插件。
  3. 登录到 vSphere Client 实例并连接到与 SRM Server 连接的 vCenter Server。
  4. 选择 [插件] > [管理插件]
  5. 单击 [下载并安装] 以安装 SRM 5.1.0 客户端插件。
  6. 插件安装完成后,登录到 SRM 并确认早期版本中的配置已保留。
  7. 对用于连接到 SRM Server 的所有 vSphere Client 实例重复此过程。

如果已安装 vSphere Replication 5.1,也必须将 vSphere Replication 升级至 vSphere Replication 5.1.0.1。请参见《Site Recovery Manager 安装和配置》中的 升级 vSphere Replication  

SRM 和 vSphere Replication 的操作限制

有关 SRM 5.1 和 vSphere Replication 5.1 的操作限制的信息,请参见 http://kb.vmware.com/kb/2034768。

SRM SDK

有关 SRM 基于 SOAP 的 API 的使用指南,请参见 VMware vCenter Site Recovery Manager API。

开放源组件

可以从 下载 VMware vCenter Site Recovery Manager 中获取适用于 Site Recovery Manager 5.1 中分发的开源软件组件的版权声明和许可证。您还可以下载 vCenter Site Recovery Manager 最新通用版本的所有 GPL、LGPL 或者其他要求公开源代码或源代码修改的类似许可证的源文件。

局限声明和限制

  • 使用导入的证书安装或升级到 SRM 5.1 失败
    如果您尝试使用导入的 PKCS12 证书而不是自动生成的证书安装 SRM 5.1 或升级到 SRM 5.1,则安装程序将运行并完成,但随后会失败并显示以下错误: 无法安装证书 (Failed to install certificate)。请参见 知识库文章 2036909。SRM 5.1.0.1 版本已修复此问题。要使用导入的 PKCS12 证书,请升级至 SRM 5.1.0.1。

  • 与 Storage vMotion 和存储 DRS 的互操作性
    在某些特定限制情况下,存储移动期间的可恢复性可能会受到影响,因此不支持 Site Recovery Manager 5.1 与 Storage vMotion (SVmotion) 或 Storage Distributed Resource Scheduler (SDRS) 配合使用,包括使用数据存储群集。

  • 与 vCloud Director 的互操作性
    Site Recovery Manager 5.1 为 vCloud Director 环境提供有限的支持。不支持使用 SRM 保护 vCloud 资源池内的虚拟机(部署到一个组织的虚拟机)。支持使用 SRM 保护 vCD 的管理结构。有关如何使用 SRM 保护 vCD Server 实例、vCenter Server 实例以及提供 vCloud Director 管理基础架构的数据库的信息,请参见 《VMware vCloud Director Infrastructure Resiliency 案例研究》

  • 与 vSphere Replication 的互操作性
    vSphere Replication 支持的最大磁盘大小为 2032GB。

  • SRM 5.1 可支持 2 个 Microsoft 群集服务器 (MSCS) 节点
    vSphere 5.1 最多可支持 5 个 MSCS 节点。SRM 5.1 可支持 2 个 MSCS 节点。

SRM 5.1 已解决的问题

本版本中已解决 SRM 5.0 中的以下问题。

  • 为 vSphere Replication 设备配对或断开配对失败,并显示 LockingFailedException

    在极少数情况下,在 vSphere Replication 设备服务器之间配对或断开配对时,如果同时停止 vSphere 服务,则操作将失败并显示以下异常:

    LockingFailedException:无法写入锁定对象:com.vmware.hms.db.entities.HmsLocalServerEntity: VRM Server GUID

    该问题已解决。

  • 有效证书生成警告

    由于在满足以下两个条件的情况下证书出现问题,vSphere Replication 设备无法配对:

     

    • 服务器证书中的主机名值与 vSphere Replication 设备地址不匹配。
      主机名值可能包含主题名称或主题备用名称。在配置应用程序的过程中,会在虚拟设备管理基础架构 (VAMI) 中指定 vSphere Replication 设备地址。
    • 对等 vSphere Replication 设备服务器具有证书颁发机构 (CA) 的有效信任证书链。
      如果该证书由受信任的 CA(如 Verisign 或 Go Daddy)颁发,或者由未知 CA 颁发,而该 CA 的证书已添加到对等 vSphere Replication 设备服务器的 hms-truststore.jks文件中以建立信任,则会出现这种情况。

     

    该问题已解决。

 

  • 安装多个 vSphere Client SRM 插件出现问题

    在任何给定时间,只应安装一个版本的 vSphere Client SRM 插件。系统不会阻止用户在 SRM 5.0 的插件上安装 4.0.x 或 4.1.0 版本的客户端插件。该问题已解决。

  • 重新保护可能会使用户完成不允许执行的任务

    用户运行重新保护操作时,完成的任务可能会超出授予的特权所允许的范围。尽管用户缺少权限,但仍可能在重新保护目标站点上创建虚拟机,或者保护重新保护源站点上的新设备。如果在其他用户删除了旧生产站点上的虚拟机或修改了这些虚拟机故障切换到的虚拟机之后启动重新保护,则可能会出现这种情况。该问题已解决。

  • 用户界面在计划的迁移过程中发生意外更改

    在计划的迁移过程中,会取消激活虚拟机并将其同步到恢复站点。在此过程中,保护组及其虚拟机将临时以 [部分已恢复] 状况显示。vSphere Client 会启用 [编辑保护组][移除保护组] 等按钮,因为这些按钮适用于这些状况,但由这些按钮触发的操作不会成功。用户可能会对这些变化状况和按钮的可用性感到困惑。该问题已解决。

  • 升级到 SRM 5.0 之后,恢复历史记录可能会丢失

    在服务器迁移升级过程中,安装程序会提供默认站点名称,而不是当前正在使用的站点名称。如果没有将默认站点名称替换为当前站点名称,则恢复历史记录可能会丢失。该问题已解决。

  • 不提供默认站点名称的许可证信息

    SRM 许可证信息在 vCenter 中是使用 SRM 站点名称作标记的。如果默认站点名称已在使用,而在同一 vCenter 组中注册了多个 SRM 服务器,则使用默认 SRM 服务器命名方式将无法区分许可信息。该问题已解决。

  • 在名称中包含非 ASCII 字符的计算机上安装 SRM 会引起访问问题

    如果安装 SRM 的计算机的名称包含非 ASCII 字符,则可能会出现用户访问问题。由于计算机名称用于构建 URL,因此这些包含非 ASCII 字符的 URL 可能无效。该问题已解决。

  • 在自定义 Windows XP 和 Windows 2003 后,非 ASCII DNS 后缀设置不正确

    如果在虚拟机 [恢复属性] 对话框的 [IP 设置] 部分的 [DNS] 选项卡中输入一个非 ASCII DNS 后缀来自定义 Windows XP 或 Windows 2003,则该自定义操作将报告为成功,但是,该非 ASCII DNS 后缀设置不正确。该问题已解决。

  • 产生非 ASCII 字符输出的自定义恢复步骤会导致 SRM 服务器崩溃

    请勿创建会产生非 ASCII 输出的自定义恢复步骤。如果将这类步骤添加到计划中,然后完成测试或恢复,则 SRM 服务器会崩溃。如果使用的计划中有一个步骤会产生非 ASCII 输出,则该计划将进入无法修改或删除的状况。该问题已解决。

  • 恢复计划配置界面显示无效的网络选项

    在配置恢复计划时,必须选择网络以与虚拟机关联。即使 DVS 上行链路端口组为无效选项,恢复计划用户界面也会将其显示为可能的选择。该问题已解决。

  • 在 vSphere Replication 设备断开连接后,虚拟机状态不更新

    vSphere Replication 设备将在站点之间交换有关虚拟机复制的信息。如果通过 [断开 vSphere Replication 设备连接] 选项断开 vSphere Replication 设备连接,则重新配置 vSphere Replication 设备连接时不会自动重新交换有关已复制虚拟机的信息。这样,虚拟机复制信息(包括哪些虚拟机可以添加到保护组等)可能会不完整。该问题已解决。

  • vSphere Client 中显示的信息可能过期

    修改 SRM 数据(如恢复计划的内容)期间,显示的信息可能不会随 SRM 信息的修改而更新。例如,将要挂起的非关键虚拟机添加到恢复计划后,将不会自动显示有关此更改的信息。该问题已解决。

  • 身份验证过程中无效证书被拒绝

    SRM 支持基于证书的身份验证。如果 SRM 服务器的证书无效,则在 vSphere Client 使用 SRM 插件连接到 SRM 服务器时会出现错误。如果证书链中的任何证书过期或尚未生效,则会出现证书无效的情况。在这种情况下,将显示以下消息: 与远程主机的 SSL 连接已终止。该远程主机证书存在以下问题:主机链中证书的时间无效 (The SSL connection to the remote host has terminated. The remote host certificate has these problems: A certificate in the host's chain is not time-valid)。此问题已解决。

  • 当许多 vSphere Client 连接到 SRM 时,操作可能失败

    SRM 使用固定大小的大型连接池与 vCenter Server 和其他站点中的 SRM 服务器进行通信以执行任务。可用连接数随着连接的 vSphere Client 数目的增加而减少。大多数情况下,这不会对系统性能产生负面影响,但如果同时执行许多操作(如保护或取消保护大量虚拟机,或者运行或测试大型恢复计划),则可能会出现问题。操作可能因多种原因而超时或失败。该问题已解决。

  • 尝试重新保护混合模式恢复计划导致处于重新保护未完成状况

    保护组可能基于 SAN 或基于 vSphere Replication (VR),而恢复计划可能由这两种类型的保护组组成。不能对既包含基于 SAN 的保护组又包含基于 VR 的保护组的计划运行重新保护。重新保护功能不会进行检查以确保保护组不只是基于 SAN 或 VR。如果尝试重新保护混合类型的保护组,则该过程将失败,并导致恢复计划处于重新保护未完成状况。要避免出现此问题,请不要创建混用保护类型的恢复计划。该问题已解决。

  • 用户启用的警报未生成任何结果

    用户可以启用 已为虚拟机重新配置保护设置警报,但从未触发该警报。出现这种情况的原因是用户在此版本中无法编辑保护设置。要在 SRM 中跟踪用户对虚拟机设置所做的更改,管理员必须启用 已为虚拟机重新配置恢复位置设置警报。该问题已解决。

  • 用户尝试配置 vSphere Replication 失败

    具有管理特权的用户可能仍无法配置 vSphere Replication。这种情况通常是未授予 [VRM 数据存储映射器] > [视图]特权而导致的。该问题已解决。

  • 在恢复期间同步存储出错

    在极少数情况下,如果启用了同步,在执行 [同步存储] 步骤的过程中可能会出现以下错误消息: VRM 组 groupname 的 VR 同步失败。VRM 服务器一般错误。请查看文档了解任何故障排除信息。详细的异常为:“最优锁定失败”(VR synchronization failed for VRM group groupname. VRM Server generic error. Please check the documentation for any troubleshooting information. The detailed exception is: 'Optimistic locking failure')。在运行恢复计划期间需传输大量数据时(如要同步大量虚拟机和大量数据的组合)更可能出现此问题。该问题已解决。

  • 无法连接到 NFC 或在恢复期间出现复制错误

    在恢复期间,可能会出现以下错误消息:

     

    • 无法连接到 host 上的 NFC 服务 (Failed to connect to NFC service at host)。
    • 无法将文件 filePath 复制到 newFilePath: errorCode - errorMsg (Failed to copy file filePath to newFilePath: errorCode - errorMsg)。

     

    完成大量同时操作时会出现此错误。通常在以下情况下会出现此错误:

     

    • 如果恢复 40 个或更多使用 vSphere Replication (VR) 保护的虚拟机。
    • 如果在 ESX 3.5 主机上恢复 10 个或更多数据存储。
    • 如果运行大量恢复计划,而这些恢复计划对具有裸磁盘映射 (RDM) 磁盘的虚拟机会产生影响。通常在 4.x 主机上运行 20 个或更多恢复计划或者在 5.0 主机上运行 40 个或更多恢复计划时会出现这种情况。

     

    该问题已解决。

  • 虚拟机在复制配置失败后可供选择

    使用向导为多个虚拟机配置复制时,某些虚拟机可能配置不成功。尽管配置失败,但这些虚拟机仍作为选项列在 [创建保护组] 向导中。这是因为配置失败的信息未进行传达。该问题已解决。

  • 需要使用 IPv6 时,网络信息字段不能填充有效信息

    如果将 vSphere Replication 设备配置为仅使用 IPv6,则会出现以下问题:

     

    • 在虚拟设备管理基础架构 (VAMI) 启动页面上,vCenter Server 地址字段使用 IPv4 文字地址预先填充。此地址无法在纯 IPv6 设备中使用。要解决此问题,请编辑该字段并输入有效的 DNS 名称或 IPv6 文字地址。
    • 未预填充 [站点名称] 字段。通常情况下,会使用 vCenter Server 清单中设备的虚拟机名称预填充此字段。要解决此问题,请输入有效的站点名称。有效站点名称与对等站点的站点名称不同。

    该问题已解决。

     

  • 大型磁盘执行不必要的完全同步

    使用 vSphere Replication (VR) 保护的磁盘大于 256 GB 时,任何导致虚拟磁盘设备内部重新启动的操作都会致使磁盘完成完全同步。内部重新启动在以下情况下发生:

    • 重新启动虚拟机
    • 对虚拟机执行 vMotion
    • 重新配置虚拟机
    • 获取虚拟机的快照
    • 暂停并恢复复制

    完全同步由 ESX 启动,且对此问题的任何解决均涉及到 ESX 的更新。这些同步涉及到对受保护站点磁盘和恢复站点磁盘的其他 I/O,这通常需要多于恢复点目标 (RPO) 的时间,从而导致丢失 RPO 目标。该问题已解决。

  • 计划的迁移可能导致 ESX 主机速度下降

    在计划的迁移过程中,SRM 首先指示 ESX 主机卸载复制的数据存储,并分离备份这些数据存储的 LUN。接下来,SRM 指示存储阵列软件将已分离的 LUN 设为只读。此过程可帮助确保 ESX 主机上的设备不会遇到要迁移的数据存储和 LUN 的全部路径异常 (APD) 情况。迁移包含 RDM 的虚拟机可能会使 RDM LUN 进入 APD 状态。RDM 进入 APD 情况后,ESX 主机会继续重新尝试与丢失的 RDM LUN 建立连接。随着不可用的 RDM 数量的增加,ESX 主机尝试重新连接到丢失的 RDM 的次数也随之增加。如果这种情况继续出现,则 ESX 主机的响应速度可能会下降,最终 vCenter Server 可能会发现主机无响应。某些存储阵列更容易出现这种情况。例如,当 SRA 在每个 LUN 的 iSCSI 目标上支持 RDM 时,更容易出现这种情况。要解决这些问题,请重新引导 ESX 主机。该问题已解决。

    SRM 5.1 中的已知问题

    下列已知问题是通过严格测试而发现的,可帮助您了解在此版本中可能遇到的某些行为。

    • glibc 库中的漏洞允许执行远程代码

      glibc 中允许执行远程代码的漏洞可能会影响到 vSphere Replication 设备。

      解决办法:有关解决此问题的详细信息,请参见 http://kb.vmware.com/kb/2144289

    • 同时在多个 LUN 上运行恢复导致出错并超时。

      如果您拥有包含 50 到 255 个光纤通道 LUN 的大型 SRM 5.1.x 环境,并且同时在超过 50 个 LUN 上运行恢复,则可能会注意到与 LUN 相关的恢复超时、错误和失败问题,在某些情况下也会发现与虚拟机相关的此类问题。在某些情况下,可能必须运行恢复计划多次才能成功。不管是在单个恢复计划中还是在多个恢复计划中保护 LUN,都会出现此问题。

      解决办法:请参见 知识库文章 2059498

    • 在恢复过程中挂载数据存储时 SRM 可能遇到错误

      在测试恢复或实际故障切换过程中,SRM 会等待已恢复的数据存储恢复可用状态。数据存储变为可用后,SRM 尝试挂载任何未挂载的数据存储。在极少数情况下,这些数据存储会在 SRM 可对其进行挂载之前自动挂载。如果这种情况出现在测试故障切换过程中,则故障切换将不会完成。如果这种情况出现在实际恢复过程中,则恢复将完成,但出现错误。要解决此问题,请重试恢复。

    • vCenter Server 连接临时中断可能会导致具有裸磁盘映射的虚拟机出现恢复问题

      如果在恢复过程中与 vCenter Server 的连接中断,则可能会出现以下状况之一:

      • vCenter Server 仍不可用,恢复失败。要解决此问题,请重新建立与 vCenter Server 的连接并重新运行恢复。
      • 在极少数情况下,vCenter Server 可以再次使用且恢复虚拟机。在这种情况下,如果虚拟机具有裸磁盘映射 (RDM),则可能无法正确映射 RDM。由于无法正确映射 RDM,因此可能无法打开虚拟机电源,或者出现与客户机操作系统或在该客户机操作系统上运行的应用程序相关的错误。
        • 如果这是测试恢复,请完成清理操作并再次运行测试。
        • 如果这是实际恢复,则必须手动将正确的 RDM 附加到已恢复的虚拟机。

      有关添加裸磁盘映射的详细信息,请参见关于编辑虚拟机设置的 vSphere 文档。

    • 取消恢复计划未完成

      运行恢复计划时,会尝试同步虚拟机。可以取消恢复计划,但在同步完成或过期之前,无法完成尝试取消所运行的恢复计划的操作。默认过期时间为 60 分钟。以下选项可用于完成取消恢复计划:

      • 暂停 vSphere Replication,同步也将失败。恢复进入错误状况后,使用 vSphere Client 在 [vSphere Replication] 选项卡中重新启动 vSphere Replication。重新启动复制后,如果需要,可以再次运行恢复计划。
      • 等待同步完成或超时。这可能需要相当长的时间,但最终会完成。同步完成或过期之后,会继续取消恢复计划。

       

    • 有效证书生成警告

      上载证书并将其安装到 vSphere Replication 设备时,会出现以下错误:

      安装证书时显示警告。由于以下原因,启用了 [仅接受由可信 CA 签署的 SSL 证书] 选项的远程 VRM 系统可能无法连接到此站点:未颁发用于给定主机名的证书: VRM 主机名 (The certificate installed with warnings. Remote VRM systems with the 'Accept only SSL certificate signed by a trusted CA' option enabled may be unable to connect to this site for the following reason: The certificate was not issued for use with the given hostname: VRM hostname)

      可忽略此错误,或者您可以使用受支持的浏览器而非 Internet Explorer 来避免出现此错误。

    • 登录虚拟设备管理基础架构 (VAMI) 时不接受非 ASCII 密码

      用户可以使用 VAMI 管理 vSphere Replication 设备。使用密码为非 ASCII 字符的帐户尝试登录 VAMI 时失败。即使提供正确的身份验证信息,也会出现这种情况。在非 ASCII 密码与 VAMI 一起使用的所有情况下,都会出现该问题。要避免出现此问题,请使用 ASCII 密码或者使用 SSH 进行连接。

    • 数据存储不可用的情况下显示过期的复制状态

      虚拟机同步开始后,目标数据存储可能会不可用。在这种情况下,组状态应当显示有关此故障的信息,但状态仍保持不变。要确定与数据存储不可用相关的问题,请使用目标数据存储生成的事件。在这种情况下会生成以下事件:

      • VR 服务器无法访问数据存储...在数据存储无法访问后立即生成
      • 违反了虚拟机 vSphere Replication RPO...无法在指定的 RPO 中生成副本

     

  • 停止受保护虚拟机的数据存储复制会生成错误的错误消息

    可保护在多个数据存储上具有磁盘的虚拟机,随后禁用其中一个数据存储的复制。在这种情况下,保护组中虚拟机的状态将更改为 无效:虚拟机“VM”不再受保护。内部错误:无法为磁盘“2001”创建定位符... (Invalid: Virtual machine 'VM' is no longer protected. Internal error: Cannot create locator for disk'2001'...)此信息错误。状态应更改为 不再复制数据存储“[ datastore name]”(Datastore '[datastore name]' is no longer replicated)。

  • 由于磁盘配置错误,虚拟机恢复失败

    可以将单个受保护虚拟机的不同的磁盘和配置文件置于多个数据存储中。恢复期间,SRM 必须有权访问裸磁盘映射和父磁盘文件。如果不具有此访问权限,则 SRM 就无法在恢复期间确定磁盘类型。在这种情况下,SRM 可能会假定裸磁盘映射 (RDM) 磁盘是非 RDM 磁盘,从而导致重新配置失败。要避免出现此问题,请确保所有可访问已恢复虚拟机配置文件的主机也可以访问 RDM 映射文件及任何父磁盘(如果这类磁盘存在)。

  • 由于证书信任方法不同,配对站点失败

    配对 SRM 站点时,出现以下错误: 本地服务器和远程服务器使用不同的证书信任方法 (Local and Remote servers are using different certificate trust methods)。当 SRM 服务器上缺少签署证书的证书颁发机构 (CA) 的根证书时,会出现这种情况。要解决此问题,请使用 Microsoft 管理控制台为 SRM 证书的签署证书颁发机构安装根证书。安装此证书后,请执行 SRM 安装的修改操作以重新提供用户生成的证书。

  • 连接受保护站点失败后,恢复无法继续

    如果在取消激活操作期间或者在 RemoteOnlineSync 或 RemotePostReprotectCleanup 期间无法访问保护站点(在重新保护期间会同时出现这两种情况),则恢复计划可能无法继续。在这种情况下,系统会等待属于保护站点的虚拟机或组完成这些中断的任务。如果在执行重新保护操作期间出现该问题,则必须重新连接原始保护站点,然后取消并重新启动恢复计划。如果在恢复期间出现该问题,则取消并重新启动恢复计划即可。

  • vSphere Replication 设备无法支持有效的 ESX 主机

    在配置 vSphere Replication 的过程中,在受支持的 ESX 版本上选择数据存储时,会显示以下消息: VR 服务器 Server Name 不具有可用于访问目标数据存储的主机... (VR server Server Name has no hosts through which to access destination datastore...)。向 vCenter Server 中添加新主机时或注册 vSphere Replication 服务器期间,如果 vSphere Replication 设备与 vSphere Replication 服务器之间的通信暂时中断,则将发生此问题。通信问题通常是由连接暂时中断或服务器服务停止引起的。

    要解决此问题,请重新启动 vSphere Replication 管理服务器服务。

    1. 登录到 vSphere Replication 设备的虚拟设备管理界面 (VAMI),地址为 https://vr_applliance_address:5480。
    2. 单击 [服务状态] 下的 [配置] > [重新启动]
     
  • 在启用了 Distributed Power Management (DPM) 的群集上卸载数据存储失败

    如果连接到 DPM 群集的主机进入待机模式,则计划的迁移和灾难恢复无法从主机中卸载数据存储。可能会显示以下错误消息: 错误:无法从主机 hostname 卸载数据存储 datastorename。远程主机已断开连接,无法进行通信 (Error: Cannot unmount datastore datastorename from host hostname. Unable to communicate with the remote host, since it is disconnected)。要解决此问题,请在完成计划的迁移或灾难恢复之前关闭受保护站点中的 DPM。可以选择在完成恢复任务后重新打开 DPM。

  • 使用未指定的网络配置部署的 vSphere Replication 服务器发生故障

    vSphere Replication 服务器是使用 OVF 部署向导从 OVF 文件进行部署的。部署向导包含一个用于指定 vSphere Replication 服务器的网络配置的页面。如果未为网络配置指定任何网络设置,则会使用 DHCP 寻址,但 vSphere Replication 服务器不支持 DHCP 寻址。要避免出现此问题,请在部署期间为 vSphere Replication 服务器指定有效的网络设置。

  • 由于证书策略严格而导致服务器配对失败时会显示一般错误消息

    尝试在站点之间为服务器配对可能失败,并显示以下错误消息: 站点配对或断开操作失败。详细信息:VRM 服务器一般错误 (Site pairing or break operation failed. Details: VRM 服务器 generic error)。当一个站点配置为使用严格的证书策略,而另一个站点配置为使用宽松的证书策略时,可能会出现此错误。在这种情况下,配对将失败,如上文所述。配对失败后,请修改宽松的证书策略以使用严格的证书策略,并提供有效的证书。

  • 在恢复站点上的文件夹名称中包含百分号 (%) 会在复制过程中创建新文件夹。

    如果您在恢复站点上的文件夹名称中包含百分号 (%),并尝试向该文件夹配置复制,则可能会在不正确的文件夹中通过其他编码创建该复制。例如,如果您创建文件夹 %3dTest,vSphere Replication 会创建新文件夹 %253dTest 并将复制置于此新文件夹中。

  • 无法在 Internet Explorer 7 中访问上下文相关帮助。

    请参见 知识库文章 1009801

  • SRM 在 RDM 故障后无法恢复虚拟机。

    裸磁盘映射 (RDM) LUN 可能会失败,而支持数据存储的 LUN 不受影响。在这种情况下,SRM 无法通过 RDM 恢复虚拟机。

    解决办法:手动恢复受影响虚拟机。在已恢复虚拟机上对 RDM LUN 执行故障切换并将其重新附加为 RDM 磁盘。

  • 在 Windows XP 或 Windows 2003 上运行 SRM 客户端插件时,vSphere Replication 设备状态为 [已断开连接]。

    在 Sphere Replication 站点的 [摘要] 选项卡中,vSphere Replication 设备的状态显示为 [已断开连接]。尝试重新配置连接会导致出现以下错误: server_address:8043 中的本地 VRMS 服务器失去连接。(该客户端无法向服务器“server_address”发送完整请求。(基础连接被关闭:发送时出现意外错误)) (An unknown connection error occurred. (The Client could not send a complete request to the server. (The underlying connection was closed: An unexpected error occurred on a send)))。因为 SRM 客户端插件在旧版本 Windows 上运行时,SRM 客户端插件和 vSphere Client 无法协商密码,所以会出现此问题。如果您在 Windows XP 64 位或 Windows Server 2003 SP2 上运行 vSphere Client 桌面版本和 SRM 客户端插件,则服务器与客户端密码支持之间可能出现不兼容问题。

    解决办法:从 Microsoft 知识库文章 948963 下载并安装 Microsoft 修补程序。此修补程序不适用于任何定期 Windows 更新,因此必须手动下载并应用该修复程序。

  • 完成恢复需要很长时间,重新保护会失败并显示以下错误: 无法检查登录凭据。身份验证服务基础架构失败 (Cannot check login credentials. Authentication service infrastructure failed)。

    发生这个错误是因为 Windows 2003 Server 上运行的 vCenter Server 中的极短端口耗尽。SRM Server 无法与 vCenter Server 通信。

    解决办法:

    1. 知识库文章 979230 安装 Microsoft 修补程序,以修复 tcpip.sys 驱动程序中的问题。
    2. 通过手动进行更改或导入以下 .reg 文件来设置以下 regedit 值: Windows 注册表编辑器 5.00 版 [HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters] "MaxUserPort"=dword:00002710 "TcpTimedWaitDelay"=dword:0000001E
    3. 如果注册表值不存在,请创建这些值。
    4. 进行更改后重新启动 Windows 2003 Server 计算机。

     

  • 关闭受保护虚拟机时恢复计划出错: 错误 - 操作已超时: 900 秒,在?关闭受保护站点中的虚拟机?步骤期间 (Error - Operation timed out: 900 seconds during Shutdown VMs at Protected Site step)。

    如果在支持动态交换的阵列(如 Clariion)上使用 SRM 保护数据存储,则在受保护站点部分关闭后运行灾难恢复时或运行强制恢复计划时,重新运行该恢复计划以完成受保护站点操作可能会出现错误。在受保护站点恢复联机但 SRM 无法关闭受保护的虚拟机时,会出现上述错误。通常,当某些阵列将受保护 LUN 设置为只读,从而使 ESXi 无法完成已打开电源的受保护虚拟机的 I/O 时,会出现该错误。

    解决办法:重新引导受保护站点上受只读 LUN 影响的 ESXi 主机。

  • 在负载繁重的环境中生成支持捆绑包可能会中断正在进行的 vSphere Replication 操作。

    在负载繁重的环境中生成支持捆绑包可能导致 vSphere Replication 在恢复操作过程中出现连接问题。如果 vSphere Replication 虚拟机的存储过载,特别容易出现此问题。

    解决办法:如果某操作因 vSphere Replication 服务器被支持捆绑包生成阻止而未能启动,请尝试重新运行该操作。重新评估群集的预期存储带宽要求以及网络带宽(如果存储为 NAS)。

  • 重新运行重新保护失败,并出现错误消息: 保护组 {protectionGroupName} 已通过需要修复的占位保护虚拟机 (Protection Group '{protectionGroupName}' has protected VMs with placeholders which need to be repaired)。

    如果 ReloadFromPath 操作在第一次重新保护期间没有成功,则相应的受保护虚拟机将进入 repairNeeded 状态。当 SRM 对保护组运行重新保护时,SRM 既无法修复受保护的虚拟机,又无法还原占位虚拟机。如果由于相应的 ReloadFromPath 操作失败而使首次对虚拟机执行重新保护操作失败,则会出现该错误。

    解决办法:启用 [强制清理] 选项并重新运行重新保护。此选项将完成重新保护操作,并启用 [重新创建占位] 选项。单击 [重新创建占位] 以修复此受保护虚拟机并还原占位虚拟机。

  • 保护虚拟机任务似乎停留在 100%。

    在执行 [保护虚拟机] 任务期间,VI Client 的 [近期任务] 窗格会显示虚拟机停留在 100%。SRM 会将该虚拟机标记为 [已配置],表示该虚拟机已受保护。由于 SRM 已成功保护该虚拟机,因此不需要采取任何措施。

  • 如果在维护模式下重新启动恢复站点 ESXi 主机后 10 分钟内尝试清理,则清理会失败。

    该清理操作将尝试交换占位符,并使用主机弹性缓存,该缓存的刷新时段为 10 分钟。如果您对已在这 10 分钟内重新启动的 ESXi 主机执行交换操作,则 SRM 不会更新 SRM 主机弹性缓存中的信息,并且该交换操作将失败。该清理操作也会失败。

    解决办法:请等待 10 分钟,然后再尝试清理。

  • 在尝试使用 vSphere Replication 来保护已受到重新保护的基于阵列的虚拟机时,SRM 将停止。

    如果您运行恢复,并尝试使用 vSphere Replication 来保护已受基于阵列的保护组保护的虚拟机,则 SRM Server 会停止。

    解决办法:重新启动 SRM Server,并在使用 vSphere Replication 进行保护之前先取消保护基于阵列的受保护虚拟机。或者,也可以继续进行基于阵列的保护,而不使用 vSphere Replication 进行保护。SRM 不支持同时使用这两种提供程序来执行保护。

  • 重新保护失败,并出现错误消息: 操作已超时:3600 秒,VR 同步对于 VRM 组 <Unavailable> 失败。操作已超时: 3600 秒 (Operation timed out: 3600 seconds VR synchronization failed for VRM group <Unavailable>. Operation timed out: 3600 seconds.)。

    运行重新保护时,SRM 将对操作可能已超时的复制组执行联机同步。默认超时值为 2 小时。

    解决办法:在 SRM 的 [高级设置] 中增加此超时值。

  • 无法配置具有物理模式 RDM 磁盘的虚拟机,即使从复制中排除该磁盘也是如此。

    如果您为采用物理模式的虚拟机配置复制,可能看到以下错误:

    VRM 服务器一般错误。查看文档了解任何故障排除信息。详细的异常为:HMS 无法为虚拟机的磁盘设置磁盘 UUID:MoRef:类型 = VirtualMachine,值 = ,服务器 Guid = null' (VRM Server generic error. Check the documentation for any troubleshooting information. The detailed exception is: HMS can not set disk UUID for disks of VM : MoRef: type = VirtualMachine, value = , serverGuid = null'.)。

    解决办法:无。

  • 计划的迁移失败,并出现错误消息: 无法复制配置文件... (Error: Unable to copy the configuration file...)

    如果在群集中有两个 ESXi 主机,并且其中一个主机与存储断开连接,则另一个主机通常可以恢复已复制的虚拟机。在某些情况下,另一个主机可能无法恢复虚拟机,恢复失败并出现以下错误: 错误:无法复制配置文件... (Error: Unable to copy the configuration file...)

    解决办法:重新运行恢复。

  • 重新保护虚拟机时,在执行“将保护配置为反向”步骤期间可能会出现以下错误: 错误 - 该操作对于保护组損g_name?仅部分完成,因为一个属于保护组的受保护虚拟机未成功完成操作。VR 未对虚拟机搗m_name?进行复制 (Error - The operation was only partially completed for the protection group 'pg_name' since a protected VM belonging to it was not successful in completing the operation. VM 'vm_name' is not replicated by VR.)。

    如果在执行“将存储配置为反向”步骤期间第一次运行重新保护失败并出现 操作已超时 (Operation Timed out) 错误,则在第二次运行重新保护时会出现上述错误。

    解决办法:手动为受影响的虚拟机配置反向复制,然后重新运行重新保护。有关反向复制的信息,请参见 vSphere Replication 管理:在 vSphere Replication 中对虚拟机进行故障恢复

  • vSphere Replication 无法通过配置有多个管理虚拟网卡的主机访问数据存储,并在 vCenter Server 中发布 DatastoreInaccessibleEventvSphere Replication 无法访问数据存储 (vSphere Replication cannot access datastore)

    如果主机配置有多个虚拟网卡,并且为管理流量选择了多个网卡,则 vSphere Replication 将只注册第一个网卡并用它来访问目标数据存储。如果 vSphere Replication 服务器地址不在主机的第一个管理网络上,则 vSphere Replication 将不会与主机通信。

    解决办法:在主机中为管理流量只选择一个虚拟网卡用于辅助站点中的数据存储。您也可以重新配置主机网络,以便第一个管理虚拟网卡的地址位于 vSphere Replication 可以访问的网络中。

  • 由于出现未决问题,虚拟机无法关闭电源。

    如果您通过将启动器从 SAN 丢弃到已注册该虚拟机的主机而有意或无意地创建了一个永久设备丢失 (PDL) 状况,则可能会出现以下错误:

    错误:当前时间无法允许该操作,因为该虚拟机有一个未解决的问题... (Error: The operation cannot be allowed at the current time because the VM has a question pending...)

    如果在测试恢复模式下运行恢复计划后运行清理时,在 PDL 期间恢复站点上的硬件出现故障,则会出现上述错误。

    解决办法:解决该虚拟机的 [摘要] 选项卡中的问题。然后在强制清理模式下重新运行清理。清理操作完成后,虚拟机可能仍位于恢复站点中,此时,请手动移除它。

  • 运行恢复期间,SRM 5.0 版可与已升级的 SRM 服务器 5.1 版进行通信。

    如果您将恢复站点从 5.0 版升级至 5.1 版,并在升级的站点中尝试灾难恢复,则受保护站点中的 SRM 服务器 5.0 版和恢复站点中的 SRM 服务器 5.1 版可以彼此进行通信,并可对受保护站点执行操作。如果在升级受保护站点之前运行重新保护操作,则该操作将运行很长时间而没有任何响应。

    在升级的站点上运行恢复之前,请停止所有仍在远程站点中运行的 SRM 5.0 服务。否则,具有不兼容版本的 SRM 服务器仍然能彼此进行通信。

  • 恢复过程出现内部错误。

    SRM 将在恢复过程中检索来自 vCenter 的各种信息。如果它不接收继续运行所需要的关键信息,则可能会出现内部错误 CannotFetchVcObjectProperty。 如果 vCenter 处于高度紧张状态或 ESXi 主机因高度紧张状态而不可用,则可能会出现该错误。当 SRM 尝试查找某一 ESXi 主机的信息,而该主机已断开连接或已从 vCenter 清单中移除时,也可能会出现该错误。

    解决办法:重新运行恢复计划。

  • 虚拟机虚拟网卡的 MAC 地址在恢复过程中通常会保留。

    在极少数情况下,测试或恢复可能无法恢复某一特定虚拟机,因为 vCenter 会在恢复站点上为该虚拟机的虚拟网卡意外地分配一个新的 MAC 地址。恢复步骤的结果列将出现以下错误消息: 错误消息 - 无法完成自定义,可能是由于脚本编制运行时错误或脚本参数无效 (错误代码:255). 可能已部分应用 IP 设置 (Error - Cannot complete customization, possibly due to a scripting runtime error or invalid script parameters (Error code: 255). IP settings might have been partially applied.)。SRM 日志包含一条消息: Error finding the specified NIC for MAC address = xx::xx:xx:xx:xx,其中 xx::xx:xx:xx:xx 是预期的 MAC 地址。

    解决办法:在 vSphere Client 虚拟机的 [属性] 中,手动将受影响虚拟机的 MAC 地址修改为“xx::xx:xx:xx:xx”,然后重新启动恢复计划。

  • 在注册 vSphere Replication 服务器时,vSphere Replication 将针对添加到 vCenter Server 清单中的主机上的数据存储报告“无法访问数据存储 (Datastore is not accessible)”的消息。

    vSphere Replication 将从 vCenter 清单中选择所有受支持的主机,并在 vSphere Replication 注册过程中启用它们。如果在 vSphere Replication 注册仍在运行时向 vCenter 中添加主机,则 vSphere Replication 将不会选择该主机,并且它将无法访问恢复站点上的数据存储。

    解决办法:断开并重新连接 vCenter 清单中的主机,以使 vSphere Replication 能够启用它。

  • 同步虚拟机、恢复或重新保护操作失败,并显示 vSphere Replication 一般错误: 在远程站点上未找到具有 Id=<...> 的请求实例 (The requested instance with Id=<...> was not found on the remote site)。

    尽管该操作报告失败,但 vSphere Replication 仍会成功将虚拟机状况与远程站点同步。在请求同步操作或运行主要操作(例如,使用该操作的恢复或重新保护)时,会出现该错误。

    解决办法:重新运行失败的操作。

  • 恢复的 VMFS 卷无法挂载,并出现错误消息: 无法恢复数据存储 (Failed to recover datastore)。

    出现该错误的原因可能是 vCenter、ESXi 和 SRM Server 之间出现滞后时间。

    解决办法:重新运行恢复计划。

  • 根据 vCenter Server 清单中的主机数量,vSphere Replication 服务器注册过程可能需要很长时间。

    如果 vCenter Server 清单包含上百台主机,则 [注册 VR 服务器] 任务将需要一个小时或更长时间才能完成,因为 vSphere Replication 需要更新每台主机的 SSL 指纹注册表。在执行 vSphere Replication 服务器注册任务时,vCenter Server [事件] 窗格将针对每台主机显示 [已配置主机用于 vSphere Replication]

    解决办法:等待注册任务完成。完成后,您可以使用 vSphere Replication 处理入站复制流量。

  • vSphere Replication 注册可能会失败,并出现错误消息: VRM 服务器一般错误 ...行已由其他事务更新或删除 ...HostEntity #<host-managed-object-id> (VRM server generic error ... Row was updated or deleted by another transaction ... HostEntity #<host-managed-object-id>)。

    如果 vCenter Server 清单包含大量主机,则在注册期间执行以下操作时, [注册 VR 服务器] 操作可能会失败,并显示该错误:

    • 从 vCenter Server 清单中移除主机。
    • 从清单中移除和重新连接主机。
    • 更改主机的 SSL 指纹。

    解决办法:重试 [注册 VR 服务器] 操作。

     

  • 测试恢复、计划的迁移或重新保护工作流操作可能失败,并出现错误消息: 操作已超时。

    在多个主站点运行多项操作时,会出现该错误。

    解决办法:重新运行失败的操作。

  • 虚拟机的恢复或测试工作流失败,并出现以下错误: 错误 - 与 ESX 或客户机虚拟机通信时出现意外错误“3008”:无法连接到虚拟机 (Error - Unexpected error '3008' when communicating with ESX or guest VM: Cannot connect to the virtual machine)。

    在极少数情况下,当配置 IP 自定义或虚拟机在客户机内的标注时,如果恢复站点群集处于全自动 DRS 模式,则会出现该错误。意外的 vMotion 可能会导致与虚拟机的通信暂时失败,从而出现自定义脚本错误。

    解决办法:重新运行恢复计划。如果该错误仍然存在,请将恢复站点群集 DRS 配置为手动模式,然后再重新运行恢复计划。

  • 某些由 SRM 启动的任务失败,这些任务会显示 NoPermission 错误,此外,还会显示 内部错误:vim.fault.NoPermission (Internal Error: vim.fault.NoPermission)而不是 执行该操作的权限被拒绝 (Permission to perform this operation was denied)。

    vSphere Client 将断言镜像的任务通过 MoRef 引用的对象是否为非 vCenter Server 或 SRM 对象。

    解决办法:如果失败的 SRM 任务是恢复任务,请查看恢复任务窗格,以获取更具体的错误信息。有关 vCenter Server 任务失败的信息,请参见子任务以获取更多信息。

  • 对面向多个远程站点的多个虚拟机执行重新保护操作失败,并出现错误消息: 无法撤消复制虚拟机 vm_name。操作已超时 (Unable to reverse replication for the virtual machine vm_name. Operation timed out)。

    vSphere Replication 在重新保护面向多个远程站点的多个虚拟机时将停止响应 SRM 请求。

    解决办法:更改一些 vSphere Replication 参数:

    1. 停止 vSphere Replication 管理服务器: /etc/init.d/hms stop
    2. 编辑 /opt/vmware/hms/conf/hms-configuration.xml,并将 hms-db-max-connections 从 99 更改为 500。
    3. 编辑 /var/lib/vrmsdb/postgresql.conf,并将 max_connections 从 100 更改为 501。
    4. 重新启动嵌入式 vPostgres 数据库: /etc/init.d/hms-vpostgres stop /etc/init.d/hms-vpostgres start
    5. 更改 hms-vlsi-server 线程池大小: /opt/vmware/vpostgres/1.0/bin/psql -U vrmsdb vrmsdb update ConfigEntryEntity set configValue='250' where configKey = 'hms-vlsi-server-threadpool-size'
    6. 增加 vSphere Replication 管理服务器进程的堆:编辑 /etc/init.d/hms,并在 JAVA_TOOL_OPTIONS 中添加 -Xmx1536M
    7. 启动 vSphere Replication 管理服务器: /etc/init.d/hms start
    8. 重新运行失败的操作。

     

  • 由 vSphere Replication 保护的虚拟机的 [上次同步大小] 值是指自上次同步后发生更改的数据量。

    即使对 vSphere Replication 所保护的虚拟机执行完全同步,[上次同步大小] 值仍会显示自上次同步后发生更改的数据量,而不是完整虚拟机容量。而这可能会被误解为同步未完成。首次同步之后,在对虚拟机进行完全同步期间,vSphere Replication 将比较整个磁盘,但只传输已更改的数据,而不是整个磁盘。

    要查看首次同步的大小和持续时间,您可以查看 vSphere Replication 发布到 vCenter Server 的事件。此问题仅会在 ESXi 5.0.x 主机上出现。已在 ESXi 5.1 主机上对此行为进行了明确说明。

  • 如果主机清单最近发生更改,则恢复或测试恢复可能会失败,并出现错误消息: 已打开电源且不处于维护模式的主机(具有硬件版本“7”和数据存储“ds_id”)不可用... (No host with hardware version '7' and datastore 'ds_id' which are powered on and not in maintenance mode are available...)

    SRM Server 会保留主机清单状况的缓存。有时,当清单最近发生更改(例如,主机无法访问、断开连接或与某些数据存储失去连接)时,SRM Server 可能需要长达 15 分钟才能更新其缓存。如果 SRM Server 缓存中的主机清单状况不正确,则恢复或测试恢复可能会失败。

    解决办法:如果您对主机清单进行了更改,请先等待 15分钟,再运行恢复。如果出现以上错误,请等待 15 分钟,然后再重新运行恢复。

  • 重新保护失败,并出现错误消息: 远程主机已断开连接,无法与之进行通信 (Unable to communicate with the remote host, since it is disconnected)

    出现此错误的原因可能是,受保护端的群集已配置为使用 Distributed Power Management (DPM),并且该操作所需的 ESX 主机之一已置于待机模式。如果 DPM 检测到主机已闲置并将其置于待机模式,则可能发生这种情况。SRM 必须与该主机进行通信,才能访问该主机所管理的已复制数据存储。SRM 不会管理受保护站点的 DPM 状况,但是,它会管理在恢复站点执行恢复、测试和清理期间的 DPM 状况。

    解决办法:如果该错误仍然存在,请暂时关闭 DPM 并确保已打开管理受保护端的已复制数据存储的 ESX 主机,然后再尝试运行重新保护。

  • 如果其中一个主机与占位数据存储的连接丢失,则测试恢复清理可能会失败。

    如果您在恢复站点上对包含两个主机的群集运行测试恢复,而该群集中的一个主机与占位数据存储的连接丢失,则测试恢复清理可能会失败。

    解决办法:在强制模式下运行清理。在恢复站点上,手动移除在与占位数据存储丢失连接的主机上创建的占位虚拟机。移除虚拟机复制配置并重新配置复制。使用保护组属性重新配置虚拟机保护。

  • 同时运行多个恢复计划时,重新保护会失败并出现错误。

    同时运行多个恢复计划时,重新保护可能会失败,并出现错误消息: 错误 - 该操作对于保护组“protection_group”仅部分完成,因为一个属于保护组的受保护虚拟机未成功完成操作 (Error - The operation was only partially completed for the protection group 'protection_group' since a protected VM belonging to it was not successful in completing the operation)

    解决办法:重新运行重新保护操作。

  • 重新启动 vCenter Server 后,使用 vSphere Replication 时,重新保护操作失败,并出现错误消息: 无法撤消复制虚拟机“ virtual_machine”(Error - Unable to reverse replication for the virtual machine 'virtual_machine')。该会话未进行身份验证。

    在 vCenter Server 重新启动后,它无法刷新 SRM 用于与 vSphere Replication 进行通信的某些会话,并导致重新保护失败。

    解决办法:在这两个站点上重新启动 SRM 服务。

  • 在某些情况下,当保护站点 LUN 遇到全部路径异常 (APD) 或永久设备丢失 (PDL) 时,SRM 可能无法恢复裸磁盘映射 (RDM) LUN。

    在首次尝试计划的迁移时,如果 SRM 尝试关闭受保护的虚拟机,则可能会显示以下错误消息:

    错误 - 当前时间无法允许该操作,因为该虚拟机有一个未解决的问题: 'msg.hbacommon.askonpermanentdeviceloss: 为虚拟磁盘 VM1-1.vmdk 提供支持的存储永久丢失了设备。您可以在单击 [重试] 后从虚拟机热移除此虚拟设备并继续。单击 [取消] 可终止此会话 (Error - The operation cannot be allowed at the current time because the virtual machine has a question pending: 'msg.hbacommon.askonpermanentdeviceloss:The storage backing virtual disk VM1-1.vmdk has permanent device loss. You might be able to hot remove this virtual device from the virtual machine and continue after clicking Retry. Click Cancel to terminate this session)

    在某些情况下,如果受保护虚拟机具有 RDM 设备,则 SRM 不会恢复 RDM LUN。

    解决办法:

    1. 当 LUN 进入 APD/PDL 状态后,ESXi Server 会使用一个问题来标记所有相应虚拟机,而该问题可能会阻止虚拟机操作。
      1. 如果出现 PDL,请单击 [取消] 关闭虚拟机电源。
      2. 如果出现 APD,请单击 [重试]

      如果您运行计划的迁移,SRM 将无法关闭生产虚拟机的电源。
    2. 如果虚拟机具有 RDM 设备,则 SRM 可能无法跟踪 RDM 设备,并且不会对其进行恢复。重新扫描所有 HBA,并确保所有受影响的 LUN 的状态均已从 APD/PDL 状况中恢复。
    3. 检查 vCenter Server 清单并解决阻止虚拟机的 PDL 问题。
    4. 如果在 LUN 恢复联机前解决 PDL 问题,则受保护站点上的 SRM Server 会错误地检测到 RDM 设备已不再附加到此虚拟机,并会移除此 RDM 设备。下次运行恢复时,SRM 将不会恢复该 LUN。
    5. 重新扫描所有 HBA 以确保 vCenter Server 清单上的所有 LUN 均处于联机状态,并打开所有受影响虚拟机的电源。vCenter Server 会将丢失的 RDM 与受保护虚拟机相关联。
    6. 检查 SRM 界面上的 [阵列管理器] 选项卡。如果所有受保护的数据存储和 RDM 设备均未显示,请单击 [刷新] 以发现设备并重新计算数据存储组。
    7. 确保 [编辑组设置] 显示所有受保护的数据存储和 RDM 设备,并且虚拟机保护状态未显示任何错误。
    8. 启动一个计划的迁移来恢复所有受保护的 LUN,包括 RDM 设备。
  •  
  • 恢复失败并显示以下错误消息: 为组创建测试泡状映像时出错... (Error creating test bubble image for group...)详细的异常为: 为数据存储获取主机挂载时出错: managed-object-id... (Error while getting host mounts for datastore: managed-object-id...)此对象已被删除或尚未完全创建 (The object has already been deleted or has not been completely created)。

    如果您正在运行测试恢复或计划的恢复,而该恢复计划失败并出现特定异常,则表示用于存储复制数据的 LUN 已临时与 ESXi 断开连接。重新连接后,复制将继续照常运行,并且不会丢失任何复制数据。在以下情形下将发生此异常:

    • vSphere Replication 找不到 LUN,因为此 LUN 已更改其内部 ID。
    • 如果将包含目标数据存储的主机从 vCenter 清单中移除并稍后添加它,则该目标数据存储内部 ID 将发生更改。

    您必须手动重新配置复制以刷新此新 ID。

    解决办法:如果主站点不再可用,请联系 VMware 技术支持以获取有关在 vSphere Replication 设备数据库中添加特殊配置条目,以便自动修复发生更改的内部数据存储 ID,从而允许执行恢复的说明。如果主站点仍然可用:

    1. 在已失败的恢复计划上执行清理操作。
    2. 在 vSphere Replication 视图的 [虚拟机] 选项卡中,右键单击一个虚拟机,然后选择 [配置复制]
    3. 单击 [下一步],然后单击 [浏览] 更改已断开但随后又重新连接的数据存储上的文件位置,并像往常一样选择相同的数据存储和文件夹位置。
    4. 重用现有磁盘并重新配置虚拟机的复制。vSphere Replication 管理服务器会发现 vCenter Server 中已更改的数据存储标识(受管对象 ID)。
    5. 等待初始同步完成。此同步将使用现有磁盘并检查数据一致性。

     

  • 在修改模式下从命令行中使用选项 CUSTOM_SETUP 运行 SRM 安装程序导致出现错误。

    如果您使用 CUSTOM_SETUP 选项安装了 SRM(例如,创建一个共享恢复站点设置),则尝试在修改模式下从命令行中使用选项 CUSTOM_SETUP 运行 SRM 安装程序将导致出现以下错误: 当标准安装已存在时,不支持 CUSTOM_SETUP 命令行 (CUSTOM_SETUP command line not supported when standard installation already exists)

    解决办法:使用 Windows 控制面板在修改模式下启动 SRM 安装程序。

  • 如果 ESXi Server 与受保护站点上的 vCenter Server 断开连接,则执行计划的迁移期间 SRM 将意外停止。

    如果受保护站点上的 ESXi Server 与 vCenter Server 断开连接,或者由于出现问题而丢失与 vCenter Server 的连接,则当您尝试执行计划的迁移时 SRM 将意外停止。计划的迁移将失败并显示一个错误。

    解决办法:重新连接 ESX Server。