如何在 vCenter 中配置和使用 vSphere Fault Tolerance(FT)来保证虚拟机的连续可用性?

问题浏览数Icon
11
问题创建时间Icon
2025-05-26 06:43:00
回答 | 共 4 个
作者头像
moonhawk88

在vCenter中配置vSphere Fault Tolerance(FT),需满足硬件兼容性,通过右键虚拟机选择‘Fault Tolerance’→‘启用’,配置网络后自动生成辅助虚拟机。延伸知识点:FT的日志记录与回放机制。FT通过vLockstep技术实现主备虚拟机同步,主虚拟机将非确定性事件(如中断、I/O)以日志形式通过专用网络通道实时传输至辅助虚拟机,辅助机严格按相同顺序执行,确保状态一致。若主虚拟机故障,备用机立即接管且无数据丢失,此过程依赖低延迟网络(建议<10ms)及专用日志通道的带宽保障。

作者头像
skyhunter66
  1. 前提条件检查

    • 确认主机硬件兼容性:CPU需支持vSphere FT(Intel VT-x或AMD-V RVI),并在BIOS中启用。
    • 确保主机间网络延迟≤10ms,带宽≥1Gbps,并配置专用FT日志网络(VMkernel端口)。
    • 虚拟机必须存储在共享存储(如VMFS/NFS),且不依赖本地磁盘。
    • 关闭虚拟机快照/挂起状态,移除不支持FT的设备(如USB直通)。
  2. 启用FT配置

    • 在vCenter中右键目标虚拟机 → 选择“Fault Tolerance” → “启用FT”。
    • 选择辅助虚拟机位置:建议跨不同物理主机(通过DRS规则限制)。
    • 验证存储策略:辅助虚拟机文件需与主虚拟机存储在同一数据存储中。
  3. 网络优化

    • 为FT日志流量创建独立VMkernel适配器,启用“Fault Tolerance日志记录”服务。
    • 使用多网卡绑定(NIC Teaming)提高FT日志通道冗余。
  4. 运行监控与维护

    • 通过vCenter监控FT状态:“Summary”页显示“Protected”表示正常。
    • 定期测试故障切换:手动关闭主虚拟机,验证辅助虚拟机自动接管(业务中断≤1秒)。
    • 执行维护前需先关闭FT:右键虚拟机 → “Fault Tolerance” → “暂时禁用FT”。

常见问题处理

  • FT无法启用:检查/var/log/vmkernel.log,常见于CPU兼容性(需EVC模式统一)或存储访问异常。
  • Secondary VM停滞:重启主虚拟机所在主机的ftcd服务(service ftcd restart)。
  • 网络抖动告警:通过esxcli network nic get -n vmnicX 检测物理网卡丢包率。
作者头像
yunshang11

是否考虑过使用vSphere High Availability (HA)来实现虚拟机的高可用性?它可以在主机故障时自动重启虚拟机,适用于更多场景且资源消耗更低。

作者头像
windpath77

在vCenter中配置vSphere Fault Tolerance(FT)需遵循以下步骤:

  1. 前提条件

    • 确保集群主机使用相同CPU品牌(Intel/AMD)且支持FT,ESXi版本需兼容。
    • 虚拟机需满足:单vCPU(vSphere 6.0后支持多vCPU)、厚置备磁盘、无快照或USB设备。
    • 配置专用FT日志网络(至少1 Gbps,延迟<10ms)并启用vMotion。
  2. 配置流程

    • 网络:在vSwitch中为FT日志分配独立VMkernel端口,确保主备主机间通信。
    • 启用FT:右键目标虚拟机 > 故障容错 > 启用,系统自动验证配置并生成辅助虚拟机。
    • 存储:主备虚拟机需访问共享存储(如VMFS/NFS),避免单点故障。
  3. 运行与维护

    • 实时监控FT状态(通过vCenter“监控”标签),确保“受保护”状态。
    • 主虚拟机故障时,辅助副本自动接管(RTO≈0),需及时修复原主机并重新启用FT。
    • 升级ESXi或虚拟机硬件前需临时关闭FT,避免同步中断。

注意事项

  • FT对I/O密集型应用可能产生性能损耗(实时数据复制)。
  • 确保集群至少两台主机且资源充足,避免资源争用导致FT中断。
  • 定期测试故障切换,验证业务连续性有效性。