【vsphere高可用】虚拟机的重置和重启

重置和重启不一样,重置指的是重新引导客户机操作系统

一、重新启动虚拟机要考虑的因素:

发生故障后,首选主机会通过考虑下列因素选择一个活动的从属主机用于启动故障主机上的虚拟机:

1、文件访问性。活动群集中的主机要能访问虚拟机文件;

2、虚拟机与主机的兼容性。包括任何所需虚拟机-主机关联性规则的影响。

3、资源预留。至少有一个主机具有足够的未预留容量(未预留他用的资源)以满足虚拟机的内存开销及任何资源预留。考虑4种类型的预留:cpu、内存、v NIC和虚拟闪存(此外必须要有足够的网络端口)。

4、主机限制。一个虚拟机只能放置在一台主机上。

5、功能限制。包括已设置需要vsphere ha强制执行“虚拟机-虚拟机反关联性规则(不能同时存在)”的高级选项;包括为容错虚拟机配置的任何每主机限制。

如果没有任何主机满足上述因素,则首选主机会发布一个时间指出没有足够的资源让vsphere ha来启动虚拟机,但会在群集状况发生更改时进行重试(重新选择)。

二、虚拟机重新启动次数限制

如果vsphere ha主代理重新启动虚拟机失败,将会在延迟一段时间后重试。Vsphere ha的最大重启次数默认是6次,但并不是所有的重启失败都根据此最大值来计算:

1、默认情况根据最大值重启:当重启失败后,主代理会在上次尝试后所实施延迟的两倍时间后进行重试,最少延迟1分钟,最多延迟30分钟。例如,延迟时间设为1分钟且在t=0开始尝试,则重试的时间点是t=1,t=3,t=7,t=15,t=30;

2、不同重启失败的情况,具有不同的延迟间隔。例如当选择重新启动虚拟机的主机在主代理做出选择后失去对某个虚拟机数据存储的访问权限时,会在默认延迟2分钟后重试,最大次数限制值为6。

3、有些情况下不会进行计数。例如,如果要重新启动虚拟机的主机在主代理发出重新启动请求之前发生故障,则会在2分钟后重试,但不会进行计数。

三、如何确定虚拟机需要重置?

“虚拟机监控”启用后,虚拟机监控服务(使用vmware tools)通过检查正在客户机内运行的vmware tools进程的常规检测信号和i/0活动来评估群集内的每个虚拟机是否正在运行。

如果没有收到检测信号或i/o活动,则有可能客户机操作系统出现故障,或为分配给vmware tools用来完成任务的时间。有时,仍然工作的虚拟机或应用程序会停止发送检测信号。为了避免不必要的重置,虚拟机监控服务还要监控虚拟机的i/o活动,如果故障时间间隔内未收到任何检测信号,则会检查i/o统计间隔(群集级别属性)。i/o统计间隔确定在前两分钟(默认,120s,可以通过高级选项das.iostatsinterval设置)内是否已发生与虚拟机有关的任何磁盘或网络活动,如果没有则重置虚拟机。

可以通过监控敏感度来控制虚拟机从出现故障到重置的时间间隔,和重置失败后再重试的时间间隔

未了避免因非瞬态错误而反复充值虚拟机。默认情况下,在某个可配置的时间间隔内将对虚拟机仅重置三次(可以配置最大重置次数)。

注意:当关闭虚拟机电源再打开虚拟机电源时,或使用vmotion将虚拟机迁移到其他主机时,重置统计信息将被清除,这会导致虚拟机上的客户机操作系统重新引导(不同于虚拟机电源状况发生改变的“重新启动”)。

如果虚拟机存在数据存储访问故障(全部路径异常或永久设备丢失),则虚拟机监控服务会挂起该虚拟机,直到故障得到排除。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇
下一篇>>