0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

资源池虚拟机时钟跳变异常的问题处理

中兴文档 来源:中兴文档 2023-09-20 11:08 次阅读

故障现象

某资源池在运行过程中一台虚拟机出现业务异常,通过查看日志和异常记录,判断为虚拟机发生时钟跳变问题,如下图所示。

b63ef268-568c-11ee-939d-92fbcf53809c.png

故障分析

检查时钟跳变异常的原因可能有如下四个:

虚拟机和时钟源时间是否正常同步。

是否发生过时钟跳变,导致虚拟机同步发生时钟跳变。

虚拟机是否发生过重启,导致时钟和硬件同步。

虚拟机是否有其他的时钟源,导致时钟在两个时钟源中变化。

根据分析原因,进行问题排查:

1. 检查虚拟机是否和时钟源正常时钟同步。

登录到虚拟机内部,通过ntpq -np命令查看虚拟机和时钟源的同步状态正常,未有大的偏差,如下图所示。

b63ef268-568c-11ee-939d-92fbcf53809c.png

2. 检查时钟源服务器,确认是否发生过时钟跳变等情况。

联系时钟源服务厂家,通过检查时钟源日志和其他业务系统时钟日志,未发现时钟中断和跳变情况,初步判断该跳变情况只发生在问题虚拟机上。

3. 检查虚拟机是否发生过重启,有无和硬件时钟发生同步。

通过执行uptime命令检查虚拟机内部状态,近期未发生重启现象,如下图所示。

b68e068c-568c-11ee-939d-92fbcf53809c.png

4. 检查虚拟机是否有其他时钟源,导致虚拟机时钟跳变。

a. 通过执行ntpq -np命令查看目前虚拟机内部只有一个时钟源,因此需要查看是否有同步计算节点配置。

b. 登录虚拟机内部,执行ps -ef|grep qemu-guest-agent进程,查看存在qemu客户端,如下图所示。

b6a5aa9e-568c-11ee-939d-92fbcf53809c.png

c. 登录计算节点系统,通过执行systemctl status qga.service和rpm -qa | grep qemu命令,确认计算节点qemu对应服务是否正常在线,如下图所示。

b6bff548-568c-11ee-939d-92fbcf53809c.png

d. 登录计算节点系统,通过virsh list命令读取虚拟机的ID,执行virsh dumpxml ID|grep "nova:name" 命令确认虚拟机,执行virsh dumpxml ID|grep -A5 -B5 guest_agent命令确认虚拟机配置,如下图所示。

b6dd0bf6-568c-11ee-939d-92fbcf53809c.png

e. 检查配置文件,确认当前虚拟机和计算节点是10分钟发生一次强制同步,如下图所示。其中“interal = 10 unit= minute ”代表10分钟。

b6f8c850-568c-11ee-939d-92fbcf53809c.png

5. 经过排查,确认虚拟机每10分钟周期强制和计算节点时间同步,由于计算节点时钟和时钟源有偏差,导致虚拟机发生时钟跳变影响业务。

故障处理

1. 虚拟机时钟同步服务器默认不打开,只有虚拟机重启时候会触发一次强制同步。

2. 如果需要打开虚拟机时钟同步,则需要在虚拟机上安装QGA插件,同时在虚拟机中把QGA插件的时钟同步开关打开。

3. 业务上线前必须明确时钟同步方案,通常虚拟机需要直接同步时钟源,不同步计算节点,避免时钟跳变。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 服务器
    +关注

    关注

    12

    文章

    9017

    浏览量

    85181
  • 时钟
    +关注

    关注

    10

    文章

    1720

    浏览量

    131359
  • 命令
    +关注

    关注

    5

    文章

    678

    浏览量

    21983
  • 虚拟机
    +关注

    关注

    1

    文章

    908

    浏览量

    28079

原文标题:TECS CloudFoundation-资源池虚拟机时钟跳变异常的问题处理

文章出处:【微信号:ztedoc,微信公众号:中兴文档】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    启动虚拟机的时候报错怎么办呢

    启动虚拟机的时候,报错:正在处理另一个任务,无法正常开机一. 在VMware vSphere Client开启虚拟机时提示错误信息:“正在处理另一个任务”,无法正常开机问题。二. 出现
    发表于 12-31 06:37

    检测域划分的虚拟机异常检测算法

    虚拟机的正常运行是支撑云平台服务的重要条件,由于云平台下虚拟机存在数量规模大、运行环境随时间动态变化的特点,管理系统难以针对每个虚拟机进行训练数据采集以及统计模型的训练。为了提高在上述环境下
    发表于 12-20 09:48 0次下载

    虚拟机按需物理资源分配方法

    针对云平台按负载峰值需求配置处理资源、提供单一的服务应用和资源需求动态变化导致资源利用率低下的问题,采用云虚拟机中心来同时提供多种服务应用
    发表于 01-02 15:18 1次下载
    云<b class='flag-5'>虚拟机</b>按需物理<b class='flag-5'>资源</b>分配方法

    基于虚拟机负载高峰特征的虚拟机放置策略

    提出了一种基于虚拟机负载高峰特征的虚拟机放置策略,通过更好地复用物理主机资源来实现资源共享,从而提高资源利用率,在云环境下,当多个
    发表于 01-13 10:34 0次下载

    虚拟计算资源调度机制研究

    虚拟机进行准确识别和区分。进而设计一种新型虚拟计算资源调度和分配机制Diff-Scheduler,将不同类型虚拟机的vCPU实施分隔离调
    发表于 02-08 17:08 0次下载
    <b class='flag-5'>虚拟</b>计算<b class='flag-5'>资源</b>调度机制研究

    虚拟机具备怎样的优势

    大规模虚拟机部署也需要编排解决方案。但是,它们很少像容器部署那样复杂。使用虚拟机时,移动部件很少,基础架构的重叠层也更少。
    发表于 01-17 15:46 3583次阅读

    基于复制技术的虚拟机容灾方案

    现在各个大企业的计算虚拟化程度都很高了,因此,很多关键的业务,如Oracle数据库都跑在虚拟机上,特别是VMware虚拟机上。但是,虚拟机上的数据保护,和物理机还是有很多的不同。物理
    的头像 发表于 10-21 11:29 3527次阅读
    基于复制技术的<b class='flag-5'>虚拟机</b>容灾方案

    基于冗余变的5G核心网虚拟机迁移方法

    频繁迁移导致了迁移资源开销大和迁移安全性低的问题。为此,提出一种基于冗余变的虚拟机迁移方法,对不同虚拟机的迁移频率建立评估计算模型,在保证虚拟机
    发表于 05-11 14:11 13次下载

    虚拟机迁移的物理主机异常状态检测算法

    虚拟机迁移的物理主机异常状态检测算法
    发表于 06-30 11:13 20次下载

    打开虚拟机电源提示“正在处理另一个任务”解决方法

    启动虚拟机的时候,报错:正在处理另一个任务,无法正常开机一. 在VMware vSphere Client开启虚拟机时提示错误信息:“正在处理另一个任务”,无法正常开机问题。二. 出现
    发表于 01-11 12:06 1次下载
    打开<b class='flag-5'>虚拟机</b>电源提示“正在<b class='flag-5'>处理</b>另一个任务”解决方法

    openEuler资源利用率提升之道:虚拟机混部OpenStack调度

    虚拟机混合部署是指把对 CPU、IO、Memory 等资源有不同需求的虚拟机通过调度方式部署、迁移到同一个计算节点上,从而使得节点的资源得到充分利用。
    的头像 发表于 01-30 10:26 955次阅读

    TECS资源池上报网络流程异常告警的问题处理

    资源TECS上报网络流程异常告警,告警单次持续15秒-4分钟之间。
    的头像 发表于 06-07 09:41 863次阅读
    TECS<b class='flag-5'>资源</b>池上报网络流程<b class='flag-5'>异常</b>告警的问题<b class='flag-5'>处理</b>

    资源后端存储服务状态异常的问题处理

    故障现象某资源在巡检过程中检查服务状态,其中云盘后端的服务状态为down,如下图所示,影响虚拟机云盘的生命周期管理操作。
    的头像 发表于 09-20 11:06 700次阅读
    <b class='flag-5'>资源</b><b class='flag-5'>池</b>后端存储服务状态<b class='flag-5'>异常</b>的问题<b class='flag-5'>处理</b>

    Docker与虚拟机的区别

    Docker和虚拟机是两种不同的虚拟化技术,它们在实现方式、资源消耗、运行性能等方面存在许多差异。本文将会详细介绍它们的区别。 一、实现方式 1.1 虚拟机
    的头像 发表于 11-23 09:37 9568次阅读

    虚拟机数据恢复—异常断电导致XenServer虚拟机不可用的数据恢复案例

    虚拟机有两个虚拟机磁盘(系统盘 + 数据盘),虚拟机作为Web服务器使用。 虚拟机故障&分析: 机房异常断电导致服务器中一台VPS(
    的头像 发表于 10-21 14:17 148次阅读
    <b class='flag-5'>虚拟机</b>数据恢复—<b class='flag-5'>异常</b>断电导致XenServer<b class='flag-5'>虚拟机</b>不可用的数据恢复案例