我认为你先去检查为什么存储的连接有问题,而不是先解决重启的问题。
一般都是一个Hypervisor的集群去挂共享存储,如果是单个主机网络有问题,重启单个主机不是问题,如果是存储网络有问题,那所有VM也都有问题,重启也是无所谓的。
如果是单个主机挂很多存储,这不是个好的架构。

2013-08-05 
刘宇超  Richard Liu




发件人: WXR 
发送时间: 2013-08-05  10:53:42 
收件人: users-cn 
抄送: 
主题: 回复: Re: 回复: 主机节点连不上主存储就会自动重启,而且还卡在umount处无法正常启动 
 
重启物理机确实对VM没有影响,但现在的问题时物理机无法正常重启,还需要机房手动重启一次才能够正常。这样我们这里就无法远程登录操作了。
一个主机挂多个主存储是为了让上面的虚拟机分别开在这些存储上,分担每个主存储的负载。
------------------ 原始邮件 ------------------
发件人: "tanthalas"<tanthalas...@hotmail.com>;
发送时间: 2013年8月5日(星期一) 上午10:45
收件人: "users-cn"<users-cn@cloudstack.apache.org>; 
主题: Re: Re: 回复: 主机节点连不上主存储就会自动重启,而且还卡在umount处无法正常启动
如果主机和存储连接断了,上边跑的VM也就挂了,读写操作都是失败的,重启了对VM也没什么影响,当然,内存数据不可能不丢。
一个主机为什么要挂这么多存储。这是你设计的问题啊。
2013-08-05 
刘宇超  Richard Liu
发件人: Jijun 
发送时间: 2013-08-05  10:29:54 
收件人: users-cn 
抄送: 
主题: Re: 回复: 主机节点连不上主存储就会自动重启,而且还卡在umount处无法正常启动 

On 08/05/2013 10:07 AM, tanthalas wrote:
> 我个人认为重启是对的,除了nfs,还有iscsi等其他存储的连接方式,有可能是其他问题造成连接失败,系统又自动判断不了,所以先尝试重启后的恢复,这不是运维中最常用的手段嘛。
> 如果你想改变这个重启方式就要改代码或脚本,这风险更大了。
感觉这样实现也有风险,我们遇到的情况是,一台主机挂有8个主存储,其中一个
出问题了,但是对应的host还是重启了,太暴力了。整个主机的健康 的虚拟机都
受到了影响。
> 2013-08-05 
> 刘宇超  Richard Liu
>
>
>
> 发件人: WXR 
> 发送时间: 2013-08-05  09:44:36 
> 收件人: users-cn 
> 抄送: 
> 主题: 回复: 主机节点连不上主存储就会自动重启,而且还卡在umount处无法正常启动 
>  
> 可以设置成连接不成功后不重启HOST主机吗?
> 另外如果主机和存储之间因为某些原因导致无法连接,既然已经是连接不上的状态,umount有问题是很正常的啊,那么这个时候做重启操作导致卡在umount处就是必然的。
> 既然这种情况下明确重启HOST会有问题,为什么cloudstack还要做重启呢?
> ------------------ 原始邮件 ------------------
> 发件人: "tanthalas"<tanthalas...@hotmail.com>;
> 发送时间: 2013年8月5日(星期一) 上午9:26
> 收件人: "users-cn"<users-cn@cloudstack.apache.org>; 
> 主题: Re: 主机节点连不上主存储就会自动重启,而且还卡在umount处无法正常启动
> 主机和存储之间有hearbeat检测,当重试多次不能连接,就会强制host重启,这属于CS检测机制。
> umount fail,也说明这个存储连接有问题。
> 所以不如先检查一下存储的问题,这是你系统环境的故障,不能算是CS的问题。
> 2013-08-05 
> 刘宇超  Richard Liu
> 发件人: WXR 
> 发送时间: 2013-08-04  08:12:42 
> 收件人: CloudStack邮件组 
> 抄送: 
> 主题: 主机节点连不上主存储就会自动重启,而且还卡在umount处无法正常启动 
>
> 经常发现主机节点会自己重启,而且每次基本上都不会正常重启成功,都是关机的时候卡在umount处,提示内容大概为
> umount fail ,device is busy
> 好像是因为主机节点发现自己连接不上主存储后,agent或者management服务就会重启物理服务器。
> 这样的话效果还不如不重启,每次一出现这个现象,就必须要机房的人去按重启键重启。
> 请问有没有什么设置可以让cloudstack出现这种问题的时候不重启呢,另外有没有办法解决重启的时候卡在umount处的情况。
-- 
Thanks,
Jijun

Reply via email to