Grid Engine - 如何检测集群节点状态?

问题描述 投票:0回答:2

我目前正在使用

Altair Grid Engine
,我需要找到一种方法来确定
Altair Grid Engine
中每个节点的状态(即,它是正在运行还是已停止)。我已经尝试了几个命令,但它们没有提供我需要的信息。

这是我到目前为止所做的尝试:

qconf -sel
:这个命令帮助我获取了集群中已注册节点的列表。但是,它不提供有关每个节点的状态或状况的任何具体信息。

qconf -se <cluster-node-name>
:此命令为我提供特定节点的集群信息。不幸的是,返回的信息不包含有关节点状态或状态的任何详细信息。

我尝试使用

qhost -F
,它确实显示集群信息,但不显示该节点的当前状态。

如果有人能指导我如何准确检测每个集群节点的状态,我将不胜感激。我还应该尝试其他命令或方法吗?

预先感谢您的协助!

scheduler altair sungridengine
2个回答
0
投票

取决于您所说的节点状态的含义。在 gridengine 中,状态显示在队列实例上。您可以尝试 qhost -q 或使用 qselect -qs u ;qselect -qs E ;qselect -qs a 获取列表 无法联系的主机上的队列实例、处于错误状态的队列实例或已报警的队列实例。


0
投票

qstat -u -f

-f 选项会显示所有队列的摘要信息 与排队的作业列表一起显示。

示例:

qstat -f -q 12cores.q

队列名称 qtype resv/used/tot. load_avg 拱形状态
-------------------------------------------------- ------------------------
[电子邮件受保护] BIP 0/0/12 -NA- lx-amd64 au
-------------------------------------------------- ------------------------
[电子邮件受保护] BIP 0/12/12 12.00 lx-amd64
-------------------------------------------------- ------------------------
[电子邮件受保护] BIP 0/12/12 11.97 lx-amd64
-------------------------------------------------- ------------------------
[电子邮件受保护] BIP 0/12/12 12.02 lx-amd64
-------------------------------------------------- ------------------------
[电子邮件受保护] BIP 0/12/12 12.03 lx-amd64
-------------------------------------------------- ------------------------
© www.soinside.com 2019 - 2024. All rights reserved.