我最近安装了我的SGE集群上的openmpi 2.0版。但是,当我提交作业,我得到“主机KET验证失败”。虽然我能够在没有提交主机的密码登录到该节点(compute10)。
在输出文件中的错误:
警告:对tty的访问(错误的文件描述符)。因此,在这个外壳没有作业控制。周三01月30日十五时58分53秒EST 2019主机密钥验证失败。 [文件orca_main / gtoint.cpp,线137]:ORCA通过ORCA_GTOInt错误终止完成
我SGE脚本如下:
!/ bin中/ tcsh的
$ -q SGE-队列@ compute10
$ -On灯8
$ -In
$ -cwd
附加$ Jÿ
$ -l h_vmem = 64G
日期
SETENV OMP_NUM_THREADS 8
/ home / user中/ orca_4_0_1_2_linux_x86-64_openmpi202 /逆戟鲸ccl3.inp> ccl3.out
日期
而我的并行环境MPI:
MPI pe_name
槽999
user_lists NONE
xuser_lists NONE
start_proc_args /export/sge6.2_U7/mpi/startmpi.sh -catch_rsh $ PE_HOSTFILE
stop_proc_args /export/sge6.2_U7/mpi/stopmpi.sh
allocation_rule $ pe_slots
control_slaves TRUE
job_is_first_task FALSE
urgency_slots分钟
accounting_summary TRUE
尝试不同的东西,更新的openmpi到3.1.0版本和建筑用方案后解决了以下问题。
的./configure前缀=的/ usr /本地--with-SGE --enable-orterun前缀由默认