我有一个已经运行了很长时间并且不想结束它的进程。
我怎么把它放在nohup下(也就是说,即使关闭终端,如何让它继续运行?)
使用bash的Job Control将进程发送到后台:
bg
在后台运行它。disown -h [job-spec]
,其中[job-spec]是工作号码(如第一个正在运行的工作的%1
;使用jobs
命令查找您的号码),以便在终端关闭时不会终止作业。在tcshell中,这对我在Ubuntu linux上工作。
bg
在后台运行jobs
得到它的工作号码nohup %n
,其中n是工作号码假设由于某种原因,Ctrl + Z也无法正常工作,转到另一个终端,找到进程ID(使用ps
)并运行:
kill -SIGSTOP PID
kill -SIGCONT PID
SIGSTOP
将暂停这一进程,SIGCONT
将在后台恢复这一进程。所以现在,关闭两个终端并不会停止你的过程。
将正在运行的作业与shell(=使其成为nohup)分开的命令是disown
和一个基本的shell命令。
从bash-manpage(man bash):
disown [-ar] [-h] [jobspec ...]
如果没有选项,则会从活动作业表中删除每个jobspec。如果给出了-h选项,则不会从表中删除每个jobspec,但会对其进行标记,以便在shell收到SIGHUP时不会将SIGHUP发送到作业。如果不存在jobspec,并且未提供-a和-r选项,则使用当前作业。如果未提供jobspec,则-a选项表示删除或标记所有作业;没有jobspec参数的-r选项将操作限制为正在运行的作业。除非jobspec未指定有效作业,否则返回值为0。
那意味着,这很简单
disown -a
将删除作业表中的所有作业并使其成为nohup
这些都是上面的好答案,我只是想补充说明:
你不能disown
一个pid或过程,你disown
一个工作,这是一个重要的区别。
作业是附加到shell的进程的概念,因此您必须将作业放入后台(而不是暂停它),然后将其取消。
问题:
% jobs
[1] running java
[2] suspended vi
% disown %1
有关Unix作业控制的更详细讨论,请参阅http://www.quantprinciple.com/invest/index.php/docs/tipsandtricks/unix/jobcontrol/。
不幸的是disown
特定于bash而不是所有的shell都可用。
某些类型的Unix(例如AIX和Solaris)在nohup
命令本身上有一个选项,可以应用于正在运行的进程:
nohup -p pid
Node的答案真的很棒,但它仍然提出了如何让stdout和stderr重定向的问题。我找到了Unix & Linux的解决方案,但它也不完整。我想合并这两个解决方案。这里是:
对于我的测试,我创建了一个名为loop.sh的小bash脚本,它在无限循环中打印一小段睡眠。
$./loop.sh
现在以某种方式得到这个过程的PID。通常ps -C loop.sh
足够好,但它打印在我的情况下。
现在我们可以切换到另一个终端(或按^ Z并在同一个终端)。现在gdb
应该附加到这个过程。
$ gdb -p <PID>
这会停止脚本(如果正在运行)。它的状态可以通过ps -f <PID>
检查,其中STAT
字段是'T +'(或者在^ Z'T'的情况下),这意味着(man ps(1))
T Stopped, either by a job control signal or because it is being traced
+ is in the foreground process group
(gdb) call close(1)
$1 = 0
关闭(1)成功时返回零。
(gdb) call open("loop.out", 01102, 0600)
$6 = 1
如果成功,Open(1)将返回新的文件描述符。
这个开放与open(path, O_TRUNC|O_CREAT|O_RDWR, S_IRUSR|S_IWUSR)
相同。而不是O_RDWR
O_WRONLY
可以应用,但/usr/sbin/lsof
说'u'为所有std *文件处理程序(FD
列),这是O_RDWR
。
我检查了/usr/include/bits/fcntl.h头文件中的值。
输出文件可以用O_APPEND
打开,正如nohup
所做的那样,但man open(2)
没有提出这个问题,因为可能存在NFS问题。
如果我们得到-1作为返回值,那么call perror("")
会输出错误消息。如果我们需要errno,请使用p errno
gdb命令。
现在我们可以检查新重定向的文件。 /usr/sbin/lsof -p <PID>
印刷品:
loop.sh <PID> truey 1u REG 0,26 0 15008411 /home/truey/loop.out
如果我们想要,我们可以将stderr重定向到另一个文件,如果我们想再次使用call close(2)
和call open(...)
使用不同的文件名。
现在附加的bash
必须被释放,我们可以退出gdb
:
(gdb) detach
Detaching from program: /bin/bash, process <PID>
(gdb) q
如果脚本被gdb
从另一个终端停止,它将继续运行。我们可以切换回loop.sh的终端。现在它不会向屏幕写任何内容,而是运行并写入文件。我们必须把它放到后台。所以按^Z
。
^Z
[1]+ Stopped ./loop.sh
(现在我们处于相同的状态,就像^Z
在开始时被按下一样。)
现在我们可以检查工作状态:
$ ps -f 24522
UID PID PPID C STIME TTY STAT TIME CMD
<UID> <PID><PPID> 0 11:16 pts/36 S 0:00 /bin/bash ./loop.sh
$ jobs
[1]+ Stopped ./loop.sh
因此,进程应该在后台运行并从终端分离。 jobs
命令输出方括号中的数字表示bash
中的作业。我们可以在以下内置的bash
命令中使用在作业号之前应用'%'符号:
$ bg %1
[1]+ ./loop.sh &
$ disown -h %1
$ ps -f <PID>
UID PID PPID C STIME TTY STAT TIME CMD
<UID> <PID><PPID> 0 11:16 pts/36 S 0:00 /bin/bash ./loop.sh
现在我们可以退出调用bash。该过程继续在后台运行。如果我们退出它的PPID变为1(init(1)进程)并且控制终端变得未知。
$ ps -f <PID>
UID PID PPID C STIME TTY STAT TIME CMD
<UID> <PID> 1 0 11:16 ? S 0:00 /bin/bash ./loop.sh
$ /usr/bin/lsof -p <PID>
...
loop.sh <PID> truey 0u CHR 136,36 38 /dev/pts/36 (deleted)
loop.sh <PID> truey 1u REG 0,26 1127 15008411 /home/truey/loop.out
loop.sh <PID> truey 2u CHR 136,36 38 /dev/pts/36 (deleted)
评论
gdb的东西可以自动化,创建一个包含命令的文件(例如loop.gdb)并运行gdb -q -x loop.gdb -p <PID>
。我的loop.gdb看起来像这样:
call close(1)
call open("loop.out", 01102, 0600)
# call close(2)
# call open("loop.err", 01102, 0600)
detach
quit
或者可以使用以下一个班轮代替:
gdb -q -ex 'call close(1)' -ex 'call open("loop.out", 01102, 0600)' -ex detach -ex quit -p <PID>
我希望这是对解决方案的完整描述。
将运行过程发送到nohup(http://en.wikipedia.org/wiki/Nohup)
nohup -p pid
,它对我不起作用
然后我尝试了以下命令,它工作得非常好
/usr/bin/python /vol/scripts/python_scripts/retention_all_properties.py 1
。bg
在后台运行它。disown -h
,以便在终端关闭时不会终止进程。exit
以退出shell,因为现在你很好,因为操作将在后台运行它自己的进程,因此它不依赖于shell。这个过程相当于运行nohup SOMECOMMAND
。
在我的AIX系统上,我试过了
nohup -p processid>
这很好用。即使在关闭终端窗口后,它仍继续运行我的过程。我们将ksh作为默认shell,因此bg
和disown
命令不起作用。
bg
- 这将把工作放在后台并在运行过程中返回disown -a
- 这将切断所有附件的工作(所以你可以关闭终端,它仍然会运行)这些简单的步骤将允许您在保持进程运行的同时关闭终端。
它不会穿上nohup
(根据我对你的问题的理解,你不需要它)。