Jenkins 在查看作业页面时极其慢(超过 3 分钟,使用冷磁盘缓存)。主页面显示良好;仅当查看单个作业的页面时才会出现问题。
我认为问题是由最近更新的 Jenkins+插件开始的,但是我该如何解决这样的问题呢?
遇到这样的问题如何解决?
首先,确保您可以重现问题。它有助于测试。如果性能问题仅在缓存处于冷态时出现,那么清除磁盘缓存(适用于 Linux 的说明)会有所帮助。
Jenkins 的“管理插件”(在管理 Jenkins 部分下)允许您单独禁用和降级插件。如果您怀疑某个特定插件导致了问题,这可以帮助您确认。
strace
可以显示Jenkins正在进行的系统调用。首先,获取主 Jenkins PID:
root@server:~# ps -ef | grep jenkins
jenkins 589 1 0 17:03 ? 00:00:00 /usr/bin/daemon --name=jenkins --inherit --env=JENKINS_HOME=/home/jenkins --output=/var/log/jenkins/jenkins.log --pidfile=/var/run/jenkins/jenkins.pid --umask=027 -- /usr/bin/java -Djava.awt.headless=true -jar /usr/share/jenkins/jenkins.war --webroot=/var/cache/jenkins/war --httpPort=8080 --ajp13Port=-1
jenkins 591 589 7 17:03 ? 00:00:51 /usr/bin/java -Djava.awt.headless=true -jar /usr/share/jenkins/jenkins.war --webroot=/var/cache/jenkins/war --httpPort=8080 --ajp13Port=-1
(本例中 pid 为 591。)
接下来,运行 strace。因为 Jenkins 是多线程的,所以您需要添加
-f
来跟踪所有线程。
strace -p 591 -f
如果幸运的话,您会找到明显的减速原因。 (在我的例子中,其中一个线程反复打开每个先前版本的
build.xml
,用于我试图查看的特定作业。)
strace
监控系统调用并告诉您进程正在做什么; jstack
显示进程的调用堆栈,这有助于告诉您为什么它正在这样做(它试图完成什么)。
jstack
需要一个 pid,并且需要以与您正在检查的进程相同的用户身份运行。 (请参阅此处了解更多详情。)
sudo -u jenkins jstack 591
这显示了相当多的信息:每个 Jenkins 线程的堆栈跟踪、库和框架代码的大量条目(例如请求处理程序和 XML 等)。不过,您应该能够在其中找到堆栈跟踪运行缓慢的特定请求处理程序以及指示其尝试执行的操作的堆栈跟踪的某些部分。