带有Ubuntu 16.04和4.4.0-137通用内核的NVIDIA DevBox随机重启并在一夜之间自动关闭

问题描述 投票:-1回答:1

我最近声明使用的NVIDIA DevBox有一个华硕BIOS,内核版本和上面提到的ubuntu版本。由于某些原因,机器不能真正留在一夜之间,因为它通常与其他笔记本电脑和/或计算机机器一起使用:您可以将它放在上面,它会在几分钟后自行锁定和/或进入睡眠模式 - 第二天,当您移动鼠标或在键盘上键入内容时,计算机会“取消暂停”或唤醒,并且您的所有程序都已开启并且正在运行前一天您离开它们的方式。

由于一些奇怪的原因,这台机器没有发生这种情况。在我之前有一位用户在大约一年内没有接触过这台机器,所以有可能他/她可能在省电方面做了某种配置,但是当我检查电源选项时一切都很好看在我的机器中(我暂停 - 1小时,锁定1小时)。我想我注意到的有趣的事情是,如果我在午餐后回来并且机器被锁定/暂停,它会在会话中回来没有任何问题,但如果我一夜之间离开,那么我会在第二天到达并且机器自动关闭。建筑物被锁定,因此其他人不可能在一夜之间实际关闭电源关闭按钮,我还检查了其他用户的历史命令(我们都有管理员权限,而且他没有使用计算机)检查远程访问关闭,也不会弹出。

我在几个地方看过,由于供电不足或供电不足,可能会出现供暖问题,但我该如何检查是否属实?我有psensor应用程序,但这似乎只是实时记录温度而不将它们保存到一个文件,我可以检查任何显卡(有4个)或主板的温度。

诊断机器自动关闭的另一种方法是什么?我如何知道是加热问题还是电源故障?或者可能是内核问题?除了我在安装方面经验丰富的NVIDIA驱动程序外,该机器暂时没有安装真正强烈的程序(几乎是新的),所以也许我可以考虑一个新的Ubuntu安装? - 如果存在硬件问题,这几乎毫无意义

其他详情:

NVIDIA驱动程序已正确安装。当我强行执行以下命令并且机器连续运行2天(对于这些机器来说应该是轻而易举的)时,驱动程序被窃听并且机器响应非常严重,直到它很难在超过5分钟后开启连续2次在半夜连续重启:

$ unset autologoff

我不得不在以后正确地重新安装驱动程序(并重新设置autolog选项),并且系统回到当前状态,如果它超过24小时没有做任何事情,它“需要”自行关闭(没有做任何事情)因为它没有接收人工输入,但后端进程可能仍在运行)。

  • 主板:华硕EATX DDR4 LGA 2011-3主板X99-E WS / USB 3.1
  • CPU:Intel Xeon E5-2690 v4 2.6 GHz 14核LGA 2011处理器135 W.
  • 冷却器:Corsair Hydro系列H80i v2极致性能液体CPU散热器,黑色。
  • 电源:EVGA SuperNOVA 1600 P2 80+白金,1600W ECO模式全模块化NVIDIA SLI和Crossfire Ready 10年保修电源220-P2-1600-X1
  • 显卡:4 Titan X Pascal。

在发现机器给我这个错误之后,我在启动时添加了pci=noaerhttps://askubuntu.com/questions/771899/pcie-bus-error-severity-corrected

产量:

$ cat /proc/cmdline

BOOT_IMAGE=/boot/vmlinuz-4.4.0-137-generic.efi.signed root=UUID=569dd2ad-c5a6-4ae4-a167-f849b8f6ae9e ro quiet splash pci=noaer vt.handoff=7
reboot suspend power-off
1个回答
0
投票

通过将系统上传到Ubuntu 18.04来解决问题。该bug的根源从未被发现,但我怀疑它与内核有关,可能与显卡,BIOS和16.04 Ubuntu版本不太匹配。

© www.soinside.com 2019 - 2024. All rights reserved.