cluster-computing 相关问题

计算机集群是一组协同工作的系统,因此在许多方面它们可以被视为单个系统。

Slurm 每个节点仅运行 1 个作业

我正在构建一个新的slurm集群,我不太熟悉资源如何分配。我有 4 个节点,每个节点有 32 个核心。当我提交作业时,每个节点只运行 1 个作业,其余的都在

回答 1 投票 0

如何从 UMAP 集群的一部分创建新的 Seurat 对象?

我的任务是对 PBMC 数据集中的 T 细胞进行分析。我收到了 9 个簇,代码如下。 外周血单个核细胞 <- RunUMAP(pbmc, dims = 1:10) DimPlot(pbmc, reduction = "umap") Clus...

回答 1 投票 0

Kubernetes-客户端从客户端到服务或 Pod 的 Rest 调用

我有一个 Kubernetes 集群,我使用 .NET 的 kubernetes-client 库来管理配置、存储、服务和状态集的配置。配置运行良好,并且有必要...

回答 2 投票 0

无法将图像推送到私有注册表:获取x509:证书对于ingress.local有效,而不是registry.local

我已经使用 Nvidia deepops 设置了 Kubernetes 部署。我的集群是在我的家庭网络上运行的单个节点,Zerotier 充当我的远程控制计算机和其他计算机之间的网络桥梁...

回答 1 投票 0

Kubernetes:来自服务器的错误(未找到):未找到部署.apps“kube-verify”

我在我的专用网络中设置了一个 Kubernetes 集群并成功部署了一个测试 Pod: 现在我想公开该服务的外部IP: 但是当我跑步时: kubectl 获取部署 kube-verify 我得到:

回答 6 投票 0

在Windows终端远程下载文件

我希望在Windows终端中运行download.bat来执行名为“download.bat”的文件,将大学计算集群(Linux)帐户中的文件夹中的文件下载到我的本地目录。 格...

回答 1 投票 0

远程下载文件的Window终端脚本

我希望在Windows终端中运行download.bat来执行名为“download.bat”的文件,将大学计算集群(Linux)帐户中的文件夹中的文件下载到我的本地目录。 格...

回答 1 投票 0

防止集群上的作业在部署期间在生产代码上运行

我有一个脚本,作为生产环境中集群上的作业运行几分钟。有 0 到 100 个这样的作业,每个作业有 1 个脚本,同时在

回答 1 投票 0

Slurm - 如何运行 n 个 n 个作业列表?

我有一个必须在 slurm 监控的集群上运行的作业列表: srun job_1 srun job_2 srun job_3 ... 我想 6 x 6 运行这些作业,但我不确定正确的方法。 谢谢...

回答 1 投票 0

FailOverManager - 错误 - 计算机已加入集群

我尝试在 FileOverManager 中连接新服务器,但收到错误“计算机已加入集群”。 但该服务器未连接到集群。第一次尝试因超时而崩溃。 我是吗

回答 1 投票 0

访问 kubernetes 仪表板时尝试访问服务时出现错误:“拨号 tcp 10.44.0.2:8443: 连接:连接被拒绝”

我使用了 kubernetes 硬方法并成功使用 kubernetes 1.18.6 部署了集群 我使用 vmware 和 kubernetes 1.18.6。我部署了 metric-server 和 kubernets 仪表板 我用过这个通讯...

回答 3 投票 0

Snakemake远程规则重新读取配置文件?

我正在使用snakemake(v7.22.0)在集群上执行多个作业。我有几个不同版本的工作流程,有时会并行执行,其中涉及更改配置文件......

回答 1 投票 0

无法使 SQL Server 实例在集群服务器上联机

我要将第一个 SQL Server 实例 (SQL001) 从第一个服务器 (Win001) 故障转移到第二个服务器 (Win002)。以下是我们事件日志的应用程序目录中的错误消息: [sqsrvres] 在线周四...

回答 1 投票 0

如何在Raspberry Pi上进行Socket.IO多线程?

我有一个监听套接字的socket.io服务器: io.on('连接', (套接字) => { socket.on('myEvent', 函数(数据){ socket.emit('eventReceived', { status: 1 }); }); }); 我...

回答 1 投票 0

如何找到已完成的 SLURM 作业的排队时间?

我正在尝试找到一种方法来查看已完成作业的等待时间,直到它们在以 SLURM 作为工作负载管理器的集群上启动为止。 我知道“sacct”命令可以打印很多信息...

回答 2 投票 0

不使用 MongoDB Atlas 创建集群

我正在寻找如何在不使用 MongoDB Atlas 的情况下创建集群,但我找不到任何东西,如果您能给我一个页面、视频或参考资料,我将不胜感激。 我找到的关于 MongoDB 的所有内容

回答 1 投票 0

ORA-01654: 无法扩展索引

召集所有 Oracle 大师! 我正在 WebSphere 上对一个经过良好测试的应用程序进行集群。相关应用程序处理来自...的 1k JMS 消息大约完成了一半。

回答 4 投票 0

当节点拔掉网线时,节点认为自己在线。起搏器/Corosync

我正在尝试使用 Pacemaker/Corosync 将 2 台计算机集群在一起。他们共享的唯一资源是 ocf:heartbeat:IPaddr 这是主要问题: 由于只有两个节点故障转移...

回答 3 投票 0

在集群计算节点上使用 VSCode 远程隧道进行自动身份验证

我在集群计算节点上发现了这篇关于 VSCode 远程隧道的有用文章。 有没有一种方法可以自动进行身份验证(类似于 ssh-key),这样就不需要遵循

回答 1 投票 0

客户端请求执行期间 GridDB 中出现“10010 TXN_PARTITION_STATE_UNMATCH”错误问题

我在 GridDB 中执行客户端请求时遇到持续存在的问题,错误代码为“10010 TXN_PARTITION_STATE_UNMATCH”。使用的GridDB版本是“5.1.0-39692 CE,...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.