我正在尝试确定任何可能的选项,以通过使用 GPU 来加速线性代数计算。更准确地说,我需要加速显式动力学求解器。因为在每个增量中它都解决了一个线性系统,我想也许我可以通过使用 GPU 来加速它。
目前我有一个 C# 代码可以做到这一点(CPU 明智)。但如果需要,我愿意使用任何语言(C++、Python)。由于我是这方面的新手,我在谷歌上搜索并得出结论,最好的选择可能是使用 OneAPI 和 ROCm。问题是,到目前为止,对于 OneAPI 和 ROCm,我还没有找到一种方法让它们在带有 AMD GPU 的 Windows 环境中本地运行。我在这里错过了什么吗?
任何帮助将不胜感激。