vectorization 相关问题

矢量化是指一种编程范例,其中函数一次性在整个数组上运行。这在函数调用,存储器访问,并行化和代码表达方面提供了好处。某些编程语言(如MATLAB)经过优化,可在向量化时提供最佳性能。

为什么这个简单的 openCl 内核的矢量化会使其变慢?

我目前正在使用 OpenCl 在 GPU 上实现一个简单的并行索引总和。这是需要对大型数组进行连续流压缩的项目的一部分,所以我认为这将是一个很好的

回答 1 投票 0

Clang 的 __restrict 不一致?

我正在研究高度“可向量化”的代码,并注意到关于 C++ __restrict 关键字/扩展 ~,即使在简单的情况下,Clang 的行为与 GCC 相比也是不同且不切实际的......

回答 1 投票 0

如何防止 rgb 到 colorID 转换创建 256^3 大小的数组并仍然保持矢量化?

在进行像素分割时,我有 256 个不同的 colorID 与某些 RGB 值集匹配,并且需要编写一个脚本来检索分割的 RGB 图片中每个像素的 colorID。有

回答 1 投票 0

R 中的快速 binom.test 以获得多个置信度?

我有一个数据集 df,其中包含两个变量:成功 (x) 和试验 (n)。我希望为该数据集中的每一行获取不同

回答 1 投票 0

使用 numpy 向量化此操作

为了介绍这个问题,假设我有一个存储 N 个点的 2D 数组(Nx3)。另一方面,我有一个 1D 数组 (M, 3),其中包含单个 3D 参考点的坐标,因此 M...

回答 2 投票 0

批量 Png 到 SVG

我需要将51.587个png文件转换为svg。 这些文件包含在名为“Folder1”的文件夹中的 61115 个子文件夹中。徽标很容易转换,因为每个 png 有 1-4 种颜色。 我...

回答 1 投票 0

为什么pytorch的nn.ModuleList不支持矢量化?下面的代码有性能问题吗?

我的模型中有很多子网络,对于不同的样本,我想使用不同的子网络进行一些计算。经过一番搜索,我发现了以下方法。为什么 pytorch 的 nn.ModuleList...

回答 1 投票 0

为什么自动矢量化器无法找到“可矢量化类型信息”?

我正在尝试对我的一些代码进行矢量化,但我不断遇到信息 C5002:由于“1305”原因,循环未矢量化。根据这个页面: // 当编译器无法执行时,会发出代码 1305

回答 1 投票 0

如何在 clang++ 中禁用矢量化?

考虑以下小搜索功能: 模板 int32_t countsearch(const uint32_t *base, uint32_t 针) { uint32_t 计数 = 0; #pragma clang 循环矢量化(disa...

回答 2 投票 0

是否有 R 函数用于从 1:n 跨 n 个向量进行采样?

给定一个 n 向量,我试图在 1 和 n 之间选择一个随机值。这是我当前的解决方案: <- c(10, 5, 35, 16, 2) sapply(n, function (x) sample(seq_len(x), 1)) However, this se...

回答 1 投票 0

如何优化matlab中嵌套循环的运行速度

我需要在matlab中处理四维矩阵的元素。其中N在100左右。下面的程序计算起来非常耗时,不知道是否有合适的方法来简化它

回答 1 投票 0

我如何抽象Vector256的逻辑<T< in C# to support different hardware configurations?

C# 中的向量化。通过 Vector 类工作。有不同大小的向量,例如 Vector64/Vector128/Vector256。但我该如何使用它们呢?我用 Vector256 编写了一个 for 循环,b...

回答 1 投票 0

在 RISC-V RVV 0.7.1 中屏蔽 CSR SpMV 的各个行

编辑:我已将我的问题重新表述为更有成效的内容,并将在下面提供答案。这个问题的旧版本仍在下面。 我正在实现一个优化的 SpMV 内核...

回答 1 投票 0

如何使用列名数组有效读取 pandas

df = pd.DataFrame({"col_a": [1,2,3], "col_b": [5,4,0], "col_c": [9,7,6]) cols = [["col_a", "col_b"], ["col_c", "col_b"], ["...

回答 3 投票 0

向量化一个带有“继续”分支的循环

我目前正在学习一门课程,在该课程中我们可以使用超级计算机。 CPU 是 Intel(R) Xeon(R) Gold 6240 CPU。我们的任务是矢量化(但我们不被允许使用

回答 1 投票 0

向量化逻辑索引

我有一个具有三个通道的图像。我还有一个掩码,可以从每个通道中随机提取相同数量的像素(但跨通道不一定相同)。 是否可以矢量化...

回答 1 投票 0

使用列名列表在 pandas 数据框中进行操作

假设我有一个数据框: 将 pandas 导入为 pd df = pd.DataFrame({"A1": [10, 20, 15, 30, 45], “B1”:[13,23,18,33,48], “C1”:[1...

回答 1 投票 0

jax 中的向量化最小化和求根

我有一系列由 args 参数化的函数 f(x, 参数) 并想要确定 N = 1000 个 args 值的 f 与 x 的最小值。我可以访问该函数及其导数。我的...

回答 1 投票 0

高效地从一长串字典中提取元素

我有一个(长)字典列表,但为了这个例子,我将它们表示为 d = [{'a':1}, {'a':2}, {'a':3}] 我需要从这些字典中提取相同的元素,即 [我['a']...

回答 2 投票 0

使用矢量化在 Pandas 数据框中查找大于当前值的第一次出现的价格值

让我们以 Pandas 数据框为例,它有两列“日期”和“价格”,其中“日期”始终升序,“价格”是随机的,即 df = pd.DataFrame({ '日期':['01/01/2019', '01/02/20...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.