vectorization 相关问题

矢量化是指一种编程范例,其中函数一次性在整个数组上运行。这在函数调用,存储器访问,并行化和代码表达方面提供了好处。某些编程语言(如MATLAB)经过优化,可在向量化时提供最佳性能。

有效地使用英特尔编译器SVML`__m128 _mm_sincos_ps()`

我有一个简单的循环:for(ii = 0; ii <numRows * numCols; ii ++){mCOmega [ii] = cosf(paramOmega * mI [ii]); mSOmega [ii] = sinf(paramOmega * mI [ii]);我想要...

回答 1 投票 1

具有不同大小的numpy数组元素的条件

我在伪Python代码中有以下情况,需要为优化目的找到它的矢量化解决方案,因为我正在处理成千上万的语音分析条目...

回答 1 投票 0

网格化分散数据,无需插值

我有三个向量,X,Y和Z,它们代表在矩阵V中找到的一些数据的3d坐标(即V = f(X,Y,Z))。以下是此数据的一些功能(假设/断言,如果您愿意):X和......

回答 1 投票 2

将numpy数组栈与Hermitian转置相乘,无需循环

我想在我的代码中完全摆脱for循环。我有一个复杂的numpy数组stack1维度为OxMxN这是堆叠在第一维中的MxN数组。对于我们......的每个MxN阵列

回答 2 投票 3

从RGB到BGRA的快速矢量化转换

在关于将RGB转换为RGBA和ARGB转换为BGR的一些先前问题的后续内容中,我想通过SSE加速RGB到BGRA的转换。假设一台32位机器,并想使用...

回答 4 投票 6

使用Numpy而不是循环

我有以下虚拟数据:import numpy as numpy x = np.linspace(1,10,10)y = np.linspace(1,10,10)x [:: - 1] .sort()y [:: -1] .sort()tot_value = np.sum(y)n_values = np.array([1,2,3])...

回答 2 投票 2

MATLAB:用NaN替换每列的前导零

我有一个叫做mat的3D矩阵。每列可以包含或不包含可变数量的前导零。我需要用NaN替换它们。重要的是要认识到可能会有更多......

回答 1 投票 1

MATLAB:从双数组到单元数组的矢量化赋值

我有三个数组,大小相同:xout%单元格数xin%数字数组双精度b%逻辑数组如何获取与索引对应的xin元素...

回答 1 投票 4

如何以完全向量化的方式确定多行中的行相等?

我有一个numpy.ndarray叫做大小分组(S,N)。每行分组为我提供了数据样本的组标签。我运行我的算法S次并在每次迭代中获得新的组标签。一世 ...

回答 3 投票 4

在`C`函数中定义`static const` SIMD变量

我有一个这种形式的函数(从使用SSE的指数函数的最快实现):__ m128 FastExpSse(__ m128 x){static __m128 const a = _mm_set1_ps(12102203.2f); //(1 << ...

回答 3 投票 3

不同大小的和和乘法矩阵

我在Matlab中有两个矩阵:A大小为GxM,B大小为DxM。我想创建一个大小为GxD的矩阵C,使得C(g,d)= sum(A(g,:))。* B(d,:))/ M.让我用一个例子清楚地解释A = [1 2 3; ...

回答 1 投票 2

使用cython加速numpy数组的类

我有以下代码:class _Particles:def __init __(self,num_particle,dim,fun,lower_bound,upper_bound):self.lower_bound = lower_bound#np.array of shape(dim,)...

回答 1 投票 1

R中的编码实践:不同风格的优缺点是什么?

最近关于使用require与::的问题引发了关于在R中编程时使用哪种编程风格的问题,以及它们的优点/缺点。浏览......

回答 4 投票 33

read.xls - 读取可变长度的工作表列表及其名称

鉴于几个.xls文件具有不同数量的工作表,我正在使用gdata包中的R使用read.xls将它们读入。我有两个相关问题(解决第二个问题应解决第一个问题):...

回答 2 投票 6

在R中计算加权分组的快速方法意味着什么?

给定纵向数据,我如何计算矩阵,其中每列代表给定变量的加权分组均值?我开发了一种需要循环的方法,它太慢了....

回答 1 投票 0

减去包含NA的两个数据帧,使其等于零

我想通过减法比较两个大数值数据帧,即最快的矢量化,以便找出两者相等的位置。就我的目的而言,如果两者包含......

回答 1 投票 0

r mapply vs“bad lapply”

我想我在这里错过了一些简单的东西:我有一个data.frames列表,以及一个要选择的行号列表。像这样:a

回答 1 投票 6

从二阶导数计算的曲线的SIMD优化

这个问题真是好奇心。我正在将例程转换为SIMD指令(我对SIMD编程很陌生),并且遇到以下代码问题:// args:uint32_t ...

回答 2 投票 4

如何编码这个矩阵乘法?

我有两个矩阵:A = [1 2; 3 4; 5 6] B = A'乘法应该采用从两者中提取行和列向量的方式。 C = B(:,i)* A(i,:)这样第一次......

回答 3 投票 6

将python代码矢量化为numpy

我有以下代码片段(用于霍夫圆变换):对于范围内的r(1,11):对于范围内的t(0,360):trad = np.deg2rad(t)b = x - r * np.cos (传统)a = y - r * ......

回答 2 投票 2

© www.soinside.com 2019 - 2024. All rights reserved.