vectorization 相关问题

矢量化是指一种编程范例,其中函数一次性在整个数组上运行。这在函数调用,存储器访问,并行化和代码表达方面提供了好处。某些编程语言(如MATLAB)经过优化,可在向量化时提供最佳性能。

索引到 df 行的向量化

我想矢量化我的代码并尝试 df['results'] = coord.loc[df['a'],'x_coord'] * coord.loc[df['b'],'y_coord'] 但它返回错误“ValueError:无法在具有重复的轴上重新索引...

回答 1 投票 0

操作给定的 DataFrame 以在不同的结构中重新创建它,Pandas Python

Left DataFrame 是给定的,我想将它重新创建到正确的 DataFrame。 你好, 所以假设我有一个给定的数据框(左边的),我想创建一个新的数据框(右边的)。 我...

回答 1 投票 0

SIMD:如何使用其索引在 4 个 __m256d 寄存器中找到最小值

我有 4 个 _m256d,如何找到所有 16 个值中的最小值? 我怎么知道最小值来自哪个 __m256d 变量?它是哪个元素?假设

回答 1 投票 0

postgresql 上不存在“vector”类型 - langchain

我试图在 pgvector 扩展和 langchain 的帮助下在 postgresql 上嵌入一些文档。不幸的是,我遇到以下错误: (psycopg2.errors.UndefinedObject) ty...

回答 1 投票 0

拆分字符串列以创建新的二进制列

我的数据只有一列,我正在尝试使用行中每个“/”之后的内容创建其他列。以下是数据的前几行: 我的数据<- data.frame( ALL = factor(c( &...

回答 10 投票 0

高效(在 Ryzen 上)将 __m256 的奇数元素提取到 __m128 中的方法?

是否有一种固有的或另一种有效的方法将 AVX 寄存器的 64 位组件的高/低 32 位组件重新打包到 SSE 寄存器中?使用 AVX2 的解决方案是可以的。 到目前为止,我正在使用

回答 1 投票 0

如果为 tfidfvectorizer 输入一个数据行,则会出现维度不兼容的错误

我正在尝试实现 tf-idf 并使用 KNN 来预测基于文本的类。我有 500 行的数据分成 450-50 用于训练和测试。 在训练时,我已经拟合了训练数据和

回答 0 投票 0

向量化迭代Python函数:c[i] = a[i] + b[i] * c[i-1]

我有一个迭代 Python 函数: 将熊猫导入为 pd def calculate_result(foo: pd.Series, bar: pd.Series, baz: pd.Series) -> pd.Series: 结果 = pd.Series(index=foo.index, dtype=float) ...

回答 1 投票 0

发送 tf.data.Dataset 到模型。适合 seq2seq 模型,在格式上给出各种错误

我正在尝试更新 https://www.tensorflow.org/text/guide/word_embeddings 中的步骤以接受序列到序列,其中输入序列是上下文、问题、答案串联在一起...

回答 0 投票 0

如何广播两个vector of vector的元素外和?

我有两个相同大小的 Matrix{Vector{}},比如 A 和 B。我想得到一个 Matrix{Matrix{}}, M,这样每个元素都是 A 和 B 的每个元素的外和,即 M[i, j][k, l] = A[i, j][k] ...

回答 2 投票 0

c++ 向量中 long long int 的位移,例如 380 位

我正在寻找一种有效的方法来按位移动 long long int 的整个向量。应该移动整个向量,而不仅仅是分别移动每个值。例如 shift 值可以是随机的

回答 1 投票 0

满足特定条件时在 DataFrame 中的行之间创建行的快速函数 | Python 熊猫

我正在寻找一种更快的替代方法来编辑 pandas DataFrame 的行(拆分、添加)。 这是代码: # 开始的定义 start_0 = dt.datetime(2023,4,1,0,0,0) # 使用 c 创建一个 DataFrame ...

回答 1 投票 0

在 python 中向量化包含分层字符串的 for 循环

我有一个使用for循环编写的代码,我想知道是否有向量化的解决方案?我的问题是元素的顺序很重要并且在 if 子句中使用。 下面的代码描述了

回答 1 投票 0

禁用向量访问边界检查时意外的垃圾收集器活动

我在测试 Java 19 jkd.incubator.vector 和 java.lang.foreign API 时观察到奇怪的 GC 行为。使用 JMH 来避免 OSR 编译工件(如果我做错了这部分请告诉我),我

回答 0 投票 0

在数组数组上使用 numpy 掩码数组而不会得到扁平化输出

考虑以下代码 x = np.array([[1, 2, 3], ['NaN', 4, 'NaN'], [7, 8, 9]]) # 将“NaN”字符串转换为掩码值 mask = np.ma.masked_where(x == 'NaN', x) # 获取一个布尔数组指示...

回答 4 投票 0

在 pytorch 中加速矢量函数的导数

我需要计算批次 x nvarout(比如 150)中的向量函数输出相对于批次 x nvarin(比如 2)中的输入 x 的一阶和二阶导数。 我设法做到这一点......

回答 1 投票 0

如何使用向量化来提高python性能?

我正在对我的交易策略进行回测,这是一个每日策略,并且会有 2 个数据框。 第一个数据框是每日交易信号,有两列:交易日期和交易 ...

回答 0 投票 0

在 mac 上安装 pgvector 扩展

我正在尝试在我的 Mac 上安装 postgres 矢量扩展,但我越来越 错误:扩展名“vector”没有安装脚本,也没有版本“0.4.0”的更新路径。 这就是......

回答 1 投票 0

如果 numpy 数组中的任何项目已经出现在前一个数组中,则删除该数组中的子数组

我有一组 numpy 数组。我需要过滤掉重复项——如果数组中的任何项目存在于前一个数组中,那么它被认为是重复项。 #IE。: 到达= 数组([[4580, 4581, 4657...

回答 3 投票 0

如何矢量化运行在 pandas Periodindex 上的 for 循环,我需要将日期时间排序到适当的时间段?

我有一个数据框“timeseries”,它以日期时间作为索引,我有一个 PeriodIndex “on”: 将 numpy 导入为 np 将熊猫导入为 pd 时间序列 = pd.DataFrame( 指数=pd.

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.