使用 pyarrow 时 Jupyter 中出现“内核似乎已死亡”错误

问题描述 投票:0回答:1

这是代码:

bad_array = pa.array([5.25,5.11,7.1,3.111,-1.2])
good_array = pa.array([5.25,5.11,7.1,3.111,2.4])

array = bad_array

boolean_mask = pc.less(array, pa.scalar(0))

boolean_mask.true_count

在尝试返回布尔数组的“true_count”时,内核死亡。然而,“false_count”工作正常。很奇怪。

我之前认为问题是由于我尝试处理的数据大小造成的,但后来我尝试在这些非常小的数组上运行测试并遇到了相同的错误。

有什么想法吗?

谢谢。

python jupyter-notebook pyarrow
1个回答
0
投票

这是由于已在 https://github.com/apache/arrow/issues/41016 报告的已知错误造成的。它已在 PyArrow 16.0.0 中修复,因此升级到 PyArrow 16.0.0 或更高版本应该可以解决您的问题。

© www.soinside.com 2019 - 2024. All rights reserved.