同样的代码返回从不同运行不同的结果

问题描述投票：0回答：1

IM我的代码，还有我从蜂巢表创建一个数据帧。而我做的fonction过滤器一个简单的过滤器。但结果是随机的：我执行包含过滤几次相同的细胞，有时，它会返回行，有时不回来。我敢肯定，只有一个在预期的结果一致。并没有其他的作品在同一时间上的源文件。

df = spark.sql("select id from hive_table limit 100")

df.filter(col('id') == 27654909)

pyspark jupyter-notebook

1个回答

1
投票

我不是专家在pyspark，可以肯定的，但你的症状听起来像限制实际上是控制搜索的深度，而不是返回记录结果的最大数量。

因为我想这是一个开发环境，如果取消该限制条款，你得到的一次性成功100％？

最新问题

© www.soinside.com 2019 - 2024. All rights reserved.