我有如下数据集
+---------+
| column1 |
+---------+
| ABC |
+---------+
| DEF |
+---------+
| GHI |
+---------+
| JKL |
+---------+
| MNO |
+---------+
现在必须获得第四行列值为JKL
。无论如何有直接获得。我通常按以下方式进行]
String dataTemp = df.select("column1").collectAsList().get(3).toString();
但是我不想每次都收集为列表,这可能会在处理大型数据集时引起问题。
约翰,
您需要使用monotonically_increasing_id
内置函数并对其进行过滤。