我希望一旦时间大于 07:00:00,'tatsaechlicher_einsatztag' 列的日期应该是 'einsatzdatum' + 1,如果时间小于 07:00:00,那么它应该是同一天。这里的问题是代码无法读取第121行的字符串,目前总是加1天,因为不识别字符串。
您可以使用“hours”功能来做到这一点。您需要从 pyspark.sql 导入它,例如
from pyspark.sql import functions as F
要实际执行比较,它会是这样的。
F.hours(F.col("column_name")) < F.lit(7)