如何获取2019-11-07T22:00:00.000 + 0000和2019-11-07T21:55:00.000 + 0000的两个时间戳之间的时差

问题描述 投票:2回答:2

我尝试过下面的代码,它给我-55作为上面2个time_stamps之间的差。它应该给我5分钟。是否有任何直接功能可以在pyspark中获得正确的时差。df.withColumn(“ time_diff”,F.minute(“ time_stamp”)-F.minute(“ time_stamp2”))] >>

没有给我正确答案。请帮助

我尝试过下面的代码,它给我-55作为上面2个time_stamps之间的差。它应该给我5分钟。是否有任何直接功能可以在pyspark中获得正确的时差。 df ....

pyspark
2个回答
0
投票

您可以使用以下功能来获取以秒为单位的时差:


0
投票

您可以尝试这个吗?>

import pyspark.sql.functions as F
import pyspark.sql.types as Types
df = df.withColumn('t1_unix', F.unix_timestamp(df.t1, "yyyy-MM-dd'T'HH:mm:ss.SSS"))
df = df.withColumn('t2_unix', F.unix_timestamp(df.t2, "yyyy-MM-dd'T'HH:mm:ss.SSS"))
df = df.withColumn('diff', ((df.t1_unix-df.t2_unix)/60).cast(Types.IntegerType()))
© www.soinside.com 2019 - 2024. All rights reserved.