是否可以生成具有如下日期格式的数组datearray = [ “20190901”, “20190902” ...... .., “20190930”]
我想输入日期范围,它会自动生成。数组
使用databricks python
start = '20190101'
end = '20190501'
[str(x).replace('-', '').split()[0] for x in pd.date_range(start=pd.Timestamp(start), end=pd.Timestamp(end), freq='1D')]
如果您要给出天数,则可以给出结束日期,而不是给出结束日期,
start = '20190101'
days = 100
[str(x).replace('-', '').split()[0] for x in pd.date_range(start=pd.Timestamp(start), end=pd.Timestamp(start) + pd.Timedelta(days=days), freq='1D')]
spark.sql("SELECT sequence(to_date('2018-01-01'), to_date('2018-03-01'), interval 1 month) AS Date").show()
将返回类似[2018-01-01,2018-02-01,2018-03-01]的列名称为Date的列表。
然后您可以使用]进行转换>
from pyspark.sql.functions import to_date