使用 Pyspark 更改字符串类型顺序并删除特定字符

问题描述 投票:0回答:1

假设我有一个像下面这样的专栏

日期
03/2024
07/2024
12/2024
06/2024
01/2024

但我想更改字符串顺序并删除中间的特定字符

日期
202403
202407
202412
202406
202401

请帮助我!

pyspark
1个回答
0
投票

使用

DATE_FORMAT
TO_DATE
功能。就像下面这样。

SELECT
    DATE_FORMAT(TO_DATE(date, 'MM/yyyy'),'yyyyMM') AS date
FROM 
    VALUES ('03/2024'),('07/2024'),('12/2024'),('06/2024'),('01/2024') 
    AS (date)
+------+
|date  |
+------+
|202403|
|202407|
|202412|
|202406|
|202401|
+------+
© www.soinside.com 2019 - 2024. All rights reserved.