假设我有一个数据集,其中有一列,
date
0 2022-01-15
1 Jan 23, 2021
2 Sun Feb 7 10:45:32 2020
3 Friday, 03-MAR-2019
4 2022-18-01
大多数行包含
YYYY-MM-DD
,部分行仅包含 YYYY-DD-MM
格式。
我使用月份映射将字符串转换为 int 以及其他一些技术来分别处理每种情况。
m_mapper = {
'jan': '01',
'feb': '02',
'mar': '03',
'apr': '04',
'may': '05',
'jun': '06',
'jul': '07',
'aug': '08',
'sep': '09',
'oct': '10',
'nov': '11',
'dec': '12'
}
但是我似乎想不出转换
Sun Feb 7 10:45:32 2020
和 YYYY-DD-MM
格式的想法,是否有任何包/方法可以将它们转换为像 YYYY-MM-DD
这样的单一格式?
适用于
Sun Feb 7 10:45:32 2020
和 YYYY-DD-MM
格式
您可以使用:
datetime
模块或 dateutil
模块将其解析为 YYYY-MM-DD
格式。
import datetime
date_string = "Sun Feb 7 10:45:32 2020"
date_time_obj = datetime.datetime.strptime(date_string, "%a %b %d %H:%M:%S %Y")
formatted_date = date_time_obj.strftime("%Y-%m-%d")
print(formatted_date)
import dateutil.parser
date_string = "Sun Feb 7 10:45:32 2020"
#date_string = "2020-02-07"
parsed_date = dateutil.parser.parse(date_string)
formatted_date = parsed_date.strftime("%Y-%m-%d")