如何统一数据集的日期时间格式

问题描述 投票:0回答:1

假设我有一个数据集,其中有一列,

                      date
0               2022-01-15
1             Jan 23, 2021
2  Sun Feb 7 10:45:32 2020
3      Friday, 03-MAR-2019
4               2022-18-01

大多数行包含

YYYY-MM-DD
,部分行仅包含
YYYY-DD-MM
格式。

我使用月份映射将字符串转换为 int 以及其他一些技术来分别处理每种情况。

m_mapper = {
    'jan': '01',
    'feb': '02',
    'mar': '03',
    'apr': '04',
    'may': '05',
    'jun': '06',
    'jul': '07',
    'aug': '08',
    'sep': '09',
    'oct': '10',
    'nov': '11',
    'dec': '12'
}

但是我似乎想不出转换

Sun Feb 7 10:45:32 2020
YYYY-DD-MM
格式的想法,是否有任何包/方法可以将它们转换为像
YYYY-MM-DD
这样的单一格式?

python datetime datetime-format
1个回答
0
投票

适用于

Sun Feb 7 10:45:32 2020
YYYY-DD-MM
格式

您可以使用:

datetime
模块或
dateutil
模块将其解析为
YYYY-MM-DD
格式。

import datetime
date_string = "Sun Feb 7 10:45:32 2020"
date_time_obj = datetime.datetime.strptime(date_string, "%a %b %d %H:%M:%S %Y")
formatted_date = date_time_obj.strftime("%Y-%m-%d")
print(formatted_date)
import dateutil.parser
date_string = "Sun Feb 7 10:45:32 2020"
#date_string = "2020-02-07"
parsed_date = dateutil.parser.parse(date_string)
formatted_date = parsed_date.strftime("%Y-%m-%d")
© www.soinside.com 2019 - 2024. All rights reserved.