日期解析在python-dateutil模块中不适当

问题描述 投票:1回答:2

当前我正在使用最新的python-dateutil模块v2.8.1,在这里我运行类似的命令:

from dateutil import parser
print(parser.parse('May 20,2019').isoformat())

我得到了:2020-05-20T00:00:00

但是直到python-dateutil模块v2.4给出的结果为:2019-05-20T00:00:00

这是该模块的错误还是我做错了?

python python-3.x python-dateutil
2个回答
0
投票

我刚刚检查了2.5.0的发行说明https://github.com/dateutil/dateutil/releases/tag/2.5.0

这似乎表明可能是:

解析器问题,其中年份> 100 AD被错误地解析。贡献的通过@ Bachmann1234(gh pr#130)


0
投票

您没有做错任何事情-这似乎是由于添加了对解析ISO 8601日期(例如stdlib logging时间戳)的支持而导致的回归。

2020-05-20 12:34:56,789

逗号后的数字是时间的毫秒部分。添加对逗号分隔符的支持也导致了原始帖子中看到的错误。

在dateutil v2.5.0 +中:

>>> from dateutil.parser import parse
>>> parse("May 20,2019")  # bugged
datetime.datetime(2020, 5, 20, 0, 0)
>>> parse("2020-05-20 12:34:56.789")
datetime.datetime(2020, 5, 20, 12, 34, 56, 789000)
>>> parse("2020-05-20 12:34:56,789")  # working
datetime.datetime(2020, 5, 20, 12, 34, 56, 789000)

在dateutil v2.4.2中:

>>> from dateutil.parser import parse
>>> parse("May 20,2019")  # not bugged
datetime.datetime(2019, 5, 20, 0, 0)
>>> parse("2020-05-20 12:34:56.789")
datetime.datetime(2020, 5, 20, 12, 34, 56, 789000)
>>> parse("2020-05-20 12:34:56,789")  # not working
ValueError: Unknown string format

请注意,您的案例中的“ 2019”年将被忽略。 2020年来自将当前日期替换为已解析的信息。如果您传递default kwarg,它将替换为它。

>>> from datetime import datetime
>>> parse("May 20,1998")
datetime.datetime(2020, 5, 20, 0, 0)
>>> parse("May 20,1998", default=datetime(1998,3,19))
datetime.datetime(1998, 5, 20, 0, 0)
© www.soinside.com 2019 - 2024. All rights reserved.