将datetime转换为另一种格式而不更改dtype

问题描述 投票:2回答:1

我只是在学习熊猫,我遇到了一些问题。

  1. 在一个从csv文件中读取的DataFrame中,我有一列包含不同格式的日期数据(如'%m/%d/%Y''%Y-%m-%d',可能是空白的。)我希望统一此列的格式。但我不知道是否还有其他格式。因此,当我使用pd.to_datetime()时,它引发了一些错误,例如格式不匹配而不是时间数据。如何统一此列的格式?
  2. 我已将该列的一部分转换为datetime dtype,并且它采用YYYY-mm-dd格式。我可以保留datetime dtype,并将格式更改为'%m/%d/%Y'吗?我使用过pd.dt.strftime(),它会更改格式,但也会将dtype更改为str,而不是保留datetime dtype。
python python-3.x pandas datetime series
1个回答
2
投票

因此,当我使用pd.to_datetime()时,它引发了一些错误,例如格式不匹配而不是时间数据。如何统一此列的格式?

使用errors='coerce'选项可以返回非转换值的NaT(非时间)。另请注意,format参数不是必需的。省略它将使Pandas能够尝试多种格式,否则它将恢复为NaT1。例如:

df['datetime'] = pd.to_datetime(df['datetime'], errors='coerce')

请注意,混合类型可能会被错误地解释。例如,Python将如何知道05/06/2018是6月5日还是5月6日?将应用一系列约定,如果您需要更好的控制,您将需要自己应用自定义订购。

我可以保留日期时间dtype,并将格式更改为'%m /%d /%Y'吗?

你不能。 datetime系列内部存储为整数。任何人类可读的日期表示只是表示,而不是基础整数。要访问自定义格式,您可以使用Pandas中提供的方法。您甚至可以将这样的文本表示存储在pd.Series变量中:

formatted_dates = df['datetime'].dt.strftime('%m/%d/%Y')

dtypeformatted_dates将是object,这表明你的系列元素指向任意Python时代。在这种情况下,那些任意类型碰巧都是字符串。

最后,我强烈建议您在工作流程的最后一步之前不要将datetime系列转换为字符串。这是因为一旦你这样做,你将不再能够在这样的系列上使用高效的矢量化操作。


1这将牺牲性能并与datetime.strptime形成对比,后者需要指定格式。在内部,Pandas使用dateutil库,如docs所示。

© www.soinside.com 2019 - 2024. All rights reserved.