我的日志文件数据带有INFO,WARNING,ERROR,OTHER(FATAL,DEBUG)。
10:00:00 INFO
10:00:00 INFO
10:01:51 WARNING
10:02:05 ERROR
10:05:20 INFO
10:06:01 WARNING
10:07:08 ERROR
10:44:00 DEBUG
10:51:01 FATAL
10:52:05 ERROR
11:01:59 INFO
11:08:01 WARNING
11:59:05 ERROR
12:02:00 INFO
12:09:01 WARNING
12:18:05 ERROR
12:31:00 INFO
12:40:01 FATAL
12:55:05 DEBUG
13:05:36 INFO
13:26:01 WARNING
13:30:05 ERROR
我需要每小时计算INFO,WARNING,ERROR和OTHER的总数。
输出在下面看起来应该像这样
10:00 3, 2,3,2
11:00 1,1,1,0
输出中的10:00是从10:00:00到10:59:59的时间范围
导入了熊猫和itertools,并使用了groupby,但无法成功。我不想让您混淆我的代码。所以请帮帮我。我非常需要它。
带有您的样本数据:
您需要:
您的df:
不转换为日期时间: