如何编写脚本来读取日志文件并按关键字对日志进行分组并每小时进行计数

问题描述 投票:1回答:4

我的日志文件数据带有INFO,WARNING,ERROR,OTHER(FATAL,DEBUG)。

10:00:00 INFO    
10:00:00 INFO   
10:01:51 WARNING    
10:02:05 ERROR      
10:05:20 INFO 
10:06:01 WARNING
10:07:08 ERROR 
10:44:00 DEBUG  
10:51:01 FATAL
10:52:05 ERROR  
11:01:59 INFO  
11:08:01 WARNING  
11:59:05 ERROR 
12:02:00 INFO
12:09:01 WARNING 
12:18:05 ERROR 
12:31:00 INFO 
12:40:01 FATAL 
12:55:05 DEBUG 
13:05:36 INFO 
13:26:01 WARNING
13:30:05 ERROR

我需要每小时计算INFO,WARNING,ERROR和OTHER的总数。

输出在下面看起来应该像这样

10:00 3, 2,3,2 

11:00 1,1,1,0

输出中的10:00是从10:00:00到10:59:59的时间范围

导入了熊猫和itertools,并使用了groupby,但无法成功。我不想让您混淆我的代码。所以请帮帮我。我非常需要它。

python pandas pandas-groupby devops itertools
4个回答
2
投票

带有您的样本数据:


1
投票

您需要:


1
投票

您的df:


0
投票

不转换为日期时间:

© www.soinside.com 2019 - 2024. All rights reserved.