我注意到
ec2ApiErrCount
指标有时会报告非零值
为了调查潜在的 EC2 API 错误,我启用了 CloudTrail 管理事件。 但是我在CloudTrail中没有找到对应的EC2 API错误日志。
这是我的查询片段:
fields @timestamp, @log, eventName
| filter eventSource like "ec2.amazonaws.com"
| filter userAgent like "amazon-vpc-cni"
| sort @timestamp desc
我还应该检查其他因素或日志来了解 ec2ApiErrCount 指标和 CloudTrail 日志之间的差异吗?
什么可能导致
ec2ApiErrCount
报告非零值?
以下是用于过滤来自 VPC CNI 的错误 EC2 API 调用的日志洞察查询片段:
fields @timestamp, userAgent, eventName
| filter not isempty(errorCode)
| filter eventSource like "ec2.amazonaws.com"
| filter userAgent like "amazon-vpc-cni"
| sort @timestamp desc
| limit 100
我注意到有一些
DeleteNetworkInterface
错误,例如“网络接口‘eni-xxxx’当前正在使用中。”
但是,这种常见错误是通过重试循环来处理的。