我在一个EMR(Spark群集)中有一个批处理作业,该作业将批量插入另一个EMR(HBase群集)。两个EMR都位于同一专用子网中。
我如何监视两个EMR之间的带宽? AFAIK他们没有使用NAT Gateay,对吗?如果在同一子网内发生其他人员,我是否可以仅具有从EMR到EMR数据传输的指标?假设另一个Spark作业执行大量改组。
P.S。确实,AWS在同一可用区内的EC2实例之间为您提供〜10千兆比特/秒的带宽吗?此带宽是否在同一子网内的所有实例之间共享?
首先,无法监控子网的流量,每个实例级别的网络统计信息(如进出的字节数(也包括数据包))都会发布到cloudwatch中。
如果需要在集群级别,则可以根据实例的集群类型在逻辑上对其进行分组,并聚合相应的指标,并为每个集群提供自定义统计信息,不支持即开即用。*
] >>是的,在同一VPC中具有私有IP的实例之间不需要NAT进行通信。
(https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/enhanced-networking.html)