我有以下基础设施:
我有一个带有NodeJS + Express进程的EC2实例在端口上侦听消息(进程1)。每次进程收到消息时,都会将其发送到SQS队列。然后我在同一台机器上有另一个进程使用长轮询读取队列(进程2)。当它在队列中找到消息时,它会将数据插入位于RDS实例上的MariaDB数据库中。
(只是为了澄清,消息是由用户生成的,他们发送一大块数据,其中包含任意信息到进程1正在侦听的端点)
现在我想将读取SQS(进程2)的进程放在Lambda函数中,以便写入队列的进程和从队列中读取的进程完全独立。问题是我不知道这是否可行。
我知道Lambda函数是为响应事件而调用的,目前支持的事件是S3,SNS,SES,DynamoDB,Kinesis,Cognito,CloudWatch和Cloudformation,但不是SQS。
我正在考虑使用SNS通知来调用Lambda函数,以便每次将消息推送到队列时,都会触发SNS通知并调用Lambda函数,但在使用它后,我意识到这是不可能的从SQS创建SNS通知,只能将SNS通知写入队列。
现在我有点卡住,因为我不知道如何继续。由于AWS服务的当前限制,我觉得无法创建此基础结构。还有另一种方法可以做我想做的事情,还是我处于死胡同?
只是为了通过我所做的一些研究扩展我的问题,这个github repo展示了如何从Lambda函数读取SQS队列,但lambda函数只有在从命令行触发时才有效:
https://github.com/robinjmurphy/sqs-to-lambda
在自述文件中,作者提到了以下内容:
更新:Lambda现在支持SNS通知作为事件源,这使得这个hack完全不需要SNS通知。如果您喜欢使用Lambda函数处理SQS队列上的作业,您可能仍会发现它很有用。
但我认为这不能解决我的问题,SNS通知可以调用Lambda函数,但是当我在SQS队列中收到消息时,我看不到如何创建通知。
谢谢
有几种策略可用于连接点,(A)同步或运行 - 睡眠 - 运行以保持数据处理流在SNS,SQS,Lambda之间。
策略1:让Lambda函数收听SNS并实时处理[请注意,SQS队列可以订阅SNS主题 - 其中 将 可能有助于记录/审计/重试处理]
策略2:鉴于您正在获取源自SQS队列的数据。您可以尝试使用2个Lambda函数[Feeder&Worker]。
馈线将是
scheduled lambda function
,其工作是从SQS(如果有的话)中获取项目并将其作为SNS主题推送(并继续永久地执行)工作者将被链接到听取SNS主题,这将做
actual data processing
我们现在可以使用SQS消息来触发AWS Lambda函数。此外,不再需要运行消息轮询服务或创建SQS到SNS映射。
我有类似的情况(现在部署了一个工作解决方案)。我已通过以下方式解决了这个问题:
即向SNS发布活动;然后散布到Lambda和SQS。
注意:这不适用于必须按特定顺序处理的事件。
有一些陷阱(有可能的解决方案),如:
两种情况的解决方案都是对SQS队列进行长轮询;但这确实使你的lambda账单更加昂贵。
注1
短轮询是默认行为,其中在ReceiveMessage调用上对加权随机机器集进行采样。这意味着只返回采样机器上的消息。如果队列中的消息数量很少(小于1000),则可能会获得比每次ReceiveMessage调用请求的消息少的消息。如果队列中的消息数量非常小,您可能不会在特定的ReceiveMessage响应中收到任何消息;在这种情况下,您应该重复该请求。 http://docs.aws.amazon.com/AWSSimpleQueueService/latest/APIReference/API_ReceiveMessage.html
AWS SQS是亚马逊最古老的产品之一,它仅支持到2018年6月的轮询(长和短)。如this answer所述,AWS SQS现在支持在SQS中新消息到达时触发lambda函数的功能。 this document提供了完整的教程。
我曾经使用不同的机制来解决这个问题,下面给出了一些你可以使用的方法。
我们有一些类似的要求,所以我们最终建立了一个库并开放它以帮助SQS到Lambda异步。我不确定这是否符合您的特定要求,但认为值得一看:https://read.iopipe.com/sqs-lambda-teaming-up-92c4096be49c