我正在使用EMR笔记本从S3提取数据并对数据进行一些操作,然后将其推入不同的s3存储桶。基本上,代码是使用ipython笔记本(jupyter)编写的。
我需要查询DynamoDb表以获取一些其他数据。因此,我必须在EMR笔记本中编写代码以查询ddb。找不到任何相关的维基,我不确定是否可以做到这一点?
有人可以帮我吗?另外,如果您共享一些Wiki如何做到这一点,将对您有很大的帮助
提前感谢。
要使用python查询DynamoDB,您将需要python软件包boto3。如果您使用的是PySpark或Python3笔记本,则此软件包应该可用。
此documentation说明了如何使用boto3查询DynamoDB。