AWS Glue 爬网程序仅爬网列名称而不是数据

问题描述 投票:0回答:2

我有多级 json 文件,我已使用 Glue 作业将其转换为 CSV。现在我尝试在该 CSV 文件上使用爬网程序,爬网程序正确创建粘合表(显示已创建状态 1)。但是当我在 Athena 中检查此表时,它只显示表的列名,不显示任何数据。在爬虫创建过程中,我使用分类器作为逗号,但它仍然不起作用。有什么想法、建议来解决这个问题吗? 请查看随附的 CSV 屏幕截图。还可以在 Athena 中找到随附的屏幕截图输出。

输入CSV:

Athena 中的输出:只有列名,没有数据。

amazon-web-services aws-glue amazon-athena glue-crawler
2个回答
0
投票

我得到了解决方案,但我不明白逻辑。通常在爬虫中我习惯选择文件作为源数据,但这次我选择文件夹名称并且它起作用了。


0
投票

我们使用爬虫来获取您的数据架构并创建数据目录。有了这个数据目录,您可以使用 Job Glue 或 Athena 读取数据...

© www.soinside.com 2019 - 2024. All rights reserved.