Hadoop初学者 - 数据摄取和分析

问题描述 投票:1回答:1

HDFS存储结构化和非结构化数据.HIVE&IMPALA使我们能够编写sql查询,然后将其转换为MapReduce。用户如何了解存储数据的模式或如何根据存储在HDFS中的数据形成这些表?

hadoop hive impala
1个回答
0
投票

如果使用Parquet文件格式,则可以使用工具直接检查文件块。例如,请参阅this。大多数hadoop文件格式也有类似的方便工具,例如orcfiles的https://orc.apache.org/docs/tools.html

© www.soinside.com 2019 - 2024. All rights reserved.