在hadoop hdfs中查看数据格式的最佳方法是什么？

Question

将近50GB的CSV文件加载到Hadoop集群中，我希望看到一些用于标识列的示例记录。

我试过用

hadoop fs -cat employees.csv | head -n 10

我的问题是

Answer 1

这取决于您的版本。

对于较旧的Hadoop（<3.1.0）版本：

hadoop fs -cat employees.csv | head -n 10

对于较新的（> = 3.1.0）Hadoop版本

 hadoop fs -head employees.csv