我这里有一个Sqoop场景。请提供相关信息。在我的RDBMS中,我有n个表,其大小分别为1 GB,500 MB,50 MB,10 MB等。在这种情况下,如何一次性或以其他方式导入所有表?
Sqoop允许您一次摄取一个表,它也允许您导入多个表。我不确定后者在性能方面的效果如何。
我认为仅为少数几个表运行导入并不合理。但是,这只是我的意见。
这就是你如何做到的。
sqoop import-all-tables \
--connect jdbc:mysql://your_ip_address:3306/database_name \
--driver com.mysql.jdbc.Driver \
--username root \
--warehouse-dir temp_dir_for_staging \
--hive-import \
--hive-overwrite \
--hive-database hive_db \
--exclude-tables list_of_tables_to_be_excluded
-m 1
在这里阅读更多相关信息。
https://sqoop.apache.org/docs/1.4.0-incubating/SqoopUserGuide.html#id1766722