如何将oracle表导入hive表

问题描述 投票:0回答:2

我正在尝试使用sqoop将oracle表导出到hive表:

sqoop import --connect  jdbc:oracle:thin:@<server>:1521:<db> --username <user> --password <passwd> --table <table name> --hive-import --hive-table <hive_table_name> -m 1

我一直收到这个错误。

2018-09-13 10:55:34,825 ERROR tool.ImportTool: Import failed: org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://localhost:9000/user/<table_name> already exists

我想将oracle表导入到hive表中。我在这里失踪了什么?

hadoop hive sqoop
2个回答
0
投票

您的表已存在于HDFS上,您应该添加target-dir(hdfs上的路径)

句法:

sqoop import --connect jdbc:sqlserver://sqlserver-name \
      --username <username> \
      --password <password> \
      --driver   <driver-manager-class> \
      --table    <table-name> \
      --target-dir  <target-folder-name>

然后根据target-dir创建一个外部Hive表


0
投票

您可以使用hive-import从RDBMS导入到Hive

sqoop import \
--connect jdbc:mysql://localhost/learning \
--username root --password-file "/Learning/sqoop/.password" \
--table employee -m 1 \
--target-dir /Learning/sqoop/import/employee_hive \
--hive-import \
--hive-table employee.employee_hive

根据您的要求更改参数。如果要创建新的Hive表,也可以使用--create-hive-table

© www.soinside.com 2019 - 2024. All rights reserved.