我的 dsbulk 加载程序和与 Cassandra 的数据连接有问题

问题描述 投票:0回答:1

有人可以帮助我吗?我需要将 .csv 文件输入到我在 Cassandra 中创建的表中。我已经在 dsbulk 加载器的语法中查找问题,但我找不到错误可能是什么。

cassandra表的代码是

创建表格aire(estacion文本,titulo文本,latitud文本,longitud文本,fecha文本,periodo文本,so2文本,无文本,no2文本,co文本,pm10文本,o3文本,dd文本,vv文本,tmp文本, hr 文本、prb 文本、rs 文本、ll 文本、ben 文本、tol 文本、mxil 文本、pm25 文本、主键(estacion、fecha、periodo));

CMD 控制台中 dsbulk 的代码是

dsbulk load -url ~/下载/年龄性别按种族分组分组总响应人口普查居民人口计数2006-2013-2018-人口普查-RC-TA-SA2-DHB/Data8277 .csv -k newzealand -t census --schema.mapping“年份=年份,年龄=年龄,民族=民族,面积=面积,性别=性别,计数=计数”

错误是

操作 LOAD_20240509-223924-806000 意外失败:Com.datastax.oss.dsbulk.connectors.api.Connector:无法实例化提供程序 com.datastax.oss.dsbulk.connectors.csv.CSVConnector。 原因:Com/univocity/parsers/common/Format。 引起者:Com.univocity.parsers.common.Format。

你也有过类似的错误吗?怎么解决?

请解决。我现在需要这个。

cassandra dsbulk
1个回答
0
投票

我希望您正在使用 DSBulk 版本

1.11.0
运行,如果没有,请升级到该版本。您可以通过运行
./dsbulk --version
命令来检查版本。

接下来,您需要正确指定映射。例如,您的命令行中有

"Year = year
。您的表中没有名为
year
的此类列。

例如,如果您的输入 CSV 包含以下示例记录,

header1,header2
1,2

如果你的表模式是这样的,

create table if not exists demo (col1 primary key, col2);

为了加载它,我们可以提供像

header1=col1,header2=col2
这样的映射(如果我们要将所有标题与表列匹配)。

请参阅此处的文档https://docs.datastax.com/en/dsbulk/reference/schema-options.html#schemaMapping,了解有关如何设置映射的更多详细信息。

© www.soinside.com 2019 - 2024. All rights reserved.