有办法从 COPY TO 失败的地方恢复吗？

Question

我正在使用 Cassandra 的 COPY 命令（可以在 https://docs.datastax.com/en/cql-oss/3.x/cql/cql_reference/cqlshCopy.html 找到文档）将大型表导出到 CSV在此之后我需要导出更大的。

我使用的命令是：

COPY my_table_name TO 'my_table_name.csv'

运行 12 小时（并创建 289GB 文件）后，我收到以下错误：

Error for (3598295844520231142, 3615644561192297385): ReadFailure - Error from server: code=1300 [Replica(s) failed to execute read] message="Operation failed - received 0 responses and 1 failures" info={'failures': 1, 'received_responses': 0, 'required_responses': 1, 'consistency': 'ONE'} (permanently given up after 349000 rows and 1 attempts)
Exported 1280 ranges out of 1281 total ranges, some records might be missing

我想知道是否有办法从失败点继续下去。我看到错误显示“在 1281 个总范围中导出了 1280 个范围”，有没有办法只指定最后一个范围，这样我就不需要再次尝试导出整个表？

文档提到了 BEGINTOKEN 和ENDTOKEN，但我不清楚它们是什么意思，如果它们可以帮助我的话。

是否有更可靠的方法来导出表？

Answer 1

COPY

命令应用于表中最多大约 100 万条记录（根据经验）。原因是它非常慢（单线程 python）并且即使简单也不是很健壮。

有免费的工具可以实现同样的目的。我特别想到DSBulk。要创建 CSV，请使用

unload

命令 doc

该组件为您提供了许多导出选项和检查点机制，以便在您停止时重新启动。输出是多个 CSV，以后更容易移动。

dsbulk unload -url ~/data-export -k ks1 -t table1

有办法从 COPY TO 失败的地方恢复吗？

问题描述投票：0回答：1

1个回答

最新问题

有办法从 COPY TO 失败的地方恢复吗？

问题描述 投票：0回答：1

1个回答

最新问题

问题描述投票：0回答：1