spark-cassandra-connector 相关问题

连接Apache Spark和Cassandra以进行集群查询


spark-cassandra-connect python deleteFromCassandra方法

我正在Databricks Notebook上使用Spark,Cassandra,Spark-Cassandra-Connector,根据他们的网站,我们可以使用'deleteFromCassandra'删除行:https://github.com/datastax/spark-cassandra-。 。

回答 1 投票 0

spark-cassandra-connector配置:并发读取与输入读取reads_per_sec

阅读https://github.com/datastax/spark-cassandra-connector/blob/master/doc/reference.md#read-tuning-parameterscurrent.reads时感到困惑:设置joinWithCassandra的读取并行度...] >

回答 1 投票 0

将Cassandra行分组然后使用Spark写为木地板文件

我需要将Cassandra分区写为实木复合地板文件。由于我无法在foreach函数中共享和使用sparkSession。首先,我调用collect方法来收集驱动程序中的所有数据,然后编写...

回答 1 投票 0

大数据项目的哪种架构?

这听起来像是一个非常笼统的问题,我希望答案是“是,但是”。预计明年会有100 Gb的各种数据到达,我想建立一个稳定的结构。这些数据将...

回答 1 投票 0

从Spark写入Cassandra时为空指针异常

我正在使用spark-cassandra-connector-2.4.0-s_2.11将数据从spark写入Databricks集群上的Cassandra。我在将数据从Spark写入Cassandra时遇到java.lang.NullPointerException。 ...

回答 1 投票 0

是否有办法找出Cassandra中的SELECT语句使用了哪个节点?

我已经为spark-cassandra-connector编写了一个自定义LoadBalancerPolicy,现在我想确保它确实有效!我有一个具有3个节点的Cassandra集群和一个具有复制功能的键空间...

回答 2 投票 0

Spark批处理在2个Cassandra群集之间迁移数据

我正在使用spark将一些数据从一个cassandra表移动到另一个集群上的另一个cassandra表。我为以下源集群之一指定了cassandra配置:/ * spark ....

回答 1 投票 0

从spark数据帧插入cassandra表会导致org.codehaus.commons.compiler.CompileException:文件'generated.java'错误

我正在使用spark-sql.2.4.1v,datastax-java-cassandra-connector_2.11-2.4.1.jar和java8。我这样创建cassandra表:create company(company_id int PRIMARY_KEY,company_name text); ...

回答 2 投票 0

在远程主节点中运行forEachPartition时,Apache Spark java.lang.ClassCastException

我有一个Java微服务,该微服务连接到Apache Spark集群,并使用Datastax Spark-Cassandra连接器将数据持久保存到apache Cassandra数据库集群。我写了以下方法...

回答 1 投票 0

具有RetryPolicy的Datastax spark cassandra连接器,用于将DF写入cassandra表中

我正在尝试将一致性级别为“ EACH_QUORUM”的spark数据帧写入cassandra。我的代码如下所示:val sparkBuilder = SparkSession.builder()。 config(cassandraHostPropertyProperty,...

回答 1 投票 0

如何使用火花卡桑德拉连接器以批处理方式装入集合数据类型

我试图加载它与收集的数据类型两个属性为卡桑德拉表火花数据帧。在进入的原料的文件,这些属性是文本/字符串。我用下面的代码...

回答 1 投票 0

如何在不连接Cassandra的情况下创建CassandraTableScanJavaRDD?

我正在尝试对连接到Cassandra并执行select语句的方法进行单元测试。然后将返回的CassandraTableScanJavaRDD转换为数据帧并进行进一步处理。 ...

回答 1 投票 0

来自kafka的Spark Structured Streaming以分布式方式在Cassandra中保存数据

我试图创建一个从Kafka到Spark的结构化Streaming,这是一个json字符串。现在想要将json解析为特定列,然后将数据帧保存到cassandra表中,并具有最佳值...

回答 2 投票 0

Spark parquet s3错误:AmazonS3Exception:状态代码:403,AWS服务:Amazon S3,AWS请求ID:xxxxx,AWS错误代码:null

我正在尝试阅读AWS S3中存在的镶木地板文件并获得以下错误。 17/12/19 11:27:40 DEBUG DAGScheduler:ShuffleMapTask结束于0 17/12/19 11:27:40 DEBUG DAGScheduler:...

回答 2 投票 2

Apache Spark无法处理大型Cassandra列族

我正在尝试使用Apache Spark来处理我的大型(~230k条目)cassandra数据集,但我经常遇到不同类型的错误。但是我可以在......时成功运行应用程序

回答 1 投票 3

哪个版本应该使用java语言进行Spark cassandra连接?

我正在尝试使用Java语言连接spark和cassandra数据库。连接spark和cassandra我使用最新版本的Spark-cassandra-Connector,即2.4.0。目前我可以连接......

回答 1 投票 -1

多次使用预准备语句,警告Cassandra查询降低性能

我从某个地方获取数据并将其插入每天的cassandra然后我需要从cassandra中检索整个星期的数据并进行一些处理并将结果插回到cassandra ....

回答 2 投票 0

在Cassandra 3.11.4中服务器端的慢查询记录器Cassandra

根据https://issues.apache.org/jira/browse/CASSANDRA-12403我尝试使用Cassandra 3.11.4上的以下步骤启用慢速查询记录,但无法查询它们是什么问题,或者我...

回答 1 投票 0

DSE Analytics Spark中的列名错误无效

我有一个表,其结构大致如下 - > CREATE TABLE keyspace_name.table_name(id text PRIMARY KEY,type text,bool_yn boolean,created_ts timestamp,modified_ts ...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.