apache-zeppelin 相关问题

Apache Zeppelin是一款基于Web的笔记本电脑,支持数据驱动的交互式数据分析。您可以使用SQL,Python,Scala等制作精美的数据驱动,交互式和协作文档。它还支持Markdown语法。

我如何打印出一个spark.sql对象?

我有一个spark.sql对象,其中包括几个变量。 import com.github.nscala_time.time.Imports.LocalDate val first_date = new LocalDate(2020, 4, 1) val second_date = new LocalDate(2020, 4, ...)

回答 1 投票 0

我可以在程序上运行Zeppelin笔记本吗?

我有Zeppelin在Hadoop之上,有一个Spark集群。我想在一个笔记中运行前五段,然后在另一个笔记中运行前五段。我不想让它们在同一时间运行 ...

回答 1 投票 0

工作65被取消,因为SparkContext被关闭。

我在一个共享的Apache Zeppelin服务器上工作。几乎每天,我都会尝试运行一个命令,并得到这个错误。Job 65 cancelled because SparkContext was shut down 我很想知道更多关于... I would love to learn more about what...

回答 1 投票 0

如何让Apache ZeppelinShiro在不同的端口(不是8080)上工作?

Apache Zeppelin 0.9.0 preview1包括基本的Shiro auth,只要在confzeppelin-site.xml中指定的zeppelin.server.port是8080,就可以正常工作。然而,我想使用另一个端口(例如9000)来进行 ...

回答 1 投票 0

我可以在Zeppelin中以编程方式检查一个段落的状态吗?

我在Spark集群上使用Zeppelin与Hadoop。我想检查一个段落的状态,看看它是成功、运行、不运行还是错误。我知道我可以滚动到段落,然后......

回答 1 投票 0

我可以在Spark中清除环境变量吗?

我在Spark集群上使用Zeppelin与Hadoop。我想定义变量,然后清除它们。 val myvar = 1 我想能够myvar,并让它不再等于1。

回答 1 投票 0

我可以在zeppelin的`sh`命令中包含一个变量吗?

我在Spark集群上使用Zeppelin与Hadoop。我想运行一个命令来检查s3上的文件,我想使用一个变量。这是我的代码 %sh aws s3 ls s3:/my-bucketmy_folder 我可以 ...

回答 1 投票 0


如何使用angular脚本在WHERE子句的查询界面的下拉菜单中添加额外的功能,如操作符,条件子句?

我试图添加一些额外的功能,就像在superset中一样,比如在WHERE子句中有一个下拉菜单,其中提到了几个操作,如EQUAL TO,NOT EQUAL TO,GREATER THAN等。

回答 1 投票 0

为什么火花中的一些音符工作得很慢,为什么在同一情况下多次执行的时间不同?

我的问题是关于pyspark代码在zeppelin中的执行时间。我有一些笔记,我在其中使用了一些SQL,在我的一个笔记中,我用.topandas()函数将我的数据框架转换为panda......。

回答 1 投票 0

我如何重新启动已停止的Spark上下文?

我正在用Apache齐柏林飞艇和hadoop运行Spark。我的理解是Zeppelin就像一个kube应用程序,它将命令发送到运行Spark并使用Hadoop访问文件的远程计算机。我...

回答 1 投票 1

HIVE表在SPARK中可用,但未在Hive CLI中显示

这个问题可能是这个问题的重复,但给出的答案并不令人满意。我在Zeppelin上运行了以下简单代码:(与pyspark CLI相同的情况)%spark2 ....

回答 1 投票 0

如何通过以用户输入格式进行输入来在Zeppelin中运行CQL?

我正在尝试通过使用Zeppelin工具采用用户输入格式来运行CQL查询:-%cassandra SELECT $ {选择字段类型= uuid,uuid | created_by | email_verify |用户名}来自$ {选择表= ...

回答 1 投票 1

Zeppelin无法启动IPython内核

[相当长一段时间以来,我一直遇到Zeppelin的问题,该问题似乎无法启动IPython。我遵循了本指南和本指南。使用正确的python正确设置了Pyspark解释器...

回答 1 投票 2

Zeppelin:构型错误

当我尝试运行我的齐柏林飞艇时,我收到此错误消息:OpenJDK 64位服务器VM警告:忽略选项MaxPermSize = 512m;在8.0 WARN [2020-05-25 09:08:31,181]中删除了支持({...

回答 1 投票 0

Python pyspark将DF写入.csv并将其存储在本地c驱动器中

我想保存一个使用SQLContext提取数据的数据框,并将其保存到c驱动器中的.csv文件中。我正在使用Zeppelin运行我的代码。下面的代码运行,但是我在该位置看不到文件...

回答 1 投票 0

在pyspark中显示数据帧的不同值的最佳方法是什么?

我想检查数据帧的不同值,我知道有一种方法可以做到。我想看看Rabbit,Platypus和book列的唯一值。这是第一个...

回答 1 投票 1

如何为Spark sql中的窗口函数修复错误不匹配的输入'partition'?

我想在Spark SQL中运行窗口函数。我让Zeppelin坐在Hadoop的Spark集群之上。我想在表中添加行号,并通过两个ID的组合对其进行分组。这个...

回答 1 投票 0

从包含三列的csv文件创建neo4j图

我有一个包含某些主题的生产者和消费者的csv文件。例如,生产者,主题,消费者PRODUCER-1,TOPIC-A,CONSUMER-1 PRODUCER-2,TOPIC-B,CONSUMER-2 PRODUCER-1,TOPIC-C,CONSUMER-3 PRODUCER-1,...

回答 1 投票 1

Kubernetes上的火花+ Zeppelin

我尝试遵循此文档:https://zeppelin.apache.org/docs/0.9.0-SNAPSHOT/quickstart/kubernetes.html Zeppelin安装-确定Spark Image-确定当我尝试运行时:%spark.conf spark.executor ....

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.