Apache Zeppelin是一款基于Web的笔记本电脑,支持数据驱动的交互式数据分析。您可以使用SQL,Python,Scala等制作精美的数据驱动,交互式和协作文档。它还支持Markdown语法。
我有一个spark.sql对象,其中包括几个变量。 import com.github.nscala_time.time.Imports.LocalDate val first_date = new LocalDate(2020, 4, 1) val second_date = new LocalDate(2020, 4, ...)
我有Zeppelin在Hadoop之上,有一个Spark集群。我想在一个笔记中运行前五段,然后在另一个笔记中运行前五段。我不想让它们在同一时间运行 ...
我在一个共享的Apache Zeppelin服务器上工作。几乎每天,我都会尝试运行一个命令,并得到这个错误。Job 65 cancelled because SparkContext was shut down 我很想知道更多关于... I would love to learn more about what...
如何让Apache ZeppelinShiro在不同的端口(不是8080)上工作?
Apache Zeppelin 0.9.0 preview1包括基本的Shiro auth,只要在confzeppelin-site.xml中指定的zeppelin.server.port是8080,就可以正常工作。然而,我想使用另一个端口(例如9000)来进行 ...
我在Spark集群上使用Zeppelin与Hadoop。我想检查一个段落的状态,看看它是成功、运行、不运行还是错误。我知道我可以滚动到段落,然后......
我在Spark集群上使用Zeppelin与Hadoop。我想定义变量,然后清除它们。 val myvar = 1 我想能够myvar,并让它不再等于1。
我在Spark集群上使用Zeppelin与Hadoop。我想运行一个命令来检查s3上的文件,我想使用一个变量。这是我的代码 %sh aws s3 ls s3:/my-bucketmy_folder 我可以 ...
如何使用angular脚本在WHERE子句的查询界面的下拉菜单中添加额外的功能,如操作符,条件子句?
我试图添加一些额外的功能,就像在superset中一样,比如在WHERE子句中有一个下拉菜单,其中提到了几个操作,如EQUAL TO,NOT EQUAL TO,GREATER THAN等。
为什么火花中的一些音符工作得很慢,为什么在同一情况下多次执行的时间不同?
我的问题是关于pyspark代码在zeppelin中的执行时间。我有一些笔记,我在其中使用了一些SQL,在我的一个笔记中,我用.topandas()函数将我的数据框架转换为panda......。
我正在用Apache齐柏林飞艇和hadoop运行Spark。我的理解是Zeppelin就像一个kube应用程序,它将命令发送到运行Spark并使用Hadoop访问文件的远程计算机。我...
这个问题可能是这个问题的重复,但给出的答案并不令人满意。我在Zeppelin上运行了以下简单代码:(与pyspark CLI相同的情况)%spark2 ....
如何通过以用户输入格式进行输入来在Zeppelin中运行CQL?
我正在尝试通过使用Zeppelin工具采用用户输入格式来运行CQL查询:-%cassandra SELECT $ {选择字段类型= uuid,uuid | created_by | email_verify |用户名}来自$ {选择表= ...
[相当长一段时间以来,我一直遇到Zeppelin的问题,该问题似乎无法启动IPython。我遵循了本指南和本指南。使用正确的python正确设置了Pyspark解释器...
当我尝试运行我的齐柏林飞艇时,我收到此错误消息:OpenJDK 64位服务器VM警告:忽略选项MaxPermSize = 512m;在8.0 WARN [2020-05-25 09:08:31,181]中删除了支持({...
Python pyspark将DF写入.csv并将其存储在本地c驱动器中
我想保存一个使用SQLContext提取数据的数据框,并将其保存到c驱动器中的.csv文件中。我正在使用Zeppelin运行我的代码。下面的代码运行,但是我在该位置看不到文件...
我想检查数据帧的不同值,我知道有一种方法可以做到。我想看看Rabbit,Platypus和book列的唯一值。这是第一个...
如何为Spark sql中的窗口函数修复错误不匹配的输入'partition'?
我想在Spark SQL中运行窗口函数。我让Zeppelin坐在Hadoop的Spark集群之上。我想在表中添加行号,并通过两个ID的组合对其进行分组。这个...
我有一个包含某些主题的生产者和消费者的csv文件。例如,生产者,主题,消费者PRODUCER-1,TOPIC-A,CONSUMER-1 PRODUCER-2,TOPIC-B,CONSUMER-2 PRODUCER-1,TOPIC-C,CONSUMER-3 PRODUCER-1,...
我尝试遵循此文档:https://zeppelin.apache.org/docs/0.9.0-SNAPSHOT/quickstart/kubernetes.html Zeppelin安装-确定Spark Image-确定当我尝试运行时:%spark.conf spark.executor ....