Apache Zeppelin是一款基于Web的笔记本电脑,支持数据驱动的交互式数据分析。您可以使用SQL,Python,Scala等制作精美的数据驱动,交互式和协作文档。它还支持Markdown语法。
Spark + s3-错误-java.lang.ClassNotFoundException:类org.apache.hadoop.fs.s3a.S3AFileSystem未找到
我有一个Spark ec2集群,我在这里从Zeppelin笔记本提交pyspark程序。我已经加载了hadoop-aws-2.7.3.jar和aws-java-sdk-1.11.179.jar并将它们放在/ opt / spark / jars ...
我尝试转移sql查询以激发lang。这是SQL查询:%sql从表限制$ {limit = 10}中选择$ {checkbox:fields = AGE | NAME | SEX}然后我转移了spark lang:%spark var fields = z.select(“ ...] >
创建Solr解释器后,然后尝试通过Zookeeper查询集合,但是它引发异常,由以下原因引起:org.noggit.JSONParser $ ParseException:
如何使用Knox提供基于SAML的SSO,基于Zeppelin中HadoopGroupProvider中基于组的角色进行配置?
[我正在尝试在Zeppelin上实现角色库访问控制,使用Knox对外部IdP进行身份验证,并在用户成功成功后从LDAP实例执行组查找...
我正在使用齐柏林飞艇和角度解释器。我尝试了三种不同的方式。他们都没有成功。但是出现了简单的标记。第一个变数数组= []; all_properties.forEach(item => {...
SparkSession应用程序源代码配置属性,不覆盖AWS EMR默认值上的JupyterHub和Zeppelin
我具有Spark Driver设置,可以使用Zeppelin和或JupyterHub作为客户端来在AWS EMR上进行交互式Spark编程。但是,当我使用自定义配置属性(应用程序...
[我正在尝试在Zeppelin中可视化火花结构化的流。我能够使用内存接收器(spark.apache)来实现。但是对于大数据量,这不是可靠的解决方案。哪个会更好...
我创建了一个临时表,该表创建了订阅了两个不同列表的用户的用户ID列表。因此表看起来像这样:| userid | +++++++++ 1 2 3 4 5我想创建一个...
我目前正在尝试使用pyspark解释器和python 3.7.3在Zeppelin(0.8.1)笔记本中生成可视化效果。使用seaborn(0.9.0)生成以下简单情节大约需要...
Apache Zeppelin是否适合为多个用户提供仪表板?
换句话说,齐柏林飞艇是否可以用作Tableau的小规模替代品?我具有报告仪表板的新UI / UX设计。仪表板的数据来自关系数据库(SQL Server)。这个...
如何在Zeppelin中将数组从spark绑定到javascript?
你好,我与齐柏林飞艇一起工作以可视化某些仪表板,我正在使用Angularjs解释器显示系统来配置Spark查询,所以我想在...的输入文本框中添加自动填充功能]
如何自动更新zeppelin中的%spark.sql结果以进行结构化流式查询
我正在(来自zeppelin 0.7的spark 2.1.0中运行结构化流,用于来自kafka的数据,我正尝试通过spark.sql可视化流的结果,如下所示:%spark2 val spark = ...
我正在将Zeppelin笔记本与%livy.pyspark解释器一起使用。我正在Hadoop Hive表上运行SQL查询,并希望查看该表的几行内容。我正在使用以下代码:'''%livy.pyspark from ...
我使用齐柏林0.8.0和我有哪里飞艇表视图将字符串转换为数字的问题。在下面的代码段中的数据帧包含字符串“007”。这显示...
我找不到获取Apache zeppelin 0.9.0二进制文件的方法。我认为曾经有一个下载页面,因此被删除了。有人可以帮我吗?谢谢,Ori
我使用Apache的飞艇,我可以从两个Postgres的结果,并分别clickhouse。但是,我需要合并两个查询。
NoSuchMethodException:运行pyspark代码齐柏林时scala.tools.nsc.interpreter.ILoop.scala
我想运行一个飞艇细胞pyspark,但我得到的scala.tools.nsc.interpreter.ILoop.scala细胞代码NoSuchMethodException:%pyspark打印(“你好”)错误:java.lang中....
我尝试请求与蜂房和齐柏林蜂巢数据库,但我得到这个错误:SemanticException无法提取与表table_name。 org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.ipc ....
我在本地系统中创建一个飞艇码头工人形象和配置为通过Maven仓库星火解释并拼命地跑齐柏林它的工作。但是,当我停止泊坞窗,再次拼命地跑......
飞艇java.lang.OutOfMemoryError:GC开销超过限制
我在飞艇org.apache.spark.SparkException得到一个错误:作业已中止。与描述产生的原因:java.lang.OutOfMemoryError:GC开销超过限制。星火监测表明,GC了...