apache-zeppelin 相关问题

Apache Zeppelin是一款基于Web的笔记本电脑,支持数据驱动的交互式数据分析。您可以使用SQL,Python,Scala等制作精美的数据驱动,交互式和协作文档。它还支持Markdown语法。

在 zeppelin 0.8 + Spark 中读取 csv 文件

我正在尝试使用这样的spark来读取zeppelin笔记中的csv文件(我还尝试了使用\或//的路径的多种语法): 这是我的代码: %火花 值按钮2 = 我正在尝试使用这样的 Spark 读取飞艇注释中的 csv 文件(我还尝试了使用 \ 或 // 的路径的多种语法): 这是我的代码: %spark val button2 = <div class="btn btn-success btn-sm">READ CSV</div>.onClick{() => try { //val df = spark.read.option("header", "true").csv("C://Users/ut00xzh7/Documents/TEST_CSV_AC_CREATION/ac_lst.csv") val df = spark.read.format("com.databricks.spark.csv").option("header", "true").load("C://Users/ut00xzh7/Documents/TEST_CSV_AC_CREATION/ac_lst.csv") val res= df.collectAsList() AngularModel("result", res) } 我收到此错误: java.io.IOException: No FileSystem for scheme: C 经过一些研究后,我发现我可以使用 %dep 添加库,但我没有任何权利这样做,所以我有点坚持这个。 您需要将路径指定为file:///C:/Users/...,在 URI 中强制执行本地文件方案。否则,磁盘 C 被视为 URI 方案(scheme:authority/path 的一般表示) 我在尝试加载文本文件时在 Zeppelin 中遇到错误。错误消息为 org.apache.spark.sql.AnalysisException: 路径不存在: file:/C:/doc/mytext.txt

回答 2 投票 0

当我在本地计算机 [Windows 11] 中安装 Apache Zeppelin 时,Zeppelin 服务器已启动,但未加载 UI。它抛出角度/距离 404 错误

java.io.FileNotFoundException:C:\ Users \ PRIYA \ Downloads \ zeppelin-0.11.0-bin-all \ zeppelin-0.11.0-bin-all \ zeppelin-0.11.0-bin-all in \ zeppelin-web-角度\dist 在 org.eclipse.jetty.webapp.

回答 1 投票 0

运行 Zeppelin 时无法识别 VM 选项“MaxPermSize=512m”

当我尝试通过以下任一方式运行 Zeppelin 时 bin/zeppelin.sh 或者 bin/zeppelin-deamon.sh 启动 我收到以下错误消息。 无法识别的 VM 选项“MaxPermSize=512m” 错误:无法创建...

回答 5 投票 0

Docker 上的 bitnami/spark 和 zeppelin 的 SPARK_HOME 配置错误

我在使用 Docker 和 Zeppelin 实现 Spark 时遇到问题,需要一些解决方案 我的 docker-compose.yml: 版本:“3.7” 服务: 火花大师: 图片:bitnami/spark:l...

回答 1 投票 0

Apache Zeppelin 有智能感知吗?

Apache Zeppelin 在其笔记本用户界面中是否支持智能感知/自动完成? 如果是这样我该如何使用它? 我尝试在互联网上搜索,但未能找到有效的来源。这个

回答 3 投票 0

Zeppelin 笔记本中出现错误,指出无法创建接收器

我正在尝试在 Apache Flink 中处理后从 1 个 KDS 写入另一个 KDS。我使用 Zeppelin 笔记本通过以下查询创建接收器表: %flink.ssql 创建表 seller_revenu...

回答 1 投票 0

K8S 解释器上的 Apache Zeppelin 由于 UnknownHostException 崩溃

嗨,需要帮助! 我已经在 k8s 集群上的 zeppelin 命名空间下部署了 apache/zeppelin:0.9.0,遵循文档,这是我的 zeppeling-server.yaml 文件: api版本:v1 种类:

回答 2 投票 0

如何将 Zeppelin 设置为 CentOS 上启动服务的一部分?

OP答案如下(希望对社区有帮助) 下面你将看到我的真实答案。 (我发布这个问题是为了传递答案。)我花了一段时间才找到正确的答案,所以我...

回答 1 投票 0

无法在 Windows Server 上的 Zeppelin 中运行 python 代码

我可以在我的 Windows Server 2019 上配置 Zeppelin 并成功启动它。 我的环境变量配置如下: HADOOP_HOME C:\hadoop\ JAVA_HOME C:\Programm Files\Zulu\zulu-8\jre\

回答 1 投票 0

zeppelin (0.9.0) helium s3 文件夹不可用

在 zeppelin-site.xml 中启用 helium 文件夹时,默认 s3 存储桶返回 403 为了 错误 [2023-08-01 14:23:24,964] ({qtp1383547042-15} HeliumOnlineRegistry.java[getAll]:103) - https://s3.

回答 0 投票 0

PySpark 获取检查点目录(版本< 3.1.0)

我们可以使用下面的代码在PySpark中设置检查点目录路径: spark.sparkContext.setCheckpointDir('/检查点') 由于 SparkContext.getCheckpointDir() 仅在 PySpark 版本中引入...

回答 2 投票 0

zeppelin spark.pyspark 解释器错误:AttributeError: 'SparkSession' object has no attribute '_wrapped'

使用 %spark.pyspark 解释器时,出现错误: org.apache.zeppelin.interpreter.InterpreterException:org.apache.zeppelin.interpreter.InterpreterException:无法引导 pyspark 在组织。

回答 1 投票 0

使用 Shiro 登录 Zeppeline 失败

我已经设置了 Zeppeline Docker 实例并在远程 VM 中运行。 此外,我使用下面的示例 Shiro.ini 启用了 Shiro 身份验证 [用户] admin = 管理员,管理员 用户 1 = 用户 1、角色 1、角色 2 ...

回答 0 投票 0

apache zeppelin 多节点集群

我已经部署了一个有 2 个节点的 zeepline 集群。配置“zeppelin.cluster.addr”,notebook和interpreter存放在hdfs中,使用nginx做负载均衡。在使用中,我发现

回答 0 投票 0

Apache Zeppelin 和 Spark 显示 Scala 模块 2.13.3 需要 Jackson Databind 版本 >= 2.13.0 和 < 2.14.0 - Found jackson-databind version 2.12.0

我在 Docker 上使用 Apache Zeppelin 0.10.1 和 Spark 3.3.0,我一直收到这个错误... com.fasterxml.jackson.databind.JsonMappingException:Scala 模块 2.13.3 需要 Jackson Databind versi ...

回答 1 投票 0

Spark CSV读取 忽略字符

我通过Zeppelin使用Spark 2.2.1。现在我的spark读取代码如下: val data = spark.read.option("header", "true").option("delimiter", ",").option("treatEmptyValuesAsNulls", "true")......。

回答 1 投票 0

如何在zeppelin中用网络可视化图形?

我想在zeppelin中用%network可视化我的图。我已经通过读取JSON文件定义了节点和边缘。 val nodes = spark.read.option("multiline", "true").json("optnodes.json") val edges = ....

回答 1 投票 0

在Zeppelin中使用%pyspark解释器注册表时,我无法访问%sql中的表。

我使用的是Zeppelin 0.5.5。我在这里找到了这个python的代码示例,因为我无法让我自己的代码与%pyspark http:/www.makedatauseful.compython-spark-sql-zeppelin-tutorial。我有一种感觉...

回答 2 投票 5

在Apache Zeppelin中使用z.run()来触发一个段落。

我在使用Apache Zeppelin时遇到了一些问题,我不知道我遗漏了什么,基本上我是想在Apache Zeppelin中使用z.run从另一个段落中触发一个段落。当我在Apache Zeppelin上运行...

回答 1 投票 1

把一个大文件写到S3的最好方法是什么?

我正在使用zeppelin和spark,我想从S3中获取一个2TB的文件,并在Spark中对其进行变换,然后将其上传到S3,这样我就可以在Jupyter笔记本中使用该文件。这个...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.