apache-zeppelin 相关问题

Apache Zeppelin是一款基于Web的笔记本电脑,支持数据驱动的交互式数据分析。您可以使用SQL,Python,Scala等制作精美的数据驱动,交互式和协作文档。它还支持Markdown语法。

在Amazon EMR中执行Zeppelin笔记本作为重复工作

我正在从Databricks迁移到Amazon EMR,并计划使用Zeppelin笔记本代替Databricks笔记本。目前,许多Databricks笔记本计划作为工作。有没有 ...

回答 1 投票 0

如何使用REST api运行zeppelin笔记本并在python中返回结果?

我使用python的以下REST调用运行zeppelin笔记本:import requests requests.post('http:// xyzx:8080 / api / notebook / job / 2BZ3VJZ4G')。json()输出为{u'status' :你好'} ......

回答 3 投票 1

使用AWS Glue Jobs将缺少的列值设置为默认值

我正在尝试使用Glue从dynamodb提取数据集到s3。在此过程中,我想选择少量列,然后为具有缺失值的任何和所有行/列设置默认值。 ...

回答 1 投票 0

在vmware上安装Zeppelin和spark

我在VMware工作站上安装了zeppelin和spark(centos 7)。我安装java添加java home添加spark home到zeppelin我不想从localhost地址启动zeppelin但是从ip ...

回答 1 投票 0

Spark + Zeppelin中没有添加依赖项

我无法从zeppelin向spark类路径添加自定义依赖项。环境:AWS EMR:Zeppelin 0.8.0,Spark 2.4.0额外配置火花解释器:spark.jars.ivySettings / tmp / ivy-settings ....

回答 1 投票 0

AZURE HD INSIGHT(群集)将CSV文件导入存储:创建表格

我对编码非常陌生 - 我知道基础知识,所以我在这个项目上拔头发。我试图最终将我的Hadoop集群链接到Tableau,我的项目的大部分将...

回答 1 投票 0

Spark写csv通过zeppelin失败

Spark 2.1.1.2.6.2.0-205 Zeppelin 0.7.3我在某台机器上运行一段代码,比如服务器-A。代码完成得很好。当我通过Zeppelin运行相同的代码(连接到相同的...

回答 1 投票 1

在Zeppelin可视化中更改默认组颜色

我有一堆数据,我正在放入散点图,但默认的颜色排序是“蓝色”,“浅蓝色”,然后最后是“橙色”。我的数据分为两组,具有常数组名,......

回答 1 投票 1

apache-zeppelin在mac OS上使用home brew时安装0.8.0

我已经安装了java版“1.8.0_181”,scala,apache-spark,apache-zeppelin使用home brew,并且在这些安装时没有出现错误。如果我在终端上运行$ spark-shell,...

回答 2 投票 0

如何让Zeppelin在EMR集群上干净地重启?

我正在运行EMR集群并尝试使用Zeppelin笔记本进行数据分析。版本:发行标签:emr-5.2.1 Hadoop发行版:Amazon 2.7.3 Hive 2.1.0 Spark 2.0.2 Zeppelin 0.6.2我...

回答 4 投票 8

使用%pyspark中的Dataframe到zeppelin中的%python

我在%pyspark中有一个pandas数据帧,我想在zeppelin中的%python单元格中使用它。我无法做到。知道如何做到这一点?

回答 1 投票 -2

Windows上的Apache Zeppelin:创建python解释器时出错

我在Windows上尝试过apache zeppelin,遇到运行python解释器的麻烦。执行python段时,它显示错误:org.apache.thrift.TApplicationException:Internal ...

回答 1 投票 3

无法从浏览器访问Apache Zeppelin服务器

我有一台运行Ubuntu 16.04的虚拟机,我已经下载了Apache Zeppelin 0.7.0。我面临的问题是,当我尝试使用bin / zeppelin-daemon.sh启动Zeppelin服务器时......

回答 3 投票 0

Apache Zeppelin:如何将整个报告发布到网站

连接到PostgreSql数据库并检索特定数据后,进行了一些(5)可视化。不是将每个段落(每个单独的可视化)发布到网站,而是......

回答 1 投票 4

与Zeppelin的HCatalog表的pyspark

我创建了一个表HCatalog表,其中分区映射到S3中的某些zip文件。在Zeppelin中,我使用%pyspark模块创建了一个段落,其中包含以下代码:段落1:%pyspark ...

回答 2 投票 1

访问Kubernetes集群中Zeppelin的界面

我正在尝试将Zeppelin添加到Kubernetes集群中。因此,使用来自apache / zeppelin的Zeppelin(0.8.1)docker镜像,我创建了一个K8S部署和服务,如下所示:部署:kind:...

回答 1 投票 1

GeoSpark Zeppelin氦气插件

我正在尝试启用geospark-zeppelin氦插件,但无法看到此链接中所述的geospark-zeppelin按钮。我使用AWS EMR集群中提供的Zeppelin(0.8.0)。这是 ...

回答 1 投票 0

Scala和Spark UDF功能

我做了一个简单的UDF来转换或从spark中的temptabl中的时间字段中提取一些值。我注册了该函数,但是当我使用sql调用该函数时,它会抛出一个NullPointerException。下面......

回答 2 投票 9

如何将时间列分为5秒间隔并使用Presto计算行数?

我正在使用Presto和Zeppelin。有很多原始数据。我必须总结那些数据。我想每5秒组一次。 serviceType logType date -------------------------------- ...

回答 1 投票 1

Apache Zeppelin 0.8.0-Snapshot“无法执行build:dist”(构建Zeppelin:Web应用程序)

我正在从maven构建Apache Zeppelin 0.8.0,我必须使用Zeppelin提供的高级功能,例如Apache Zeppelin笔记本电脑授权允许“跑步者”但我正在尝试不同的...

回答 2 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.