databricks 相关问题

有关Databricks统一分析平台的问题

Pyspark - 将Json类型数据转换为表格形式

我在 pyspark 数据框中输入了如下所示的输入数据, 我想将其转换为表格形式,如下所示, 请帮助我,因为我对 pyspark 还很陌生。

回答 1 投票 0

SQL 查询使用 databricks 分解嵌套 json 中的多个值

我正在尝试使用 databricks sql 获取嵌套 json 的数据,但无法对多个数组列执行爆炸,并且抛出以下错误 [不支持的生成器。多生成器]...

回答 1 投票 0

Databricks Repo 与 Workspace

我注意到在 Databricks 中,有一个“Workspace”文件夹部分和一个“Repos”文件夹 - 如下所示: 我一直试图在网上研究有什么区别,但没有运气。看来...

回答 2 投票 0

相似表的连接时间差异很大

我有下面描述的两张表。我通常将此表与另一个较小的表连接(内部连接)。然而,根据检查执行时间,表 2 大约需要 9 分钟,而......

回答 1 投票 0

在增量实时表中执行Spark sql

我是 DLT 新手,正在尝试掌握它。我写了下面的代码。我有两个流表(temp1 和 temp2)。我正在从这些表中创建两个视图。然后我将加入那些 vi...

回答 1 投票 0

底层数据更改时的 Databricks DLT 和 CDC

我有一个 DLT,其中底层数据以 parquet 格式存储在 S3 中。该数据可能会被更新和附加。抛开 SCD 只看 CDC,我正在尝试找到 SQL 语法...

回答 1 投票 0

Delta 实时表的 Databricks 初始加载

我正在研究 Delta 实时表的 Databricks 初始加载。 我的生产管道场景是我的目标表是 SCD 1,我的源数据来自 eventhub(它存储数据...

回答 1 投票 0

通过Python脚本在Databricks中使用spark

我正在尝试在databricks上部署streamlit应用程序。 为此,我使用命令: !streamlit run myApp.py 每次我尝试执行 getOrCreate 时,我都会从 databricks 收到错误,指出我无法创建...

回答 1 投票 0

尝试重命名 df 中的列时无法设置属性“列”消息

我有一个包含许多列(大约100)的DF,我需要重命名所有列。所以我做了这个 将 pandas 导入为 pd data.columns = ["ide_ads", "ide_any", "ide_sfdsdf"] #

回答 1 投票 0

无法从 Databricks 社区版安装 Azure ADLS Gen 2:com.databricks.rpc.UnknownRemoteException:发生远程异常

我正在尝试从我的databricks社区版安装ADLS Gen 2,但是当我运行以下代码时: 测试 = Spark.read.csv("/mnt/lake/RAW/csds.csv", inferSchema=True, header=True) 我...

回答 1 投票 0

共享集群:无法使用Secret

我正在从非隔离共享切换到共享集群。 我的 Spark 配置在集群中如下所示: fs.azure.account.oauth2.client.secret {{secrets/keyvault/s}} fs.azure.帐户....

回答 1 投票 0

在 Databricks 工作区 azure 中打开 dbfs 时出错

我已经在 Databricks 工作区管理和集群中激活了 DBFS。但是当我尝试打开时,我收到以下消息: DBFS 文件浏览器:Azure 容器不存在

回答 1 投票 0

在 delta live 表中添加列元数据注释

我正在创建增量实时表,我想添加基于列的元数据注释。 下面是我的代码: @dlt.表( comment =“学生数据的扁平化表格”, 名称='

回答 1 投票 0

在不使用boto3的情况下将文件(python)从databricks写入S3?

我有 AWS 的访问密钥和安全密钥,但我想将文件写入 S3 存储桶中,而不用在 python 代码中暴露我的访问密钥和安全密钥。

回答 1 投票 0

是否可以为托管服务和托管磁盘禁用 Azure Databricks 的客户托管密钥?

我无法为托管服务和托管磁盘禁用 Azure Databricks 的 CMK。尽管我已成功禁用 DBFS 根的 CMK。 我需要禁用我的 Azure 的客户管理密钥

回答 1 投票 0

如何使用JPA连接Databricks数据库和Springboot应用程序

将 Springboot JPA 支持的应用程序与 Databricks 集成时面临问题。 以下是我们为集成所做的步骤和设置。 当我们启动 springboot 应用程序时...

回答 1 投票 0

在自定义 Vnet 中部署 Databricks

我已启用安全集群连接并尝试在我的自定义 Vnet 中部署 Databricks。 我创建了一个 Vnet - 并配置了两个子网。现在,当我尝试创建 databricks 工作区时,我的...

回答 1 投票 0

如何使用databricks执行深度克隆以将数据从一个Datalake迁移到另一个Datalake?

我正在尝试使用深度克隆将数据从 Azure Data Lake 迁移到 S3。源Data Lake中的数据以Parquet格式存储并分区。我尝试按照

回答 1 投票 0

Databricks 命名“目录”和“数据库”而不是“数据库”和“架构”的基本原理

Databricks 将事物称为“目录”和“数据库”而不是更标准的“数据库和模式”有什么理由吗? 他们所说的数据库基本上是一个模式:它可以包含ta...

回答 1 投票 0

在统一目录中显示依赖于外部位置的对象

在使用 Databricks 时,我需要删除外部位置。 我运行 SHOW EXTERNAL LOCATIONS 并得到以下结果: 之后我运行 DROP EXTERNAL LOCATION gold_prd 接收错误:

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.