databricks 相关问题

有关Databricks统一分析平台的问题

使用 Scala API 设置 TBLProperties

我正在使用模式覆盖将数据写入表中 由于我的列名中有特殊字符,我需要为列映射设置以下三个属性。 'delta.minReaderVersion' = '2', '

回答 2 投票 0

Spark 异常:没有凭证范围

我是 Databricks 新手,正在尝试从我的通用计算集群连接到 Rstudio Server。 以下是集群配置: 政策:个人电脑 访问模式:单用户 数据块...

回答 1 投票 0

Azure Databricks CLI - 在立即运行的作业中传递笔记本参数

我最近在运行下面的命令时遇到了通过 pip 安装的旧版 dbx databricks cli 的问题,不知何故,环境变量中传递的笔记本参数没有被获取。 数据块...

回答 2 投票 0

如何将数据框结果放入Excel的不同工作表中并将其存储在databrciks中自己的DBFS文件夹中

有没有一种方法可以将两个不同的数据帧结果放入一个 csv 文件中并将其存储在自己的 databrikcs 文件夹中。 所以基本上我有 DF1(结果集)和 DF2(结果计数),我想保留这两个

回答 1 投票 0

Delta Live Table - 无法重新定义数据集

我是 Delta Live Table 的新手。 我正在尝试从 databricks 教程创建一个增量实时表。 我创建了一个笔记本并附加了一个交互式集群 -DBR 14.3-LTS。 我正在运行...

回答 1 投票 0

`databricks labs ucx` 对 azure cloud shell 的依赖性问题

我正在尝试在 Azure Cloud Shell 上安装 Databricks labs ucx。 但是,ucx 需要 Databricks CLI v0.213 或更高版本。 ucx 还需要 Python 3.10+,但 Azure Cloud Shell 上仅提供 3.9。 在

回答 1 投票 0

类型错误:无法合并类型 <class 'pyspark.sql.types.LongType'> 和 <class 'pyspark.sql.types.StringType'>

我有一个数据框df。我想将其转换为 Spark 数据框。所以我用运行时版本7的databricks编写了它 df_s=spark.createDataFrame(df) 但我收到错误消息 类型错误:值...

回答 1 投票 0

无法合并数据块中的类型<class 'pyspark.sql.types.StringType'>和<class 'pyspark.sql.types.LongType'>

我有一个数据框df。我想将其转换为 Spark 数据框。所以我用运行时版本7的databricks编写了它 df_s=spark.createDataFrame(df) 但我收到错误消息 类型错误:值...

回答 1 投票 0

databricks delta - 动态替换where条件

我正在尝试使用azure databricks 在增量表上使用replacewhere 子句。这是重现问题的设置: CREATE TABLE mymaintable (dt DATE, name STRING, YN string) USING delta; 在...

回答 1 投票 0

如何转换 Azure Databricks 中“SHOW TABLE EXTENDED LIKE 'employe*'”示例中的“信息”列?我希望得到一些意见

SQL语句 显示表扩展如“雇员*”; 输出: 数据库表名是临时信息 -------- --------- ----------- ---------------------- --------------...

回答 1 投票 0

使用 Delta Live Table (CDC) 增量摄取 Snowflake 数据

我有一些数据位于 Snowflake 中,所以我想使用 delta live 表对它们应用 CDC,但我遇到了一些问题。 这是我正在尝试做的事情: @dlt.view() def 表1(): 返回

回答 1 投票 0

每天使用“类似更改源”的 JSON 更新 Delta 表

我有一个增量表,其结构如下: 编号 |第 1 列 | ....|列号 “....”表示有大量列 存储帐户中每天都会存储一个 JSON。我可以阅读

回答 1 投票 0

Databricks Delta Live 表 - 应用增量表中的更改

我正在使用 Databricks Delta Live Tables,但在向上游插入某些表时遇到一些问题。我知道下面的文字很长,但我试图尽可能清楚地描述我的问题......

回答 2 投票 0

在Databricks中安装libpostal

我正在尝试在 Databricks 中安装 libpostal python 包装器。 pip install postal 最终为 CalledProcessError:命令“pip --disable-pip-version-check install” 邮政'返回非零退出...

回答 1 投票 0

使用 terraform 添加服务主体权限时出现问题

我正在尝试添加在azure上管理的服务主体Databricks,并使用terraform放置帐户级别权限,如下所示: 错误:无法创建 mws 权限分配:未找到 /...的端点

回答 1 投票 0

如何在 Databricks SQL 中创建和使用地图

我想创建一个地图并在同一个 SQL 查询中使用它。我正在尝试类似的东西 从table1中选择sample_map[t1.col1],t1.col2作为t1,(选择map(1,2,3,4))作为sample_map group by t1.col2;

回答 1 投票 0

使用 pyspark dataframe 将所有数据收集到具有相应行的列中

我有一个数据框,其中包含如下屏幕截图所示的列。我想添加一个附加列“all_data”,它将保存其中列的所有数据。 这是我尝试过的 夫...

回答 1 投票 0

从 ASP.NET Core Web 应用程序调用 Databricks API

我们的应用程序是一个在 Entra Id 中注册的 Web 应用程序。应用程序使用 OIDC 进行身份验证。我们在 Entra 的 API 权限中添加了 Databricks 范围(user_impersonation)....

回答 1 投票 0

使用 Rest API 在 Databricks SQL 仓库上执行 SQL 查询

有没有办法使用 Rest API 在 Databricks SQL Warehouse 上执行 SQL 查询? 我可以在文档中看到有用于创建查询的 API,但没有看到任何用于运行查询的 API。

回答 3 投票 0

无法在DataBrick中挂载文件夹

我正在尝试运行代码以将文件夹装载到 Azure Blob 存储中。我尝试使用另一个启用了软删除的 Blob 存储帐户,它仍然有效。但是当我创建另一个 blob 存储时

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.