databricks 相关问题

有关Databricks统一分析平台的问题

从 Databricks ADLS 安装点以字节字符串形式读取文件

目标是从 ADLS 安装点读取 Databricks 中的文件作为字节字符串。 确认 ADLS 挂载点 首先,使用 dbutils.fs.mounts() 确认具有以下内容: ...

回答 3 投票 0

如何安排Delta Live Tables维护任务的时间?

这是来自databricks的文档 Delta Live Tables 在表更新后 24 小时内执行维护任务。维护可以通过删除...来提高查询性能并降低成本

回答 1 投票 0

Bitbucket 云存储库使用 Databricks 服务主体 git 凭证的存储库访问令牌

我正在尝试让 Databricks 工作流作为服务主体运行。我正在使用 Bitbucket 云存储库访问令牌,以便 Databricks 服务主体使用 git 凭据...

回答 1 投票 0

单元格下方值的总和

表格当前如下所示: |自安装以来的天数 |安装| | ------------------ | -------- | | 1 |一个 | | 2 |乙| | 3 | C...

回答 1 投票 0

Spark - 处理后移动文件

我将json文件读入数据帧: df = Spark.read.option("multiline", "true").json(f"/mnt/bronze/{something}*") 然后我进行一些处理,然后将其写入...

回答 1 投票 0

Databricks 更改数据源

根据 Databricks 上的文档更改数据源 同时支持批量查询和流式查询。 我想知道是否有办法在批量查询中传递参数。 更多

回答 1 投票 0

如何在 Scala 中使用括号修改此代码

我在 Databricks 中有一个 Spark 数据框,其中包含一个 ID 和 200 个其他列(如数据的透视视图)。我想对这些数据进行逆透视以制作一个具有一半列的高对象,我将在其中...

回答 1 投票 0

解析 json 并将字段添加到 Python 中的数据框

我有一个笔记本,可以查询 API 并根据附加格式获取 JSON。 { "display_name":"IST-XXX1", “成员”:[ { “aad_id”:&

回答 2 投票 0

使用 databricks 自动加载器使用 gzip 文件

我目前无法找到通过自动加载器直接加载 .gz 文件的方法。我可以将文件作为二进制内容加载,但无法提取压缩的 xml 文件并在 str 中进一步处理它们...

回答 1 投票 0

使用 Ray 将数据从 Spark 传输到 Ray 数据集

更新: 我想我终于明白了这个问题。当 databricks 初始化 Spark 会话时,raydb-spark 会话并未真正设置。 那么,有没有办法让 raydb-context 在...

回答 1 投票 0

BigInt 与布尔大小 PySpark

我有一些表,其中的列包含可以包含值 0 或 1 的指标(0 表示 false,1 表示 true)。我假设将类型从数字转换为布尔值会导致大小

回答 2 投票 0

Databricks 表

Databricks 外部表 大家好,我想知道在 ADLS(Azure Data Lake Storage)中使用连接到 Delta 表的外部表是否是一个好的做法。是不是常用的appro...

回答 1 投票 0

从 Databricks 挂载 ADLS Gen 2 abfss 时出错:错误 IllegalArgumentException:不支持的 Azure 方案:abfss

我修改了 @Bhagyashree 善意提供的一些代码,试图在 ADLS Gen 2 上安装 abfss 容器名称=“根” 存储帐户 =“我的存储帐户” 键=“

回答 2 投票 0

无法在 databricks 运行时版本 7 中使用 shell 命令访问 /dbfs/FileStore

在 databricks 运行时版本 6.6 中,我能够成功运行如下 shell 命令: %sh ls /dbfs/FileStore/tables 但是,在运行时版本 7 中,这不再起作用。有没有...

回答 4 投票 0

Databricks 结构化流写入托管表

在 Databricks 结构化流中,是否可以使用 writeStream API 将流写入统一目录管理表? 我能够将流写入 ADLS Gen2 中的外部表,...

回答 1 投票 0

如何导入databricks笔记本中wheel文件中的方法?

嗨,我正在尝试导入wheel文件中的方法,因为我正在安装它并且当我使用此代码时 ! pip install date_util-1.0-py2.py3-none-any.whl 来自 date_util-1.0-py2.py3-none-any

回答 2 投票 0

我希望从存储在数据帧列中的数组中获取第二个元素

我有数据框 df1 ,列名称是具有如下行的数据,并且想要获取数组的第二个元素。 [1,5,2,5,8,3,4] [3,4] [5] [] [8, 5,0,2,5,8,1,4] 我想要输出像 5,5,3 4 空...

回答 1 投票 0

记录Azure数据工厂和azure databricks

我正在寻找有关如何专业管理 Azure 数据工厂和 Azure Databricks 中的日志的反馈,类似于企业中通常的做法。就我而言,我有一个 Azure 数据工厂

回答 1 投票 0

放置秘密范围 - databricks

我需要使用笔记本而不是 CLI 来更新机密。因此,我正在使用 API,每次获取新的访问令牌和刷新令牌时,我都想在我的 databricks 支持的秘密中更新它们

回答 1 投票 0

azura databricks 自定义函数不起作用(python)

在 databricks/python 中,我尝试创建自定义函数,但收到错误。 这是我试图创建的函数: 从 pyspark.sql.functions 导入 col, substr 定义

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.