databricks 相关问题

有关Databricks统一分析平台的问题

如何使用 Databricks API 创建目录

我正在尝试使用 Databricks API 创建一个目录,但我很难在 cURL 请求中找到正确的占位符。 我尝试使用 mkdirs 创建目录,但没有成功! 卷曲 -X POST https...

回答 1 投票 0

在 Databricks 中添加管道运算符 (%>%) 作为快捷方式

有没有办法将 R 管道运算符 (%>%) 合并为 Databricks 中的快捷方式?

回答 1 投票 0

我想在 Databricks 中创建一个计划,在每个月的第一个工作日运行作业

我想在 Databricks 中创建一个计划,在每个月的第一个工作日(工作日指周一至周五)运行作业。 我尝试使用 Cron 语法,但没有任何运气......

回答 1 投票 0

在 Databricks 中重试从 Snowflake 读取流的安全方法

我们正在探索从 Azure Databricks 中读取雪花流数据的场景。 细节: 我们有一个大的雪花桌子,上面已经设置了流。 我们还有其他来源...

回答 1 投票 0

优化Delta表命令

我有启用了液体集群的增量表,当表上正在进行另一个写入操作时,我可以在增量表上运行优化命令吗?它会损坏数据、日志和我吗...

回答 1 投票 0

PyTorch:AttributeError:“torch.dtype”对象没有属性“itemsize”

我正在尝试在medium Article上关注这篇文章。 我遇到了一些问题,所以我所做的剩余更改是对 TrainingArguments 对象添加了gradient_checkpointing_kwargs={'use_reentra...

回答 1 投票 0

PySpark:连接第二个数据帧中的 NULL 值应该匹配

我有一个要求,如果匹配的 df2 具有空值,则它应该匹配。默认情况下,Spark 不匹配带有 null 的行。 df1- ID 姓名 城市 电子邮件 1 约翰城 A [email protected] 2 雾慈...

回答 1 投票 0

数据框值替换

我试图用“yyyy-MM”+“-01”替换“yyyy-MM”,下面是我的代码,但我没有得到正确的结果。请注意,我正在研究数据块: 从 pyspark.sql.functions 导入 col、concat、lit、when #S...

回答 1 投票 0

如何仅使用Spark SQL读取dbfs中的csv文件?

我正在开发databricks交互式集群,我想使用SQL查询存储在ADLS或DBFS中的csv文件。 问题: 我可以轻松地对增量表和镶木地板文件执行此操作。但是,当我执行此操作时...

回答 1 投票 0

DataBricks QueryEndpointInput 字段名称不是 JsonParameter

DataBricks Java SDK 有一个名为 QueryEndpointInput 的类。 其中有一个名为 name 的字段。这是图书馆中唯一的字段 未使用 @JsonParameter 进行注释。 当我们打电话时

回答 1 投票 0

使用spark更新数据库表

为什么 Apache Spark 不提供更新数据库表的特定列的功能? 我尝试使用基本的 Spark 读写操作更新 PostgreSQL 表,但我无法...

回答 1 投票 0

视图使用 get_json_object 在 Athena 中失败,但在 Databricks 中有效

在我们的组织中,我们需要在 Databricks 和 Athena 中公开数据。 我们有一些使用“get_json_object(my_col)['path']”函数的视图,并按 Databricks 的预期运行。

回答 1 投票 0

检查路径上是否存在增量表

我需要在加载之前从 delta-lake 表中删除某些数据。我可以从增量表中删除数据(如果存在),但当表不存在时会失败。 Databricks scala 代码...

回答 3 投票 0

使用requirements.txt中的凭据安装私有包

我想要一个私人包裹 %pip install -r /dbfs/requirements.txt 在这个requirements.txt中给出: git+https://:[email protected]/ 如果我给...

回答 1 投票 0

通过全局初始化脚本启用 Databricks 集群日志

我想通过全局初始化脚本为工作区中的所有集群(新的或旧的)设置集群日志传送。 我尝试通过自定义 Spark conf 添加底层 Spark 属性 - /databricks/dri...

回答 1 投票 0

以编程方式从 MlFlow 模型注册表获取模型的输入架构

有没有办法从 MlFlow 模型注册表中获取输入模式(完成训练的特征)?在记录经过训练的模型时,使用“signature”参数捕获输入模式。

回答 2 投票 0

SQL 帮助 - 仅使用 Expect 子句获取不同的记录,然后添加 loaddatetime 列

我试图通过排除系统列(LoadDate、LoadDateTime、SourceFilename)来仅检索表中的不同记录,因为正在加载重复记录并且系统加载日期为

回答 1 投票 0

如何在 pyspark 中使用 varchar(50) 创建模式或在 pyspark 中转换为 varchar(50)

schema = StructType([StructField("列名", StringType(), True) 在我的列目标系统中,他们分配了 50 长度,并且我在数据块中创建了 StringType 模式,同时

回答 1 投票 0

ModuleNotFoundError:运行 Delta Live Tables Python 笔记本时出现无名为“dlt”的模块错误

当尝试创建Python笔记本并按照设置databricks delta live表的各种示例进行操作时,如果您尝试运行y...

回答 3 投票 0

写入文件时编辑机密/密钥 - Azure Databricks

我想在使用 dbutils.fs.put() 写入文件时编辑 api_key,有什么方法可以本地执行此操作吗? 另一种选择是我手动删除出现的 api 密钥,但是...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.