有关Databricks统一分析平台的问题
我需要在Databricks中现有的Delta Lake Table之上创建一个抽象。是否可以使基于Spark中的Delta Lake Table的SQL Server类型的SQL View?
我有一个流应用程序,正在运行到Databricks笔记本作业中(https://docs.databricks.com/jobs.html)。我希望能够使用stop()优雅地停止流式作业...
databricks dbfs是否支持文件元数据,例如文件/文件夹创建日期或修改日期
我正在尝试在数据砖笔记本中的目录中进行爬网以查找最新的镶木地板文件。 dbfsutils.fs.ls似乎不支持有关文件或文件夹的任何元数据。是否有任何...
我有一个数据笔记本中的笔记本,每天都会在特定时间运行该笔记本,并且我还从该笔记本中创建了仪表板,如何使仪表板结果自动导出...
我在scala中具有以下代码:val fullCertificateSourceDf = certificateSourceDf .withColumn(“ Stage”,when(col(“ Data.WorkBreakdownUp1Summary”)。isNotNull && col(“ ...
我正在创建Azure管道,该管道显示databricks笔记本的代码覆盖率。它使用spark连接到adls gen1。我写了另一个Databricks笔记本进行单元测试。集成两个...
我正在尝试通过凭据传递将其安装到dbfs,从而使Databricks工作区中的团队能够访问Azure存储帐户Gen2容器。我希望能够管理...
如何避免使用python-pptx保存文件时出现zipfile错误
我正在使用python-pptx包从一系列数据帧中创建许多.ppt文件。都可以通过添加幻灯片等方式很好地工作,直到调用prs.save()为止,其中“ prs”是...
如何将两个包含相同名称的df连接到具有不同列名称的行中。即:dfSummer = / InSummer / TripsBooked /-/ Jon / 3 /-/ Tyler / 5 /-/ ...
如何将数百万个文件移动到Azure Blob存储中同一容器中的另一个文件?
我们在Azure Blob存储中有数百万条记录(镶木地板和json文件),其结构如下:/RecordName/Year/Month/Day/Hour/ParquetOrJsonFiles.parquetOrjson大约有。 500万个文件...
如何在Databricks中关闭文件来压缩文件(在Azure Blob存储上)
我训练有素的深度学习模型来自一个文件夹中的几个文件。因此,这与压缩数据帧无关。我要压缩此文件夹(在Azure Blob存储中)。但是当我使用...
从Databricks更新/覆盖Azure SQL数据库中的表
在Azure Databricks中,该表已经在Azure SQL仓库中创建,我想对Azure SQL数据库中的现有数据库执行更新,或者在我运行我的工作时覆盖它的内容...
从Databricks(python)对Azure SQL数据库中的表执行更新/覆盖]]
在Azure Databricks中,该表已经在Azure SQL仓库中创建,我想对Azure SQL数据库中的现有数据库执行更新,或者在我运行我的工作时覆盖它的内容...
我有一个小的日志数据框,其中包含有关在给定笔记本中执行的ETL的元数据,该笔记本是Azure DataFactory中管理的较大ETL管道的一部分。不幸的是,它...
是否有可能制作Azure数据块解决方案的“图像”或“快照”,“服务”?
我有个主意。也许真的关闭了。但是...我想创建一个Azure DB解决方案,对其进行设置,安装所需的库,部署模型,数据库等等。一旦全部测试,我就会...
[尝试使用apache spark加载模块时出现Databricks错误
我正在Databricks中使用笔记本。如果有帮助,可以使用python 3设置笔记本。一切正常,我可以从Azure存储提取数据。但是,当我运行时:import org.apache ....
如何将整个python应用程序添加到Azure数据块中并运行它?
我们有一个用Python编写的功能模型。我想一次复制所有代码并从azure databricks运行它-我看到有一种方法可以从azure数据工厂运行python代码,但是我看到它的...
我的代码看起来像这样,我不知道为什么会引发错误,出现这种情况后该错误在第3行中,有人可以帮忙吗?谢谢SELECT CASE WHEN(CASE WHEN ...
Databricks Delta Lake + ADSL + Presto
[Databricks刚刚发布了Delta Lake和Presto集成的公开预览。我是Azure的新手,该链接多次提及EMR和Athena,但缺少Azure关键字。所以我要问一个...
我在Databricks的Spark SQL中有表,并且有一个列作为字符串。我将新列转换为Array数据类型,但仍将其转换为一个字符串。数据类型是表模式列中的数组类型,列为...