azure-data-lake 相关问题

Azure Data Lake Analytics是Microsoft Azure中的三大数据服务套件:HDInsight,Data Lake Store和Data Lake Analytics。这些完全托管的服务使得易于上手和轻松扩展以Hive,Pig,Spark,Storm和U-SQL编写的大数据作业。要了解更多信息,请访问:https://azure.microsoft.com/en-us/solutions/data-lake/

将附加文本文件从 databricks 写入 azure adls gen1

我想将某种日志文件写回到azure adls gen1 我可以使用以下方式编写(而不是附加) dbutils.fs.put(文件名,"随机文本") 但我无法使用它附加它 打开(“/dbfs/mnt/文件...

回答 3 投票 0

使用 Python 将文件从一个目录移动到 Azure gen2 中的另一个目录

我想在完成处理后将文件从一个文件夹移动或复制到 Azure ADLS gen2 中同一容器内的另一个文件夹。 我正在尝试将文件上传到新目录,但它不起作用......

回答 0 投票 0

我如何知道谁更改了 ACL 中的 ADLS 权限

问题围绕Azure Data Lake Storage,有一个用户一直在修改ACL文件夹中的权限,我们需要找到一种方法来知道是谁。我想做什么...

回答 0 投票 0

使用 mssparkutils.fs.cp 将 db 文件从临时目录复制到 Azure 数据湖会导致 Azure Synapse 出现校验和错误

我有一个临时目录 (tempfile.mkdtemp()),我在其中使用 Azure Synapse 笔记本中的 sqlite3 对数据库文件进行编辑。当尝试将完成的 db 文件复制到已安装的数据湖存储时,如下所示:

回答 0 投票 0

Azure Datalake Gen1 Permission Denied while iterated over folders

我正在尝试使用 Python SDK 遍历 Azure datalake Gen1 中的所有文件夹。我正在使用分配有所有者角色的服务主体。然而,当我尝试访问一些折叠......

回答 0 投票 0

如何使用删除活动通过 ADF 管道从 ADLS 中的多个子文件夹中删除旧文件夹?

我正在尝试从 ADLS 中删除超过 7 天的文件夹。我要删除的文件夹名称为日期,位于主文件夹的子文件夹下。请参阅下面的文件夹示例

回答 2 投票 0

Azure Synapse Pipeline 如何将每个文件作为 sql 脚本执行?

是否可以使用 Azure Synapse Pipeline 将一组文件作为 SQL 脚本执行? 我有一组文件,每个文件都包含用于在我的 Azure Synapse Ded 中创建存储过程的 SQL ...

回答 1 投票 0

使用 Great Expectations 从 Azure Data Lake 读取 CSV 时出错:TypeError: read_csv() got an unexpected keyword argument 'connect_options'

我在本地使用 Great Expectations 并尝试将其连接到 Azure Data Lake。 我通过简单地使用 Pandas 从数据湖中读取 CSV 文件来测试连接。 该代码产生一个电子...

回答 1 投票 0

如何获取上个月ADLS总容量报告

我正在寻找包含 ADLS 总容量(包括所有容器)详细信息的报告,如果可能的话,获取一些每日大小报告和指标详细信息。我试过 get-

回答 0 投票 0

实施蔚蓝三角洲湖时的数据保留策略

我正在 Azure 中实施一个三角洲湖,这个想法是定期消耗大量数据,因为它是一家银行,并且根据法规,它必须有一个数据保留策略,也就是说,它生成......

回答 0 投票 0

Azure Data Lake 存储 Gen2 权限

我目前正在 Azure 中构建数据湖 (Gen2)。我使用 Terraform 来配置所有资源。但是,我遇到了一些权限不一致的问题。根据文档,可以设置

回答 2 投票 0

Delta Lake 更改日志?

我有一个 Databricks 环境,我需要创建一个实时日志表,其中包含我的配置单元 Metastore 中任何增量表发生变化的所有实例。创建、更改、插入、删除、任何更改...

回答 0 投票 0

如何设置 Delta Live Tables 以便能够访问 Azure Data Lake 文件?

我正在用 sql 编写增量实时表笔记本来访问数据湖中的文件,如下所示: 创建或刷新流式实时表 MyTable AS SELECT * FROM cloud_files("DataLakeSou...

回答 1 投票 0

Azure Datalake Gen2 重命名文件问题

描述错误: 利用 DataLakeServiceClient,我试图在 Azure Synapse 笔记本中解压缩文件后重命名文件,但在重命名之前我一直很成功(...

回答 1 投票 0

在 Azure Data Lake Gen2 中启用分层命名空间所需的 ADF 管道更改

在 Azure Data Lake Gen2 中启用分层命名空间时,ADF 管道需要进行哪些更改。 一旦升级完成,ADF 和 Synapse 会有哪些改进......

回答 1 投票 0

如何从 Azure ML studio 中的数据存储 uri 以编程方式(在 python 代码中手动)创建数据资产

我已经将我的 Azure Data lake 的 blob 容器连接为 Azure ML studio 中的数据存储,而且我能够从那里在屏幕上创建数据资产 - 它读取不同文件夹中的所有文件...

回答 0 投票 0

Attribute Error: 'str' object has no attribute get

从 azure.identity 导入 DefaultAzureCredential 从 azure.synapse.artifacts 导入 ArtifactsClient 从 azure.mgmt.synapse 导入 SynapseManagementClient 从 azure.synapse.artifacts.models 导入

回答 0 投票 0

无论我有什么 IR,我的 DIU 仍然是 4

我的 DIU 不会从 4 改变,无论我是否有一个 8(+8 核)的中等大小的 IR。 我在 SFTP(美国地区)中有一个包含 15gb 数据的文件,它是 .gz 格式。我在 ADLS Gen2(欧盟地区)中需要它...

回答 0 投票 0

记录到 Azure blob 的数据,因为 CSV 缺少换行符

我正在尝试使用下一个命令将我的数据记录到 Azure blob 存储中: #获取 PowerBI 指标 $Result = Get-PowerBIActivityEvent -StartDateTime 2023-03-13T23:58:59 -EndDateTime 2...

回答 0 投票 0

通过 ADF 将数据从 SFTP 复制到 ADLS Gen 2

我在 SFTP 服务器中有大约 200GB 的 .gz 格式数据。我需要通过 ADF 将其复制到 ADLS 中。 可以吗。?需要采用什么数据集文件格式。文件格式应该...

回答 1 投票 0

© www.soinside.com 2019 - 2024. All rights reserved.