DBFS 和 databrciks 卷之间的区别

问题描述 投票:0回答:1

DBFS 和卷有什么区别?

卷属于 DBFS 还是在架构方面到底属于什么?

我想了解卷的地位以及与 DBFS 相比的优势?

有人可以帮助我吗?

azure databricks azure-databricks
1个回答
0
投票

DBFS 和卷有什么区别?

类似于 DBFS AZURE Databricks - 文件存储和 DBFS 的差异

假设您的意思是https://learn.microsoft.com/en-us/azure/databricks/sql/language-manual/sql-ref-volumes?wt.mc_id=MVP_323223中的卷,那么您可以说DBFS 和卷处理 Databricks 中的数据存储,它们在不同的上下文中使用并具有不同的功能。 DBFS 更多的是提供与云对象存储交互的接口,而 Databricks SQL 中的卷则提供一种访问、存储、管理和组织云对象存储位置中的文件的方法。

Databricks 中的 DBFS 和卷具有不同的用途并具有不同的功能:

DBFS(Databricks 文件系统):

  • DBFS 是安装到 Databricks 工作区中并可在 Databricks 集群上使用的
    distributed file system
  • 它是可扩展对象存储之上的抽象,将类 Unix 文件系统调用映射到本机云存储 API 调用。
  • DBFS 通过将云对象存储 URI 映射到相对路径来提供便利。这允许您使用目录和文件语义而不是特定于云的 API 命令与对象存储进行交互。
  • DBFS 允许您挂载云对象存储位置,以便您可以将存储凭据映射到 Databricks 工作区中的路径。

Databricks SQL 中的卷:

  • Unity Catalog objects
    表示云对象存储位置中的逻辑存储卷。
  • 它们提供访问、存储、管理和组织文件的功能。
  • 表格提供对表格数据集的治理,而卷则增加对非表格数据集的治理。
  • 卷可以是托管卷,也可以是外部卷。
  • 访问卷中文件的路径使用以下格式:/Volumes/////

卷属于 DBFS 还是在架构方面到底属于什么?

Databricks SQL 中的 DBFS 和卷是独立的组件。
DBFS 是一个用于与云对象存储交互的分布式文件系统。
Databricks SQL 中的卷是 Unity Catalog 对象,用于访问、存储、管理和组织云对象存储中的文件。它们互不属于彼此,但以不同的方式与同一云对象存储交互。

我想了解卷的地位以及与 DBFS 相比的优势?

如前所述,它们有不同的用途。
Databricks SQL 中的卷提供对非表格数据集的治理和灵活的数据管理。
DBFS 是一个用于与云存储交互的文件系统。它们是独立的,但与同一云存储的交互方式不同。

© www.soinside.com 2019 - 2024. All rights reserved.